Skip to content

遇到的一些问题和疑惑(creat_lmdb_dataset 和convert模块) #102

@fyy0322

Description

@fyy0322

首先就是博主提供的数据集和训练集的txt文件中的内容是已经编码好的,图片的相对路径后跟的不是文字而是数字。但是问题在于好像这些数字的索引和Alphabets是不对应的;第二,代码labelList = []
for line in imagePathList:
word = line.split()[1]
labelList.append(word)
似乎应该修改成labelList = []
for line in imagePathList:
word = line.split()
labels=word[1:]
labelList.append(labels)
这样labels才能将第一个元素(也就是图片路径)后的所有元素(也就是文本字符)添加到 labelList中。并且,在处理字符数据并将其存储到 LMDB 数据库时,通常的步骤是先将字符编码,然后再将编码后的数值索引存储到 LMDB 数据库。这种方式更高效,也更符合实际操作流程。所以对于在百度网盘中的数据集,其实都不需要进行convert转换了的。这是目前我遇到问题后从头开始研究想到的一些可能的问题

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions