-
Notifications
You must be signed in to change notification settings - Fork 325
Open
Description
首先就是博主提供的数据集和训练集的txt文件中的内容是已经编码好的,图片的相对路径后跟的不是文字而是数字。但是问题在于好像这些数字的索引和Alphabets是不对应的;第二,代码labelList = []
for line in imagePathList:
word = line.split()[1]
labelList.append(word)
似乎应该修改成labelList = []
for line in imagePathList:
word = line.split()
labels=word[1:]
labelList.append(labels)
这样labels才能将第一个元素(也就是图片路径)后的所有元素(也就是文本字符)添加到 labelList中。并且,在处理字符数据并将其存储到 LMDB 数据库时,通常的步骤是先将字符编码,然后再将编码后的数值索引存储到 LMDB 数据库。这种方式更高效,也更符合实际操作流程。所以对于在百度网盘中的数据集,其实都不需要进行convert转换了的。这是目前我遇到问题后从头开始研究想到的一些可能的问题
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels