UNet 实现文档印章消除
pytorch==1.5
opencv-python 4.2
numpy
- data 的目录:
- test:测试集图片的路径
- mytest:测试结果的输出路径
- train:训练集图片的路径,包含含印章的图片以及标注印章位置的 xml 文件
- train_cleaned:训练集图片人工去除印章后的标签
- valid:验证集图片的路径,包含含印章的图片以及标注印章位置的xml文件
- valid_cleaned:验证集图片人工去除印章后的标签
-
config.py
设置参数,包括文件路径、模型结构参数和训练的参数等。
-
train.py
运行 python train.py 训练模型。
-
predict.py
运行 python predict.py 测试。
-
由于作者所使用的图像分辨率极高,在训练和测试时从完整图像中扣出包含印章的区域(ImageSize=512*512),然后进行训练。 如果图片的分辨率适中或者显存足够大,可以跳过此步骤,无需进行印章标注,直接使用原图进行 UNet 训练。
-
从原图中扣出印章区域也可以使用 yolo 代替。