Skip to content
/ HOGAMTL Public

This is a HOG aided multi-task learning model for screen content image quality assessment, shorten as HOGAMTL

Notifications You must be signed in to change notification settings

evaGao/HOGAMTL

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

65 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

HOGAMTL

This is a HOG aided multi-task learning model for screen content image quality assessment, shorten as HOGAMTL.

环境配置

UBUNTU16.04 + MATLAB2016 + caffe

安装caffe可参考:Ubuntu16.04 Caffe 安装步骤记录(超详尽)

训练测试数据

SIQAD1 + SCID2

百度云链接:https://pan.baidu.com/s/1Tg20HH9V_ddodn1g6_pGsQ 密码:v7bd

前期提示

  • 为了便于理解,可先读paper文件夹下的论文,有英文版和中文版(毕业设计中的基于多任务CNN的无参考屏幕内容图像质量评价一章)
  • 为了方便理解算法流程,下面在算法叙述方面会有部分输出结果的名称为临时拟编,注意不要与代码实际的输出结果名称搞混
  • 实际运行matlab代码时
    • 注意其调用函数文件的齐全,且路径可寻,否则会报错
    • 若当前路径下缺失要调用的函数文件,则在 reserve 文件夹下搜索该函数文件

运行步骤

处理数据

一、提取图像块的HOG特征并保存

  1. 对图像进行分块,分为若干 32*32*3 的图像子块,并提取每个子块的HOG特征;
    运行代码:matlab/hog_rgb_3.m
    代码输入:失真图像路径
    输出结果:HOG元组
    HOG提取

  2. 将HOG元组写入文本文件hog.txt中;
    运行代码:matlab/write_in.m
    代码输入:输出文件路径、HOG元组
    输出结果:hog.txt(内容为多行数字,每行为图像块的36维HOG特征)

二、制作训练测试所需要的数据格式(lmdb数据,包含图像和对应的标签【质量分数标签和HOG标签】)

  1. 对比度归一化图像并分块;
    运行代码:matlab/prepare_rgb_3.m
    代码输入:失真图像路径
    输出结果:归一化后的图像块
    归一化图像块

Little Tips:

  • 这里的输出路径需要自己指定,具体位于代码第22行。默认保存在失真图像路径下,文件夹名称为 “rgb_3_test”,有需要自行修改即可。
  • 以上代码写的比较繁琐。先对图像进行了分块然后提取了每块的HOG特征,然后对比度归一化了整幅图像,又进行了分块,得到若干对比度归一化图像块。前后相当于重复分块了两次,比较耗时。或许可以精简一下,先整体对图像分块,然后直接基于各个图像块提取其HOG特征,并进行对比度归一化操作。这样前后只需进行一次分块操作即可。至于这样操作是否会影响最终结果,未知,可以尝试一下。
  1. 根据前面某步所得到的hog.txt文件来制作 "img_patch_path label" 的训练集和测试集文件;
    运行代码:matlab/train_val_scoreshog.m
    代码输入:参考图像路径、失真图像路径
    输出结果:训练和测试集的txt文件 - score_train_1.txt 和 score_val_1.txt(文件每一行内容:训练/测试图像块路径 图像块质量分数 图像块HOG特征)

Little Tips:

  • 这里的输出路径需要自己指定,具体位于代码第17行。
  • 这个代码操作稍有些复杂,包含了:数据分割(根据参考图像将失真图像块按8:2分为训练集和测试集)、将图像块与原整幅失真图像质量分数对应、将图像块路径和质量分数以及对应的HOG特征并列写入txt文件中。为了更方便理解其过程,可以先看一下该代码首行的 流程 注释。
  1. 按行打乱步骤2所产生的训练集文件内容 score_train_1.txt;
    运行命令:
shuf score_train_1.txt的路径 -o score_train_shuf.txt (打乱后的输出路径具体名称可自行指定)

Little Tips:

  • 上面的运行命令是Linux命令,直接在shell黑框下运行即可。
  • 这里不需要打乱测试集,因为在测试的时候,我们要让图像块对应到原整幅图像上。打乱训练集即可。
  1. 删除训练/测试集文件中存在NaN的行;
    运行代码:python/daily.py(删除文件中的NaN)
    代码输入:打乱后的训练集/测试集文件路径
    输出结果:去除掉NaN的训练/测试集文件

Little Tips:

  • NaN产生自HOG特征,有NaN的数据虽不多,但NaN的存在会影响网络训练,导致不收敛或训练中断,需要将其去除。
  1. 制作训练集的lmdb数据和测试集的lmdb数据;
    运行代码:python/generation.py
    代码输入:对比度归一化后的图像块路径、训练/测试txt文件路径
    输出结果:训练/测试lmdb数据集,可直接用于训练和测试

Little Tips:

  • 运行代码是python格式
  • 制作lmdb的原因是caffe训练测试需要lmdb的数据格式,数据格式与所选取的深度学习框架有关。

多任务网络模型训练

  • 网络架构文件:SIQAD/train8.protxt
  • 参数配置文件:SIQAD/solver_val8.protxt
  • 训练启动脚本:SIQAD/train1.sh
  • 测试启动脚本:SIQAD/test.sh
    网络架构

Little Tips:

  • 要知道如何跑起来,了解一下caffe运行流程,且各文件里的路径需根据自身情况进行修改
  • 在训练到测试切换时,记得更换网络架构文件中的输入数据路径,测试的batchsize=1
  • 以上的路径为SIQAD数据库的训练路径,SCID的文件名与其一致,具体内容位于SCID文件夹下
  • 可以调参,且可视化训练过程中loss值下降情况等,具体查看caffe使用规则
  • 经过测试,最终得到两个输出文件,一个是output.txt(内容为网络预测输出的图像块hog特征和图像块质量分数值),另一个是scores.txt(内容为图像块的真实hog特征和真实质量分数值)

图像质量预测评估

  1. 去除输出的hog结果,只保留预测分数;
    运行代码:python/daily.py(只保留score)
    代码输入:上一步测试后输出的output.txt 和 scores.txt
    输出结果:去除hog特征后的output.txt 和 scores.txt

  2. 考虑到之前删去了NaN的图像块,导致预测图像块的总数和原图的图像块总数不一致,因此需要补齐预测分数文件和真实分数文件;
    运行代码:python/daily.py(将NaN的图像块以'0'的形式补充到预测质量分数文件 output.txt 中和将NaN的图像块的真实质量分数补充到真实质量分数文件 scores.txt 中)
    输出结果:补齐后的output.txt和scores.txt

  3. 根据权重策略预测整幅图像的质量分数;
    运行代码:matlab/VLSD_find_region.m
    输出结果:将图像块分数乘以权重后的质量分数文件 output_weight.txt 和 真实质量分数文件 scores.txt
    权重求解图

Little Tips:

  • 在运行这段代码时,需要有包含测试图像块名字+分数的文本文件,以及只有测试图像块名字的文本文件,因此需要另外运行一个小脚本(daily.py(去除每行的HOG内容))

计算PLCC和SROCC值

  1. 将加权的图像块质量分数求和得到整幅图像预测质量分数;
    运行代码: matlab/compute_LCC_SROCC.m
    代码输入:output_weight.txt 和 scores.txt
    输出结果:图像块加权求和后的整幅失真图像预测质量分数 predict.txt 和真实质量分数 real.txt

  2. 计算PLCC和SROCC等指标;
    运行代码:matlab/verify_performance.m
    代码输入:predict.txt 和 real.txt
    输出结果:SROCC值、KROCC值、PLCC值和RMSE值
    两个数据库的指标结果

实验验证

  • 绘制散点图;
    运行代码:matlab/assessment.m
    代码输入:predict.txt 和 real.txt
    输出结果:散点图结果
    本文方法散点图

Little Tips: 像其它合理性验证,泛化能力验证,单个失真类型验证等代码自行编写,非常容易。这里只提供散点图绘制代码。

注意事项

关于算法使用HOG特征,目的是为了提取屏幕内容图像的梯度纹理特征。基于此,本算法还尝试了LBP特征和灰度共生矩阵特征,效果都不如HOG特征好。但这里还是把提取LBP特征和灰度共生矩阵GLCM特征代码提供一下吧,仅供参考

  • LBP特征提取:python/lbp.py
  • GLCM特征提取:python/glcm.py

参考

[1] Yang H, Fang Y, Lin W. Perceptual quality assessment of screen content images[J]. IEEE Transactions on Image Processing, 2015, 24 (11): 4408–4421.
[2] Wang S, Gu K, Zhang X, et al. Subjective and objective quality assessment of compressed screen content images[J]. IEEE Journal of Emerging and Selected Topics in Circuits and Systems, 2016, 6 (4): 532–543.

About

This is a HOG aided multi-task learning model for screen content image quality assessment, shorten as HOGAMTL

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published