Print

发布时间: 2021-06-25
摘要点击次数:
全文下载次数:
DOI: 10.3969/j.issn.2096-8299.2021.03.016
2021 | Volume 37 | Number 3




    图像技术    




  <<上一篇 




  下一篇>> 





基于双路径残差网络的虹膜图像超分辨率重建
expand article info 王鹤铭, 沈文忠
上海电力大学 电子与信息工程学院, 上海 200090

摘要

低分辨率虹膜图像所含有效信息较少,实际应用到虹膜识别中会影响识别精度,而图像超分辨率重建技术能够有效解决这一问题。针对虹膜图像的结构和纹理差异,提出了适用于虹膜图像超分辨率的双路径网络结构,设计了双支路残差密集块提取深层虹膜特征,并采用后置放大策略重建图像。针对CASIA-IrisV4虹膜图像库进行了实验,并与主流重建算法进行了比较,发现重建的图像结构清晰,纹理细节丰富。虹膜匹配实验结果表明,该算法的等错误率均为最优,重建图像具有良好的识别效果。

关键词

图像超分辨率重建; 虹膜识别; 双路径残差网络; 残差密集块; 虹膜匹配算法

Super-resolution Reconstruction of Iris Image Based on Dual Channel Residual Network
expand article info WANG Heming, SHEN Wenzhong
School of Electronics and Information Engineering, Shanghai University of Electric Power, Shanghai 200090, China

Abstract

The low-resolution iris images contain less effective information, and their actual application will affect the recognition accuracy.Image super-resolution reconstruction technology can solve this problem effectively.Based on the difference between structure and texture of iris images, this paper proposes a dual-channel network structure which is suitable for iris images.We design dual-path residual dense blocks to extract deep features and use post-magnification strategy to reconstruct the final image.Experiments are conducted on the CASIA-IrisV4 image library.Comparied with classic methods, the reconstructed images have clearer structure and richer texture details.The result of the iris matching experiments shows the EER are all optimal, which means the reconstructed iris images reach a better recognition performance.

Key words

image super-resolution reconstruction; iris recognition; dual-channel residual network; residual dense block; iris matching algorithm

虹膜识别是一种可靠的身份认证方式, 虹膜纹理具有高度的稳定性、唯一性和鉴别能力[1]。在不可控的应用场景中, 如监控和移动生物识别中, 由于设备或采集距离的限制, 采集的虹膜图像缺失像素分辨率, 导致虹膜定位错误甚至无法定位, 严重影响了虹膜识别性能。图像超分辨率(Super Resolution, SR)重建技术为解决这一问题提供了方法。

超分辨率重建技术[2-3]是指根据一幅或多幅低分辨率(Low Resolution, LR)图像, 重建一幅高分辨率(High Resolution, HR)图像, 可大致分为基于插值、基于重构和基于学习3种方法。基于插值的方法, 如最近邻插值和双三次插值法, 具有算法简单、计算速度快等特点, 但重建图像精度不高。基于重构的方法, 如邻域嵌入和锚点邻域回归, 是利用图像先验信息作为约束条件生成锐利的纹理细节, 但当缩放因子较大时, 重建效果迅速退化。近几年, 随着机器学习和计算机视觉的迅猛发展, 基于卷积神经网络(Convolutional Neural Network, CNN)的超分辨技术成为研究热点。SRCNN[4]是最早的3层CNN网络, 将SR任务分为特征提取、非线性映射和图像重建3部分, 具有优于插值法和重构法的重建效果。但由于网络结构简单, 所以重建图像存在模糊现象。深度超分辨率(Very Deep Super Resolution, VDSR)[5]拓展了SRCNN的非线性映射部分, 改用20层卷积层的VGG-Net为基本架构, 并采用小尺寸卷积核, 取得了良好的重建效果。深度递归卷积网络(Deeply Recarsive Convolution Network, DRCN)[6]为减少网络参数量, 堆叠16层递归卷积层, 并采用递归监督和跳跃连接加速网络收敛, 稳定训练过程, 提升网络性能。残差密积网络(Residual Dense Network, RDN)[7]结合残差块和密集块的独特优势, 设计残差密集块提取特征, 并充分融合图像上下文信息, 进一步提高了重建精度。

上述工作主要针对自然图像的超分辨任务。虹膜图像有其独特的属性, 结构信息较少, 虹膜纹理具有随机性、复杂性和极大的变异性, 就使得在开放的数据集中进行超分辨任务变得尤为困难。此外, 自然图像关注重建的视觉效果, 注重优化保真度指标, 如峰值信噪比(Peak Signal to Noise Ratio, PSNR)和结构相似度(Structual Similarity, SSIM)。虹膜图像的超分辨除保证视觉感受外, 还应考虑其识别效果。已有少量超分辨率研究围绕虹膜图像展开。文献[8]探讨了CNN在虹膜识别应用中的可行性, 将5个预训练好的网络作为虹膜关键信息提取器, 使用支持向量机作为分类器, 发现CNN擅长表达虹膜图像, 并可有效提高虹膜分类准确度。文献[9]采用不同类别的数据集(纹理、自然以及虹膜图像数据集)分别训练SRCNN和VDSR, 使用虹膜图像微调, 发现重建图像保真度及识别效果均优于传统方法。本文在以上工作的基础上, 结合虹膜图像细节纹理差异, 设计了适用于虹膜图像的超分辨率重建的双路径结构, 能准确重建高保真度的高分辨率虹膜图像; 对超分辨率主体网络、特征提取模块、上采样策略进行了优化设计, 进一步提高重建图像的PSNR和SSIM; 进行了虹膜匹配实验, 取得了优异的识别效果。

1 双路径残差网络

为了获取虹膜图像的结构和纹理特征, 本文采用双路径网络结构, 由不同的支路网络完成不同的特征提取任务, 具体如图 1所示。与SRCNN类似, 双路径残差网络将整个网络分为浅层特征提取、非线性映射和图像重建3部分。

图 1 双路径残差网络

1.1 浅层特征提取

早期的SRCNN和VDSR等超分辨网络采用前置放大策略, 先将原始低分辨率图像ILR通过插值法放大为目标尺寸, 随后送入网络。提取的特征包含插值法引入的误差信息, 故而重建精度不高。本文采用后放大策略, 与上采样模型配合, 直接从ILR提取浅层特征F-1F0F-1用于全局残差学习, F0作为两个支路网络的输入。

1.2 非线性映射

虹膜内外圆是重要的结构信息, 用于虹膜的精确定位, 虹膜纹理细节是匹配的唯一依据。针对这两种不同的特征, 本文采用双路径结构[10], 支路1提取细节特征, 支路2提取结构特征。在双路径均引入残差密集块(Residual Dense Block, RDB), 用于提取深层虹膜特征, 具体如图 1中蓝色卷积块所示。各支路采用RDB提取深层信息, 原始RDB如图 2所示。

图 2 原始RDB

RDB由一组3×3卷积层、密集连接、通道约束层以及局部残差学习组成。密集连接和局部残差学习能充分利用各级分层特征, 相当于高通滤波器, 不断地将前向特征向后传递。在保留高频分量的同时, 避免了卷积过深而造成的信息丢失。

假设第d个RDB内有C层3×3卷积层, 则第C层卷积层的输出表示为

$ F_{C}=W_{C}\left[F_{d-1}, F_{1}, F_{2}, \cdots, F_{C-1}\right] $ (1)

式中: WC——第C层卷积;

[Fd-1, F1, F2, …, FC-1]——C层前面所有层的输出及RDB输入的密集连接。

d个RDB的输出表示为

$ F_{d}=W_{d}\left(\left[F_{d-1}, F_{1}, F_{2}, \cdots, F_{C}\right]\right)+F_{d-1} $ (2)

式中: Wd——通道约束。

本文改进原始RDB, 设计两条使用不同尺寸的卷积核支路的RDB。卷积核越大, 其对图像的感受范围越大, 能提取更为全局、语义层次更高的特征。支路1使用的卷积核尺寸为3×3, 有较小的感受野, 对于细微的纹理信息比较敏感, 可捕捉相邻像素间上下、左右之间的关系, 并提取细节特征[11]。支路2卷积核尺寸为5×5, 对于图像的形状轮廓较为敏感, 因有大的感受野, 故能从原图中提取丰富的结构特征。但大尺寸卷积核会增加参数量和计算复杂度。卷积核数量相同时, 一个5×5卷积层的参数量和计算量是3×3卷积层的2.78倍。由于两个3×3卷积核感受野与一个5×5卷积核感受野相同, 因此将5×5卷积核替换为两个3×3卷积核, 既可以保证感受野和网络性能不变, 又可以减小计算复杂度和参数量。这样, 支路2的卷积层数量是支路1的2倍。

支路1提取的纹理特征FD表示为

$ \begin{array}{l} F_{D}=W_{D}\left(F_{D-1}\right)= \\ W_{D}\left(W_{D-1}\left(\cdots\left(W_{1}\left(F_{0}\right)\right) \cdots\right)\right) \end{array} $ (3)

式中: W1, W2, W3, …, WD——D个RDB的特征提取;

F1, F2, F3, …, FD——RDB提取的特征。

支路2提取的结构特征用FD表示。

1.3 图像重建

图像重建包含特征融合、全局残差学习和上采样模型。结构特征和纹理特征融合可以更好地表达虹膜图像。跳跃连接是对特征的并行排列, 特征本身大小不会改变, 可以有效减少网络中要求准确承载信息的负担, 缓解网络模型模拟非线性映射的难度。本文采用跳跃连接集成结构和纹理特征, 为减少计算复杂度, 采用1×1的卷积核约束通道数量。全局残差学习能够加快网络收敛, 降低训练难度。最终提取的特征FG可表示为

$ F_{\mathrm{G}}=W_{\mathrm{G}}\left(\left[F_{D}, F_{D}^{\prime}\right]\right)+F_{-1} $ (4)

式中: WG——通道约束;

[FD, FD]——跳跃连接。

FG是直接从原始低分辨虹膜图像上提取的低维度特征, 需通过上采样将特征图映射为目标大小。本文采用文献[12]提出的亚像素卷积层, 具体如图 3所示。

图 3 亚像素卷积层

首先, 亚像素卷积层采用后放大策略, 不会引入错误信息。其次, 亚像素卷积层使用手工固定卷积核, 而是通过训练得到一组周期移动卷积核, 这些卷积核切合当前超分辨任务, 能有效保证重建质量。周期移动卷积核(Periodic Shuffling, PS)可表示为

$ \operatorname{PS}(T)_{x, y, c}=T_{[x / r],[y / r], C \cdot r \cdot \bmod (y, r)+C \cdot \bmod (x, r)+c} $ (5)

式中: T——网络中的张量;

x, y——HR空间中的像素坐标;

r——用于重建的上采样因子;

c——最终通道数。

这些滤波器可以将r×r通道的LR特征图映射为r通道的HR。重建的高分辨率图像ISR可表示为

$I_{\mathrm{SR}}=\mathrm{PS}\left(F_{\mathrm{G}}\right) $ (6)

2 实验结果与分析

2.1 数据集

本文使用中科院CASIA-IrisV4/CASIA-Iris-Lamp虹膜图像库训练网络。该图像库是在不同光照条件下采集的, 瞳孔会随光照变化而弹性变形, 使得相应的SR任务难度增加。选用Lamp模拟真实采集的应用场景。Lamp共计16 212张图像, 411人。随机选择300人, 挑选结构清晰、纹理丰富的左右眼各10幅图像, 共计6 000幅图像作为训练集。随机选择300人, 左右眼各6幅图像, 共计3 600幅作为测试集。

Lamp图像视为HR, 本文采用双三次插值法(Bicubic)作为退化模型, 对Lamp下采样, 模拟实际的LR。在网络训练之前, 首先对原始HR图像按照步长(设为16)进行裁剪, 得到一系列48×48 HR图像块, 然后根据缩放因子(例如4倍)的大小, 进行下采样, 得到对应图像块LR(12×12)。LR和HR组成图像对, 相当于将input和label送入网络进行训练。

2.2 实验设置

在Windows 10系统中搭建的Tensorflow框架下进行训练, 电脑硬件参数为Inter Core i7-8700K, 显卡为Nvidia Geforce RTX 2080Ti。初始化学习率为10-4, 学习率更新策略为Adam, 动量参数β设置为0.9, 激活函数统一设置为Relu, 训练周期为100。

超分辨率的目的是重建高分辨率图像ISR, 使其尽量接近原图IHR。网络训练是在寻找LR和HR之间的非线性映射, 也在不断更新和优化各层网络参数Wb。本文选用平均绝对误差(Mean Absolute Error, MAE)作为损失函数, 则为

$ L(W,b) = \frac{1}{{MN}}\sum\limits_{x = 1}^M {\sum\limits_{y = 1}^N {\left| {I_{{\rm{HR}}}^{(x,y)} - I_{{\rm{SR}}}^{(x,y)}} \right|} } $ (7)

式中: W, b——卷积核参数和偏差;

M, N——图像的宽和高;

I(x, y)——图像坐标(x, y)处的像素值。

Bicubic, VDSR, DRCN, RDN等算法的训练采用与本文相同的训练集和测试集, 训练设置均与其对应开源代码一致。本文算法在实验过程中对其进行了2倍、4倍和8倍的重建。采用主观可视化比较(PSNR)和客观评价指标(SSIM)对这5种算法进行评估。考虑到虹膜图像的实际应用, 设计了虹膜匹配实验, 将等错误率(EER)作为另一评价指标。

2.3 网络优化

网络中RDB数量(D)及RDB内卷积层数(C)对网络深度、参数量以及重建质量等影响较大。本文在缩放因子为4时, 改变DC, 训练不同深度的网络, 寻找最优化网络模型。首先, 拟定C为4, 改变D的大小训练网络, 并统计各项评估指标。RDB数量优化如表 1所示。

表 1 RDB数量优化

下载CSV
D/C PSNR/dB SSIM 参数量/MB EER/% 测试时间/s
1/4 37.50 0.939 7.55 1.590 0.329
3/4 37.53 0.939 21.00 1.560 0.427
5/4 37.31 0.935 34.40 1.514 0.570
7/4 37.62 0.940 47.80 1.546 0.586
9/4 37.70 0.940 61.30 1.506 0.676

表 1可知, PNSR和SSIM值越高、EER值越小意味着较好的重建质量。当D=9时, PSNR和SSIM的值最高, EER值最小, 达到了最佳的视觉感受和识别效果。然而此时网络最深, 参数量最多, 测试时间最长, 计算中消耗大量内存, 不可视为最优网络。考虑到虹膜图像的超分辨率重建侧重于识别准确率, 因此根据EER与计算速度的折中, 选定D为5。随后, 改变C的大小训练网络, 卷积层数量优化如表 2所示。

表 2 卷积层数量优化

下载CSV
D/C PSNR/dB SSIM 参数量/MB EER/% 测试时间/s
5/2 37.34 0.937 10.7 1.556 0.406
5/6 37.29 0.937 72.1 1.509 0.619
5/8 37.44 0.938 123.0 1.429 0.738

表 2可知, 随着卷积层数的增加, PSNR和SSIM仅有较小的波动, C=8时, 其EER最优, 但其参数量为123 MB, 测试时间最长。C=2时, EER显示最差结果。C=6时EER值比C=4时小0.005%, 但其参数量多出2倍多, 测试时间也较长。因此, 根据EER与计算速度的折中, 选定C=4。

2.4 实验结果及分析

不同超分辨率算法重建图像的PSNR和SSIM实验结果如表 3所示。

表 3 不同超分辨率重建算法的PSNR与SSIM

下载CSV
算法 PSNR/dB SSIM
2倍 4倍 8倍 2倍 4倍 8倍
Bicubic 40.060 34.760 31.930 0.971 0.910 0.870
VDSR 41.680 35.430 32.360 0.979 0.922 0.865
DRCN 42.890 36.570 32.930 0.985 0.927 0.876
RDN 42.810 37.280 33.130 0.982 0.937 0.883
本文算法 42.340 37.310 33.470 0.977 0.935 0.886
图 4 不同超分辨率算法重建虹膜图像的可视化比较

表 3可以发现, 不同缩放因子下, CNN重建虹膜图像的PSNR与SSIM普遍高于Bicubic, 效果显著, 表明CNN在虹膜图像超分辨率任务中的巨大潜力。本文算法在8倍重建时, 取得了最优的PSNR和SSIM, 分别比RDN高0.34 dB和0.003 dB, 在4倍重建时, 取得最优的PSNR, 表明本文算法在较大缩放因子时虹膜图像超分辨率重建中优势显著。

不同超分辨率算法重建可视化比较如图 4所示。

在2倍重建时, 各个算法都表现出接近原图的重建效果, 随着缩放因子增加, 部分网络重建性能下降。4倍重建时, Bicubic出现朦胧的视觉感受, VDSR和DRCN出现虹膜图像纹理模糊, 细节丢失的现象, 而RDN和本文算法始终有着清晰的结构和纹理。8倍重建时, Bicubic的虹膜区域已经完全模糊, 甚至出现可见的像素粒, VDSR和DRCN也由于过度平滑而丢失大量纹理, RDN和本文算法虽然也有细节丢失, 但是保留了虹膜区域的部分块状结构性纹理。相比之下, 本文算法的纹理亮度较深, 观察光斑、睫毛、瞳孔边缘等可以发现, 其对微小细节的恢复更加准确, 展现出优越的重建质量。

本文同时进行了虹膜匹配实验, 并根据EER评估各超分辨率重建算法的重建质量。原始图像的EER为1.394%, 其他算法的EER如表 4所示。

表 4 不同超分辨率算法的EER

下载CSV
算法 EER/%
2倍 4倍 8倍
Bicubic 1.482 1.804 4.730
VDSR 1.552 1.543 3.328
DRCN 1.519 1.514 3.610
RDN 1.539 1.520 2.889
本文算法 1.593 1.514 2.773

表 4可以发现, 在2倍重建时, Bicubic的EER为1.482%, 最接近原图, 且优于其他网络。因此, 当采集的低分辨率虹膜图像不需要大的上采样因子时, 相比基于CNN的算法, 采用传统插值法足以完成超分辨率任务, 其识别效果仅有少量退化。在4倍重建时, DRCN和本文算法取得最佳识别效果。在8倍重建时, 本文算法的识别效果最佳, 且远高于其他算法, 表现出优异的重建性能。此外, 结合表 3可以发现, 较高PSNR和SSIM并不会带来较好的虹膜识别效果, 在2倍重建时, DRCN的PSNR和SSIM分别比Bicubic高2.83 dB和0.014, 而EER低于Bicubic。这表明虹膜图像的视觉效果与识别效果没有明显的相关性, 虹膜图像的超分辨率任务更应该注重提升识别的准确率, 而非视觉效果。

3 结语

本文提出基于虹膜图像的双路径残差网络, 将低分辨率虹膜图像作为网络输入, 设计双支路, 利用不同深度的残差密集块分别提取细节特征和结构特征, 引用全局残差学习融合特征, 最后经亚像素卷积层将提取的低维度特征放大, 重建出高分辨率虹膜图像。实验结果表明, 本文所提算法能高效准确重建高分辨率虹膜图像, 尤其在缩放因子较大的情况下, 其领先的PSNR和SSIM及清晰的可视化效果表明重建图像具有较高的保真度。同时, 与其他算法相比, 本文算法的EER表现更好。由于在虹膜图像采集过程中会出现低分辨率美瞳图像, 因此实际虹膜识别过程中需即时侦测美瞳图像, 考虑将图像超分辨率技术用于重建高分辨率美瞳图像, 以提高其侦测准确率。

参考文献

  • [1]
    宋天舒, 沈文忠, 晁静静. 基于神经网络的虹膜图像上眼睑的精确定位[J]. 上海电力学院学报, 2019, 35(1): 77-82. DOI:10.3969/j.issn.1006-4729.2019.01.015
  • [2]
    YANG W, ZHANG X, TIAN Y, et al. Deep learning for single image super-resolution: a brief review[J]. IEEE Transactions on Multimedia, 2019, 21(12): 3106-3121. DOI:10.1109/TMM.2019.2919431
  • [3]
    TIMOFTE R, ROTHE R, GOOL L V. Seven ways to improve example-based single image super resolution[C]//Computer Vision and Pattern Recognition (CVPR). Las Vegas, USA, 2016: 1865-1873.
  • [4]
    DONG C, LOY C C, HE K, et al. Image super-resolution using deep convolutional networks[J]. IEEE Trans Pattern Anal Mach Intell, 2016, 38(2): 295-307. DOI:10.1109/TPAMI.2015.2439281
  • [5]
    JIWON K, JUNG K L, KYONG M L. Accurate image super-resolution using very deep convolutional networks[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 1646-1655.
  • [6]
    JIWON K, JUNG K L, KYONG M L. Deeply-recursive convolutional network for image super-resolution[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 1637-1645.
  • [7]
    ZHANG Y, TIAN Y P, KONG Y, et al. Residual dense network for image super-resolution[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake, UT, 2018: 1-6.
  • [8]
    NGUYEN K, FOOKES C, ROSS A, et al. Iris recognition with off-the-shelf CNN features: a deep learning perspective[J]. IEEE Access, 2018(6): 18848-18855.
  • [9]
    EDUARDO R, ANDREAS U, FERNANDO A F. Iris super-resolution using CNNs: is photo-realism important to iris recognition?[J]. IET Biometrics, 2019, 8(1): 69-78. DOI:10.1049/iet-bmt.2018.5146
  • [10]
    CHEN Y P, LI J N, XIAO H X, et al. Dual path networks[C]//31st Conference on Neural Information Processing Systems. Loong Beach, CA, USA, 2017: 1-9.
  • [11]
    CHU J, LI X, ZHANG J, et al. Super-resolution using multi-channel merged convolutional network[J]. Neurocomputing, 2020, 394: 136-145. DOI:10.1016/j.neucom.2019.04.089
  • [12]
    SHI W, CABALLERO J, FERENC H. Real-Time Single Image and Video Super-Resolution Using an Efficient, Sub-Pixel Convolutional Neural Network[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 1-5.