
在一些影视剧中,比如《速度与激情7》、《谍影重重5》等,我们经常会看到这样的一些炫酷镜头:某个系统(如天眼系统)抓拍一张图像,原始画面中是微小模糊不清的目标,经过图像增强、放大处理后,目标人物会变得非常清晰可辨。电影中为了博取观众的眼球,难免有些夸张的成分,但现实中确实存在类似的技术,这就是图像超分辨率技术。
概括来说,超分辨率技术就是把一张或多张低分辨率图片重建为尺寸更大、像素更多、质量更高的计算机视觉技术, 或者在不改变分辨率时去除压缩噪声,获得比传统图像处理更加清晰、锐利、干净的照片。我们使用图像浏览器也可以放大图像,但多数是基于线性或非线性插值技术来实现的,这里要重点讨论的是基于深度学习来实现的超分辨率技术。
另外,超分辨率技术现在已不仅限于提高图像的分辨率,最新的研究成果中会在超分辨任务中结合去噪、去模糊的功能,在放大图像的同时去除原始图像中的模糊降质。比如最近发表在CVPR 2019上发表的一篇超分辨率论文《Deep Plug-and-Play Super-Resolution for Arbitrary Blur Kernels》,效果令人称奇,感兴趣的读者可以查阅作者的论文或者GitHub网站(网址:https://github.com/cszn/DPSR)。
图像超分辨率技术的典型应用场景
通过前文中的描述,我们对图像超分辨率技术有了直观的认识。在现实生活中,图像超分辨率技术的用途还是非常多的,下文我们会从几个比较典型的场景来进一步阐述。
1.图像视频压缩领域
随着高清、超高清时代的到来,表达单帧画面所需要的像素点越来越多,比如一幅4K的图像,原始数据量大概有23.7MB(3840 x 2160 x 3),那么对应到一秒30帧画面的数据量将会有近712MB。如果不进行视频压缩的话,无论是传输还是存储,简直是灾难。
当前通用的新一代视频压缩的三大标准为:ITU/ISO联合主导的新一代编码标准H.266/VVC,谷歌、英特尔等一些软硬件巨头发起的AOM联盟所主导的AV1编码标准,以及我国主导的AVS3标准。新一代的视频编解码标准都在考虑结合当前比较流行的人工智能技术,来进一步提升压缩性能,其中之一就是超分辨率技术。比如,在AV1标准中,智能超分辨率编码就是提升质量的重要工具之一。在谷歌的论文中有图例显示了该过程(An Overview of Core Coding Tools in the AV1 Video Codec, Fig.6),超分辨率可以通过环路重建和上采样来实现,先将信源图像进行下采样再编码,重建与最后输出都能通过超分技术还原回和信源同尺寸的图像。其应用场景主要为带宽比较低或者低时延,但对画质的要求不太高的场合。
2.安防监控领域
在公共安防领域,虽然没有文章开始所描述的电影大片中那样炫酷镜头,但在监控画面中提取清晰可见的目标人或物,对于案件侦破等可以起到关键作用,是非常有实用价值的计算机视觉任务。
监控相机在拍摄视频的过程中,往往会受到天气、距离、角度、相机自身性能等客观因素的影响,得到的画面可能会存在模糊、分辨率低、人眼可辨性差等问题,这时就可以针对视频中的重要画面,进行超分辨率重建,提升画面质量来获得清晰可辨的目标体,比如识别出车牌号码或者嫌疑人脸部等关键信息,为案件侦破提供重要的线索。
另外,笔者在Github上发现有个名叫SREZ的开源小项目,该项目使用深度神经网络(准确来讲是基于生成对抗网络技术),以4x因子放大16x16人脸小图,得到的64x64图像显示清晰的脸部特征。笔者特意下载SREZ源码做了实验验证,使用CelebA的20万人脸图像库,训练了一个SREZ的模型。虽然经过超分得到的高分图像跟原始高分图像有些细微的差异,但比原始低分辨率的图像有明显质量提升,感兴趣读者可以到SREZ项目网站上查看效果(网址:https://github.com/david-gpu/srez)。
3.卫星遥感图像领域
遥感卫星一般运行在距离地面几百公里的位置,采集地面的各种遥感影像,广泛应用于土地利用、灾害监测、军事侦察和工程建设规划等领域。对于卫星图像而言,地面采样距离(GSD)是一种常见的衡量图像质量的方法,其表示图像中单个像素所表示的实际物理距离,也即卫星图像的空间分辨率,其精度会受到传感器噪声、物像相对移动、光学系统的像差等各种图像退化因素的影响。直接研制高分辨率遥感卫星,耗时较长、价格高、流程复杂,如果利用图像超分辨率技术,对低分辨率卫星图像进行重建,提升图像画质,将大大提升后续的处理精度,可以在传感质量、回访速率以及成本间做很好的权衡。因此图像超分辨率技术在卫星遥感领域也是具有很高的商业价值。
日本国家先进工业科学技术研究所在2018年曾发表了一篇论文(Deep Learning Based Super Resolution for Satellite Imagery),在原论文中给出了图示对比,对比了双三次插值和采用深度学习的超分辨率技术放大后的效果,画质明显清晰很多,感兴趣读者可以查阅该论文。
4.医学成像领域
如今的医疗诊断领域,医学图像为临床诊断提供着重要的依据,其中包括X射线计算机断层成像(Computed Tomography,CT)和正电子发射型计算机断层成像(Positron Emission Tomography,PET)。医学图像的分辨率,一方面受限于医疗成像设备的物理能力,得到的图像分辨率有限;另外一方面,为了减少CT成像中X射线和PET成像中辐射对人体的影响,出现了低剂量(Low-dose)CT成像和低计数率(Low-count)PET成像问题,可以认为是退化的低分变率图像。针对这些情况,可以通过图像超分辨率技术得到清晰医学影像,实现对病变细胞的精准探测,有助于医生对患者病情做出更好的诊断,同时也能减少成像设备对人体的辐射影响。
5.消费电子产品
在消费电子产品领域,各个厂家都争相在其产品中集成图像超分算法,提升产品竞争力。
随着手机摄影功能的日益强大,越来越多的人选择用手机记录自己生活中的点点滴滴,拍摄已成为手机的最重要的功能之一。当前主流的手机厂商,除了从摄像镜头、感光元器件等硬件方面(如“浴霸”四摄造型)提升性能外,在软件算法层面也会采用图像超分辨率技术,对画质做进一步的提升,形成光学变焦+ AI图像超分算法的组合方案。通过图像超分算法可以覆盖令人难以置信的焦距范围(如50倍以上),“望远镜”、“手机拍月亮”已成为厂家新一轮手机拍摄性能的宣传口号了。
另外,一些电视厂商如三星,在2019年初发布的QLED 8K高清电视,分辨率高达7680x4320,但限于当下8K视频内容相对缺乏的现状,所以在电视内部集成了基于人工智能的超分算法,使得一些4K或者质量更低的视频,能更好呈现8K画质效果,实现沉浸式的观看体验。
6.互联网娱乐领域
在互联网娱乐领域,图像超分辨技术早就已经进入到大家的生活当中了。
比如,在影视剧点播方面就是图像超分技术大显身手的地方。当前热门的视频网站如优酷、爱奇艺、腾讯视频等,也都在围绕其视频数字资产,借助于AI算法,提升画质,最大化其商业价值。
在这些视频网站的影视库中,存放着大量年代久远的电影或电视剧,受限于那个年代的拍摄器材和存储条件,保存下来的视频分辨率较低,甚至有模糊、划痕等低质画面。尤其是一些经典的影视剧目,为了满足观众的需求和体验,会对这类视频做高清修复。这项工作如果通过人工来完成,不仅对工作人员的技术功底要求非常高,而且修复效率也非常低。此时,通过AI超分技术,再结合其他图像增强算法,可以在非常短的时间内实现视频的高清修复,极大提升效率,修复后画面效果也是非常不错的。在优酷网站上播出的高清版《士兵突击》,就是通过超分技术来高清修复的(同时使用色彩增强等多种图像处理方法),感兴趣读者可以观看该剧来对比一下修复前后的效果。
再如大家经常使用的腾讯类工具中也加入了图像超分技术,QQ空间中使用TSR模型(Tencent Super Resolution)实现图片高清放大查看,能够保证图片大小只有原来25%的情况下,完全重构图片的纹理与色彩。另外微信、天天P图、动漫业务等腾讯的业务也都是超分的使用场景。
图像超分辨率技术的原理
上文介绍了图像超分的诸多应用场景,那么图像超分技术是如何实现的呢?本节将会从技术的角度来介绍图像超分辨率的原理。
图像超分技术的传统方法包括基于插值的方法和基于重构的方法,但随着深度学习技术的流行,研究热点也都转向基于深度学习的方法来实现。限于篇幅,这里主要介绍基于深度学习的超分方法。
图1 超分辨率一般网络框架
如图1所示,基于深度学习方法的超分模型主要过程就是输入一张或多张低分辨率的图像,经过一个CNN(卷积神经网络)网络模型以后,生成一张高分辨率的图像。
在训练阶段,我们会使用大量的低分辨率图像样本作为输入,将预测生成的高分辨率图像和原始高分辨率图像做比较,利用损失函数来度量两张图像之间的差异,然后使用误差来优化CNN模型,这样反复进行多轮迭代,直到损失函数收敛为止。通过这样的训练手段,可以得到CNN模型,该模型能学习到低分辨-高分辨图像之间的非线性映射关系。
在推理阶段,对输入的低分辨图像,使用训练好的CNN模型做出预测,推断出高分辨图像。
超分辨率任务的损失函数存在几种类型,如像素损失、内容损失、纹理损失等,每一种函数都对生成图像的不同方面进行惩罚。一般情况下,我们会通过对各种损失函数的误差分别加权求和,这样可以同时使用多个损失函数,这使得模型能够同时关注多个损失函数所贡献的方面,进一步提升生成的高分辨图像视觉效果。
结束语
图像超分辨率技术是图像处理相关问题中的基础问题之一,已经在图像视频压缩、安防监控、卫星遥感图像、医学成像、消费娱乐等众多领域中得到广泛的应用,并表现出优异的性能,是一项非常有意义和实用价值的技术。未来图像超分技术将会在物联网、穿戴设备、VR/AR等更多领域中大展身手。与此同时,在这个领域也有一些还待解决的问题,如无监督的图像超分、真实场景的泛化、与去噪/去雾/去模糊任务相结合等,相信在众多科研工作者的努力下,在图像超分辨率技术领域上将会有更大的技术突破。