Super-Resolution

这是Super-Resolution仓库的说明文档。

VESPCN

介绍

这是对论文《Real-Time Video Super-Resolution with Spatio-Temporal Networks and Motion Compensation》的复现,论文中提出的网络被称为VESPCNspatio-temporal sub-pixel convolution networks(时空子像素卷积网络),代码使用TensorFlow实现。

网络架构

提出的网络

  1. 提出了时空子像素卷积网络,可以在维持实时速度的同时有效利用时间冗余并且提升重建准确率
  2. 讨论了early fusionslow fusion3D fusion用于连续视频帧的联合处理
  3. 提出了一种全新的联合运动补偿(joint motion compensation)视频超分(VSR)算法

spatio-temporal sub-pixel convolution networks

空间变换网络 STN

https://blog.csdn.net/qq_39422642/article/details/78870629

光流法

考虑一个像素I(x,y,t)用了dt时间到达下一帧I(x+dx,y+dy,t+dt),用一阶泰勒展开得到: \(I(x+dx,y+dy,t+dt)=I(x,y,t)+\frac{\delta I}{\delta x}dx+\frac{\delta I}{\delta y}dy+\frac{\delta I}{\delta t}dt+\zeta\) 两边对t求导,得到: \(\frac{\delta I}{\delta x}\frac{dx}{dt}+\frac{\delta I}{\delta y}\frac{dy}{dt}+\frac{\delta I}{\delta t}\frac{dt}{dt}=0\) 令 \(u=\frac{dx}{dt},v=\frac{dy}{dt},I_x=\frac{dI}{dx},I_y=\frac{dI}{dy},I_t=\frac{dI}{dt}\) 上式可以写成: \(I_xu+I_yv+I_t=0\) 这个方程中,Ix,Iy,It可以由图像计算出,(u,v)即为该像素点的光流矢量。因为目前仅有一个方程,但有两个未知数,所以还要引入其他约束条件,此处不再展开。

网络分析

VESPCN从其设计思想看是运用邻近帧(前一帧和后一帧)之间的信息,将前后帧对应到当前帧之后,拼接成一个9通道的矩阵作为ESPCN超分网络的输入。VESPCN可以分为2个部分,三帧对齐图像重建

三帧对齐部分借鉴了光流法STN(Spatial Transform Networks),分别构建了光流估计网络和空间变换网络。光流估计网络对应Motion estimation模块,而STN对应Warp模块,前者用来估计帧间的运动,后者用来运动补偿。

part 1

图像重建部分采用ESPCN网络,这里的输入是3张图片的9个通道。

结果

如下图所示(摘自paper),

paper-result

作者

朱文康

如果你有问题,欢迎联系我。我的邮箱是:wenkang_zhu@whu.edu.cn,乐意回复。

谢谢。

参考文献