B站将修复动漫画质的模型作为开源超分辨率无噪波、无伪影还是二维最了解二维-量子比特,
- 时间:
- 浏览:0
为了能用高清再现儿时的XXX,AI最近不惜努力。
最近,我们发现了一种为动漫图像而产生的画质修复模型。
Real-CUGAN。
这款开源车型今天登上了GitHub的热榜,也来自b站官方。
其效果也比之前两个成功的超分割模型更先进,推理速度、兼容性等更快、更好。
“次子刺猴子”是什么。
其结构魔改不会从以往的大火图像中破坏无损放大/降噪神器Waiff2x(GitHub标星23k),无缝兼容。训练码基本上来自腾讯去年刚刚出品的RealESRGAN(GitHub标准星9.1k)
Waiff2x源于日本的“技术宅”,原理是将二维图像的堆积如山与原图放在一起,通过算法向模型本身学习如何放大图像。
Waiff2x有免费的网页版。
RealESRGAN主要对高分辨率图像变为低分辨率过程中的各种“劣化”过程进行模拟,在显示模型上浆合的图后将其高清图反向推出。
这是在ECCV2018PIRM-SR挑战赛中获得第1名的超得分“前辈”ESRGAN的进一步改良。
与这两位相比,Real-CUGAN有什么独特性呢。
首先在训练集中,前两个都采用私有的二维训练集,量级和质量未知,Real-CUGAN使用百万级高清二维数据集。
在推论耗时的方面(目标为1080P),如果以Waiff2x为基线,则RealESRGAN仅需2.2x,Real-CUGAN仅需1x。
在强度调整方面,Waiuff2x可支持多种降噪强度,RealESRGAN不可调整。Real-CUGAN支持四种降噪强度和维护修复,未来将提供不同程序的模糊去除、JPEG伪影去除、锐化等功能。
另外,Waiuff2x只能实现1倍和2倍的分辨率修复,RealESRGAN只支持4倍,Real-CUGAN也可以是2~4倍(1倍还在训练中)
当然,最重要的是效果。
让我们看一些最直观的比较图。
Real-CUGAN和Waiff2x的结果相差不大,但可以看出RealESRGAN没有处理地面纹理。
在这个比较图中,Waiuf2x显然没有后面两条线那么清晰,但与Real-CUGAN相比,RealESRGAN人物的嘴和下巴线是虚的,有杂线。
在这幅“终极渣清型”图像的超分化效应中,Waiuf2x还不是很明显。
RealESRGAN整体清晰,但依然有噪音产生,产生明显伪影——只有Real-CUGAN画面好看,表现最好。
为了便于更多的创作者为四种玩家提供不同的参数安排,Real-CUGAN为四种组开放了不同的推理参数设置。
Windows播放器Real-CUGAN为Windows用户打包了可执行的环境(下载链接可以在文末的仓库中自己取)
您可以使用congfig文件设置通用参数:在mode中输入视频或image,以确定超视频或超图像。
模型有三种,具体选择哪一种也很有参考价值:
Waifu2x-caffe播放器提供了Real-CUGAN2x标准版(denoise-level3、和Real-CUGAN2x免切割线版两个参数。
Python播放器需要torchgt;=1.0.0、numpy、opencv-python、moviepy模块。
VapourSynth播放器(Provideo Press)这个不详细说,不过,符合的读者请参照仓库的自述me说明~
最后,Real-CUGAN也计划进行更多更新。包括快速模型、简单的GUI、步进到任何指定的分辨率功能、改进自己的效果(优化纹理保留、减少模型处理痕迹)
心动的朋友可以按下面的链接试试手:https://github.com/bilibili/ailab/tree/main/Real-CUGAN