AI高仿你的笔迹只需要一个单词,Deepfake文字版来了,网友:说谎真可怕-量子位
- 时间:
- 浏览:0
终于,有人实现了我小学时的梦想!
只要我拍下自己的笔迹,AI就会给我誊写英语作业,画风“完全一致”类型:
这是FacebookAI最新出品的“文本样式刷”(TextStyleBrush),只需一张笔迹的照片,就可以完美还原文本文字的组合。
不仅可以换花换树,还可以空着把“酱油瓶”换成“茶壶”。
就像蔬果店所有的印刷文字都是手写的一样,也可以直接实现风格的置换。
这样看来,现在连照片文字都不一定是真实的。
强于格式刷:文本也可以在实际使用过程中进行交换,TextStyleBrush真的是格式刷,需要在哪里刷哪里。
真正厉害的是模拟手写的字体。
只需输入文本内容,加上笔迹,就可以用一个单词生成“手写版”。
这个效果,用肉眼看的话真的不能分辨真伪!
在蔬菜厂标价印刷体全部更换为手写体的过程中,还可以识别非印刷体的样品,自动跳过转换合成。
◆如果两个手写标签没有更改为模拟特定的字体格式,TextStyleBrush也有很好的表现。
海报、垃圾桶、路标、饮料瓶、店面装饰等各种文字风格的handle:
除了直观效果外,开发商还对合成图像进行了数据上的分析。
TextStyleBrush产生的图片由于合成误差(MSE)而大大降低,峰值信噪比(PSNR)和结构相似性(SSIM)也大大提高。
在字符识别的准确性方面,TextStyleBrush在三个数据集中都很出色。
精度均达到95%以上。
修改GAN后,根据难以辨认真伪字符Facebook,“字符样式刷”TextStyleBrush是一种基于自我监督方法训练的模型,可以对相同文本内容的字符进行样式转换,就像格式刷一样。
当然,不仅仅是Word的格式刷,照片中的文字也可以直接替换,所以模型需要学习文字识别和图像分割的方法。
◆为了同时实现逆光场景以及图像分割和文字样式转换,TextStyleBrush模型是基于StyleGAN2设计的,后者可以生成非常逼真的图像照片。
但是StyleGAN2有两个问题。
首先,生成图像的方法是“乱打”,即不能控制输出图像特征。但是,TextStyleBrush必须生成指定文本的图像。其次,虽然StyleGAN2的整体风格不受控制,但TextStyleBrush的风格包含了大量信息的组合,包括颜色、比例、样式转换等特征,甚至是具有个人特色的笔迹的详细差异。因此,TextStyleBrush首先将文本信息和样式作为两个“附加条件”来控制模型输出,从而解决模型随机生成图像的问题。
而且,为了进一步精细地控制文本的样式特征,还提取神经网络层中的各种样式信息,将这些信息注入到文本生成器中,便于从各种尺度(颜色、整体样式、细节)控制字符的样式。
此外,由于图像分辨率不同,生成器必须生成和替换与区域分辨率相似的文本。
因此,在该模型中组装有能够控制高低分辨率的结构,以使生成的文字图像与输入图像的分辨率一致。
这样,在置换前后字体的清晰度差不会变大。
但是和照片不同,文字的风格要更自由,所以有时画风的真实性说不出来。
因此,在训练时,Facebook引入了创新的自我监督训练方法,将风格分类、文本识别(OCR)和GAN三种模型结合起来保持输入的风格/文字内容,并决定替换哪一种。
例如,如果在文本识别中让TextStyleBrush生成文本图像,则模型使用预训练文本识别结构来“确定”图像的文本内容并评分。
事实证明,这样训练出来的模型确实很好用。
网友:说谎会扰乱真相吗?我有点担心……合成人的脸已经玩得太多了,合成笔迹还是第一次。
而且那个效果真的很好呢!
所以,TextStyleBrush一发布,就吸引了很多人。
用户已经开始想象它的用途:
LeCun也传输了一波。
但能不能玩太难受了,手痒的网友纷纷赶来提问。
这将揭示引起争议的地方。
合成的笔迹是假的就够了,如果被滥用或滥用怎么办。
假设任何人的笔迹都可以非常简单地合成,如果需要签名该怎么办呢。
例如,一位网友表示,只要能模仿医生们的“草书”处方。
除了对安全隐私问题的担忧,这对字体设计师来说也不是什么好消息。
毕竟每个字体都有版权,如果简单模拟一下,就不是盗版满天飞,就连作者本尊都分辨不出真伪了。
一位网友说,更接近无法分辨真伪的反乌托邦世界。
与此相对,Facebook的CTO
你怎么想?
TextStyleBrush数据集:https://github.com/Facebookresearch/IMGUR5K-Handwriting-Dataset
论文地址:https://scontent-fml2-1.xx.fbcdn.net/v/t39.8562-6/10000000_944085403038430_3779849959048683283_n.pdf