让小甲鱼惊呼两个“卧草”得逆天AI绘画机器人
在线体验:传送门https://www.bilibili.com/video/BV1E24y1Z73b
继 Dall-E2 和 Imagen 之后,AI 作画又有了新的神器:
Stable Diffusion
先来直观感受下威力(更多见视频):
只要你会打字,随便写几个需求。
就能生成超高清图像。
还可以通过它来做视频,几分钟就能看遍文明演变。
结果因为生成效果太好,第一次给小甲鱼老师展示的时候,他连连质疑这是真人画的建的数据库。
实现逻辑简单说就是下面几个点。
[*]通过 CLIP 模型对语言进行编码,让AI理解人话
[*]通过扩散模型将编码结果生成为图像
扩散模型的工作原理就是逐步添加高斯噪声来破坏训练数据,直到变成纯噪声。
然后再训练一个神经网络来扭转过程,恢复数据。
但只要原始图像过大,训练成本就成指数级上升,效率大大降低。
因此 Stable Diffusion 的作者基于此进行了调校。
在不影响训练成果的前提下,将数据压缩,让普通人电脑也可以使用。
此外还引入了交叉注意层,增加图像生成的逻辑性。
开源后广受好评,不过也有一些人懂了歪心思,用它来伪造图片或视频。
许多人呼吁,应该从技术层面限制这类AI的能力,欢迎评论或者弹幕你的高见~ {:5_108:} 不错诶,看看 tomok 发表于 2022-9-12 17:11
不是我多管闲事啊,你也别骂我,我就是随便说一句,诶....那个你都中级鱼油III了怎么才1个技术值啊? 编程追风梦 发表于 2022-9-12 21:54
不是我多管闲事啊,你也别骂我,我就是随便说一句,诶....那个你都中级鱼油III了怎么才1个技术值啊?
不生气哦。
当你到了 III,就会明白的。 tomok 发表于 2022-9-13 08:52
不生气哦。
当你到了 III,就会明白的。
? {:5_108:} 支持不二大神!
页:
[1]