TikTok现在直接在应用程序中提供了一个非常基本的文本到图像的AI生成器

文本到图像的AI系统现在在能力和流行度上都在蓬勃发展，还有什么比它们出现在世界上最热门的应用程序：TikTok中更好的证明。

该视频平台最近添加了一种名为“AI绿屏”的新效果，允许用户输入文本提示，然后软件将生成该文本提示为图像。然后可以将此图像用作视频的背景-对于创作者来说可能是一个非常有用的工具。

与Google的Imagen、OpenAI的DALL-E2或Midjourney的同名软件等最先进的文本到图像模型相比，TikTok系统的输出非常基本。它只创造了相当抽象和旋转的图像;这种力量体现在TikTok建议的“海洋中的宇航员”和“花星系”等提示的梦幻性质中。相比之下，其他模型可以生成逼真的图像和复杂而连贯的插图，看起来像是由人类绘制或绘制的。

不过，TikTok模型的局限性很可能是故意的。首先，更高级的模型需要更大的计算能力，这对公司来说是昂贵且资源密集型的。其次，TikTok拥有超过10亿用户，如果让所有这些人能够为他们能想象到的任何事物创建逼真的图像，几乎肯定会产生一些令人不安的结果。

例如，我们测试了模型创建裸体和血腥的能力——文本到图像生成器经常试图限制的两种类型的输出。基于“刺杀鲍里斯·约翰逊”和“刺杀乔·”等暴力提示的图片大多产生抽象的漩涡，英国首相的脸几乎可以辨认(尽管该男子熟悉的金发拖把确实让漫画变得特别容易).

同样，涉及裸体的请求——“海滩上的裸体模特”——会产生适合主题的颜色，包括肉色、沙橙色和海蓝色，但不会让牧师脸红。

那么，TikTok的“AI绿屏”的出现值得注意的是，它显示了这项技术正在以多快的速度成为主流。可以说，文本到图像AI的最新开发周期始于2021年，当时OpenAI最初发布了DALL-E。不到两年后，这项技术已经通过像TikTok这样的应用程序掌握在数百万人的手中。

考虑到这些系统的危害和好处的潜力，事情只会从现在开始变得陌生。

标签：

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，多谢。

TikTok现在直接在应用程序中提供了一个非常基本的文本到图像的AI生成器

猜你喜欢

最新文章