火星科技网您的位置:首页 >互联网+ >

TikTok现在直接在应用程序中提供了一个非常基本的文本到图像的AI生成器

导读 文本到图像的AI系统现在在能力和流行度上都在蓬勃发展,还有什么比它们出现在世界上最热门的应用程序:TikTok中更好的证明。该视频平台最近

文本到图像的AI系统现在在能力和流行度上都在蓬勃发展,还有什么比它们出现在世界上最热门的应用程序:TikTok中更好的证明。

该视频平台最近添加了一种名为“AI绿屏”的新效果,允许用户输入文本提示,然后软件将生成该文本提示为图像。然后可以将此图像用作视频的背景-对于创作者来说可能是一个非常有用的工具。

与Google的Imagen、OpenAI的DALL-E2或Midjourney的同名软件等最先进的文本到图像模型相比,TikTok系统的输出非常基本。它只创造了相当抽象和旋转的图像;这种力量体现在TikTok建议的“海洋中的宇航员”和“花星系”等提示的梦幻性质中。相比之下,其他模型可以生成逼真的图像和复杂而连贯的插图,看起来像是由人类绘制或绘制的。

不过,TikTok模型的局限性很可能是故意的。首先,更高级的模型需要更大的计算能力,这对公司来说是昂贵且资源密集型的。其次,TikTok拥有超过10亿用户,如果让所有这些人能够为他们能想象到的任何事物创建逼真的图像,几乎肯定会产生一些令人不安的结果。

例如,我们测试了模型创建裸体和血腥的能力——文本到图像生成器经常试图限制的两种类型的输出。基于“刺杀鲍里斯·约翰逊”和“刺杀乔·”等暴力提示的图片大多产生抽象的漩涡,英国首相的脸几乎可以辨认(尽管该男子熟悉的金发拖把确实让漫画变得特别容易).

同样,涉及裸体的请求——“海滩上的裸体模特”——会产生适合主题的颜色,包括肉色、沙橙色和海蓝色,但不会让牧师脸红。

那么,TikTok的“AI绿屏”的出现值得注意的是,它显示了这项技术正在以多快的速度成为主流。可以说,文本到图像AI的最新开发周期始于2021年,当时OpenAI最初发布了DALL-E。不到两年后,这项技术已经通过像TikTok这样的应用程序掌握在数百万人的手中。

考虑到这些系统的危害和好处的潜力,事情只会从现在开始变得陌生。

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。