谷歌的人工智能文本到图像生成器Imagen获得了一项新功能,可以从动画图像生成四秒长的短视频,类似于GIF。
Imagen2是该工具的增强版本,谷歌在拉斯维加斯举行的CloudNext会议上宣布了该工具(来自TechCrunch)。
谷歌将这项新功能称为“文本到实时图像”,它可以根据用户提示创建四秒长的视频。谷歌分享的例子包括“山脉鸟瞰图”、“捕捉一锅沸腾的泰国咖喱”、“岩石海岸,黄色然后坚硬,汹涌的波浪”等提示。
谷歌表示,该工具将以每秒24帧(fps)的速度和360x640像素的分辨率创建实时图像,并且未来还会进行改进。所有生成的实时图像都将具有不可见的SynthID标签,以提醒其他人图像的AI诞生,并与过滤器配对以确保安全。
目前还不清楚为什么谷歌正在开发一种生成短的、低分辨率GIF的人工智能工具,而它的竞争对手,如OpenAI的Sora,可以将文本转换为超现实的视频。谷歌自己的Lumiere也能够生成比Imagen2更高质量的视频。根据这家科技巨头的说法,该工具主要面向企业,它希望成为一个企业应用程序,可能用于生成广告的快速镜头。
Imagen2的文本到实时图像功能应该在未来普遍可用。
据报道,苹果公司还在开发一款名为Keyframer的类似工具,该工具可以通过提供文本指令从单个图像生成动画。你可以在这里读更多关于它的内容。