OpenAI 的 Sora 文本转视频生成器将于今年晚些时候公开发布

OpenAI 首席技术官 Mira Murati 告诉《华尔街日报》，Sora 最终也将融入声音。

您很快就能亲自试用 OpenAI 的热门文本转视频生成器。在接受《华尔街日报》采访时，OpenAI 首席技术官 Mira Murati 表示 Sora 将于“今年”上市，也可能“需要几个月的时间”。

OpenAI 于 2 月首次展示了 Sora，它能够根据文本提示生成超现实场景。该公司最初只向视觉艺术家、设计师和电影制作人提供了该工具，但这并没有阻止一些由 Sora 生成的视频进入各视频平台。

Murati 表示，除了向公众提供该工具外，OpenAI 还计划“最终”加入音频，这有可能使场景更加逼真。该公司还希望允许用户编辑 Sora 制作的视频内容，因为人工智能工具并不总是能创建准确的图像。“我们正在试图弄清楚如何将这项技术用作人们可以编辑和创作的工具，”Murati 告诉《华尔街日报》。

当被问及 OpenAI 用什么数据来训练 Sora 时，Murati 没有说得太具体，似乎在回避这个问题。“我不会详细介绍所使用的数据，但它是公开的或授权的数据，”她说。Murati 还表示，她不确定它是否使用了 YouTube、Facebook 和 Instagram 上的视频。她只是向《华尔街日报》证实， Sora 使用了与OpenAI 有合作关系的Shutterstock 的内容。

Murati 还告诉《华尔街日报》，Sora 的运行成本“要高得多”。OpenAI 正试图在向公众发布该工具时，使其“成本与该公司的 AI 文本转图像模型 DALL-E 相近”。在《华尔街日报》的报道中，您可以看到更多关于该工具可以制作哪些类型视频的示例，包括瓷器店里的动画公牛和美人鱼智能手机评论员。

随着 2024 年总统大选的临近，人们对生成式人工智能工具及其制造虚假信息的可能性的担忧只增不减。Murati 表示，Sora 发布后可能无法生成公众人物的图像，类似于 DALL-E 的政策。视频也可能会有水印以将其与真实内容区分开来，但正如我的同事 Emilia David 指出的那样，水印并不是一个完美的解决方案。