Meta吹嘘其最新的人工智能视频工具胜过OpenAI等竞争对手

2024-11-06 16:22来源:本站

  

  

  我它刚刚推出了AI视频生成器Movie Gen,与OpenAI的Sora竞争。

  Movie Gen可以使用文本prom制作附带音频的视频它也可以按舞会编辑pt。

  我它比OpenAI和谷歌更晚加入视频生成竞赛。

  感谢您的报名!转到时事通讯偏好

  上周五,meta发布了一款新的人工智能视频生成工具,这也是该公司在与OpenAI争夺人工智能霸主地位的战斗中发起的最新攻势。

  该公司在一份新闻稿中表示:“今天,我们很高兴推出meta Movie Gen,这是我们针对媒体的突破性生成式人工智能研究,包括图像、视频和音频等模式。”“当被人类评估时,Movie Gen在这些任务上的表现优于业内同类模型。”

  meta在其新闻稿中称Movie Gen是“最先进的沉浸式叙事模型套件”,包括视频生成、音频生成、个性化视频生成和视频编辑。该公司表示,这些模型是使用公开数据和许可数据进行训练的。

  通过文本提示,Movie Gen可以以每秒16帧的速度制作长达16秒的视频,同时推理“物体运动、主体-物体互动和摄像机运动”。用户可以上传自己的照片,并将其整合到个性化视频中,Movie Gen可以根据用户的文字指令编辑视频。

  meta的示例视频展示了一个水下视角,一只小河马(参考Moo Deng,有人知道吗?)在宁静的水中愉快地游来游去。

  另一幅是一只考拉在冲浪板上,旁边的提示是:“一只毛茸茸的考拉熊在冲浪。它有一件灰白色的外套和一个圆鼻子。冲浪板是黄色的。考拉熊用爪子抓着冲浪板。考拉熊的面部表情是专注的。阳光灿烂。”

  新闻稿称,通过音频生成,用户可以“创建和扩展声音效果、背景音乐或整个配乐”,最长可达45秒。例如,一条蛇在树林中爬行的片段包括提示:“树叶沙沙作响,树枝折断,伴随着管弦乐。”

  meta进入音频和视频领域的时间有点晚,因为OpenAI和谷歌等顶级竞争对手已经在这一领域占据了一席之地。今年2月,OpenAi推出了自己的视频生成器Sora, 5月,谷歌紧随其后推出了Veo。

  然而,meta在人工智能军备竞赛中给OpenAI带来了竞争。虽然OpenAI的ChatGPT首次亮相并使该公司享誉全球,但meta的Llama模型最近的迭代也受到了好评。许多人认为7月份发布的Llama 3.1优于OpenAI不久前发布的gpt - 40。

  meta表示,它的新“最先进的模型”在A/B人类比较中优于竞争对手。该公司的新闻稿称,在视频生成方面,受访者更喜欢Movie Gen,而不是OpenAI Sora。meta并没有与同样提供音效和音乐的谷歌的Veo进行A/B比较,但meta在一篇冗长的研究论文中表示,它认为谷歌的视频到音频生成模型在长度上可能比meta的更有限。

  meta、OpenAI和谷歌没有立即回应置评请求。

三九点资讯声明:未经许可,不得转载。