北京时间2月16日凌晨,OpenAI在官网正式发布了文生视频大模型Sora,其可以根据用户提示生成长达1分钟的视频,同时保持视频中出现的人物、景色的连贯性,甚至即便切换镜头,人物依然能够保持一致。
现点现做
OpenAI首席执行官山姆·奥尔特曼在社交平台对网友放言,“留下想看什么的评论,我为你生成视频”,并在两小时内“现点现做”放出了10多条视频。这立刻引发了科技圈和影视圈的双重“震撼”,油管粉丝高达2.39亿的顶流网红“野兽先生”直接在奥尔特曼的社交账号下哀求:“求求你了山姆,不要让我没有工作。”
DCCI互联网研究院院长刘兴亮在接受记者采访时表示,Sora无疑是人工智能领域的一次重大突破。这一技术不仅展示了AI在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业提出了前所未有的挑战和机遇。导演图拉古则告诉记者,Sora的潜力并不是代替拍摄或者创作,而是让每一个人成为创作者,这必然会产生新的业态。
“一部电影预告片,讲述了30岁的太空人戴着红色羊毛编织的摩托车头盔、蓝天、盐漠、电影风格的冒险故事,用35毫米胶片拍摄,色彩生动。”这是OpenAI官网展示的诸多视频生成提示语句之一,记者发现,根据该提示语句生成的视频不仅达到了语句的内容预期,还创造性地出现了多个镜头的切分,而且神奇的是,在不同角度的镜头中,视频主角“太空人”可以看出是同一人。
在另一个OpenAI提供的例子中,输入提示词“中国龙的农历新年庆祝视频”,就生成了一段人们舞龙的视频,记者发现,这段视频包含了庞大的庆祝队伍和人群,但他们也都能保持前后的一致和连贯。
OpenAI表示,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色,“Sora还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。”
超感影游
目前Sora生成的还基本限于“短视频”,如果生成带剧情的长篇故事似乎还有更多挑战。图拉古告诉记者,Sora更大的潜力在于传递蒙太奇故事,而不是准确和具有节奏的叙事,“它准确地传递某一个人的100%的意图还是差一点,不过大部分创作者不会在意这些。也就是说,它其实能够传递某一个人90%的情绪感觉或者表达这已经足够了。”
Sora的发布让图拉古十分激动,他目前正在打造一个被称为“超感影游”的沉浸式线下体验项目,在他看来,未来很多人都可以成为创作者,而不仅仅局限于现在的专业人士,电影的“KTV时代”,随着AI的到来即将到来。
“技术总是跨越式进步,后面可能会更超乎我们的想象。”图拉古说。
不过,OpenAI也坦承,目前Sora模型也有弱点,“它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。”
北京时间2月16日8时,山姆·奥尔特曼“趁热”在社交平台发布了招人公告,“OpenAI团队是我见过的最有才华、最友善的一群人,致力于解决最困难、最有趣和最重要的问题。我们所有关键资源均已到位,专注于打造通用人工智能,你或许应该考虑加入我们。”
据新京报