第05版:综合 上一版3  4下一版  
 
标题导航
人工智能领域重大突破 OpenAI发布文生视频大模型~~~
微型机器人首次完成~~~
约2700名医生酝酿集体辞职 抗议政府扩招高校医学生政策~~~
回到首页 | 标题导航
2024年02月18日 星期日
3 上一篇  下一篇 4 放大 缩小 默认
人工智能领域重大突破 OpenAI发布文生视频大模型
Sora将“颠覆”视频和电影制作?
OpenAI官网截图

  北京时间2月16日凌晨,OpenAI在官网正式发布了文生视频大模型Sora,其可以根据用户提示生成长达1分钟的视频,同时保持视频中出现的人物、景色的连贯性,甚至即便切换镜头,人物依然能够保持一致。

  现点现做

  OpenAI首席执行官山姆·奥尔特曼在社交平台对网友放言,“留下想看什么的评论,我为你生成视频”,并在两小时内“现点现做”放出了10多条视频。这立刻引发了科技圈和影视圈的双重“震撼”,油管粉丝高达2.39亿的顶流网红“野兽先生”直接在奥尔特曼的社交账号下哀求:“求求你了山姆,不要让我没有工作。”

  DCCI互联网研究院院长刘兴亮在接受记者采访时表示,Sora无疑是人工智能领域的一次重大突破。这一技术不仅展示了AI在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业提出了前所未有的挑战和机遇。导演图拉古则告诉记者,Sora的潜力并不是代替拍摄或者创作,而是让每一个人成为创作者,这必然会产生新的业态。

  “一部电影预告片,讲述了30岁的太空人戴着红色羊毛编织的摩托车头盔、蓝天、盐漠、电影风格的冒险故事,用35毫米胶片拍摄,色彩生动。”这是OpenAI官网展示的诸多视频生成提示语句之一,记者发现,根据该提示语句生成的视频不仅达到了语句的内容预期,还创造性地出现了多个镜头的切分,而且神奇的是,在不同角度的镜头中,视频主角“太空人”可以看出是同一人。

  在另一个OpenAI提供的例子中,输入提示词“中国龙的农历新年庆祝视频”,就生成了一段人们舞龙的视频,记者发现,这段视频包含了庞大的庆祝队伍和人群,但他们也都能保持前后的一致和连贯。

  OpenAI表示,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色,“Sora还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。”

  超感影游

  目前Sora生成的还基本限于“短视频”,如果生成带剧情的长篇故事似乎还有更多挑战。图拉古告诉记者,Sora更大的潜力在于传递蒙太奇故事,而不是准确和具有节奏的叙事,“它准确地传递某一个人的100%的意图还是差一点,不过大部分创作者不会在意这些。也就是说,它其实能够传递某一个人90%的情绪感觉或者表达这已经足够了。”

  Sora的发布让图拉古十分激动,他目前正在打造一个被称为“超感影游”的沉浸式线下体验项目,在他看来,未来很多人都可以成为创作者,而不仅仅局限于现在的专业人士,电影的“KTV时代”,随着AI的到来即将到来。

  “技术总是跨越式进步,后面可能会更超乎我们的想象。”图拉古说。

  不过,OpenAI也坦承,目前Sora模型也有弱点,“它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。”

  北京时间2月16日8时,山姆·奥尔特曼“趁热”在社交平台发布了招人公告,“OpenAI团队是我见过的最有才华、最友善的一群人,致力于解决最困难、最有趣和最重要的问题。我们所有关键资源均已到位,专注于打造通用人工智能,你或许应该考虑加入我们。”

  据新京报

3 上一篇  下一篇 4 放大 缩小 默认
版权说明:天津日报报业集团所属10报2刊所有作品,版权均属于天津日报报业集团,受《中华人民共和国著作权法》的保护。所有关于天津日报报业集团及其子报子刊内容产品的数字化应用,包括但不限于稿件签约、网络发布、转稿等业务,均需与天津日报报业集团商谈,与天津日报报业集团有互换稿件协议的网站,在转载数字报纸稿件时注明“来源-天津日报报业集团-XX报”和作者姓名,未与天津日报报业集团有协议的网站,谢绝转稿,违者必究。
天津日报报业集团法律事务部