第09版:综合 上一版3  4下一版  
 
标题导航
回到首页 | 标题导航
2024年01月05日 星期五
3 上一篇  下一篇 4 放大 缩小 默认
阿里大模型让照片跳舞 朋友圈掀起斗舞潮
张珊珊

  只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈!

  2024年首个工作日,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频就陆续在国内社交媒体和朋友圈刷屏。这些大约10秒的视频都不是真人出镜,均由大模型生成,这种低门槛的“跳舞”方式引发了网友的广泛体验,掀起一波斗舞潮。各路网友金句频出:AI治愈了我的四肢不协调、科目三的风吹到了考古界、再也不用担心跳科目三崴脚……

  这是阿里云通义千问APP上线的免费功能,输入“通义舞王”“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频,生成的视频能较好地保留原形象的面部表情、身材比例、服装以及背景等特征。目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步、鬼步舞等12种热门舞蹈模板。

  该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。其中,视频生成是大模型领域最热门的研究方向之一,谷歌、Meta、Runway等国外科技公司都在积极布局,但一直以来,人物形象的视频生成面临诸多技术挑战。

  在相同数据集的测试下,Animate Anyone的性能表现显著优于国内外同类模型。

  去年9月,通义千问成为国内首批通过备案的大模型,通义千问APP上线后功能持续升级,目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。

  新报记者 张珊珊

3 上一篇  下一篇 4 放大 缩小 默认
版权说明:天津日报报业集团所属10报2刊所有作品,版权均属于天津日报报业集团,受《中华人民共和国著作权法》的保护。所有关于天津日报报业集团及其子报子刊内容产品的数字化应用,包括但不限于稿件签约、网络发布、转稿等业务,均需与天津日报报业集团商谈,与天津日报报业集团有互换稿件协议的网站,在转载数字报纸稿件时注明“来源-天津日报报业集团-XX报”和作者姓名,未与天津日报报业集团有协议的网站,谢绝转稿,违者必究。
天津日报报业集团法律事务部