发布时间:2024-12-31 05:19:45 来源: sp20241231
本报记者 赵语涵 袁璐
相似的时间点,更甚于上次的震撼。2月16日,曾以大模型ChatGPT震惊全球的人工智能科技公司OpenAI再次祭出新“王炸”——文生视频大模型Sora,只需输入一段文本指令,即可生成一段60秒的视频,画面精致细腻。
“AI(人工智能)成长速度比想象中更快!”有人对此振奋,也有人表达担忧:“人类是否真的准备好了?”但越来越多的声音认为,人工智能将引领第四次工业革命。
首个视频大模型横空出世
Sora并非首个文生视频大模型。此前,科技巨头谷歌、创业公司Runway等都已布局这一赛道。Sora何以惊艳全球?相比此前应用,它将生成视频的时间大幅延长至60秒,在画面的细致逼真、流畅程度、三维空间多角度呈现等方面也有明显提升。
360集团创始人周鸿祎就谈到了几个让他印象深刻的镜头:小狗在雪地玩耍溅起纷飞的雪粒,毛茸茸的毛发根根分明、随风浮动;咖啡杯里,两只帆船“缠斗”掀起翻涌的波浪水纹;不同角度的街景通过运镜流畅地呈现。
跳出视频领域,更深广的变革或许正悄然发生。
周鸿祎谈到,Sora的颠覆性绝不仅仅限于一个文字生成视频的工具,而是通用人工智能对世界理解的又一次突破。一年前,ChatGPT标志着人工智能对人类语言和知识的理解达到了一个突破点。而除此之外,这个世界还有很多规律,例如小狗拱雪雪会留在鼻子上、无人机在空中飞时视角如何变换等,而Sora目前生成的视频,显示它对这个世界的规律有了更为完整的理解。这意味着,通用人工智能时代或将加速到来。
同济大学人文学院特聘教授解学芳也认为,Sora的出现意味着AI理解真实世界的能力进一步跃升,但这类大模型的突破性发展未来也会受到算力、算法、伦理法规的制约,应对其保持积极且审慎的态度。
视频行业格局或被重塑
Sora的横空出世,让视频领域从业者感受到了危机。“太震撼,感觉要丢饭碗了。”北京某文化传播有限公司创始人胡娟坦言,Sora让她危机感陡增,“这完全可以用于镜头样板,一些复杂的特效制作,以前工期至少得好几天,但AI将其缩短到了几分钟。”
摄影师李浩楠认为,Sora对影视相关的产业影响比较大,能大幅拉低制作成本,特别是涉及多角度、多机位的视频,如果AI能够部分替代人工拍摄和剪辑,成本可能只要原来的十分之一。
Sora的技术突破也让大大小小生成式AI创业公司和投资机构的前景变得充满挑战。某专注全球早中期企业的风投公司运营合伙人罗超表示,Sora表现出的领先性让Runway、Pika Labs等视频生成大模型明星公司面临强力冲击,而相比这些自研大模型公司,纯做应用的创业公司则更加前途未卜。
在新壹科技CEO雷涛看来,Sora的诞生,无疑会改变AI视频生成市场格局。“就国内而言,要看哪些企业能结合、利用新技术,完善符合国情的产品。”
AI让“眼见不一定为实”
Sora展示的生成视频也被发现有不少“穿帮”镜头。比如,在一段老奶奶吹蜡烛的视频中,老奶奶吹气后蜡烛却没有熄灭;在另一段玻璃杯从空中坠落的视频中,玻璃杯刚被抬到半空,桌上就已经有水流出来了。
这也是目前文生视频大模型的短板——不懂物理世界以及因果关系等。在中国政法大学传播法研究中心副主任朱巍看来,大模型所生成的视频代表着AI对这个世界规律的理解,但这不一定都是正确的,因此也让“眼见不一定为实”。
更广泛的担忧,是视频的可信度高于文字和图片,一旦生成门槛被大幅降低,难辨真伪的虚假视频可能会被用于传播谣言、诈骗等非法领域。对此,朱巍认为,应参考此前针对生成式AI的相关规定,对AI生成内容予以标识。
此外,创作者用一段文字生成视频后,该视频的版权归属等问题也需要重新梳理。目前,针对AI生成文字或图片的著作权归属问题已形成争论。去年年底,北京互联网法院就针对一起“人工智能生成图”著作权侵权纠纷案做出一审判决,这也是我国首例涉及“AI文生图”著作权案件。法官认为,人们利用生成式人工智能生成图片时,本质上仍然是人利用工具进行创作,如果能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法的保护。(北京日报) 【编辑:付子豪】