点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
最近,OpenAI发布了首个视频生成模型Sora,并展示了几段文生视频的演示短片,引起了讨论热潮,几乎所有媒体都将Sora带来的变革指向传媒行业,马斯克也在社交媒体上表示:gghumans(人类认赌服输)。Sora将如何改变传媒行业?对普通人有什么影响?对此,我们采访了中国传媒大学媒体融合与传播国家重点实验室大数据首席科学家、教授、博士生导师沈浩。
Q:目前,Sora的效果远超之前的AI模型,它在处理复杂场景、角色运动、背景细节等方面的能力如何?
沈浩:Sora是继GPT之后,大语言模型的又一种新的现象级应用场景。它的特点主要是在视觉上,特别是它能够一镜到底,持续输出一分钟的超现实状态,所以给大家带来了极大的直观感觉和影响。这个产品出现以后,引起了整个社会,无论是业界,还是整个大众对创新的极大感知。我想我们首先是乐见人工智能在不断地创新和发展。
OpenAI发布的AI视频片段
到现在为止,我们看到Sora可能生产了有上百个作品,它革新性与能力体现在很多方面。首先是它一镜到底的运镜和对镜头的感知,其次是它生成的内容,有人把它叫作“世界模拟器”。这个概念其实是有它的前瞻性和未来性的,也就是说它既符合我们人类看待这个物理世界的同时,又能够重构我们对物理世界的认知。所以它生成的作品具有非常强的视觉冲击力,甚至不是我们通过拍摄就可以实现的。最后,Sora生成的内容给大家提供了无限的想象空间。
Q:有业内人士称,Sora将使得AGI的实现或从十年缩短至一两年,您怎么看?
沈浩:AGI全称叫做通用人工智能,Sora属于AIGC,也就是利用人工智能生成内容。AGI不单指数字世界,换句话说不仅仅是视觉或者影视作品等,还包括机器人、无人驾驶,甚至还有更广阔的应用前景。从这个角度来讲,Sora并不是核心的驱动AGI发展的部分。
但因为Sora的出现,可能会让AGI拥有更具象化的感知,比如人工智能机器人,物理的机器人或者是人形的机器人,当然也包括未来的智能化驾驶汽车。所以Sora与AGI之间并不能画等号,但是它会助力AGI去理解世界、理解现实。
Q:Sora能否成为传媒行业的一种重要工具?它的诞生对传媒行业会产生怎样的影响?
沈浩:首先,Sora需要极大的算力,所以目前它的推广和普及还存在困难。
其次,如果我们做一个尝试,比如用Sora制作一部电影或者一档60分钟的节目,这需要一分钟一分钟地生成。在这个基础上,怎么把故事流畅地串联起来是个很大的问题。仔细看Sora生成的视频,在整个空间中还存在一些缺陷,如同AI作画一样,无法完全复现真实。所以它生成的内容就传媒业来讲,主要对于自媒体、短视频以及娱乐教育或者科幻等领域产生极大影响。
很多人认为Sora会影响未来的职业发展,其实一个创新技术的出现引发人们对未来的一些想象是很正常的事情。不光是Sora,自AIGC诞生之日起,一直都在影响着人们对未来职业的想象。这个影响一定是有的,它会淘汰行业中的某一些人,但不会淘汰优秀的记者或创作者。因为我们毕竟还是要用文本去生成创意理念,这是人类需要去做的,只是它让我们的创意变得具象化。对影视行业或传媒产业反而是又有了一个增产增效的手段。
Sora生成的视频。上图由提示词「一只小熊猫和一只巨嘴鸟是最好的朋友,在蓝色时刻漫步在圣托里尼岛」生成;下图由提示词「一个男人在夏威夷热带水域上空定点跳伞,宠物金刚鹦鹉在旁边飞翔」生成。
Q:目前Sora还存在哪些弱点?在实际应用中面临着哪些挑战?
沈浩:首先,我更愿意说以ChatGPT为主的大语言模型本身是一个颠覆性的革命性产品,而Sora只是这个产品不断迭代进化中的一个新的节点,它是ChatGPT这种技术的进化和延伸。
Sora的缺点,除了应用的成本、生成的算力之外,我认为特别要谨慎的就是技术误用问题。所谓误用,不仅是新闻上的虚假信息、伪造信息,还包括人工智能出现伊始就被应用到的电信诈骗、色情传播等犯罪领域。
如果这些数字作品将来对社会价值体系产生了较大的影响,甚至虚幻了一种可能的场景,可能会让人们产生错误的社会认知。所以现在所有大模型在严格限制这些问题,比如裸体、仇恨、种族,当然也包括对某些特定群体的认知上的诋毁,我相信大模型会在这个问题上做到价值对齐。
Q:从Chatgpt、Midjourney到现在的Sora,这些AI技术对于普通人的生活会有什么样的影响?
沈浩:其实技术越自动化、智能化,就会越平民化。过去需要专业人士才能完成的东西,现在很多学生甚至中老年人都会玩了,比如,如今人们手机里下载一个翻译的APP,不需要掌握他国语言就可以走出国门,实现上百个国家语言之间的切换。同样,如果你做自媒体,过去你作为非专业人士想做出电影级的或者比较专业级的视频是很困难的,但如果将来Sora开源了,或者其他公司发布了类似Sora的产品,那这件事就会变得很容易,包括现在很多短视频平台里都有很多这样的内容。
所以我的观点就是去拥抱技术。它并不难,它会越来越成为工具化,能够帮助我们提高生产效率,如果你在创意上有欠缺它会给你创意上的补偿,如果你在内容生产上有困难它至少也能给你提示。但如果你不拥抱它,你可能就真的被淘汰了。
策划:蔡琳
记者:董小娴
文字整理:刘雪洁 蔡琳 柳艳云(实习)