史安斌 郑恩:迈入“融合性真实”:文生视频技术对新闻传媒业态的重塑

【专家观点】时间:2024-04-25      来源:申金鑫      

纵观媒介发展史,人类的传播活动不断探索扩展感官本能的媒介,以期实现更高效的意义建构。与其将传播研究视为理论的演进,不如认为它是一部科学技术研究(STS)意义上的媒介技术进步史。技术进步不仅推动了传播模式的创新,也促进了相关实践和理论的发展。作为媒介进化论里程碑的梅里尔和洛温斯坦(Merrill and Lowenstein)的媒介发展模型理论,认为媒介的发展和传播规律遵循一个“精英-大众-分众”的传递模式。该模型阐释了一个理解媒介如何适应社会变迁和技术发展的框架,强调了媒介演化过程中受众角色的变化。时至今日,该理论对于阐释数字化和网络化时代媒介技术演化如何推动受众体验的分散化和个性化方面依旧具备阐释力。然而,我们不能单纯地陷入技术决定论泥沼,而是应客观评价技术在提高传播效率和多维提升人类感官主体性方面的作用。同时,需要重新审视媒介技术演化与传播实践创新之间的社会文化联系,重视其对传播本体论的探讨。


本文聚焦于以Sora为代表的文生视频技术现象,重点探讨了其对新闻传媒业的重塑功能。基于Transformer架构的Sora模型代表了文生视频的最新应用,它的出现也是生成式人工智能(AIGC)的重要节点。Sora的“心智涌现”带来了突破“费曼极限”的可能性,技术和数字鸿沟的填平将加快“世界建模UGC(用户生成内容)时代”的到来。文生视频技术对新闻传媒业的重塑主要体现在“融合性真实”和“去介质化”的业态重构。从国际传播的角度来看,Sora所重塑的“数字共情”新业态为推动实践跨越“数字巴别塔”、构建“全球南方”数字社群的转文化传播带来了新的契机。


No.1

Sora模型与文生视频的兴起


文生视频,作为GPT-4模型功能在视觉传播领域的延展,代表了一种能够通过AI生成视频内容的先进机器学习模型。它基于深度学习技术,特别是自然语言处理(NLP)、计算机视觉(CV)和语音识别(ASR)的融合,利用文本、图像、音频、视频等多种输入生成新的视频内容。目前,循环网络(RNN)、生成对抗网络(GAN)和扩散模型(Diffusion models)是文生视频领域内较为成熟的模型思路。


作为行业领军者,“开放人工智能”(Open AI)公司通过结合GPT和DALLE的技术路线,进行了广泛的研究和创新,成功开发了Sora AI视频生成模型,在龙年春节期间发布后再度引爆全球舆论场。Sora能够生成各种时长、长宽比和分辨率的视频,内容包括精细的场景、生动的角色表情和复杂的镜头运动,同时支持现有视频的扩展或缺失帧的填补。Open AI将Sora定位为一种世界模拟器,认为它在构建物理世界的通用模拟器方面具有广阔的前景。模型的发布预示着,到2026年,全球生成式人工智能市场规模有望达到981亿美元。


Sora模型基于Transformer架构,采用前沿的多模态方法处理给定的文本提示和空间时间信息,从而生成与指令相符的视频内容。Transformer架构的两大优点为Sora提供了强大的支持:首先,它能将视频内容分解为3D patch,类似于如何通过DiT技术处理图像,这种方法不仅打破了传统的分辨率和尺寸限制,还能够综合处理时间和空间的多维信息。其次,Transformer模型遵循OpenAI的尺度定律(Scaling Law),表明模型的性能随着参数规模的增大、训练时长的延长和训练数据集的扩大而显著提升。


与同类竞品相比,Sora模型展现出了其独到之处,与Gen-2、Emu Video等同类产品形成鲜明对比。传统模型通常依赖于CLIP技术训练生成的文本-图像对,随后引入时间维度对视频进行标注,这种方法可能导致视频数据质量的不一致性。相比之下,Sora通过采纳更为丰富和多样化的视频数据集,并在此基础上应用DALL·E3的“重绘要点”(re-captioning)技术,将其扩展到视频领域,极大地丰富了视频内容的多样性和创新性。


在产品性能方面,Sora模型在多个关键维度上实现了显著突破,包括视频的保真度、长度、稳定性、一致性、分辨率及文字理解能力。Sora模型通过深入分析和学习海量视频数据,能够识别并模拟视频内容中的物理规律,展现出对现实世界复杂性的深刻理解。Sora的数据驱动学习机制,特别是其在函数逼近方面的能力,使其在识别和模拟复杂系统的微观模式方面表现出色。这种能力被认为是神经网络模型中的“涌现能力”,它是指模型通过分析数据的高维结构,揭示出系统的内在规律和特性。这种“涌现性”表现为系统各组成部分的相互作用、互补和制约,共同激发出整个系统的独特行为和独有的特征。


No.2

“费曼极限”与“心智涌现”:Sora对产业及未来影响


在生物学、人类学和经济学等复杂系统领域,很难找到能够与数理物理学中那样精确的简洁数学理论。这种现象称为“费曼极限”,原因是这些系统的复杂性远超我们的认知能力。机器学习模型展现的涌现能力,为我们突破这一极限提供了可能。据预测,到2025年,人工智能将贡献全球数据内容的20%,涵盖文本、图像及视频等多个领域,对内容产业造成巨大的冲击。信息流平台将可能经历重大的变化,用户可通过AI直接创造个性化内容,数字内容生产的现有格局因此被重新定义。本文认为,Sora将对以下行业及领域产生重大影响。


(一)短视频及其衍生领域的转型


在数字化时代背景下,Sora技术在短视频及其衍生领域(如广告、创意和音乐视频)的应用,标志着内容创作与供给模式的根本变革。根据Gartner公司的研究显示,通过利用Sora的文生视频技术,内容创造者能够实现内容生产的自动化和个性化,其中尤以流量热点驱动的内容创作最为显著。例如,通过简单的文字输入,Sora能够自动生成与用户偏好高度匹配的短视频内容,从而大幅提升内容生产效率和质量。此外,该技术在减少设计和创意行业客户需求“翻译”成本方面发挥了显著作用,如针对设计行业应用Sora的案例研究显示,客户能够直接通过文字描述,实现对复杂创意内容的快速原型化,从而显著提高设计流程的效率和客户满意度。


(二)长视频和影视动画产业的创新


对于长视频和影视动画产业,Sora的应用正开启新的叙事和制作可能性。传统的影视制作过程不仅成本高昂,而且时间消耗巨大。然而,Sora技术的引入,通过自动化特效制作和虚拟电影制作技术,不仅大幅降低了制作成本,而且缩短了制作周期。以OpenAI发布的Sora原创未来科技电影预告片《穿越沙漠星际》为例,Sora可以切换镜头,包括特写、跟踪和空中镜头,以及改变镜头构图,这不仅为导演提供了丰富的视觉参考,还大幅缩短了从前期制作到后期特效的时间。


业界普遍认为,Sora是AIGC发展的又一个“奇点”,主要表现在它已经初步掌握了“电影语法”,能够做到“未经提示就能进行镜头切换”。虽然目前看来,文生视频对电影制作尚未产生实质性的威胁,但也有知名制作人在Sora发布后决定搁置其8亿美元的工作室扩张计划。


如编剧工会等行业组织所担心的那样,“我们可能正在目睹电影向‘迷因’(meme)的转折时代”——叙事将被简化为陈词滥调,真挚的情感被即时满足所取代。“自主电影”(Autobiographical Cinema)的泛滥将对深度电影形成挑战,这将是当代电影史的一个关键转折点。


(三)游戏产业的变革与VR/AR技术的突破


在游戏产业,Sora的应用不仅仅局限于游戏场景的生成,更在于如何以高保真度渲染环境,以及如何模拟玩家操作游戏角色的情景。例如,Sora被用于《我的世界》游戏中,通过AI模拟玩家在游戏世界中的操作,实现了无需人工干预的自动运作。这一突破不仅展现了Sora在游戏设计和开发中的潜力,也为未来游戏产业的发展方向提供了新的思路。同时,Sora在虚拟现实(VR)和增强现实(AR)领域的应用,通过其强大的场景生成和细节捕捉能力,为构建高质量的虚拟世界和资产创造了新的可能,进一步推动了物理世界与数字世界之间界限的模糊。



No.3

Sora对新闻传播的实践与理论重塑


以Sora为代表的文生视频大模型将开启“世界建模UGC时代”,这意味着任何技术鸿沟都将被科技进步所填平,人类的想象力便能创造出不同的“世界模型”。20年前,社交媒体将互联网2D内容生产带到PGC(专业内容生产)时代,再由PGC走向UGC(用户生成内容)时代。自2022年以来,AIGC的持续发展,特别是由文本生成到图片生成到近期的视频生成,“世界建模UGC时代”指日可待。这也意味着,AIGC的一次次“奇点”突破逐步构建了虚拟世界和现实世界的互动,若强化人工穿戴设备(硬件)技术,人脑和机器融合在一起的概率将大幅提升。搭建如斯蒂芬森在其经典作品《雪崩》所创造的元宇宙将成为现实。“数字化身”(Digital Avatar)为数字主体的沉浸由三维逐渐面向全景模式打下了基础。


VR之父拉尼尔(Lanier)将由视频构成的虚拟世界称为“人类可以逃避的独立世界,它将代表一种‘文化新宗教’,是人类未来居住的数字混合现实”。以Sora为代表的文生视频技术的兴起,对传统新闻传播的实践和理论产生了深刻的解构效应,具体表现在以下几个方面:


(一)在线的“叙事新闻学”:“时空临场”的主观体验


随着文生视频技术的发展,传统新闻报道的客观性和中立性正遭遇前所未有的挑战。在数字化身能够随意穿梭于不同历史和地理位置的背景下,新闻报道的时空限制被彻底打破。这种技术不仅改变了人们获取新闻的方式,更重塑了新闻传播的本质。例如,通过虚拟现实技术,用户可以以第一人称视角体验历史事件,这种沉浸式体验与传统通过文字或影像传达的新闻报道形成鲜明对比。在此情境下,新闻的接收者不再是被动的信息消费者,而是主动的体验者,他们的主观体验成为信息解读的核心,这对新闻的客观报道原则构成了根本性的解构。


以Sora为代表的文生视频技术使得在线的“叙事新闻学”(narrative/literary journalism)成为一种趋势。“叙事新闻”本身的素材可能是作者的一个灵感或某个久远的想法,它在本质上是一种“意识的流动”,与基于传统新闻要素的客观新闻有着本质的区别。前者,更像是一种新闻戏剧和演出,其本质主要不在于对真实信息的掌握,而更接近于一种“心理疗愈”。文生视频技术将使创作者脑海中的想法更为直接地呈现为高还原度视频,此类视频的清晰度与真实视频甚至无二,这使得艺术创作中最核心的“灵感变现”有了便捷的输出。同时,它也打破了新闻“在场”(presence)的传统界限,为数字时代的“叙事新闻”创造了可能。


“叙事新闻学”认为传媒业与其他艺术、娱乐的形式在本质上是一致的,如它们将听众/观众/用户带入另一个世界——通过远程旅行抵达想象的最深处。如穿越小说,将受众传送到时空无限遥远的场所,而行旅者的思想和意识随环境的改变而产生无限联想。与古老的部落仪式空间相仿,叙事空间是一个建构的社会心理场所,它是一个“阈限世界”,使受众一起进入小说、戏剧、电影或游戏模拟的虚构世界。Sora技术将叙事这一抽象的内容通过算法读心转化成生产式视频,它与元宇宙世界的新闻生产有一定的相通之处。在“第二人生”(SL)世界中的叙事新闻,它们因虚拟现实的形态,更具备意志、情感传递的功能。它是传统新闻业走出新闻编辑室的一个最新例证。创作首先会考虑戏剧性叙事的运作,情感动员的力量如何依赖于角色动机、情感结构、情感效果得以实现,故事结构、时间案情和情感效果如何打动人心获得共鸣,成为SL新闻传播重点考虑的维度。


文生视频的出现会使得未来新闻生产的仿真感增强,创作者的灵感涌现。基于高还原度的视频重现和虚拟现实技术,传统的新闻真实性、客观性将面临消解。基于意识控制和灵感变现的超仿真性,文生视频的新闻脚本将获得一种戏剧所达到的历史效果,它是一种主动建构的新闻,也是建构新闻学(Constructing News)最新的发展阶段。在此新阶段,新闻不再仅仅是传递事实,而是成为一种深度参与和情感共鸣的体验。职业记者或者内容创造者能够将基于心理全景图案的视频新闻以视觉系叙事的方式使得新闻构建达到新的高度,而其未来追求的历史共鸣、情感获得、价值认同以及心理疗愈将超越新闻文本生产的范畴,而接近于文学、戏剧、神话创作。技术演进与叙事新闻相融合,为我们认识未来新闻业提供了全新的视角。


(二)传播多模态网络:超越主客体二元论


电影《头号玩家》(Ready Player One)揭示的未来人类的生存图景,其场景是基于科学技术对人类主体的反身思考。它既平行于现实世界,又独立于现实世界,是映射现实世界的在线虚拟数字世界。人类不但面临着虚拟与现实的二重世界,且在进一步的将来,还可能面临技术反身(如虚拟视频超越现实世界的现象)所带来的问题。这意味着,虚拟比现实更加真实,虚拟比现实更加沉浸。这与传统传播学基于现实主义的理论架构相去甚远,那么,虚拟存在的主客体关系何为?可以推测的是,未来的数字世界将是科学技术、人类主体与社会文化“你中有我,我中有你”的传播境界。基于主体、客体、介质、环境、文化、心理、现实、虚拟、区块链相融合的传播网络将完整展示传统传播模式论所忽视的“不可知论”的力量,这使得传播学者不得不重新审视构成传播多模态网络的所有人类和非人类实体的关系,而不仅仅将视角局限于人类或社会本身。


在此,高还原度、全息的文生视频将是链接未来数字社会(如元宇宙)的重要路径。一直以来VR虚拟现实和AR增强现实最希望实现的是主客体融合的全息影像,其中视频形态和内容是最主要的部分。以Sora技术为代表的文生视频除进一步加强其高还原度影响和质量外,它还试图完全打通语言(文字)到视频的通路,这意味着原有的视频生产的模式将被颠覆,它将个体心智的内容转化成视频进而进行精准传播。它也被视为未来基于脑机接口,甚至实现“意识流”与“意识流”对接的一种前期尝试。随着数据模型的积累,由文字产生视频内容的普遍性意义会更加精确,加以一定规模的数据投喂,人际传播以及大众传播的“文-心”通路将被极大拓展,由“文以载道”到“文以载智”再到“文以载心”的传播实践将被实现。


“超人类主义”的概念最早由英国生物学家朱利安·赫胥黎于1957年提出。人类将在无止境的技术进步中超越现有生命的局限,进入一种超越自然生物条件的生命状态。技术迭代会像几何级数增长,从而使人类进步的速度远超自然演化的速度。随着脑机接口、量子力学和人工智能的技术迭代,以Sora为代表的文生视频技术可能在技术上达到高精度仿真或模拟人类所需的各类必要条件,从而实现基于视频生产模型的“心智上传”(mind uploading)。心智上传是一个探讨将人类意识或心智从其生物学基质转移到人造基质(如计算机)的科学和哲学概念。从功能主义角度看,心智状态由其功能或作用定义,而不是由其物质构成定义。如果一个人工系统能够复制大脑的功能,那么理论上,它也能复制心智。对此观点深以为然的有著名功能主义倡导者希尔勒里·普特南(Hilary Putnam)和丹尼尔·丹尼特(Daniel Dennett)。进一步而言,心智上传的理念与超人类主义的哲学旨趣颇为相同。在超人类主义者看来,数字技术的发展对于颠覆传统哲学本体论的主体与客体单调二元论是一种必然的路径,在他们眼里人类的后代将摆脱硅基生命的物理身体限制,将意识/意志以数字化模式上传到计算机上从而实现灵魂永生。由此,超越主客体二元论,形成传播多模态网络将是讨论未来新闻传媒业的技术和哲学本体论的重要趋势。


(三)“心智上传”:“加冕消解”与“去介质化”的传媒业


一直以来,新闻研究的前提是基于“媒介”的信息传播活动。当“媒介”这个形式被诸如“用户临场”等技术演进所逐渐消解或者式微时,我们会更清醒地去认识“新闻生产”的本质究竟何为。辛格尔(Singer)认为,“验证和解释”(verification and exploration)是新闻业的本质。布伦南(Brennen)进一步强调了新闻事实的混乱性和不确定性,指出它们常常依赖于解释的角度。


在这一框架下,新闻被视为一种文化生产过程,其中记者通过验证和阐述信息,维护了特定的意义、符号、象征系统及意识形态,从而拥有了作为公共领域事件发言人的“文化权威”。这种由记者或新闻机构“加冕”的信息生产模式,长久以来构成了传统新闻业的基石。以上两个学者的观点代表了主流学界对新闻业生产的本质的理解,即由记者(机构)加冕的信息而形成新闻,这些概念适用于传统新闻业。


随着Sora技术的兴起和“世界建模UGC时代”的到来,新闻传播的模式正在发生根本性变革。Sora技术不仅推动了新闻内容的生成式创新,也为去介质化的新闻业带来了实质性的技术基础。在此,新闻内容的创建过程不再仅仅依赖于记者的“加冕”,而是转向了用户参与和算法生成的模式。这也意味着,新闻业的去中心化进程加快,公民与职业记者的边界更加模糊,信息生产的普遍性得到加强,共创新闻内容成为可能。这将加速新闻传媒业从传统的媒介转向基于意识流的新闻传递,这将减少信息传递过程中意义的部分失真。


另一方面,“算法”是主体(人类)与客体(机器)的一种心智交流,通过数据和意义的不断交换建构,最终形成符合用户意愿的“合意新闻学”。表面上看,基于算法推送的数字新闻是受众选择、建构的新闻,它似乎弥补了控制论被诟病的理论缺陷——对受众“使用与满足”的回应。但“算法新闻学”本质上是由客体所计算和控制的,它的基础逻辑是基于特定程序设计的大数据库,通过统计学的数据分析而进行的新闻控制,从而实现了数字时代“看起来很美”的主客体交融。计算传播科学中的“心智上传”是假定可以将心智转化为“0”和“1”的二进制信息形式并上传至与人脑异质的载体(如硅基的计算机)中,这实际上已隐含地假定心智是基质独立的(因此是多重可实现的)和可计算的。在这个数字空间中,作为精神之我,即数字化身和作为物理之我的身体实现了“身心分离”。基于“脑即计算机”“心智即软件”逻辑的计算功能主义,尽管它受到具身心智理论派的强烈批判,如与功能主义哲学家持相反意见的梅里尔·庞蒂(Maurice Merleau-Ponty)和弗朗西斯科·瓦雷拉(Francisco Varela),他们强调了心智和身体之间不可分割的联系,主张心智过程与其身体和环境的互动密切相关。但对新闻传媒业而言,计算功能主义将使机器(数据大模型)和信息接收者(受众)直接形成一种闭环的新闻制造或信息制作,它的跨时空性是媒介去介质化的关键一步。


基于Sora等文生视频和AIGC的进一步发展,未来的新闻业是一种“双方同意幻觉”的沉浸式交互。它与新闻数据库、信息铲工(Information Spade)一道构成“合意的数字新闻”模式——即将意识融于虚拟新闻的制作。


(四)“巨型拟态”:新闻真实性与客观性的消解


以Sora为代表的文生视频预示着数字新闻的虚拟化,进一步模糊了真实与虚拟的界限。新闻真实性是传统新闻学的基本原则,新闻报道的权威树立在于呈现真实,至少是为还原现实做出最大努力。计算机科学的巨擘艾伦·凯认为“所有的新闻都是一种模拟”。换言之,每条消息都是某种想法的模拟,它可能是具象的或抽象的。一名新闻记者使用生动的语言重构事件,电视新闻工作者“编辑”一个示威的画面,甚至新闻组合可以使用演员和布景来完成模拟新闻。AIGC的加速发展强化了基于模拟和新闻事件的更为交互的方法,这也意味着通过真实新闻的事件、图片和话语,利用全息文生视频甚至未来的人机交互的新闻触景,它一定是基于指令和事实的结合。


虚拟数字技术对新闻真实性、客观性的消解是更为隐蔽的。它位于机器深处,模拟的隐喻隐藏在算法内部。“脸是真的,心是假的”,在虚拟数字新闻情境中“控制真实”与生动的现实主义无缝对接,但其关于时间、动机、因果关系的序列存在于基于表面真实的机制中,是一种深层的控制。如鲍德里亚所言,从符号学表征视角来看,新闻报道不一定是真实的,它很像对真实的模拟。这里的模拟预设了编程代码所建构的“意识形态”,以便接近于真实的面目,隐藏其深层的控制本质。从这个意义上说,虚拟新闻扩展了新闻记者运用符号系统的能力,用更为“过滤”的办法建构我们对周围世界的看法,它可以被认为是具备某种意识形态的。


未来的数字新闻业,将成为一种更高级的符号学说服形式,一种新的感官修辞。在虚拟现实时代,“声音字节”将被“体验字节”取代,用户将沉浸于鲍德里亚所说的“巨型拟像”之中。这种基于VR和AI增强的虚拟新闻,预设了编程代码构建的“意识形态”,隐藏其控制本质的深层面,构建了一个比真实更真实的新闻客体,这将是数字时代控制论的新渗透。


(五)跨越“数字巴别塔”:构建“全球南方”的“数字共情”


从国际传播的角度来看,Sora代表了一种新兴的、以技术为核心驱动力的跨文化传播媒介。它的出现预示着国际传播将从传统的静态“跨文化”模式转向一个动态化的“转文化”模式。通过利用生成式人工智能技术,Sora为“全球南方”与“数字南方”提供了新的对话平台,有利于其实现国际传播的价值提升。尽管“网缘政治”和“数字巴别塔”现象对国际传播构成了一定的挑战,但根据现有技术,Sora在国际传播路径上非常符合“第三文化人”与“Z世代”青年群体的价值偏好,为中国提升国际形象、贡献中国智慧提供了由技术赋能的重要机遇。


正如数智华流中以TikTok、Temu等“四小花旦”的成功案例所示,利用Sora的技术进步,提升与全球“Z世代”的互动,以及通过“数字丝绸之路”推动信息自由流通,展现了中国在全球化进程中的“全球中间地带”角色。在“数字丝路”的“搭台唱戏”的格局下,构建更广泛的媒体交流与共进的“统一战线”,推动“平台世界主义”向纵深发展。


在技术后冲(Techlash)的背景下,以Sora为代表的视频平台有潜力打破以英语为中心的西方传播格局,使得以中国为代表的“全球南方”能够更深入地参与到国际传播的格局重组中。目前我国在文生视频领域处于加速追赶状态,因为语言的通用性原因,英语在大数据和大模型的积累方面有着天然的原发优势。但未来视频和虚拟技术的加速发展,将使语言不再是全球公民的交流障碍。未来“数字沟通”的愿景将由以单一语言为交流载体的传播形态转向图像、视频甚至意识传播——最大限度还原“人”与“人”精神交往的本质。如果新闻活动无限贴近新闻本体的意识本性的话,新闻更像是人与人之间的一种意识(意志)交流。“新闻活动是人类用来构建共同精神家园的手段,新闻活动是人类用来建立精神关系、实现精神交往的一种特殊手段。”从这个角度来说,Sora技术能在新闻传媒业态本质即“意义传递、意识传播和精神交往”的实践中另辟蹊径


也正基于以上逻辑,中国作为东方文明的代表,曾因语言技术等限制未能实现与自身文明属性所适配的全球媒介形象,中国传统文化中大量的优秀内核都未得到有效放大。同时,基于中华文明特色的一些特有的文化现象因文化差异未能与全球同步传达,甚至形成了国际传播中固有的认知偏见。借助于文生视频带来的发展契机,以符合全球化浪潮的视觉传达新形态来多视角、无限化传递先前因语言局限而无法达成的传播效果。


其中,人类的普遍情感和价值如真善美,爱、喜悦、悲伤、恐惧、怜悯等都是人性相同之处,Sora技术作为全真式视频代表,通过其作为传播载体能更好地守望人性,以转文化的传播形态实现全球化的移情和共情,让更多文化/文明跨越地域、政治、意识形态的偏见来更深入理解、认同和传播中华文化的优秀内核。这也是更有效地贡献“公共文化产品”,传递“共同善”(common good),有效提升国家共情的“暖实力”的重要契机。在文生视频技术赋能全球南方,“转文化”成为国际传播新常态形势下,以中国为代表的南方国家从边缘走向中心的“反向回流”将引领跨越“数字巴别塔”障碍、构建数字南方社群、打造“数字共情”的国际传播新潮流,推动建立更加公平公正、普惠包容的国际传播新秩序。


No.4

结论与讨论


1922年,李普曼在《公众舆论》中提出了“拟态环境”(Pseudo-Environment)的概念。他认为,经由大众传播活动形成的信息环境,是对现实世界的再现,人们生活在拟态环境所构建的“象征社会”之中。一百年后,“拟态环境”在“文生视频”的语境中得以实现。Sora技术的媒介演进,使得传播时空得以打破,虚拟和现实的边界日益模糊。


自美国社会评论家凯伊斯(Ralph Keyes)提出了“后真相时代”这一概念后,加上虚拟现实技术的不断发展,传统“新闻业的终结”的呼声重现。“后真相”这一术语最初用于描述当代美国社会的各种文化病灶,如侵蚀事实、祛魅真相的文化现象。自2016年被《牛津词典》“册封”为“年度热词”之后,它更多被理解为后现代背景下,以解构普适原则为诉求出现的“伦理的阴阳魔界”。


在这一背景下,不论是讨论“新闻业的终结”还是后真相、后事实的问题,学界都必须面对一个根本问题:在当前的技术和社会文化环境下,“事实”或“真相”是否可能?这也关系到维系新闻两个核心命题,即真实性和客观性原则。尤其是随着信息技术的发展,新闻传播业正经历着一场“去介质化”的变革,这不仅使物质与精神、主体与客体之间的界限变得模糊,也挑战了依赖于职业记者或媒介机构通过事实核查或验证来维护真相的传统立场。


具体而言,Sora等文生视频大模型的兴起极大地推动了基于虚拟与现实之间的新闻传播场景的发展。本文认为,未来的新闻业将呈现“融合性真实”的特征,这种“具身新闻”的本质是由物质现实和虚拟数字共同构建的合意事实,不再仅局限于传统的客观实证主义,而是代表了一种多元主义或相对主义的视角。这种新闻业态超越了传统的现实-虚拟二元论,预示着一种全新的真实性重构。


“融合性真实”的概念主要来自虚拟技术进步对于传统真实性的冲击。它指的是通过技术手段融合多种信息来源和呈现形式,以创造出既真实又具有沉浸感的新闻体验。这种体验旨在通过增强的视觉和感官元素,使观众能够更深入地理解和体验新闻事件。在以Sora为代表的文生视频技术的加持下,“真实”不再仅仅是对事实的简单陈述,因为由文到视频必然涉及机器的“算法转译”过程,这个过程与传统的新闻业一样无法做到绝对的真实、客观。“融合性真实”意味着以算法、模型或数据训练为驱动的AIGC技术离不开计算机这一客体的内容生成,这也就先验地决定了未来新闻传媒业将更受制于“算法意识”这一经大数据投喂而产生的“AI意识”,实现完全真实或绝对真实将是不可到达的乌托邦。


本文之所以再度抛出真实性概念,是因为在媒介技术的深入演化背景下,“真实性”可以被理解为信息和经验对其来源或来源的真实程度。例如,如果一个虚拟对象或环境准确地反映了它所基于的物理世界,那么它就可以被认为是真实的。同样,如果化身准确地反映了创造者的特征和行为,就可能被认为是真实的。传统的新闻传播学科关于“真实性”的探讨是基于现实性的。也就是说我们讨论一个事物是否真实几乎等同于这个事物是否是现实中的事物。关于“真实性”的概念和认知是基于人们对于现实世界的理解。进一步而言,真实性的认识是基于人类能够通过感官器官能够感受到的现实世界,如眼睛能够看到,耳朵能够听到,鼻子能够闻到等。但对于人类感官器官能力以外的事物,以及一些宇宙能量、信息、暗物质等的存在是否是真实性的存在呢?对此,量子力学等前沿科学早已探讨过此类问题,如薛定谔的猫、波粒二象性等实验,本文不再赘述。简言之,真实并不是客观的,它的存在也可能因为人们的观察、意识的变化、不同人的观察而发生变化,更进一步说世界就是一场虚幻的意识外现。从这个意义上说,现实的真实性概念早已被量子力学的发展所推翻。


基于以上判断,为保有传统意义上的真实性概念的最大公约数,在讨论文生视频的“融合性真实”框架时,其“真实的坚守”可以是基于事实的报道与核验,即报道的核心仍是基于可验证的事实和数据。这些事实构成了报道的基础,确保了新闻内容的真实性。此外,真实性还可以理解为坚持客观的视角和最大限度重新模拟真实世界的环境和情境。如前文所述,受制于算法/技术本身的局限,使用高还原度的视频技术虽然能够提高新闻叙事的吸引力和沉浸感,但这些增强效果也不可避免地会构建一个超越实际/现场发生的视觉环境——这种增强可能会误导受众。同时,算法的生成来自人类集体数据的不停训练,它对特定的事件/价值存在一定的技术偏见和刻板印象,这使得其在生成视频时会通过音乐、色彩以及镜头剪辑来强化某种特定的新闻情绪,这种情绪化的叙述也会影响到新闻的客观性和中立性。


卡斯特(Manuel Castells)认为,虚拟技术导致了“具身交流”这种新形式的兴起。它有潜力创造一种新的真实性形式——“虚拟世界中的真实性”。这种真实性糅合了创作者的内容输出偏好和机器算法特定的意识框架,而形成一种“人-机”共创的“融合性真实”。可以预见,以文生视频和AIGC为代表的虚拟技术,将模糊现实与虚拟的边界。它在虚拟空间中呈现出一些真实的意识和沟通,这与未来人类的“数字化身”在数字虚拟世界中的生存——一个与物理现实世界并行的虚拟世界(现实世界的隐喻)的情境极其相似。


未来像元宇宙这样的“去介质化”情景可能并非数字新闻业的最终形态,但Sora所展示的高度逼真的文生视频创作将重塑“新闻介质”的概念,新闻内容可能被无脚本的3D沉浸视频所替代,更可能被“用户临场”和“时空到达”所取代。这种变革将如何影响新闻业的生产和消费模式,为未来的新闻业研究提供了新的视角和挑战。


一直以来,传统的传播理论研究具有几个先验的逻辑:一是传播行为的发展是以媒介为载体的,而媒介通常被认为是人类若干感官功能的延伸,通过媒介来传递意义/符号;二是传播理论具有一定的二元论倾向,即专注于以客体为倾向的传播效果研究或侧重于以主体为倾向的受众选择理论;三是以实证研究为主体的传播理论解决的是少数关键变量的线性研究,尚未涉及主客体交互、科学技术/社会文化交互的多模态传播网络结构。此类固式化的研究逻辑将在Sora这样的文生视频技术面前显得理论不足。


以Sora为代表的文生视频的兴起应不仅仅将其看作AIGC的一种技术发展,更重要的是数字化生存对于哲学本体论的主体与客体都有着颠覆性的想象力,这对于大部分社会学科基于康德以来的二分视角都提出了新的要求。特别是建立在大众传播媒介特有的时代环境而发展起来的传播学,在面对新的传播情境时将面临理论阐释失效和新的学科身份危机。


当“赛博迷思”进入到AIGC的文生视频阶段,我们正在目睹(体验)一场空间/非空间、物理实体/数字存在、真实/虚拟、结构/非结构、介质/非介质、科技/人文、物质/精神交往的混杂景观,任何二元的阐释学、社会学、人类学、哲学、传播学等都将在其面前显得苍白无力,其时空的复杂性呼唤一种新的多模态范式的出现。新闻传播学和新闻传媒业,在这场由AIGC引领指数级的理念和实践变革中,是否能开辟一片新的“天空”(Sora的日文原义)?


(文章原载于《传媒观察》2024年第4期“深观察”专栏,注释从略。学术引用请参考原文。)



作者:史安斌,郑恩

编辑:申金鑫



分享: