为训大模型不择手段的AI公司,打破了这个古老的互联网协议
2024-02-21
更新时间:2024-02-21 21:56:03作者:无忧百科
北京时间2月16日凌晨,OpenAI发布了文生视频大模型Sora及多个样例视频。相比于此前的类似应用,Sora更加强大,一经宣布便在全球网络世界产生巨大反响,好评如潮,热度不断。Sora仍在快速迭代中,是一个移动的靶子,我在这里作为一名文科(传播学)教授,仅从媒介学角度对Sora做出一些试探性的分析,这些分析也许明天就过时了,因此聊作一时和一家之言。
Sora生成的视频:一位女性走在东京的街上。
Sora:“画出不可画者”(super-media)
此前的ChatGPT 是文生文,Midjourney 是文生图,Pica 和Runaway等是文生视频,Sora 可以基于文字、图像和视频提示(prompts)生成视频,但是相对于此前类似应用,Sora生成的视频时间更长(60秒),可以变换视角(平行或无人机视角)和焦距(微距、特写、近景和远景等)、清晰度(高至1084K)和长宽比,还能根据用户提示依据物理原理对视频中的内容向过去或未来推演,以及表达出如孤独、热闹等情感色彩。
Sora能实现如此强大的效果,技术基础有很多,但最重要的包括基于英伟达NVIDIA RTX的虚拟引擎Unreal Engine 5,它实现了对各种“元素型媒介”的静态和动态的模拟,包括交通场景、物理原理(水、牛奶、云、雪等的流动)和材料表面(玻璃、金属、木材、砖瓦、织物和皮草等)。
人类如何再现云、水、火、土等自然元素,一直是一个极具挑战性的技术难题。彼得斯在《奇云》中引用艺术史学家休伯特·达米西(Hubert Damisch)在《论云》(Théorie du nuage,1972)一书中的论述指出:云如雾如气的特点给绘画带来了特殊挑战,因为它飘忽不定,缺乏边界,让文艺复兴时兴起的“点—线—面”几何透视原理无效。达·芬奇认为,绘画不能忽视如灰烬、泥土和云彩这样的难以表现的物体,它们都是“没有面的体”。
云让我们想起一个古老的哲学悖论(sorites paradox)——多少粒沙子可以算“一堆沙子”?其从量变到质变的分界线在哪里?对之我们根本无法确定。和声音及音乐一样,云的存在体现于其消失的过程中,它流动不居、意义深远却又含混不清,因此云能激发绘画才智,是对创作者如何使用媒介(各类笔、墨、颜料和书写表面)“画出不可画者”、“传播不可传播者”之能力的考验。绘画和摄影中记录云的历史,就是人类努力去捕捉那些既感性又抽象之物的历史。彼得斯认为,云、水、火、土等自然元素能引发媒介实践和媒介研究中的一个基本问题(problematic):在使用现有符号系统和媒介都无效时,我们如何去记录存在于时间之流中的变幻莫测、模糊不清和稍纵即逝之物?这个问题一直困扰着众多艺术家、技术家和研究者
今天,UE5和Sora的出现却将以上问题化为乌有。通过Sora,OpenAI终于大声宣布:看,这个媒介表征难题已经不复存在!这就是为什么我们在OpenAI公布的视频中几乎处处都看到水(地中海城堡边的潮水、咖啡杯中的船)、云(坐在云朵中阅读的青年)和雪(金毛狗在雪中的玩耍)等。
达米西指出,“中国有着一个强大的画云(cloud painting)的传统;与欧洲人相比,中国人并不那么焦虑或意图超越;在中国画中,云多半与山脉和海洋相处融洽,而不是要高于山海之上”。我认为,如“水”一样,“云”作为“没有面的体”,类似于不可编码的默会知识,恰可作为象征中国传播实践和思想的典型意象。今天,既然Sora已经解决了此前“不可表征”的技术难题,不远的未来它也很有可能将一切此前“不可画出和不可传播的”默会知识变成显性知识。这让我们不禁遐思,东西方文化沟通的障碍也许很快会被克服?
Sora生成的视频:白色SUV在陡峭土路上加速行驶,扬起灰尘。
Sora: 世界模拟器(world-modeling media)
有些人高呼Sora导致了“物理规律的消失和现实的消失”,我认为恰恰相反,Sora证明了物理规律的强大和现实的坚韧。
Sora作为一种强大的媒介,当然具有现实建构能力。我们可以根据媒介类型和它们在相关社会中渗透的广度和深度来区分社会阶段:“无媒介的社会”(比如口语社会)、“有媒介的社会”(比如文字和印刷社会)、“媒介社会”(比如广播、电影和电视社会)和“媒介化社会”(互联网、社交媒体和元宇宙和人工智能社会)。在“有媒介的社会”,媒介仅仅是社会的一部分,它的主要功能是表征(represent)现实;但是在“媒介化社会”,媒介成为一种环境包裹着我们。此时媒介就能建构(construct)现实——一个事件或人物如果不存在于媒介之中(不被媒体报道),就相当于不存在。这里我们可以模仿贝克莱“存在就是被感知”的名言说,“存在就是被媒介报道”,或者“存在就是被媒介化(mediated)”。Sora是“媒介化社会”的原因和结果,所以说它建构了现实当然没错。
但Sora的强大之处并非它扭曲了物理规律和真实现实,而是它理解、学习、顺应和利用了它们。Sora背后的原理非常复杂,我作为一个文科教授读了半天技术文档都没特别弄懂,也许我根本弄不懂。但它使我想起了人工智能的先驱之一诺伯特·维纳的提出的控制论。在二战期间,控制论被用来指导计算机捕捉和分析敌军轰炸机的体积、质量、所处的位置、飞行速度和方向等信息,然后这些信息被自动输入高射炮,并根据物理规律从轰炸机过去的位置预测其下一刻的位置,以指引高射炮的自动瞄准和射击。这里,控制论帮助高射炮实现了时空操纵。类似的,Sora 操纵了所谓“时空patches”, 甚至因具有“涌现”(emergence)能力——能够模拟物理世界中的人、动物和环境。这也许就是为什么说Sora具有如易经八卦一样的“一生二、二生三、三生万物”的建构和模拟世界的能力。它也因此被称为“世界模型”(world model)或者“世界模拟器”(world simulator)。OpenAI将这个世界模拟器取名为Sora——它的日文意思是“天空”。我理解为,这里的“天空”指“大气(层)”。正因为有大气层,才有了适合人类居住的地球(世界)。正如大气层是地球的模拟器(constructer/enabler)一样,Sora将成为人类建构各种“小世界”的模拟器。
Sora生成的视频:几只巨大的猛犸象穿过一片白雪覆盖的草地。
Sora:建构元宇宙 (meta-media)
我曾指出元宇宙的本质是数字孪生,包括人、物和环境的数字孪生,从而最终建构出一个与现实世界平行且交互的世界。我们此前用梦境、口语、图画、文字、钢筋水泥建构出各种想象的和真实的世界,包括远古的岩洞壁画、荷马史诗、曹雪芹笔下的大观园以及动画和现实中的迪士尼乐园和环球影城。
Sora 所基于的技术,如芯片算力、算法以及图形渲染引擎UE 5等,都是建设元宇宙的基础设施,因此我认为它的出现是向着元宇宙方向的迈进。我曾将元宇宙定义为:一个由具有强大记录能力和传输能力的媒介支撑的3D网络生态,用户远程登录其中后可以实现遥在(teleport/telepresence),从而能如在网下世界一样在3D网络空间中进行各种交互活动。这个被称为元宇宙的3D网络空间既可以是大写的单数(Metaverse),更应是小写的复数(metaverses)。换句话说,它既可以是“大型元宇宙服务提供商”(Metaverse Service Provider)提供的庞大制作,也可以是普通用户自己制作后在以上平台上免费或收费提供给其他用户的小制作和小体验,或称为“全息体验媒介产品”(holograms)。
在不久以前,为制作这类元宇宙“自媒体”产品,用户还需要使用AutoCAD、Omniverse或Horizon World(类似于2D媒体时代的生产工具Photoshop 或Premiere)等3D工具。和此前古代和现代的艺术高手一样,今天普通人通过简单的文字描述,使用Sora就可以将自己的想象高效和逼真地可视化,创造自己的元宇宙。
因此,Sora出现的意义和500多年前印刷术、100多年前的“火腿电台”(ham radio)、20年前的Web2.0(以社交媒体为代表)的意义是一样的——它们可能弥合人与人之间在拥有元宇宙生成技术上的鸿沟(技术鸿沟),因而可能弥合相应的技能鸿沟,进而可能将所有人都平等地置于仅凭自己的头脑和创意取胜的竞技场上。尽管这一设想可能过于乐观,但我们毕竟向这一天的到来靠近了许多。
Sora生成的视频:一只卡通袋鼠跳舞。
Sora:冷媒介?热媒介?(cold media, hot media)
Sora让我们能简便丝滑地从文、图和简单的视频生成复杂和逼真的新视频,这很容易让我们忽视不同媒介介质在传播效果上的差异。举例说明,一名听众听不懂舒伯特的某个小提琴曲,去问他是何意。舒伯特没有说话,只是拿起小提琴又拉了一遍;此人仍然听不懂,舒伯特仍然不说话,再拉了一遍。此人仍然满脸疑惑,请舒伯特解释曲子的意思。最后舒伯特说,曲子就是曲子,何须文字?然后离场而去。类似的,同样是文字,《六经》精简浓缩,气象万千,含义无穷,而后人对《六经》的注释洋洋洒洒,但具体而狭隘。因此何者意义更丰富?是“《六经》注我”还是“我注《六经》”?由此看,在Midjourney, Stable Diffusion、DALL-E 等文生图和Sora文生视频的转换过程中,是增加了意义还是删减了意义?例如,一位读者认为,阅读《红楼梦》文字版与看电视剧给她以相当不同的感觉;电视剧删掉了原著中很难视觉呈现的细节,少了原著的原汁原味。她说,“电视剧看到的是具体的画面,阅读小说更多是激发自己的思考与感悟。” 这就是为什么《红楼梦》会有许多人百看不厌,甚至去手抄它,珍藏它,考据它,辨析它,争论它,以至于产生“红学”的原因。我们读莎士比亚的作品,百人百议,“一千个读者眼中就有一千个哈姆莱特”,道理也类通。
麦克卢汉区分了冷媒介和热媒介。冷媒介具有低清晰度(模糊性)、高包容度和高受众参与度;热媒介具有高清晰度、低包容性,或者说低受众参与度。文字属于冷媒介,视频属于热媒介。在Sora文生视频的过程中,存在于抽象和模糊的文字中的万千气象也被图片和视频具体化和清晰化了,因此也造成了丰富意义的损失。此时,文字读者就被转化成了视频观众,丧失了能动性和参与性。这显然利弊参半。
Sora:贫媒介?富媒介?(poor media, rich media)
目前看,Sora将对影视制作、广告业、短视频业和大学影视专业的人才培养形成进一步的冲击。以上行业分工精细,环节众多,包括舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务和动画特效等。现在这些环节面临着被精简优化的压力。但我认为Sora并不能完全代替现实拍摄、制作和真人表演。
使用AI建构一个新的现实需要其具有极强大的细节控制能力。目前Sora生成的视频还不能做到完全精确,有的细节破绽人的肉眼就可以识别,例如东京街头姑娘迈步时的左右脚不太自然,人在搬椅子时椅子竟然会漂浮在空中,篮球会穿过篮筐的边筐而过,几只小狗会不断地变幻出更多的效果,人咬了一口饼干但饼干上没有咬痕等;有的破绽通过其他AI能识别,例如有人用谷歌Gemini 分析Sora生成的视频,发现东京的飘雪过于均匀,从而判断其可能是AI生成的。当然,这些问题在Sora的不断迭代中都很快能如破解物理题一样地得到解决。但是目前看,Sora能接受的“提示词”主要是可以被轻松视觉化的描述性文字,但抽象的、概念性的文字或观点能否视觉化,如何视觉化,这是Sora下一步需要回答的问题。
更重要的是,正是文字媒介与视觉媒介(图片和视频)之间的差异让我们作为用户很难以文字提示通过Sora的“人工智能黑箱”来精确地控制和输出我们想要的图片或视频。我们说“一图胜千言”,反过来这也意味着即使是通过“千言”也无法精确达到一张图片更别说一个视频的效果了。比如,在热播剧《繁花》中,90岁的游本昌老师扮演的“爷叔”看到穿上精致西装的宝总就仿佛看到了年轻时的自己。他短短几秒的面部表情和眼神注视,仿佛诉尽了自己一生的悲喜,也看哭了无数人。我很难想象,用多少以及什么样的文字作为提示词才能让Sora 精确地输出“爷叔”如此登峰造极的表演效果。Sora表面的无所不能恰恰再一次证明了如游本昌先生这样的老戏骨对于一部情感剧的不可或缺。
1986年,美国传播学者Richard Daft 和 Robert Lengel 提出了“媒介丰富度理论”(Media Richness)。该理论认为,不同媒介在信息丰富度上有差异,可从四个维度来区分:媒介传递多重线索的能力(例如声音的变化、手势等)、反馈的即时性(媒介使接收者对信息做出反应的速度)、语言的多样性(例如文字、数学公式和艺术表达等)以及媒介的个性化定制能力(例如针对不同受众定制内容)。目前看,提示词文字可以说是贫媒介,Sora输出的视频似乎是富媒介(按照前述麦克卢汉的冷媒介和热媒介之分,其实未必)。然而,《繁花》中的“爷叔”用他有着90多年大上海阅历的大脑操纵自己的数十块面部肌肉和深如海洋般的眼神,对着“阿宝”展现出(可视化)他内心的澎湃情感时,在“爷叔的脸”这一富媒介面前,Sora的视频输出只能算得上非常贫瘠的媒介了。
实际上,基于金宇澄先生的同名原著的电视剧 《繁花》聚焦于20世纪90年代初,讲述了以阿宝为代表的小人物在时代浪潮下抓住机遇、施展才华,凭借迎难而上的勇气和脚踏实地的魄力改写命运、自我成长的故事。剧情充满着引人入胜的欲望、挑战和冲突(人物与自我、与他人和与社会),包括追求 (幸福生活) 、冒险、自我证明、复仇、救赎、蜕变、重生、自我发现等。此剧的人物刻画也相当精彩,每个身处其中的普通人都选择了向商业对手挑战,向技术变革挑战,向个体命运挑战,哪怕失败也不放弃,笑对人生起伏。这些欲望、挑战和冲突都是人类经久不衰的主题, 因而使得电视剧具有了普遍性, 在作者、人物和观众三者之间形成一种共情,导致了《繁花》电视剧的热播和热议。
这也意味着,即使Sora可以高效地和逼真地输出很多个某一类型的长达60秒或以上的视频片段,即使这些视频片段能让某些自媒体或普通用户更便利更廉价地创作,某些类型的视频片段的表演仍然只有像游本昌先生这样的专业老戏骨才能胜任;能将这些片段以符合观众接受心理的方式流畅编织起来、讲述一个如《繁花》一样精彩和卖座的故事的,目前也仍然只能是由专业的讲故事高手通过专业(同时也是昂贵)的设备才能实现。尽管人类创造力的高峰已经被Sora等人工智能技术重重包围,步步逼近,但最高处的红旗仍将猎猎招展,高高飘扬。
Sora生成的视频:在“赛博朋克”背景下,一个机器人的生活故事。
Sora:旧媒介?新媒介?(old media, new media)
自2007年第一部iPhone智能手机发布(“iPhone时刻”)开始,人类的数字内容生产的“视觉转向”(a visual turn)就启动了。智能手机微小而便携,极不利于内容(尤其是文字内容)的生产,而特别有利于内容(尤其是视频内容)的消费。随着智能手机在摄影摄像上的能力越来越强,年轻人的短视频制作和消费能力也越来越强,文字阅读理解和表达能力则越来越弱。此时,文字俨然已经成为过时的旧媒介。
但ChatGPT、Midjourney, Stable Diffusion 和Sora的出现似乎告诉我们,文字并没有老去,而是突然华丽转身,成为“一生万物”的媒介之母。
文字本身就具有多媒体潜能。德国媒介学者弗里德里克·基特勒(Friedrich Kittler)认为,古希腊字母表具有如今天数字计算机一样强大的多媒体能力,能通过单一的“代码”从整体上捕捉、传播和呈现出人类的存有经验。他甚至将使用文字者比喻成坐在驾驶舱里的飞行员或游戏机屏幕前的玩家,可以随心所欲地操纵“代码”表达自己的体验。而“阅读”是“读者从小坐在母亲膝上学会的一种制造‘内在幻觉’(inner hallucination)的技巧。通过它,读者能将文字拆解成音视频甚至气味和味道流媒体。”这也意味着,文字(例如计算机编程语言)实际上是多媒体的基础媒介。
相对于拟音的古希腊字母,中国的汉字更加具有多媒体特性。首先是各种形声汉字,然后是历代文人对形声汉字的创造性使用,如白居易的名诗《琵琶行》“大弦嘈嘈如急雨,小弦切切如私语;嘈嘈切切错杂弹,大珠小珠落玉盘”;王维的“人闲桂花落,夜静春山空;月出惊山鸟,时鸣春涧中”;现代诗人卞之琳的《断章》“你站在桥上看风景,看风景的人在楼上看你。明月装饰了你的窗子,你装饰了别人的梦”。这些诗歌虽为文字,但无不字中有声,有画,有情。在形声汉字、对它们的创造性应用的基础上,再加上叙事性(narrativity)后,文字变成了有情节的故事,因此就有创造世界(text as world)的奇幻能力。
Sora的横空出世告诉我们,即使在“视频为王”的今天,影视业和短视频从业者仍然不能抛弃文字,而要精通文字表达。比如要写出这样的提示词,高超的文字能力必不可少:
“猛犸象。未来几个月谁都可以生成,提示语是:几只巨大的长毛猛犸象穿过被雪覆盖的草甸,它们长而柔软的毛在风中轻轻摇曳,远处的树木被白雪覆盖,壮观的雪山在远处若隐若现,午后阳光透过稀薄的云层,高悬在远方的太阳营造出一片温暖的辉光。低角度的摄像机捕捉到了这些庞大毛茸茸哺乳动物的美丽瞬间,摄影技术精湛,景深效果迷人。”
我们一直认为媒介技术是线性“向前发展的”,“苟日新,日日新”,除旧布新。然而,本雅明认为,时间不是一以贯之的线性连续体,而是充满裂缝和捷径——不妨说充满“虫洞”(wormhole)。通过这些虫洞,历史并非总是以单线展开,而可以以星罗棋布、群星灿烂的方式呈现,“现在”与“过去”的某个时刻之间总是存在暗合。比如过去的时尚(格子衬衣、络腮胡子和喇叭裤)死亡了,无处可寻,但在未来某个时候,它们又突然流行起来。正如有人指出,人类的存在也许是为了引出人工智能、赛博人乃至最终替代人类的硅基生命,我们今天认为已经是旧媒体的,也许会通过虫洞“回到未来”成为未来的新媒体。ChatGPT和Sora作为崭新的新媒介复活和强化了我们以为的旧媒介——文字。
Sora生成的视频:淘金热时期,加州的历史镜头。
Sora:真媒介?假媒介?(true media, fake media)
Sora输出的视频几乎可以以假乱真,是否会造成深度伪造(deepfake)和假新闻(fake news)泛滥?媒体和大众该如何应对?
确实,人工智能技术被用于多模态的内容生产(AIGC)固然可以降本增效,但同时也引入了深度伪造和假新闻的风险。最近美国巨星Taylor Swift就被“深度伪造”出色情内容,引发舆论关注。美国政府尤其关注基于AI深度伪造的假新闻对2024总统大选的干预。通过Sora用户可以用文字描述“某明星或某新闻人物作出某些行为”,并生成逼真的视频,这对新闻真实性和受众认知的危害程度更大。
如果整个信息市场假冒伪劣产品盛行,公众该会怎么办呢?历史告诉我们,在难以获得事实的时候,人们一般会逐渐发明出以下机制来过滤信息:(1)增加信源数量并比较这些不同信源,从中解读出可能的真相;(2)加入到社区中,借助集体智慧来共同分析、解读和判断各种信息可能的真假;(3)从甄别信息本身转移到甄别信源,并凭着对信源的信赖来选择相信哪些信息。
这意味着,当市场上充满着难辨真假的信息时,媒体机构作为信源的公信力将变得更加重要,它们也因此要更加珍惜自己的羽毛。如果自媒体通过AIGC产生很多低质量信息,机构型媒体就不应该将自己自媒体化,反而尤其要坚持自己的操守进行差异化竞争,以更多的更权威的事实来对冲自媒体的虚拟。如果一个机构型媒体,一方面缺乏新闻现场的视觉信息,另一方面却因为要满足视频发布的压力或无法抵御流量的诱惑而使用Sora配上了虚拟的视频,结果让读者/观众误以为真,从而造成误信误传,这首先是这个机构型媒体自身不顾自己的品牌形象逾越了真实与虚拟之间的界限的问题,而不是读者/受众是否具有识别真假视频的能力问题。
对于媒体而言,视频记者和编辑的工作是否会被替代?新闻从业者应该如何适应“Sora时代”?我认为,新闻报道追求真实(facts),而Sora几乎全是虚拟(fictions),因此我认为和chatGPT不同,Sora从本质上它对新闻业应用面不广,甚至只有坏处没有好处,除非新闻业沦为“创意业”。我想,Sora唯一可以被新闻业利用的也许是记者建构在新闻事实基础上的新闻现场的情景再现。
“视频记者”这四个字中重要的不是“视频”而是“记者”。如果记者没有脚力、眼力、脑力和笔力,而仅仅满足于坐在空调房里进行网络内容搜索和拼凑,或者不断使用人工智能炮制内容,那么这些记者在任何时候都应该被人工智能替代。
还需要指出的是,新闻业不能将对“新闻”的追逐异化成对“技术”的追逐。毋庸置疑,新闻业一直以来对技术保持高度敏感,这很有必要。例如在19世纪,路透社和美联社先后争相使用鸽子、汽船、电报和电话等新媒体,其目的尽可能缩短“新闻的爆发”与“新闻为受众接受到”两者间的时间差。我认为,新闻机构的采纳新媒体技术的指导原则应该是“技术服务新闻”而不是相反。新媒介技术如果有利于更好地报道新闻,则应该尽快采纳,如果不利于更好地报道新闻,则应暂缓采纳。在各种“虚拟现实”技术盛行的今天,新闻业应该更加坚守“现实”本身。如果主动放弃自己的“现实”阵地不加区别地拥抱虚拟现实,这是新闻业自毁长城的失败,而不是虚拟现实技术所向披靡的成功。
对于Sora带来的隐忧,管理部门应该如何应对?我认为,技术革新在以加速度进行,管理注定会滞后。让事情更为棘手的是,从平台算法开始到现在的人工智能,由于涉及海量数据、极为复杂的算法以及众多用户与chagGPT及Sora的个性化互动,即使时人工智能专家(比如OpenAI CEO Altman)也无法精确预测和解释人工智能给出的每一个输出背后的原因。这给对AI的规制带来了前所未有的挑战。
Sora目前还没有对大众开放,估计要到美国总统大选之后。Open AI将对Sora生成的视频设置类似于对DALL-E的限制:禁止暴力、色情、盗用真人形象和已知艺术家的创作风格;它还将在生成的视频中嵌入代码以将其与人工拍摄的视频区别开来。但从文字开始,媒介技术就是生产复制品(化身、幻影、鬼魂)的工具,也因此带来了版权侵害和伪造的风险。我们要从技术生产者、政策制定者、新闻媒体、教育机构和用户等多方面共同规制AIGC。人工智能体现了人类的聪明才智,如何扬长避短地规制人工智能,需要人类发挥出相同甚至更多聪明才智。这是对人类智慧的巨大考验。目前来看,Sora还不会对我国带来什么风险。不过我觉得,对新技术的规制永远要基于数据风险防控和人工智能收益之间的平衡。
结语: “天空”虽美,仍需一树《繁花》
加拿大媒介学者麦克卢汉说,媒介是人体的延申。德国媒介学者基特勒对此不同意。他认为,菜刀或至多汽车,也许可以说是人体的延申,但计算机的工作原理跟人体的工作原理完全不一样,因此说计算机是人体的延申就显得人类有些自不量力了。到目前为止,主要的面向普通用户的AI技术,包括ChatGPT、Midjourney, Stable Diffusion、DALL-E、Gemini和Sora等,即使是技术专家在我们普通人面前就着技术文档讲解三个小时,我们也根本不会明白它们的技术原理。AI早已成为技术黑箱,OpenAI也必然是ClosedAI。 所以我以上的所有分析都是一名文科教授都是建立在OpenAI目前公布的Sora视频和它的公开宣称之上的,少不了主观臆测成分。很有可能,2月16日以来我们经历的关于Sora的火爆情形只是OpenAI通过Sora生成一个长达几天的逼真视频。你也许会问,这一切难道是假的?怎么可能?是呀,怎么可能是假的呢?但在我们日益被人工智能包围的深度媒介化社会中,笛卡尔的反问在回响:即使你看到的一切也许是真的,但你如何能排除它是假的的可能呢?—— 你如何排除“缸中大脑”的可能?是的,我不能排除,但因为我有身体,因为我忘不了“爷叔”的脸,我仍然坚信:“天空”(Sora)虽美,仍需一树《繁花》。(作者系复旦大学新闻学院传播学系教授、博导)