“人类提供了坐标,机器提供了地形,由此生成的图像,往往位于人类逻辑的盲区和机器统计的边缘。”
——耿弘明:《不可预测:人工智能艺术的偶然性美学》,《北京电影学院学报》2025年第12期,页12-20。
本期评议:陈新宇 梅剑华 黄典林
文本摘选:罗东
在当代,书籍之外,刊于专业学术期刊(集刊)上的论文是知识生产、知识积累的另一基本载体。
自2025年8月起,《新京报·书评周刊》在图书评介的基础上拓展“学术评议和文摘”这一知识传播工作,筹备“新京报中文学术文摘服务所”,与期刊(集刊)界一道服务中国人文社会科学事业。每期均由相关学科领域的专家学者担任评议人参与推选。我们希望将近期兼具专业性和前沿性的论文传递给大家,我们还希望所选论文具有鲜明的本土或世界问题意识,具有中文写作独到的气质。
此篇来自2026年第7期(总第22期)。作者耿弘明论述了“偶然性”在艺术史中的角色。一部现代史是人类追逐理性(如清晰结构、线性时间)的历史,而不可预测之物往往被视作意外插曲,“偶然性”遂被悬置于“理性”主线之外。然而,正是这些偶然,始终塑造着艺术的进程。尤其进入人工智能年代,一种新的创作形态已然诞生:当用户向AI输入明确的绘图指令,人与机械随机碰撞,图像变得不可预测,甚至“离谱”到超出感官习惯。新的故事,也由此展开。
以下内容由《北京电影学院学报》授权转载。摘要、参考文献及注释等详见原刊。
作者|耿弘明
一、作为可能世界与不可预测的偶然
斗室之内,一位计算机艺术家端坐在计算机前,正在使用人工智能(AI)工具生成艺术作品,面对着白色的输入文本框,他试图将脑海中那个流动的、感性的、充满私密色彩的视觉意象,挤压进语言的模具中。
他知道,提示词越详尽越好,提示词越详尽越可控,提示词细节越能获得自己想要的效果。于是,他输入了大量的参数、代码和语词“赛博朋克风格的雨夜”“霓虹灯倒影”“忧郁的眼神”“精细的皮肤纹理”“--ar 16:9”“--stylize 750”“--chaos 0”“High Contrast”“Sharp focus”……每一个词都是抛出的锚,试图在那个无形的潜在空间中固定某种形状。然而,在敲击键盘的瞬间,他却感到一种根本性的无力——语言、数字在AI 工具面前是贫困的。
按下“生成”键的那一刻,屏幕上旋转的图标或进度条,将时间拉长为一种纯粹的“等待”。这种等待带有一种宗教般的焦虑:我是在祈祷,还是在下注?接着,图像显现了。首先是再认的快感:是的,那是雨夜,那是霓虹,它们是我艺术目标的对应物。我的意向性似乎得到了满足,世界按照我的指令重组了。
但紧接着,是惊异与陌生。
图1 :常见的人工智能生成的奇怪的手。本图来自原文,《北京电影学院学报》2025年第12期。
这不是想象的图像,不是想要的图像。在画面的左下角,原本应该是一只手的地方,出现了一团无法名状的肉色纠缠。指头没有分节,而是像融化的蜡一样粘连在一起,甚至多出了一截违背解剖学规律的指骨。或者,在背景的招牌上,那些看似汉字或片假名的符号,实际上是毫无意义的笔画堆叠。他原本期待的是一个完美的“客体”,但这个故障打破了幻象。它不仅在预料之外,它甚至在人类的逻辑之外。
这是偶然。
《大师与玛格丽特》(修订版)
作者:[俄] 米·阿·布尔加科夫
译者:白桦熊
版本:中央编译出版社2024年3月
米哈伊尔·布尔加科夫(Mikhail Bulgakov)的《大师与玛格丽特》(The Master and Margarita)曾用一个非常有趣的设计演绎过这种偶然性,文联主席柏辽兹是一位受过良好教育、坚定的唯物主义者和无神论者。在与诗人的对话中,柏辽兹认为,人是自己命运的主宰。没有上帝,没有魔鬼,世界按照既定的唯物主义规律运转。由于科学和逻辑,我们可以通过制定计划来控制未来,比如他计划晚上去参加文联的会议。其隐含的逻辑在于:只要输入项(计划、意愿、逻辑)是正确的,输出(结果)就是可控的。
而神秘的异乡人沃兰德(Woland)介入了对话,他提出了一个致命的反问:如果一个人连明天晚上会发生什么都不知道,甚至连一分钟之后的自己都无法保全,他又怎么能控制生活呢?“掌管,至少也应该有个精确的计划,而且还得多少有个像样的期限吧。再请问,人非但没有可能制定一个可笑的短期计划,嗯,哪怕就是一千年吧,而且还无法保证自己明天的事情,那人类又怎么能掌管呢?”
随后,沃兰德给出了那个著名的预言:柏辽兹今晚不会去开会,因为他的头会被割掉。当柏辽兹嘲笑这是无稽之谈,问是谁割掉他的头时,沃兰德给出了那个荒谬的答案:“这是因为,安奴什卡(Annushka)已经买了葵花籽油,不光买了,而且还洒了。所以座谈会开不成了。”
改编电影《大师与玛格丽特》(2024)剧照。
这个例子之所以与“偶然”紧密相关,首先体现在变量的微不足道。如果柏辽兹死于心脏病突发,或者死于一场蓄谋已久的政治暗杀,这虽然不幸,但符合逻辑和因果律。然而,“葵花籽油”是一个完全处于宏大叙事之外的物体。安奴什卡是一个平庸、笨拙的家庭主妇,她买油、洒油是一件毫无意义的日常琐事。偶然性在于:一个精英知识分子的生死、一个宏大计划的成败,竟然取决于一瓶廉价的食用油。它打破了“大事件必有大原因” 的思维定式。
其次,这是独立因果链的交叉。在哲学上,偶然是两个独立因果序列的相遇。序列一是柏辽兹结束了谈话,因为口渴走向售货亭,然后走向电车闸机。序列二则是安奴什卡提着油瓶路过,不小心把油洒在了闸机口的转门处。序列三却是电车正点驶来。这三件事本来毫无关联。柏辽兹无法预知安奴什卡的行为,安奴什卡也不认识柏辽兹。但在那个特定的时间点和空间点,这三条线交汇了。柏辽兹踩到了油,滑倒,摔向铁轨,电车驶过——头颅落地。这就是纯粹的随机性暴力。对于柏辽兹来说,这是无法计算的“黑天鹅”事件。
最后,这也是对“线性时间”和“控制论”的嘲弄。柏辽兹代表了我们现代人的思维方式:我们相信日程表,相信算法,相信只要不出错就能抵达终点。但这摊油告诉我们:世界是一个非线性系统。安奴什卡的油就像是混沌理论中的那只蝴蝶,它扇动了一下翅膀,引发了巨大的风暴,它揭示了人类试图用逻辑网格罩住现实世界的徒劳——无论你的逻辑多么严密,现实总会抛出一个“安奴什卡”,用一种最荒诞、最不起眼的方式,证明偶然才是宇宙真正的统治者。
就像我们在训练AI 模型时,以为掌握了所有数据,在使用AI 工具时提供了尽可能丰富的提示词,但现实总会抛出一个“安奴什卡”,用一种最荒诞、最不起眼的方式,证明偶然才是宇宙真正的统治者。
早在古希腊时期,亚里士多德(Aristotle)便在《物理学》(Physics)中探讨“运气”与“自发性”问题,他指出,世界上的事件往往出于某种目的而发生,但当两个本无关联的目的在时空中交汇时,便产生了偶然性。
《物理学》
作者:[古希腊] 亚里士多德
译者:张竹明
版本:商务印书馆1982年6月
亚里士多德曾举过一个经典的例子:因果链一是一个人去集市为了买东西,因果链二是他的债务人去集市为了卖东西,两人在集市上不期而遇,债务人因此还了钱。“一个人是为了别的理由到市场上去的;如果他知道在某处可以遇到欠债人,他本来也会到那里去的;这次他去了,但不是为了要债这件事,却是偶然地在那里取回了他的债款。要债并不是通常也不是必然要去那里的;而收回债款这个目的,在他说来也不是他去的原因,但到那里去却还是他的意图或思考的结果。只有上述这些条件都具备时,才能说这个人是由于偶然性去的。”
这种相遇并非任何一方原本计划的一部分,而是两条独立行动轨迹的交叉。这便是“独立因果序列相遇” 这一概念的哲学雏形。
到了19 世纪,安托万·奥古斯丁·古诺(Antoine Augustin Cournot)继承并极大地发展了这一思想,正式提出了那个被广泛引用的看法。古诺试图解决当时科学界的一个核心矛盾:既然世界遵循严格的因果律,凡事必有因,那么“偶然”是否仅仅意味着人类无知、不知道原因?古诺给出了否定的回答。他论证道,世界中存在着无数条各自独立发展的因果链条。例如,一阵风吹落屋顶的瓦片,这是由物理学定律决定的必然序列;与此同时,一个人正巧路过屋檐下,这是由他的生活计划决定的必然序列。这两个序列在逻辑上互不相关,风不是为了砸人而吹,人不是为了接瓦片而走,但当它们在特定的时空点发生碰撞时,就构成了客观的“偶然”。古诺的贡献在于,他确立了偶然性的客观本体论地位,即偶然性是宇宙结构本身的一部分。
为了对艺术哲学中的偶然,尤其是人工智能生成艺术中的偶然进行思辨,本文对偶然的艺术哲学维度进行略微的调整,进行这样一种定位。
首先,偶然性是一种真值的非必然状态。根据戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz)和索尔·克里普克(Saul Kripke)的可能世界语义学,一个命题或事态被称为“偶然的”,当且仅当它在实际世界中为真,但在至少一个逻辑上可能的非实际世界中为假。这意味着,偶然真理(Contingent Truth)在逻辑空间中占据着独特的位置:它既非逻辑矛盾,即不可能事件,也非逻辑重言式,即必然真理。例如,“拿破仑输掉滑铁卢”是偶然的,因为我们可以构想一个逻辑上并不矛盾的世界,在那里他赢得了胜利;相比之下,“单身汉是未婚男性” 则是必然的,因为它在所有可能世界中皆成立。因此,逻辑上的偶然性严格界定为:本来可以不如此,但在事实层面上恰好如此。
图2 :古诺定义的偶然。本图来自原文,《北京电影学院学报》2025年第12期。
其次,从纯粹逻辑转向物理世界,偶然性获得了更为实在的定义,即概率。在这里,偶然是对物理决定论的直接否定。如果我们将宇宙视为一个遵循自然律的系统,一个事件是“物理偶然”的,当且仅当给定过去所有的物理事实集合与自然律集合,它们的合取并不逻辑蕴含某事件的发生。换言之,即便全知过去与法则,未来依然存在分叉的可能。这种定义引入了客观概率的概念,即概率介于0 与1 之间,而某些微观事件的发生并非由前因完全决定,而是内在地包含着随机性。因此,本体论上的偶然不仅仅是可能性的变体,而是物理实在本身的一种非决定性(Indeterminacy)特征。
最后,为了解释人类艺术经验中的偶然感,我们必须纳入认识论的维度,在这一层面上,偶然性可以被理解为认知主体在信息不完备状态下的不可预测性。即便一个事件在物理上是决定论的,如宏观尺度下的掷硬币,只要认知主体缺乏足够的计算能力或初始数据来推导结果,该事件相对于该主体而言就是偶然的。举例来说,计算机内部的参数空间,已经预示着生成的艺术品将有某种类型的残损或故障,然而,由于人类认知能力的局限和信息的相对不完备,生成之前它对人类来说充满了不可预测性。
综上所述,“偶然”是一个三位一体的结构:它是逻辑模态上的“非必然性”,是物理本体上的“非决定性”,以及认识论上的“不可预测性”。
在人类企图控制自然与社会时,偶然性是令人讨厌的,但艺术创作中,它却是艺术家青睐的对象。它们部分符合物理本体上的“非决定性”,也许人类掌握足够的隐藏参数与潜在规律后,便可以推演出决定性,但是,它们非常符合逻辑模态上的“非必然性”,以及认识论上的“不可预测性”。也正因此,在人类创造史中,秩序与混乱、控制与失控始终是一对核心的张力。偶然性(Aleatoricism)⸺这一源于拉丁语“alea”(骰子)的概念,也就暗含了一种深刻的美学力量⸺它挑战着人类固有的、对可预测性和完美形式的迷恋,迫使我们直面那片由意外和可能性构成的丰饶之地。
纪录片《如何找到图灵》(2025)海报局部。
二、从早期随机艺术到人工智能艺术
回溯20 世纪的艺术史,我们仿若置身于一场针对“必然性”的漫长叛乱之中,彼时第一次世界大战正陷入僵局,那个工业理性曾许诺将人类带入乌托邦最终引向世界大战的时代,艺术开始痛苦地反思逻辑的合法性。达达主义者特里斯坦·查拉(Tristan Tzara)正是带着这种对旧世界逻辑的极度厌恶,发明了他著名的“剪报诗”。这是一个具体且极具挑衅意味的操作流程。查拉在他的宣言中详细描述了这个步骤:首先,找一份报纸;其次,找一把剪刀;接着,挑选一篇与你想要创作的诗篇长度相当的文章;然后,小心地将文章中的每一个单词剪下来,把它们统统放入一个袋子里;轻轻摇晃;最后,一个接一个地取出纸屑,并严格按照它们出场的顺序通过复制或粘贴记录下来。
在这个具体的历史情境中,查拉的行为是对传统文学创作神圣仪式的亵渎。这里没有推敲,没有韵律的斟酌,没有“灵感”的降临。当他从袋子里摸出“资产阶级”“大象”或“虚无”这些毫无关联的词汇并强行并置时,美学价值被悬置了。这种偶然性是暴力的、物理的。它的目的是切断语言与其所指涉的现实逻辑之间的纽带。每一片掉落的纸屑,都是对因果律的嘲弄。达达主义的偶然性是一把锤子,旨在砸碎那些令人窒息的理性桎梏,通过拥抱纯粹的物理混乱来获得一种原始的解放。
随着战火平息,这种狂暴的破坏欲在20 世纪20 年代逐渐转化为超现实主义者向内的探索。如果说达达主义是向外投掷炸弹,超现实主义则是向内挖掘隧道。安德烈·布勒东(André Breton)和他的同伴们深受弗洛伊德精神分析学的影响,他们渴望绕过理性的“超我”审查,直接捕捉潜意识的涌动。其实践的核心形式便是“自动写作”。这同样有一套具体的操作指南:找一个安静的地方,让自己进入一种近乎被催眠的被动状态,忘掉你的天才和才华,然后开始书写。关键在于速度⸺必须写得足够快,快到意识来不及思考,快到逻辑来不及修正。
纪录片《约翰·凯奇》(1973)剧照。
之后,将偶然性从破坏工具和心理实验升格为一种严密的方法论,代表人物是二战后的美国作曲家约翰·凯奇(John Cage)。这标志着偶然性美学从“热”向“冷”的转变。20 世纪50 年代初,凯奇深受日本思想家铃木大拙(D.J.Suzuki)禅宗思想的影响,他开始厌倦西方艺术中无处不在的“自我表达”。他试图让声音从艺术家的喜好中解放出来,让声音只是声音本身。“人们可以放弃控制声音的欲望,将头脑从音乐(的成见)中清空,着手去发现种种手段,让声音成为其自身,而不是作为人为理论的载体或人类情感的表达。”为了实现这一点,他创作了里程碑式的作品《易之乐》(Music of Changes)。
许多人误以为凯奇的偶然音乐是随意的乱弹琴,以此而具有难以言说的随机性的艺术魅力。事实恰恰相反,其创作过程是极其烦琐、枯燥且高度系统化的“前算法”工程。由此,凯奇的艺术思维与后世计算机的算法才有了更多可对话的空间。凯奇首先制作了巨大的矩阵图表,这些图表由8×8 的格子组成,共有64 个单元,分别对应《易经》的六十四卦。他制作了多套这样的图表,分别对应音高、时值、力度、复调密度等音乐参数。
元代王蒙《松窗读易图卷》(局部)。
凯奇并不直接在五线谱上写音符,而是拿起三枚硬币进行抛掷。根据《易经》的占卜规则,三枚硬币的正反面组合对应一条“爻”,抛掷六次才能得出一个完整的“卦”(Hexagram),对应1 到64 之间的一个数字。假设他抛出了第30 卦“离为火”,他就会去查阅“音高图表”中第30 号格子里的音符;接着,他再次抛掷硬币,去查阅“时值图表”来决定这个音符有多长;再抛掷,查阅“力度图表”决定多响。为了完成这首曲子,凯奇进行了数千次的抛掷,工作量巨大,耗时数月。
在这个过程中,凯奇彻底退居幕后。他不再是一个在此刻表达悲伤或欢乐的作曲家,而变成了一个规则的制定者和系统的执行者。硬币的随机性被严格地约束在他预设的图表系统(Indeterminacy)之中。这是一个标准的算法流程:输入(随机数)——处理(查阅规则表)——输出(乐谱)。凯奇的革命性在于,他证明了通过建立一套严格的规则,可以生产出一种比人类想象力更为丰富、更为自然,也更为客观的“不确定性”。这种艺术不再是艺术家意志的投射,而是一种“模仿自然运作方式”的产物。
从剪报诗到凯奇的系统创作,随机、系统、拼贴等概念逐渐参与到艺术过程中,它们已经逐渐递进地靠近了20 世纪的一个核心变量⸺计算机。20 世纪中叶以后,随着计算机和早期人工智能的崛起与发展,这股古老的偶然性力量被注入了前所未有的计算势能,演化为一种“生成的不确定性”。当计算机进入艺术家的工作室,这种对过程的迷恋找到了最理想的载体。计算机科学中关于随机与偶然的底层逻辑,意外地为艺术家提供了一个通向无限的创作空间。这既是对概率论的数学应用,也是对作者权的哲学解构。在传统艺术受限于物理媒介和人力极限时,计算机允许艺术家通过调整随机种子和算法,瞬间生成成千上万种截然不同的视觉奇观。而且,整个过程在可控与不可控之间,在这个空间里,计算机是可能性的放大器。
早期计算机艺术先驱,如曼弗雷德·莫尔(Manfred Mohr)或维拉·莫尔纳(Vera Molnár),利用简单的算法和伪随机数生成器来探索几何形式的无穷变体。在莫尔的作品中,他面对的不是画布,而是打孔卡和巨大的平板绘图仪(Plotter)。在诸如《P-197》这样的系列作品中,莫尔设定了一个完美的立方体逻辑,然后引入随机变量来干扰这个逻辑。机器运作时,绘图仪的机械臂伴随着有节奏的嗡嗡声,在纸上精准地画出线条。然而,随着参数的随机扰动,这个立方体开始被解构、扭曲、重组。有的线条断裂了,有的面翻转了,生成了一系列既统一又各异的图像。莫尔纳则在她的《(Des)Ordres》系列中,让计算机在方格网中随机地微调方块的角度和位置。
艺术家的状态在这里是焦虑与兴奋并存的。他们编写了规则,但必须等待机器几小时甚至几天的运算与绘制,才能看到那个“意外”的结果。这里的“不确定性”是受控的:算法是确定的,但输入的随机种子不同,输出便千差万别。这揭示了一个深刻的悖论,在一个完全由逻辑构成的确定性系统中,可以涌现出看似无穷无尽的、不可预见的“意外”。这正是复杂性科学所关注的“涌现”(Emergence)现象⸺简单的局部规则在宏观尺度上产生了复杂的、难以从规则本身直接推断的全局行为。艺术家的角色,变成了在秩序的边缘进行探索,那里是结构与惊喜共存的创造力温床。
进入深度学习时代,尤其是生成式对抗网络(Generative Adversarial Network,GAN)的出现,将“生成的不确定性”推向了一个全新的哲学与美学高度。GAN 的结构本身就是一场充满不确定性的博弈。它由两个相互竞争的神经网络组成:生成器(Generator)和判别器(Discriminator)。生成器的任务是从一个被称为“潜在空间”(Latent Spaces)的高维向量(本质上是一串随机数)开始,尝试生成以假乱真的数据,比如图像。而判别器的任务则是尽可能准确地分辨出哪些是真实数据,哪些是生成器伪造的。这场“矛” 与“盾”的军备竞赛,驱动着生成器从最初的随机噪点,逐步学习并创造出越来越逼真的图像。
图3: GAN 的艺术生产过程图解。本图来自原文,《北京电影学院学报》2025年第12期。
这个过程充满了美学上的不确定性。首先,潜在空间本身就是一个充满未知的宇宙。空间中的每一个点都对应着一张可能的图像,相邻的点生成的图像相似,相距遥远的点则可能生成截然不同的内容。艺术家马里奥·克林格曼(Mario Klingemann)的作品《路人记忆一号》(Memories of Passers by I)便是对这一特性的极致展现。
克林格曼《路人记忆一号》局部。
这件作品被封装在一个复古的木制机柜中,仿佛一件古老的家具,但内部却运行着最前沿的算法。两台显示器实时、不间断地生成着一张张扭曲、模糊、怪诞又偶尔惊人逼真的面孔。克林格曼并没有“画”出这些脸,他像是一个神经系统的外科医生,不断调整着模型的参数权重,观察着输出的反馈。观众面对的是一个永不枯竭的生成之流。屏幕上的面孔如同幽灵般浮现,有的眼睛错位,有的皮肤如同融化的蜡,随即又消散在像素的迷雾中。其美学体验的核心,正是这种永恒的悬置与期待:下一秒,机器会“梦”到一张怎样的脸?这种由算法驱动的“自动人像生成”,仿佛是超现实主义自动写作在数字时代的还魂,只不过这次通往的不是个人潜意识,而是一个由海量数据和算法博弈共同构筑的、集体的、非人类的“机器无意识”。
更有趣的是,GAN 在学习过程中产生的“失败”与“瑕疵”,本身也构成了一种新的美学⸺“故障美学”(Glitch Aesthetics)。当罗比·巴拉特(Robbie Barrat)用古典裸体画训练GAN 时,他遇到了机器犯下的错误和涌现的荒谬,但并没有试图修正机器的错误,反而敏锐地捕捉到了算法困惑的瞬间。《Nude Portrait #1》等作品中,生成的图像呈现出一种令人不安的肉体质感:四肢像液体一样流淌,面部特征消失在肉色的漩涡中,背景与身体的边界模糊不清。这些“错误”带有技术缺陷,但它们是算法“思维”方式的视觉证据。机器不像人类那样理解“身体”或“面孔”的整体解剖学概念,它只是在像素级别上学习统计规律和纹理特征。因此,当它尝试重构时,便会产生这些逻辑上不通、但视觉上极具冲击力的“算法幻觉”。这种不确定性带来的瑕疵,揭示了人与机器在认知上的根本差异,这种差异本身就充满了诗意和哲学意味。
如果说GAN 的“不确定性”源于一场精心设计的内部博弈,那么近年来主导生成艺术领域的扩散模型(Diffusion Models),如DALL-E 2、Midjourney 和Stable Diffusion,则将不确定性与人类语言的模糊性、开放性更紧密地结合在一起。扩散模型的原理极具巧思:它首先学习一个“加噪”过程,将一张清晰的图像逐步变成纯粹的高斯噪声;然后,它训练一个神经网络来学习这个过程的逆向操作⸺即如何从一片纯粹的噪声中,一步步“去噪”,最终恢复或生成一张清晰的图像。在生成阶段,这个去噪过程会受到一个“引导”,这个引导通常来自人类输入的文本提示(Text Prompt)。
电影《人工智能》(Artificial Intelligence,2001)剧照。
这里的“生成不确定性”体现在多个层面。首先,起始的噪声是随机的,这意味着即使是完全相同的文本提示,每次生成的结果也会因为初始“画布”的不同而大相径庭。其次,自然语言本身充满了歧义和丰富的内涵。当用户输入“一个宇航员骑在马背上,风格是伦勃朗光影”时,模型需要在一个庞大的、由图像和文本配对训练出的语义空间中,寻找这句话最可能的视觉表达。但“伦勃朗光影”究竟意味着什么?是特定的色调、笔触质感,还是某种戏剧性的氛围?模型对此的“理解”是一种统计学上的关联,而非人类的美学领悟。因此,它的每一次“诠释”都是一次充满偶然性的冒险。
艺术家雷菲克·安纳多尔(Refik Anadol)的大型数据雕塑作品,如在MoMA展出的《无监督》(Unsupervised),将扩散模型的不确定性美学呈现了出来。安纳多尔的团队构建了一个庞大的数据管道,他将MoMA 超过200 年的馆藏数据⸺包括图像、元数据、展览历史⸺全部投喂给一个定制的AI 模型。在巨大的、高达两层楼的LED 屏幕上,算法实时地“幻想”和“梦见”艺术史的流变。观众看到的不是一幅幅静态的画,而是一片不断变形、融合、涌现的视觉星云。这是一种压倒性的感官体验:数百万个粒子如同液态金属般流动,毕加索(Pablo Picasso)的立体主义碎片可能瞬间熔化成莫奈(Oscar-Claude Monet)的印象派光斑,随后又凝结成波洛克式的抽象线条。安纳多尔站在控制台前,像指挥家一样调节着“风力”“重力”和“湍流”等参数,引导着这场数据的风暴。这件作品的魅力不在于任何一个瞬间的图像,而在于它所展现的“可能性之流”。它将整个艺术史变成了一个巨大的“潜在空间”,而算法则像一个永不停歇的梦游者,在其中穿行、探索、连接,生成着过去不存在、未来亦不可知的视觉形态。这是一种过程美学、流变美学,它邀请观众沉浸于创造的动态本身,而非仅仅欣赏一个终结的产物。
三、作为方法论与艺术哲学的偶然
至此,我们可以对人工智能艺术所设计的偶然进行一些归类,对意向性(Intention)与算法过程之间因果关系进行考查。本文用“目的”指代人类创作者在输入指令时的意向性状态,分为必然的严格预设与偶然的模糊期待;而用“算法”指代AI 模型的处理机制,分为确定性的逻辑输出与包含噪声注入的随机生成。基于这两个维度的交叉,我们可以构建出四种不同的模态。
首先是“目的偶然与算法偶然”的结合,这构成了生成艺术中最激进的形式,即一种“绝对的惊奇”。在这种情境下,创作者没有明确的预设目标,甚至故意寻求意外,而AI 模型也被设置为高随机性。这里存在双重断裂:人类意图与结果之间没有强因果链,算法输入与输出之间也没有一一对应的映射。这种模式导致了传统“作者” 概念的消解,作品不再是“创造”,而更像是一种对纯粹概率产物的“发现”,类似于马塞尔·杜尚(Marcel Duchamp)的“现成品” 概念,但其对象本身也是混沌生成的,具有不可复现的自然美学价值。
图4 :人工智能生成艺术的四种算法偶然。本图来自原文,《北京电影学院学报》2025年第12期。
其次是“目的偶然与算法必然”的组合,我们可以称之为“探索性的决定论”。当创作者意图模糊但使用的工具或参数(如Seed 值)是确定性的时候,虽然结果在物理和数学层面上是确定的,但在认识论层面上,对人类而言它却是未知的。这类似于路德维希·维特根斯坦(Ludwig Wittgenstein)“甲虫盒子”思想实验的变体,也就是说,盒子里的算法逻辑是固定的,但外部观察者只能通过输入模糊指令来探测。艺术家通过试错来寻找那个“必然存在”但尚未被看见的图像,实质上是一种对潜在空间的挖掘。
第三类是“目的必然与算法必然”的叠加,创作者拥有极度精确的目标,并且试图控制算法变量以消除随机性时,希望AI 不再是共同创作者,而退化为一种高效的画笔。但这并非意味着绝对的控制,反而揭示了一种更为隐蔽的“系统性随机”。即便创作者拥有极度精确的目标,并试图通过完全控制算法变量来消除随机性,AI 作为一个庞大的黑箱系统,其内部复杂的权重计算与潜在的过拟合风险,依然会导致不可预知的故障与逻辑分叉。它实际上演变为一种关于“控制失败”的艺术。
第四种类型,也是目前主流的创作模式,即“目的必然与算法偶然”的结合,体现为一种“受控的涌现”。创作者设定了明确的目标,确立了边界条件,而算法则在这些边界内进行随机游走。人类设定了共相,而AI 负责填充殊相。这种模式产生了变奏的美感,挑战了人类想象力的局限,我们在知道自己“要什么”的同时,却不知道它具体展现为哪一种可能。
最后,我们需要面对人类态度的问题。“生成的不确定性”迫使我们重新思考“创造力”与“作者身份”的本质。如果其结果对人类来说是不可预测且充满新意的,那么这份创造力归于何处?它存在于程序员设计的算法中?存在于艺术家设定的概念框架和数据集中?还是涌现于人机交互的复杂动态中?答案或许是“以上皆是”。
人类的想象力受限于我们的生物经验、文化记忆和逻辑因果。我们很难真正想象一个从未见过的颜色,或者一种完全违背物理规律却在视觉上自洽的结构。机器的“想象力”则受限于数据集的统计规律,它倾向于生成概率最高的、平庸的图像。然而,当你将那些充满私密色彩的意象、人类的感性碎屑挤压进代码机器时,你实际上是在高维的潜空间中进行了一次盲目跳跃。人类提供了坐标,机器提供了地形,由此生成的图像,往往位于人类逻辑的盲区和机器统计的边缘。那是一个人类想不到去画,而机器如果没有指令也绝不会去生成的坐标点。这种图像是两个异质系统碰撞后的“火花”,它既带有你的情感指纹,又带有机器那陌生甚至带有致幻感的算法特征。
为什么这种作品往往带有某种令人不安的、陌生甚至带有致幻的美感?因为它们打破了人类中心主义的审美。AI 时代的创造力,是一种分布式的、生态性的现象。它存在于整个系统中⸺人类的意图、数据的偏见、算法的逻辑、计算的偶然性,共同构成了一个能够催生新奇事物的“创造性生态”。从查拉的纸屑,到凯奇的硬币,再到GAN 的潜在空间和扩散模型的噪声场,我们看到了一条清晰的轨迹:人类不断地发明新的“骰子”,将它们抛入创造的领域,以此来打破自身的思维惯性和审美定式。人工智能,在可控与不可控的边缘地带那每一次不确定的生成,正是我们这个时代最精密、最复杂,也最富潜能的一枚骰子。这种艺术,不是人创作出了远超出机器的作品,不是机器创造出了远超越人的作品,而是人和机器一起,创造出来人和机器都无法想象的作品。AI 生成艺术超越了“工具论”(AI 只是画笔)和“替代论”(AI 将取代画家)的二元对立,指向了一种共生涌现式的新艺术观。
这种与“生成不确定性”的共创关系,也会慢慢改变艺术家的自我定位。在传统的艺术本体论中,艺术家是一位全知全能的“造物主”。这种预设包含了一个强烈的意向性前提,即艺术作品是创作者内在精神状态在物理媒介上的精确投射。在这种经典模型下,结果(作品)在逻辑上必然蕴含于原因(艺术家的构思)之中,任何偏差都被视为“技艺的失败”。然而,当我们引入生成式人工智能作为创作媒介时,这种因果链条发生了断裂。
电影《达洛维》(Dalloway,2025)剧照。
因此,人工智能工具要求一种认知谦逊。你不再是那个对画布上每一个像素拥有绝对立法权的君主,而应当被重新定义为一位“炼金术士”。炼金术士与现代化学家的区别,在于对过程的可控性与对结果的预知性的差异。炼金术士操作的是他尚未完全理解的黑箱,在这个新的创作模型中,设计实验不再是描绘蓝图,而是设定初始条件;混合元素不仅仅是堆砌素材,而是构建概率空间⸺即选择特定的数据集,划定潜在输出的统计学边界;调节火候则是对超参数的微调,这是一种对随机性与连贯性之间张力的二阶控制。在这个过程中,你失去了对具体结果的“直接因果控制”,转而获得了一种“系统性影响力”。你只能满怀期待地观察坩埚(神经网络的隐层),等待那种涌现性的发生。所谓的“化学反应”,在逻辑上即算法在处理高维向量空间时,产生的那些无法被还原为单一输入指令的复杂特征组合。
换句话说,创作不是线性的(人输入→机器输出→结束),而是一个动态的炼金系统(对话系统)。你输入一段咒语,机器吐出一个混沌的图像,关键时刻在于这个图像反过来刺激了你的视觉神经。你看到了原本没想到的东西,比如雨夜霓虹中一个意外的红色倒影,这个意外激发了你新的灵感,你修改了提示词,增加了新的参数,机器再次生成。在这个过程中,谁是创作者?不再是单纯的人,也不再是单纯的机器。作品是这个回路不断震荡、收敛的结果。最终的成品,是人类的审美直觉与算法的生成能力在无数次博弈后达成的和解。
因此,我们正在目睹一种新的艺术形态的诞生,其核心特征是从“表达”转向“探索”。表达论模型是A 指向W,艺术家A 将内在意图转化为作品W,而探索论模型是A 加M 指向S,艺术家A 与机器M 共同在一个无限的可能性空间S 中航行,评价标准变成了“惊奇感”与“启发性”。这是一种“中间态”的艺术景观。它既不是纯粹的人类意志,也不是纯粹的机器随机,而是两者在反馈循环中达成的动态平衡。你不再是全能的创造者,而更像是一位在模态空间⸺即所有可能存在的图像构成的无限海洋中航行的舵手。你的任务不是制造浪花,而是识别浪潮的方向。你不知道下一个浪头会打向哪里,而且,机器也不知道。
这种“共同的未知”构成了AI 艺术的核心魅力,AI 艺术展示了一种非人类的认知图式。这种根本性的不可预测性,迫使我们放弃对“意义”的独断解释权,转而在这个充满不确定性的海洋中,去发现那些人类未曾设想过的可能世界。当你输入提示词时,机器并非在“理解”你的语言,而是在进行高维度的数学映射。你的未知在于你无法预知模型会如何通过概率路径坍缩出一个具体的图像;机器的未知在于机器本身没有意识,它不知道自己在“画”什么,它只是在执行统计学上的最优解。这种双重盲区创造了一种奇特的认识论缝隙。正是在这个缝隙中,我们看见了超越人类经验边界的风景⸺那些在人类大脑的神经连接中从未形成过的视觉逻辑,那些违背人类直觉却暗含某种宇宙可能性的构图。由此,或许机器与人会一起走向一种数学与艺术共舞的“偶然性浪漫主义”的艺术时代。
【文献出处】耿弘明:《不可预测:人工智能艺术的偶然性美学》,《北京电影学院学报》2025年第12期,页12-20。
作者/耿弘明
本期评议/陈新宇 梅剑华 黄典林
文本摘选/罗东
海报设计/师春雷
导语校对/吴兴发