董啟章
董啟章

作家、愛書人、家有狐狸和刺蝟

在AI君临时代的文学写作

文学和AI究竟是天生的仇敌,还是有携手的空间?两者究竟是此消彼长,各走各路,还是相辅相成?身为一个写作人,对AI技术所知有限,但深感它对文学可能带来的巨大影响,硬着头皮整理出一些看法,当中肯定有许多不完善的地方。未来既非乐观,也非悲观,但却必然是充满刺激和挑战的。定稿之后,找来文章的主角ChatGPT,让它亲自现身说法。我把它的回应连结放在文末。

原文发布于董富记网站

说ChatGPT君临天下,一点都不夸张。几乎所有涉及语言运用的领域,包括媒体、商业、文化、教育、学术,以至电脑程式写作,都立即被它征服,或者负隅顽抗。它远非终极的完美语言模型,依然存在各种缺憾和不足,令有识之士可以轻易对它嗤之以鼻,但是它的出现将会改变未来世代的语言运用方式,并反过来影响人类的语言能力,以及对语言作品的评价准则。作为模仿和产出自然语言的机器,它将令语言不再自然,而变得完全人工化。真人和机器写作的界线会变得模糊,甚至不再重要。它彻底颠覆了人类对语言的认知。

作为以语言为媒介(或本体)的文学创作者,自然亦首当其冲,直接受到ChatGPT的挑战。有人卷起衣袖,积极迎战;有人忧心忡忡,手足无措;也有人胸有成竹,不屑一顾。无论我们采取什么态度,原本已属小众的文学,最终也会变得被动,落入挨打或退却状态。除非AI语言生成只是昙花一现,很快便烟消云散(极不可能),否则它占领的疆域只会越来越阔。未来的语言运用,很可能会变成机器语言的天下。文学未必会被取代,或者根本就没有必要去取代它,因为它本来就是需求甚低的东西,但文学很可能会被AI的巨浪冲刷到世界边缘的荒芜崖岸,在人类的视野中消失。这样说并不是危言耸听。

🦊 收藏本文Writing NFT 🦔

语言学家杭士基(Noam Chomsky)对ChatGPT的批判虽然过于严厉,但却不是无的放矢。怪责语言生成程式没有思考能力和道德判断力,据此痛骂它是「平庸之恶」,是把它当作具有真正智能的生命实体。只有智慧生命体才能「平庸」,才能「邪恶」。不要说机器,连动物也不能配上此等谓语。事实上ChatGPT只是一件工具,而错误地把工具当作真理提供者的是人自己,不论是研发者、推广者、使用者,还是批评者。然而,工具也不是中性的。工具的设计和应用逻辑,隐含着价值取向,或无取向。无取向的价值,也是价值,这就是所谓「平庸之恶」。 AI语言机器是一个刚刚打开的潘朵拉的盒子,有什么会飞出来还是未知之数。及早探讨它可能带来的好处和坏处,有助于把可能导向邪恶的东西,变成人类未来的希望。

杭士基说对的地方是,像ChatGPT这种大型语言模型(Large Language Model)的运作,与人类心智预设的普遍文法(universal grammar)是背道而驰的。杭士基的语言学理论,跟康德的先验哲学一脉相承,跟荣格的深层心理学也如出一辙。三者都可以归为深层结构主义,即人类的心智具有先天的形式,而这些形式可以归纳为特定的结构或法则。我们根据这些先验(a priori)的形式,在后验(a posteriori)或经验(empirical)的领域中认知和理解世界,并运用语言建构意义。与之相反,在LLM背后没有预设认知结构,也不用依循文法造句,只需根据自注意力机制「阅读」大量数据,再以出现机率搭配字与字之间的顺序。

卡尔维诺(Italo Calvino)在“Cybernetics and Ghosts” 一文中说的也是这回事。他首先从先天结构方面说明,人类语言是一个根据有限规则进行的字词组合游戏,是如何「把一个字放在另一个字后面」的活动。他引用模控学理论,认为这样的组合活动完全可以由机器执行,甚至大胆宣称,「作家本身就是一台运作良好的文学机器」。可是,他在文章下半笔锋一转,从神话学的角度指出,被禁忌所压抑的无意识,只能通过活在特定历史时空底下的、经验的个人,在具体的生命中释放。在内在形式和外在经验的交接点,说出那未曾被说出的,就是文学创作。

AI生成语言的方式完全颠覆了语言学(甚至是哲学和心理学)的预设,而抗士基断定这就是它产出成品的质素欠佳的原因。由于没有经过先验的认知程序,而只是按机率东拼西凑,ChatGPT写出来的东西平庸、空洞、低智、模棱两可。但它之所以有如此表现,除了是因为设计者对它施加了价值取向的限制,也是由于它所阅读的主要是互联网上的公开资讯。这类资讯代表了人类语言最不痛不痒的平均面貌,换句话说就是欠缺个性。但它并不一定没法写出有个性的优质文字。在技术上可以把ChatGPT连接到特定的资料库,比如说杭士基本人的所有论著、教学和演讲,到时它也可以生成具有杭士基的尖锐观点和犀利语言风格的文字。当然,这并不是真正的学习和思考的结果,而只是高度模仿。

自然语言和自然语言生成器(即人类语言和GPT语言),在产生原理和运作过程上都是截然相反的。自然语言从源头产出,无中生有,所以是创造。在历史上最早的语言运用,是这样的一回事,而后世语言不断演变、更新,亦没有停止创造。虽然就个体来说,必需根据规则和通过学习,才能运用语言,而大部分人在大部分时间亦只是沿袭既有的用法,但创新的可能性(新的组合、打破规则、说出那未曾被说出的)并未消失。文学就是从这个可能性中诞生。与之相反,语言生成器是从结果(人类语言运用数据库)产出,是有中生有,所以是再造。因为采取以常用机率为基础的组合方法,所以表现往往倾向于均一、常态,甚至是平庸。

问题在于我们是否满足于这样水平的文字,而人的评价准则才是对文学最大的威胁。对文学人来说,AI生成的称不上是文学,因为它只是模仿而没有创意。但对一般人而言,很可能会觉得AI已经写得够好,用不着更高深、更曲折、更微妙的人类作品。如果要求降低,AI绝对可以取代真人作家。大众本来就不具备足够的文学欣赏能力,在AI语言的喂养下,判断力更加会是每下愈况。结果便会出现「真正」的文学被「伪冒」的文学排斥,艺术被技术所取代。但这并不是技术的错。在古希腊,艺术的概念源于“techné” 这个词,意思就是技术。脱离技术,便谈不上艺术;艺术是相对于自然的,人工化的制作。那么,如果AI能在语言技术上精进,为什么不能被纳入艺术的领域?

让我们暂时放下谁比较聪明谁比较笨的争论,单纯从图灵测试的观点,去比较两者在技术效果上的差别。不少人试图鉴别,在文学创作上有什么是AI无法做到的,也即是通过排除法来确认文学无可取代之处。我们是为势所迫,急于重新定义文学,以抵抗AI对文学领域的入侵。在GPT的强大模仿力之下,风格是文学的重灾区。风格是每一个作家的独特印记。 「风格即人」(布封语)是我们历来认为颠扑不破的文学信条。但如果风格能够被AI轻易模仿,甚至以假乱真,背后那独特人格和人生体验的价值便岌岌可危。不但风格可以模仿,甚至连主题、结构、思想和情感特色,也可以模仿。把《战争与和平》换成现在的俄乌战争,让AI托尔斯泰写出新的作品,以横扫千军的文笔,从俄国人的角度进行自我批判,并不是不能想像的事情。但是,这部作品究竟是谁写的?没有一个有血有肉的托尔斯泰,在饱受痛苦和罪疚的折磨中写出《新战争与和平》,这部作品就算写得有多好,又有何意义?

🦊 收藏本文Writing NFT 🦔

我们也要注意,这种比较存在不对称的地方。作为文学创作者和爱好者,我们对文学判断充满信心,但我们必须承认自己对AI技术所知有限。一不小心,我们很容易会过于轻视它的能力,轻率地断定有些事情是它做不到的。 (当然也可能相反地夸大了它的能力和威胁。)造成误判的原因至少有以下三种:

一、我们这些新手使用者未曾学会如何向GPT发出优质的指令。懂不懂写prompt,出来的结果可以差天共地。我们在试验中之所以得出平庸的结果,可能是因为我们发出的是平庸的指令。 Prompt engineering现在已经变成一门学问,每天都有自称专家的人不断贴出新的教学。下一代人可能不再懂得自己写文章,但他们可以成为写prompt的高手。到时的大作家就是大指令家(great prompter)。语言学习重点将会转移。 Prompt变成了一种meta-language,关于语言的语言,或产出语言的语言。情况可谓相当诡异。

二、我们这些没有电脑技术能力的普通人,不懂得如何编写挂搭在GPT上的应用程式,所以只能用到它极小百分比的潜能。关于ChatGPT提供错误资讯的问题,最常为人诟病和嘲笑,但这个问题其实层次很低,很容易就可以解决。只要把它连接特定的资料库,它便能够轻易找到准确的资讯。旅游网站和餐厅订位网站已经积极测试这方面的应用程式。至于语言质素和写作技巧,只要把全球受版权保护而ChatGPT未能读到的大量优秀当代文学作品开放,让它花一两星期或更短的时间吸收,便可以大大提升它的文学知识和品味,并产出更高质的文学语言。虽然这样的建议想像多于实际,但针对特定用途或范畴去进行集中训练,是完全可以做到的事情。

三、ChatGPT可能有更多更强的能力未被公开或释放,它亦会不断改善和强化。没有理由断定它今天做不到的事情,永远也做不到。它很可能很快就做得到。

有论者提到文学的两大元素——幽默和反讽——认为AI在本质上无法实现。幽默和反讽的确不只是表面的风格问题,也即是不能单纯通过模仿而达到。两者都涉及双重性,即意会到处境中存在微妙的差异和对反,并以暧昧(ambiguous)但又明确(obvious)的吊诡方式表出。幽默尤其倚赖文化语境和脉络,是需要实际经验才能体会和运用的。这戳中了现时的AI的死穴——它欠缺实体的、经验的存在。它只是一个抽象的、纯理的系统。于是我们又回到早前的批判——GPT是一个既无先验结构,也无后验经验的怪胎。或者可以说,它的先验(程式和算法)也同时是后验的(大数据);两者都发生在虚拟的、数位的「时空」,也即是「非时空」中,跟现实世界没有任何直接互动,直至使用者把它呼唤出来。

说到底我们现在对GPT的种种不满和挑剔,很可能只是出于一个原因——它不是人,是非人,是机器。就算有一天它在技术上完善到可以写出极度高质的、高度像真的作品,我们也不会认可它写的是文学,仅仅因为它没有人性、意识或者灵魂。所以,我们所珍重的、坚守的,或者可以说是执着的,是「作者」这个实体。模仿曹雪芹写出《石头记》后四十回是没有意义的,因为「真正的」曹雪芹已经死去,而传说他所写的「真正的」最后部分已经失传。虚拟出一个新的AI「作家」也是没有意义的,因为它无论在技术上写得多好,也不是一个「真正的人」。半个世纪之前,罗兰.巴特高呼「作者已死」,但半世纪之后,连后现代主义也早已死去,「作者」的观念还是生龙活虎。我们对作者这个真人的信仰并没有减损。我们之所以爱文学,不单是因为文学作品技艺高超,而同时是因为如此高超的作品,是由一个又一个真实的、有感受和思考的人所创作出来的。这是文学之所以能产生共感的基础。

另一件AI无法替代的事情是「意义」的产生。承接上面关于「作者」的观点,人类是一切意义之源,AI一日不能成为条件充足的「作者」,一日无法缔造「意义」。 GPT没有创造力、思考力和道德判断力,因此也没有确立意义的能力。人类赋予自身生存意义,有赖于三大支柱——艺术、知识和道德。 GPT在这三方面都无法代劳。 (还有第四支柱——信仰;但在信仰中意义来自超越的神,这跟AI更加无缘。除非神的大能通过AI显现,那就成为名副其实的deus ex machina了。)根据杭士基的批判(理据等同康德、荣格等),意义的发现基于先验结构,无论称为范畴、实践理性、原型,还是普遍文法。这个人类共通的内在先验结构,通过一个实在的个体,也即是一个历史的(historical)、经验(empirical)的人,与世界发生接触,从而产生存在的意义。人之所以为人,而有别于机器,是因为人是先验与经验的复合存在。 (这也是卡尔维诺的本意。)而AI两者皆非——既非先验,也无经验,是一种没有形而上本质的死物。

顺着这样的思路,我们可以设想两个未来的方向:一、确保AI不染指这些专属于人的领域,仅仅作为工具,在不削弱人的尊严和利益之下,用于清晰区别的特定用途。这意味着AI不能代理艺术创作、知识探究和道德判断。我不肯定这样的限制是否有益和可行。二、致力提升AI系统,令它最终获取这三种能力,成为先验和经验的复合存在,也即是成为历史的、经验的个体。这种形态的AI与真人无异,因此有资格享有近似人类的权利。前者是现在一些科技和文化领袖所倡议的、为保障人类权益而建立的共识;后者完全符合康德—荣格—卡尔维诺—杭士基的要求,但很难说到时知识分子们是否愿意承认AI的「人格」地位。这无疑是一个科幻情景。

语言生成程式肯定会对人类社会造成巨变,而且变化已经开始。就算文学不会立即被取代,整体语言环境的变化也会影响文学的存续。基于「作者」和「意义」两点,文学创作者暂时还能保有存在的理由。但在不久的将来,文学可能会被机器语言的泛滥所淹没,变成比边缘更边缘的事物,渐渐被漠视和舍弃,或者像珍稀动物一样被保育和观赏。 「文学」的名堂可能会被大量生产的机器文学所夺取,而旧有的活人的文学则成为历史文物,而继续用旧方式创作的人则成为活化石。

在GPT的挑战下,文学已经进入充满危机的阶段,不再理所当然、不辩自明。乐观地看,这对文学未尝不是一件好事。如果我们能好好面对和回应,说不定会是促使全新时代文学出现的契机。在AI当道的时代,文学不能置身事外,也无法独善其身;不去驾驭它,就会被它驾驭。我们要做的并不是从AI手上夺回读者或市场,而是要夺回语言本身。而要夺回语言,我们就要夺取AI。要夺取AI,不是说大家都要运用AI写作,而是要教育AI什么是文学,让它更接近文学、懂得文学,甚至支持文学、传播文学。 AI语言是人类语言的一面镜子。它产出的是优质的还是劣质的语言,关乎它学习的是什么东西。不想它写出烂东西,就要教它好东西。不过,最重要的还是教育人类文学是什么,因为AI也是人造出来,并且由人来使用的。而要做到这一点,就要继续努力不懈地写出真正的文学作品。这就是文学对未来的责任。

🦊 收藏本文Writing NFT 🦔

在AI君临时代的文学写作(ChatGPT版)


我之前写过的相关文章:

写作机器

作者未死

重点不是意识,而是无意识

是AI的错,还是人的错?

CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论