豆泥
豆泥

分散式自治實踐與研究者,尋找有別於電馭極權與財閥亂鬥的第三條路。喜歡討論,請別客氣與我討論。

初探Polis 2.0:迈向关键评论网络

(编辑过)
An Initial Exploration of Polis 2.0: Moving Towards Seed Review Networks。本文介绍了Polis 的运作方法,与加入了AOI 开发的群众对话工具Talk to the city 之后的Polis 2.0 试行专案点子松AI 民主化对齐大会。并就可能的回馈网络与角色扮演的未来,进行脑力激荡。
Talk to the City 视觉化推特有关AI 的星丛

Polis 1.0 汇集意见的城邦

Polis 是一个开源的群众意见汇集系统,取其「城邦」原意,象征在网路世界,人人的意见都可以被友善的、并陈的对待。因此polis 被广泛应用于世界各地的公民审议过程,尤其是需要线上与线下整合的环节。 Polis 背后与参与式预算、法令修改、审议式民主息息相关。根据其官网所示,Polis 用于收集、分析和理解大量人们的真实想法,并以他们自己的言语表达,透过统计和机器学习来达成。

简要叙述流程,任何人都可以发起一个polis 问卷调查,准备好关键陈述(Seed Statement),便可以开放大众前往作答。如同心理测验的是非题选项,作答者在答题的过程中,会渐渐被划分到立场相近的阵营,这样的阵营在稍后会被视觉化,以图表的方式显现。这有助于之后实际的审议过程,让参与者们更清楚自己的立场,并根据关键陈述,进行更有效的讨论。

以上是Polis 的具体流程,在台湾曾被应用于vTaiwan (数位经济法规线上咨询)、READr 互动式报导页面( 如数位身分证四大公投立场等报导)、台美议题互动等等,由于是开源工具,所有人都可以使用其工具。


Polis 2.0 与城市对话

今年四月开始,英国的非营利组织集体智慧专案(CIP)发起对齐大会(Alignment Assemblies, AA),与发行ChatGPT的组织OpenAI、发行Claude的公司Anthropic一起讨论大型语言模型(LLM)开发时必然面对的对齐问题(Alignment Problem)。数位部(moda)作为伙伴,于今年七月于点子松(Ideathon)进行先行示范,也就是俗称的polis2.0。

如果说polis 既有的威力,在于将不同时间的参与者进行齐一编列的记述(chronicle),以对齐彼此的歧见。那polis 2.0 的特色在于,摊开歧见,让所有人都可以继续对话,而对话的对象为虚拟人大型语言模型(简称LLM)(目前使用ChatGPT, GPT3.5turbo)。

这次在点子松页面,除了可以看到数十项关键陈述的polis 小卡可以作答外,AA 的过程也导入了「我城对谈」(Talk to the City,暂译)。 「我城」为「人工智慧目标机构」(AI Objectives Institute, AOI)开发的工具,可以根据不同来源的丛集,如Twitter 的推文、审议工作坊的立场、Polis 的结果,训练出议题视觉化地图。其中最创新的发明为,使用者可以与这些丛集继续聊天。

LLM 会根据这些丛集的立场与你分享所见所闻。

这一次在台湾尝试的对齐大会,便是将点子松的陈述意见与投票结果,喂进「我城」,并展开新的议题丛集,让更多人可以与各个丛集继续聊天,打开与不同异见对话的空间。

比如说,我点进「 人工智慧伦理」的丛集,有一题是「法官在评估过程中不应使用AI工具。」,我接着回答「我不同意」,

带有🏛️ 表情符号的LLM 就会像沙包一样回答「我理解你可能对这个问题有不同的看法。然而,我认为法官在评估过程中不应依赖人工智慧工具。人工智慧工具可能引入偏见或错误,影响判断的公正性和准确性。人类的判断能力,包括考虑背景、细微差别和主观因素的能力,在评估复杂和主观问题时是必不可少的。仅仅依赖人工智慧工具可能会损害评估过程的完整性。」

以上整体流程,被称为Polis 2.0。

本次点子松Polis资料汇入Talk to the City 的结果

这稍稍解决(但没有完全取代)的功能,是审议后的梳理流程,如READr 针对数位身分证发起Polis,并在后续根据资料结果进行报导。 「我城」将结果视觉化为聊天工具,也是一种相对客观的报导过程,只是使用的体验介面不同,单向互动转为双向。

AOI 也是一个讨论AI对齐、促进人类繁荣的研究实验室,根据其页面解释:「Talk to the City是一个LLM调查工具,分析丰富的质性结果,来改善群体讨论和决策,而非根据有限的量化资料。质性研究结果能够以空前的规模与速度进行自动分析,协助政策制定者发现未知和争议的关键点。我们正在孵化这个工来来满足各种需求,如民主程序和工会决策、理解难民营的需求以及调解冲突。」


Meta-polis 城市作为角色扮演舞台

对我而言,这真的是极为聪明的pilot 尝试。这不禁让我想要一路往下想想,天真但重要的应用方式,姑且先称为meta-polis(元城邦)。

请看流程图辅助阅读,在polis 1.0,我们看到了强大的视觉化整合分析工具,可以协助群体梳理出关键问题与决策意向;而加入了「我城」的polis 2.0,在关键问题与决策之后,展开了更多对话的可能。这让我觉得两者是有机会组成一个回馈圈,训练出针对特定场景的LLM 关键意见者。

比如:当初始设定者决定好关键陈述,输入进polis,并透过大量的使用者进行回覆,其实已经训练好n 版本的统计数据,而将此数据喂给「我城」后,我城可以根据「立场」而非「议题」建立丛集,并将特定立场的陈述训练成LoRA(可以想像成剧本杀的角色扮演者),每一个LoRA 盖到LLM 之后,都有自己的角色。如此立场鲜明的角色,即将成为没有知觉的沙包(或强悍的立场维护者,就看prompt 如何设定)。当使用者登入「我城」后,即可与这些「虚拟意见领袖」进行对话。

这是一个数位公共领域的RPG 游戏,让人与拟人(集体意见幽魂)可以共同讨论严肃的议题,并区隔冲突。

而这些对话纪录,又可以记录成为新的资料库,经过LLM 的再分析,成为新的关键陈述,提供给polis,扩增其答题资料库,此时n+1 的资料库版本便成立了,新的LoRA (n+1) 也将可以持续更新训练。

「关键评论网络」由此形成。

这些关键评论网络,其实就是集体意见的拟人化,而这些拟人,将比真人更能承受极端意见的往返。此外,在可见的未来,不同立场的「虚拟意见领袖」可以快速互相对话,毕竟目前的LLM 特色是每次回应的结果,根据温度(temp)不同,回答的不可预测性也会不同,这将有可能整理出大量人工意见,并形成自适应的回馈循环(Feedback Loop),光是想到这个可能性就非常兴奋。

透过polis 与talk to the city 回馈循环的可见优点有二:

一、催化异见:跨越时间的立场累积,产生一种高维度「硬直」状态,将使人类意识到异见迭代的历史,一再重演,是如此相似。我乐观地认为,这将使时间维度如此缓慢的现代公民,更谦卑于争执的过程,而非拘泥于结果。

二、立场拟人:这些关键陈述打造出来的评论网络,将成为拟人LLM。我乐观地认为,虽然是由机器区分的立场,但我们可能可以毫不费力的将现实世界的多方利害关系人,套入不同的立场里面。若说LARP(临场动态角色扮演游戏,Live Action Role Playing)帮助参与者换位思考与强化各种立场的回馈,那在Talk to the City 中,是有机会创造出虚拟人机协作的LARP 剧本的。史丹佛大学和Google的研究者于四月的LLM RPG 训练论文(Generative Agents: Interactive Simulacra of Human Behavior),预示了AI 居民自适应的可能性,而数位公共场域的对话,将是一个重要的开发题目。


小结.迈向关键评论网络

Polis 解决了意见文本化的问题,毕竟大量的文字意见,是训练LLM 与其上LoRA 的关键瓶颈,而Talk to the City 解决了回馈需求,让种子意见有可能自动化的诞生,充足polis 资料库,并在舒服的环境中,征集更多文字意见。当然这只是乐观的推测,还有许多实际的技术开发需求与运算限制必须克服。

当然,这段回馈循环的调控过程中,将仰赖设计者调整语气与迭代的方向,避免极化(Polarization)的虚拟意见领袖诞生(但这也不啻是一个好的研究题目?)。本文认为Polis 2.0 开启了虚拟LARP 公共领域对话的可能性。不同地域的社会网络,将无可避免的仰赖意见领袖,无论是实体世界还是数位社会。而polis 加上talk to the city 合成的网络,将揭示了多元意见领袖的可能性,因此称之为「关键评论网络」。


相关连结

  1. Talk to the City 于点子松的试点

  2. 点子松AI 民主化Polis 议题页面

  3. AI 目标机构AOI 官方网站

  4. Generative Agents: Interactive Simulacra of Human Behavior

CC BY-NC-ND 4.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论