初探Polis 2.0：迈向关键评论网络

2023 年 8 月 22 日

An Initial Exploration of Polis 2.0: Moving Towards Seed Review Networks。本文介绍了Polis 的运作方法，与加入了AOI 开发的群众对话工具Talk to the city 之后的Polis 2.0 试行专案点子松AI 民主化对齐大会。并就可能的回馈网络与角色扮演的未来，进行脑力激荡。

Polis 1.0 汇集意见的城邦

Polis 是一个开源的群众意见汇集系统，取其「城邦」原意，象征在网路世界，人人的意见都可以被友善的、并陈的对待。因此polis 被广泛应用于世界各地的公民审议过程，尤其是需要线上与线下整合的环节。 Polis 背后与参与式预算、法令修改、审议式民主息息相关。根据其官网所示，Polis 用于收集、分析和理解大量人们的真实想法，并以他们自己的言语表达，透过统计和机器学习来达成。

简要叙述流程，任何人都可以发起一个polis 问卷调查，准备好关键陈述（Seed Statement），便可以开放大众前往作答。如同心理测验的是非题选项，作答者在答题的过程中，会渐渐被划分到立场相近的阵营，这样的阵营在稍后会被视觉化，以图表的方式显现。这有助于之后实际的审议过程，让参与者们更清楚自己的立场，并根据关键陈述，进行更有效的讨论。

以上是Polis 的具体流程，在台湾曾被应用于vTaiwan （数位经济法规线上咨询）、READr 互动式报导页面（如数位身分证、四大公投立场等报导）、台美议题互动等等，由于是开源工具，所有人都可以使用其工具。

Polis 2.0 与城市对话

今年四月开始，英国的非营利组织集体智慧专案（CIP）发起对齐大会（Alignment Assemblies, AA），与发行ChatGPT的组织OpenAI、发行Claude的公司Anthropic一起讨论大型语言模型（LLM）开发时必然面对的对齐问题（Alignment Problem）。数位部（moda）作为伙伴，于今年七月于点子松（Ideathon）进行先行示范，也就是俗称的polis2.0。

如果说polis 既有的威力，在于将不同时间的参与者进行齐一编列的记述（chronicle），以对齐彼此的歧见。那polis 2.0 的特色在于，摊开歧见，让所有人都可以继续对话，而对话的对象为虚拟人大型语言模型（简称LLM）（目前使用ChatGPT, GPT3.5turbo）。

这次在点子松页面，除了可以看到数十项关键陈述的polis 小卡可以作答外，AA 的过程也导入了「我城对谈」（Talk to the City，暂译）。「我城」为「人工智慧目标机构」（AI Objectives Institute, AOI）开发的工具，可以根据不同来源的丛集，如Twitter 的推文、审议工作坊的立场、Polis 的结果，训练出议题视觉化地图。其中最创新的发明为，使用者可以与这些丛集继续聊天。

LLM 会根据这些丛集的立场与你分享所见所闻。

这一次在台湾尝试的对齐大会，便是将点子松的陈述意见与投票结果，喂进「我城」，并展开新的议题丛集，让更多人可以与各个丛集继续聊天，打开与不同异见对话的空间。

比如说，我点进「人工智慧伦理」的丛集，有一题是「法官在评估过程中不应使用AI工具。」，我接着回答「我不同意」，

带有🏛️ 表情符号的LLM 就会像沙包一样回答「我理解你可能对这个问题有不同的看法。然而，我认为法官在评估过程中不应依赖人工智慧工具。人工智慧工具可能引入偏见或错误，影响判断的公正性和准确性。人类的判断能力，包括考虑背景、细微差别和主观因素的能力，在评估复杂和主观问题时是必不可少的。仅仅依赖人工智慧工具可能会损害评估过程的完整性。」

以上整体流程，被称为Polis 2.0。

这稍稍解决（但没有完全取代）的功能，是审议后的梳理流程，如READr 针对数位身分证发起Polis，并在后续根据资料结果进行报导。「我城」将结果视觉化为聊天工具，也是一种相对客观的报导过程，只是使用的体验介面不同，单向互动转为双向。

AOI 也是一个讨论AI对齐、促进人类繁荣的研究实验室，根据其页面解释：「Talk to the City是一个LLM调查工具，分析丰富的质性结果，来改善群体讨论和决策，而非根据有限的量化资料。质性研究结果能够以空前的规模与速度进行自动分析，协助政策制定者发现未知和争议的关键点。我们正在孵化这个工来来满足各种需求，如民主程序和工会决策、理解难民营的需求以及调解冲突。」

Meta-polis 城市作为角色扮演舞台

对我而言，这真的是极为聪明的pilot 尝试。这不禁让我想要一路往下想想，天真但重要的应用方式，姑且先称为meta-polis（元城邦）。

请看流程图辅助阅读，在polis 1.0，我们看到了强大的视觉化整合分析工具，可以协助群体梳理出关键问题与决策意向；而加入了「我城」的polis 2.0，在关键问题与决策之后，展开了更多对话的可能。这让我觉得两者是有机会组成一个回馈圈，训练出针对特定场景的LLM 关键意见者。

比如：当初始设定者决定好关键陈述，输入进polis，并透过大量的使用者进行回覆，其实已经训练好n 版本的统计数据，而将此数据喂给「我城」后，我城可以根据「立场」而非「议题」建立丛集，并将特定立场的陈述训练成LoRA（可以想像成剧本杀的角色扮演者），每一个LoRA 盖到LLM 之后，都有自己的角色。如此立场鲜明的角色，即将成为没有知觉的沙包（或强悍的立场维护者，就看prompt 如何设定）。当使用者登入「我城」后，即可与这些「虚拟意见领袖」进行对话。

这是一个数位公共领域的RPG 游戏，让人与拟人（集体意见幽魂）可以共同讨论严肃的议题，并区隔冲突。

而这些对话纪录，又可以记录成为新的资料库，经过LLM 的再分析，成为新的关键陈述，提供给polis，扩增其答题资料库，此时n+1 的资料库版本便成立了，新的LoRA (n+1) 也将可以持续更新训练。

「关键评论网络」由此形成。

这些关键评论网络，其实就是集体意见的拟人化，而这些拟人，将比真人更能承受极端意见的往返。此外，在可见的未来，不同立场的「虚拟意见领袖」可以快速互相对话，毕竟目前的LLM 特色是每次回应的结果，根据温度（temp）不同，回答的不可预测性也会不同，这将有可能整理出大量人工意见，并形成自适应的回馈循环（Feedback Loop），光是想到这个可能性就非常兴奋。

透过polis 与talk to the city 回馈循环的可见优点有二：

一、催化异见：跨越时间的立场累积，产生一种高维度「硬直」状态，将使人类意识到异见迭代的历史，一再重演，是如此相似。我乐观地认为，这将使时间维度如此缓慢的现代公民，更谦卑于争执的过程，而非拘泥于结果。

二、立场拟人：这些关键陈述打造出来的评论网络，将成为拟人LLM。我乐观地认为，虽然是由机器区分的立场，但我们可能可以毫不费力的将现实世界的多方利害关系人，套入不同的立场里面。若说LARP（临场动态角色扮演游戏，Live Action Role Playing）帮助参与者换位思考与强化各种立场的回馈，那在Talk to the City 中，是有机会创造出虚拟人机协作的LARP 剧本的。史丹佛大学和Google的研究者于四月的LLM RPG 训练论文（Generative Agents: Interactive Simulacra of Human Behavior），预示了AI 居民自适应的可能性，而数位公共场域的对话，将是一个重要的开发题目。

小结．迈向关键评论网络

Polis 解决了意见文本化的问题，毕竟大量的文字意见，是训练LLM 与其上LoRA 的关键瓶颈，而Talk to the City 解决了回馈需求，让种子意见有可能自动化的诞生，充足polis 资料库，并在舒服的环境中，征集更多文字意见。当然这只是乐观的推测，还有许多实际的技术开发需求与运算限制必须克服。

当然，这段回馈循环的调控过程中，将仰赖设计者调整语气与迭代的方向，避免极化（Polarization）的虚拟意见领袖诞生（但这也不啻是一个好的研究题目？）。本文认为Polis 2.0 开启了虚拟LARP 公共领域对话的可能性。不同地域的社会网络，将无可避免的仰赖意见领袖，无论是实体世界还是数位社会。而polis 加上talk to the city 合成的网络，将揭示了多元意见领袖的可能性，因此称之为「关键评论网络」。