初探 Polis 2.0：邁向關鍵評論網絡

2023 年 8 月 22 日

An Initial Exploration of Polis 2.0: Moving Towards Seed Review Networks。本文介紹了 Polis 的運作方法，與加入了 AOI 開發的群眾對話工具 Talk to the city 之後的 Polis 2.0 試行專案點子松 AI 民主化對齊大會。並就可能的回饋網絡與角色扮演的未來，進行腦力激盪。

Polis 1.0 匯集意見的城邦

Polis 是一個開源的群眾意見匯集系統，取其「城邦」原意，象徵在網路世界，人人的意見都可以被友善的、並陳的對待。因此 polis 被廣泛應用於世界各地的公民審議過程，尤其是需要線上與線下整合的環節。Polis 背後與參與式預算、法令修改、審議式民主息息相關。根據其官網所示，Polis 用於收集、分析和理解大量人們的真實想法，並以他們自己的言語表達，透過統計和機器學習來達成。

簡要敘述流程，任何人都可以發起一個 polis 問卷調查，準備好關鍵陳述（Seed Statement），便可以開放大眾前往作答。如同心理測驗的是非題選項，作答者在答題的過程中，會漸漸被劃分到立場相近的陣營，這樣的陣營在稍後會被視覺化，以圖表的方式顯現。這有助於之後實際的審議過程，讓參與者們更清楚自己的立場，並根據關鍵陳述，進行更有效的討論。

以上是 Polis 的具體流程，在台灣曾被應用於 vTaiwan（數位經濟法規線上諮詢）、READr 互動式報導頁面（如數位身分證、四大公投立場等報導）、台美議題互動等等，由於是開源工具，所有人都可以使用其工具。

Polis 2.0 與城市對話

今年四月開始，英國的非營利組織集體智慧專案（CIP）發起對齊大會（Alignment Assemblies, AA），與發行ChatGPT的組織OpenAI、發行Claude的公司Anthropic一起討論大型語言模型（LLM）開發時必然面對的對齊問題（Alignment Problem）。數位部（moda）作為夥伴，於今年七月於點子松（Ideathon）進行先行示範，也就是俗稱的 polis2.0。

如果說 polis 既有的威力，在於將不同時間的參與者進行齊一編列的記述（chronicle），以對齊彼此的歧見。那 polis 2.0 的特色在於，攤開歧見，讓所有人都可以繼續對話，而對話的對象為虛擬人大型語言模型（簡稱 LLM）（目前使用 ChatGPT, GPT3.5turbo）。

這次在點子松頁面，除了可以看到數十項關鍵陳述的 polis 小卡可以作答外，AA 的過程也導入了「我城對談」（Talk to the City，暫譯）。「我城」為「人工智慧目標機構」（AI Objectives Institute, AOI）開發的工具，可以根據不同來源的叢集，如 Twitter 的推文、審議工作坊的立場、Polis 的結果，訓練出議題視覺化地圖。其中最創新的發明為，使用者可以與這些叢集繼續聊天。

LLM 會根據這些叢集的立場與你分享所見所聞。

這一次在台灣嘗試的對齊大會，便是將點子松的陳述意見與投票結果，餵進「我城」，並展開新的議題叢集，讓更多人可以與各個叢集繼續聊天，打開與不同異見對話的空間。

比如說，我點進「人工智慧倫理」的叢集，有一題是「法官在評估過程中不應使用AI工具。」，我接著回答「我不同意」，

帶有🏛️ 表情符號的 LLM 就會像沙包一樣回答「我理解你可能對這個問題有不同的看法。然而，我認為法官在評估過程中不應依賴人工智慧工具。人工智慧工具可能引入偏見或錯誤，影響判斷的公正性和準確性。人類的判斷能力，包括考慮背景、細微差別和主觀因素的能力，在評估複雜和主觀問題時是必不可少的。僅僅依賴人工智慧工具可能會損害評估過程的完整性。」

以上整體流程，被稱為 Polis 2.0。

這稍稍解決（但沒有完全取代）的功能，是審議後的梳理流程，如 READr 針對數位身分證發起 Polis，並在後續根據資料結果進行報導。「我城」將結果視覺化為聊天工具，也是一種相對客觀的報導過程，只是使用的體驗介面不同，單向互動轉為雙向。

AOI 也是一個討論AI對齊、促進人類繁榮的研究實驗室，根據其頁面解釋：「Talk to the City是一個LLM調查工具，分析豐富的質性結果，來改善群體討論和決策，而非根據有限的量化資料。質性研究結果能夠以空前的規模與速度進行自動分析，協助政策制定者發現未知和爭議的關鍵點。我們正在孵化這個工來來滿足各種需求，如民主程序和工會決策、理解難民營的需求以及調解衝突。」

Meta-polis 城市作為角色扮演舞台

對我而言，這真的是極為聰明的 pilot 嘗試。這不禁讓我想要一路往下想想，天真但重要的應用方式，姑且先稱為 meta-polis（元城邦）。

請看流程圖輔助閱讀，在 polis 1.0，我們看到了強大的視覺化整合分析工具，可以協助群體梳理出關鍵問題與決策意向；而加入了「我城」的 polis 2.0，在關鍵問題與決策之後，展開了更多對話的可能。這讓我覺得兩者是有機會組成一個回饋圈，訓練出針對特定場景的 LLM 關鍵意見者。

比如：當初始設定者決定好關鍵陳述，輸入進 polis，並透過大量的使用者進行回覆，其實已經訓練好 n 版本的統計數據，而將此數據餵給「我城」後，我城可以根據「立場」而非「議題」建立叢集，並將特定立場的陳述訓練成 LoRA（可以想像成劇本殺的角色扮演者），每一個 LoRA 蓋到 LLM 之後，都有自己的角色。如此立場鮮明的角色，即將成為沒有知覺的沙包（或強悍的立場維護者，就看 prompt 如何設定）。當使用者登入「我城」後，即可與這些「虛擬意見領袖」進行對話。

這是一個數位公共領域的 RPG 遊戲，讓人與擬人（集體意見幽魂）可以共同討論嚴肅的議題，並區隔衝突。

而這些對話紀錄，又可以記錄成為新的資料庫，經過 LLM 的再分析，成為新的關鍵陳述，提供給 polis，擴增其答題資料庫，此時 n+1 的資料庫版本便成立了，新的 LoRA (n+1) 也將可以持續更新訓練。

「關鍵評論網絡」由此形成。

這些關鍵評論網絡，其實就是集體意見的擬人化，而這些擬人，將比真人更能承受極端意見的往返。此外，在可見的未來，不同立場的「虛擬意見領袖」可以快速互相對話，畢竟目前的 LLM 特色是每次回應的結果，根據溫度（temp）不同，回答的不可預測性也會不同，這將有可能整理出大量人工意見，並形成自適應的回饋循環（Feedback Loop），光是想到這個可能性就非常興奮。

透過 polis 與 talk to the city 回饋循環的可見優點有二：

一、催化異見：跨越時間的立場累積，產生一種高維度「硬直」狀態，將使人類意識到異見迭代的歷史，一再重演，是如此相似。我樂觀地認為，這將使時間維度如此緩慢的現代公民，更謙卑於爭執的過程，而非拘泥於結果。

二、立場擬人：這些關鍵陳述打造出來的評論網絡，將成為擬人 LLM。我樂觀地認為，雖然是由機器區分的立場，但我們可能可以毫不費力的將現實世界的多方利害關係人，套入不同的立場裡面。若說 LARP（臨場動態角色扮演遊戲，Live Action Role Playing）幫助參與者換位思考與強化各種立場的回饋，那在 Talk to the City 中，是有機會創造出虛擬人機協作的 LARP 劇本的。史丹佛大學和Google的研究者於四月的 LLM RPG 訓練論文（Generative Agents: Interactive Simulacra of Human Behavior），預示了 AI 居民自適應的可能性，而數位公共場域的對話，將是一個重要的開發題目。

小結．邁向關鍵評論網絡

Polis 解決了意見文本化的問題，畢竟大量的文字意見，是訓練 LLM 與其上 LoRA 的關鍵瓶頸，而 Talk to the City 解決了回饋需求，讓種子意見有可能自動化的誕生，充足 polis 資料庫，並在舒服的環境中，徵集更多文字意見。當然這只是樂觀的推測，還有許多實際的技術開發需求與運算限制必須克服。

當然，這段回饋循環的調控過程中，將仰賴設計者調整語氣與迭代的方向，避免極化（Polarization）的虛擬意見領袖誕生（但這也不啻是一個好的研究題目？）。本文認為 Polis 2.0 開啟了虛擬 LARP 公共領域對話的可能性。不同地域的社會網絡，將無可避免的仰賴意見領袖，無論是實體世界還是數位社會。而 polis 加上 talk to the city 合成的網絡，將揭示了多元意見領袖的可能性，因此稱之為「關鍵評論網絡」。

初探 Polis 2.0：邁向關鍵評論網絡

Polis 1.0 匯集意見的城邦

Polis 2.0 與城市對話

Meta-polis 城市作為角色扮演舞台

小結．邁向關鍵評論網絡

相關連結

《自主世界：雲端封建時代的安那其法則》中文版譯序

分散式身分會被資本市場的鐵拳制裁嗎？

「共同在場」是什麼感覺？中山女高演講隨筆

《自主世界：雲端封建時代的安那其法則》中文版譯序

分散式身分會被資本市場的鐵拳制裁嗎？

「共同在場」是什麼感覺？中山女高演講隨筆