初探 Polis 2.0:邁向關鍵評論網絡
Polis 1.0 匯集意見的城邦
Polis 是一個開源的群眾意見匯集系統,取其「城邦」原意,象徵在網路世界,人人的意見都可以被友善的、並陳的對待。因此 polis 被廣泛應用於世界各地的公民審議過程,尤其是需要線上與線下整合的環節。Polis 背後與參與式預算、法令修改、審議式民主息息相關。根據其官網所示,Polis 用於收集、分析和理解大量人們的真實想法,並以他們自己的言語表達,透過統計和機器學習來達成。
簡要敘述流程,任何人都可以發起一個 polis 問卷調查,準備好關鍵陳述(Seed Statement),便可以開放大眾前往作答。如同心理測驗的是非題選項,作答者在答題的過程中,會漸漸被劃分到立場相近的陣營,這樣的陣營在稍後會被視覺化,以圖表的方式顯現。這有助於之後實際的審議過程,讓參與者們更清楚自己的立場,並根據關鍵陳述,進行更有效的討論。
以上是 Polis 的具體流程,在台灣曾被應用於 vTaiwan(數位經濟法規線上諮詢)、READr 互動式報導頁面(如數位身分證、四大公投立場等報導)、台美議題互動等等,由於是開源工具,所有人都可以使用其工具。
Polis 2.0 與城市對話
今年四月開始,英國的非營利組織集體智慧專案(CIP)發起對齊大會(Alignment Assemblies, AA),與發行ChatGPT的組織OpenAI、發行Claude的公司Anthropic一起討論大型語言模型(LLM)開發時必然面對的對齊問題(Alignment Problem)。數位部(moda)作為夥伴,於今年七月於點子松(Ideathon)進行先行示範,也就是俗稱的 polis2.0。
如果說 polis 既有的威力,在於將不同時間的參與者進行齊一編列的記述(chronicle),以對齊彼此的歧見。那 polis 2.0 的特色在於,攤開歧見,讓所有人都可以繼續對話,而對話的對象為虛擬人大型語言模型(簡稱 LLM)(目前使用 ChatGPT, GPT3.5turbo)。
這次在點子松頁面,除了可以看到數十項關鍵陳述的 polis 小卡可以作答外,AA 的過程也導入了「我城對談」(Talk to the City,暫譯)。「我城」為「人工智慧目標機構」(AI Objectives Institute, AOI)開發的工具,可以根據不同來源的叢集,如 Twitter 的推文、審議工作坊的立場、Polis 的結果,訓練出議題視覺化地圖。其中最創新的發明為,使用者可以與這些叢集繼續聊天。
LLM 會根據這些叢集的立場與你分享所見所聞。
這一次在台灣嘗試的對齊大會,便是將點子松的陳述意見與投票結果,餵進「我城」,並展開新的議題叢集,讓更多人可以與各個叢集繼續聊天,打開與不同異見對話的空間。
比如說,我點進「人工智慧倫理」的叢集,有一題是「法官在評估過程中不應使用AI工具。」,我接著回答「我不同意」,
帶有🏛️ 表情符號的 LLM 就會像沙包一樣回答「我理解你可能對這個問題有不同的看法。然而,我認為法官在評估過程中不應依賴人工智慧工具。人工智慧工具可能引入偏見或錯誤,影響判斷的公正性和準確性。人類的判斷能力,包括考慮背景、細微差別和主觀因素的能力,在評估複雜和主觀問題時是必不可少的。僅僅依賴人工智慧工具可能會損害評估過程的完整性。」
以上整體流程,被稱為 Polis 2.0。
這稍稍解決(但沒有完全取代)的功能,是審議後的梳理流程,如 READr 針對數位身分證發起 Polis,並在後續根據資料結果進行報導。「我城」將結果視覺化為聊天工具,也是一種相對客觀的報導過程,只是使用的體驗介面不同,單向互動轉為雙向。
AOI 也是一個討論AI對齊、促進人類繁榮的研究實驗室,根據其頁面解釋:「Talk to the City是一個LLM調查工具,分析豐富的質性結果,來改善群體討論和決策,而非根據有限的量化資料。質性研究結果能夠以空前的規模與速度進行自動分析,協助政策制定者發現未知和爭議的關鍵點。我們正在孵化這個工來來滿足各種需求,如民主程序和工會決策、理解難民營的需求以及調解衝突。」
Meta-polis 城市作為角色扮演舞台
對我而言,這真的是極為聰明的 pilot 嘗試。這不禁讓我想要一路往下想想,天真但重要的應用方式,姑且先稱為 meta-polis(元城邦)。
請看流程圖輔助閱讀,在 polis 1.0,我們看到了強大的視覺化整合分析工具,可以協助群體梳理出關鍵問題與決策意向;而加入了「我城」的 polis 2.0,在關鍵問題與決策之後,展開了更多對話的可能。這讓我覺得兩者是有機會組成一個回饋圈,訓練出針對特定場景的 LLM 關鍵意見者。
比如:當初始設定者決定好關鍵陳述,輸入進 polis,並透過大量的使用者進行回覆,其實已經訓練好 n 版本的統計數據,而將此數據餵給「我城」後,我城可以根據「立場」而非「議題」建立叢集,並將特定立場的陳述訓練成 LoRA(可以想像成劇本殺的角色扮演者),每一個 LoRA 蓋到 LLM 之後,都有自己的角色。如此立場鮮明的角色,即將成為沒有知覺的沙包(或強悍的立場維護者,就看 prompt 如何設定)。當使用者登入「我城」後,即可與這些「虛擬意見領袖」進行對話。
這是一個數位公共領域的 RPG 遊戲,讓人與擬人(集體意見幽魂)可以共同討論嚴肅的議題,並區隔衝突。
而這些對話紀錄,又可以記錄成為新的資料庫,經過 LLM 的再分析,成為新的關鍵陳述,提供給 polis,擴增其答題資料庫,此時 n+1 的資料庫版本便成立了,新的 LoRA (n+1) 也將可以持續更新訓練。
「關鍵評論網絡」由此形成。
這些關鍵評論網絡,其實就是集體意見的擬人化,而這些擬人,將比真人更能承受極端意見的往返。此外,在可見的未來,不同立場的「虛擬意見領袖」可以快速互相對話,畢竟目前的 LLM 特色是每次回應的結果,根據溫度(temp)不同,回答的不可預測性也會不同,這將有可能整理出大量人工意見,並形成自適應的回饋循環(Feedback Loop),光是想到這個可能性就非常興奮。
透過 polis 與 talk to the city 回饋循環的可見優點有二:
一、催化異見:跨越時間的立場累積,產生一種高維度「硬直」狀態,將使人類意識到異見迭代的歷史,一再重演,是如此相似。我樂觀地認為,這將使時間維度如此緩慢的現代公民,更謙卑於爭執的過程,而非拘泥於結果。
二、立場擬人:這些關鍵陳述打造出來的評論網絡,將成為擬人 LLM。我樂觀地認為,雖然是由機器區分的立場,但我們可能可以毫不費力的將現實世界的多方利害關係人,套入不同的立場裡面。若說 LARP(臨場動態角色扮演遊戲,Live Action Role Playing)幫助參與者換位思考與強化各種立場的回饋,那在 Talk to the City 中,是有機會創造出虛擬人機協作的 LARP 劇本的。史丹佛大學和Google的研究者於四月的 LLM RPG 訓練論文(Generative Agents: Interactive Simulacra of Human Behavior),預示了 AI 居民自適應的可能性,而數位公共場域的對話,將是一個重要的開發題目。
小結.邁向關鍵評論網絡
Polis 解決了意見文本化的問題,畢竟大量的文字意見,是訓練 LLM 與其上 LoRA 的關鍵瓶頸,而 Talk to the City 解決了回饋需求,讓種子意見有可能自動化的誕生,充足 polis 資料庫,並在舒服的環境中,徵集更多文字意見。當然這只是樂觀的推測,還有許多實際的技術開發需求與運算限制必須克服。
當然,這段回饋循環的調控過程中,將仰賴設計者調整語氣與迭代的方向,避免極化(Polarization)的虛擬意見領袖誕生(但這也不啻是一個好的研究題目?)。本文認為 Polis 2.0 開啟了虛擬 LARP 公共領域對話的可能性。不同地域的社會網絡,將無可避免的仰賴意見領袖,無論是實體世界還是數位社會。而 polis 加上 talk to the city 合成的網絡,將揭示了多元意見領袖的可能性,因此稱之為「關鍵評論網絡」。