豆泥
豆泥

分散式自治實踐與研究者,尋找有別於電馭極權與財閥亂鬥的第三條路。喜歡討論,請別客氣與我討論。

初探 Polis 2.0:邁向關鍵評論網絡

(编辑过)
An Initial Exploration of Polis 2.0: Moving Towards Seed Review Networks。本文介紹了 Polis 的運作方法,與加入了 AOI 開發的群眾對話工具 Talk to the city 之後的 Polis 2.0 試行專案點子松 AI 民主化對齊大會。並就可能的回饋網絡與角色扮演的未來,進行腦力激盪。
Talk to the City 視覺化推特有關 AI 的星叢

Polis 1.0 匯集意見的城邦

Polis 是一個開源的群眾意見匯集系統,取其「城邦」原意,象徵在網路世界,人人的意見都可以被友善的、並陳的對待。因此 polis 被廣泛應用於世界各地的公民審議過程,尤其是需要線上與線下整合的環節。Polis 背後與參與式預算、法令修改、審議式民主息息相關。根據其官網所示,Polis 用於收集、分析和理解大量人們的真實想法,並以他們自己的言語表達,透過統計和機器學習來達成。

簡要敘述流程,任何人都可以發起一個 polis 問卷調查,準備好關鍵陳述(Seed Statement),便可以開放大眾前往作答。如同心理測驗的是非題選項,作答者在答題的過程中,會漸漸被劃分到立場相近的陣營,這樣的陣營在稍後會被視覺化,以圖表的方式顯現。這有助於之後實際的審議過程,讓參與者們更清楚自己的立場,並根據關鍵陳述,進行更有效的討論。

以上是 Polis 的具體流程,在台灣曾被應用於 vTaiwan(數位經濟法規線上諮詢)、READr 互動式報導頁面(如數位身分證四大公投立場等報導)、台美議題互動等等,由於是開源工具,所有人都可以使用其工具。


Polis 2.0 與城市對話

今年四月開始,英國的非營利組織集體智慧專案(CIP)發起對齊大會(Alignment Assemblies, AA),與發行ChatGPT的組織OpenAI、發行Claude的公司Anthropic一起討論大型語言模型(LLM)開發時必然面對的對齊問題(Alignment Problem)。數位部(moda)作為夥伴,於今年七月於點子松(Ideathon)進行先行示範,也就是俗稱的 polis2.0。

如果說 polis 既有的威力,在於將不同時間的參與者進行齊一編列的記述(chronicle),以對齊彼此的歧見。那 polis 2.0 的特色在於,攤開歧見,讓所有人都可以繼續對話,而對話的對象為虛擬人大型語言模型(簡稱 LLM)(目前使用 ChatGPT, GPT3.5turbo)。

這次在點子松頁面,除了可以看到數十項關鍵陳述的 polis 小卡可以作答外,AA 的過程也導入了「我城對談」(Talk to the City,暫譯)。「我城」為「人工智慧目標機構」(AI Objectives Institute, AOI)開發的工具,可以根據不同來源的叢集,如 Twitter 的推文、審議工作坊的立場、Polis 的結果,訓練出議題視覺化地圖。其中最創新的發明為,使用者可以與這些叢集繼續聊天。

LLM 會根據這些叢集的立場與你分享所見所聞。

這一次在台灣嘗試的對齊大會,便是將點子松的陳述意見與投票結果,餵進「我城」,並展開新的議題叢集,讓更多人可以與各個叢集繼續聊天,打開與不同異見對話的空間。

比如說,我點進「人工智慧倫理」的叢集,有一題是「法官在評估過程中不應使用AI工具。」,我接著回答「我不同意」,

帶有🏛️ 表情符號的 LLM 就會像沙包一樣回答「我理解你可能對這個問題有不同的看法。然而,我認為法官在評估過程中不應依賴人工智慧工具。人工智慧工具可能引入偏見或錯誤,影響判斷的公正性和準確性。人類的判斷能力,包括考慮背景、細微差別和主觀因素的能力,在評估複雜和主觀問題時是必不可少的。僅僅依賴人工智慧工具可能會損害評估過程的完整性。」

以上整體流程,被稱為 Polis 2.0。

本次點子松Polis資料匯入 Talk to the City 的結果

這稍稍解決(但沒有完全取代)的功能,是審議後的梳理流程,如 READr 針對數位身分證發起 Polis,並在後續根據資料結果進行報導。「我城」將結果視覺化為聊天工具,也是一種相對客觀的報導過程,只是使用的體驗介面不同,單向互動轉為雙向。

AOI 也是一個討論AI對齊、促進人類繁榮的研究實驗室,根據其頁面解釋:「Talk to the City是一個LLM調查工具,分析豐富的質性結果,來改善群體討論和決策,而非根據有限的量化資料。質性研究結果能夠以空前的規模與速度進行自動分析,協助政策制定者發現未知和爭議的關鍵點。我們正在孵化這個工來來滿足各種需求,如民主程序和工會決策、理解難民營的需求以及調解衝突。」


Meta-polis 城市作為角色扮演舞台

對我而言,這真的是極為聰明的 pilot 嘗試。這不禁讓我想要一路往下想想,天真但重要的應用方式,姑且先稱為 meta-polis(元城邦)。

請看流程圖輔助閱讀,在 polis 1.0,我們看到了強大的視覺化整合分析工具,可以協助群體梳理出關鍵問題與決策意向;而加入了「我城」的 polis 2.0,在關鍵問題與決策之後,展開了更多對話的可能。這讓我覺得兩者是有機會組成一個回饋圈,訓練出針對特定場景的 LLM 關鍵意見者。

比如:當初始設定者決定好關鍵陳述,輸入進 polis,並透過大量的使用者進行回覆,其實已經訓練好 n 版本的統計數據,而將此數據餵給「我城」後,我城可以根據「立場」而非「議題」建立叢集,並將特定立場的陳述訓練成 LoRA(可以想像成劇本殺的角色扮演者),每一個 LoRA 蓋到 LLM 之後,都有自己的角色。如此立場鮮明的角色,即將成為沒有知覺的沙包(或強悍的立場維護者,就看 prompt 如何設定)。當使用者登入「我城」後,即可與這些「虛擬意見領袖」進行對話。

這是一個數位公共領域的 RPG 遊戲,讓人與擬人(集體意見幽魂)可以共同討論嚴肅的議題,並區隔衝突。

而這些對話紀錄,又可以記錄成為新的資料庫,經過 LLM 的再分析,成為新的關鍵陳述,提供給 polis,擴增其答題資料庫,此時 n+1 的資料庫版本便成立了,新的 LoRA (n+1) 也將可以持續更新訓練。

「關鍵評論網絡」由此形成。

這些關鍵評論網絡,其實就是集體意見的擬人化,而這些擬人,將比真人更能承受極端意見的往返。此外,在可見的未來,不同立場的「虛擬意見領袖」可以快速互相對話,畢竟目前的 LLM 特色是每次回應的結果,根據溫度(temp)不同,回答的不可預測性也會不同,這將有可能整理出大量人工意見,並形成自適應的回饋循環(Feedback Loop),光是想到這個可能性就非常興奮。

透過 polis 與 talk to the city 回饋循環的可見優點有二:

一、催化異見:跨越時間的立場累積,產生一種高維度「硬直」狀態,將使人類意識到異見迭代的歷史,一再重演,是如此相似。我樂觀地認為,這將使時間維度如此緩慢的現代公民,更謙卑於爭執的過程,而非拘泥於結果。

二、立場擬人:這些關鍵陳述打造出來的評論網絡,將成為擬人 LLM。我樂觀地認為,雖然是由機器區分的立場,但我們可能可以毫不費力的將現實世界的多方利害關係人,套入不同的立場裡面。若說 LARP(臨場動態角色扮演遊戲,Live Action Role Playing)幫助參與者換位思考與強化各種立場的回饋,那在 Talk to the City 中,是有機會創造出虛擬人機協作的 LARP 劇本的。史丹佛大學和Google的研究者於四月的 LLM RPG 訓練論文(Generative Agents: Interactive Simulacra of Human Behavior),預示了 AI 居民自適應的可能性,而數位公共場域的對話,將是一個重要的開發題目。


小結.邁向關鍵評論網絡

Polis 解決了意見文本化的問題,畢竟大量的文字意見,是訓練 LLM 與其上 LoRA 的關鍵瓶頸,而 Talk to the City 解決了回饋需求,讓種子意見有可能自動化的誕生,充足 polis 資料庫,並在舒服的環境中,徵集更多文字意見。當然這只是樂觀的推測,還有許多實際的技術開發需求與運算限制必須克服。

當然,這段回饋循環的調控過程中,將仰賴設計者調整語氣與迭代的方向,避免極化(Polarization)的虛擬意見領袖誕生(但這也不啻是一個好的研究題目?)。本文認為 Polis 2.0 開啟了虛擬 LARP 公共領域對話的可能性。不同地域的社會網絡,將無可避免的仰賴意見領袖,無論是實體世界還是數位社會。而 polis 加上 talk to the city 合成的網絡,將揭示了多元意見領袖的可能性,因此稱之為「關鍵評論網絡」。


相關連結

  1. Talk to the City 於點子松的試點

  2. 點子松 AI 民主化 Polis 議題頁面

  3. AI 目標機構 AOI 官方網站

  4. Generative Agents: Interactive Simulacra of Human Behavior

CC BY-NC-ND 4.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…
加载中…

发布评论