📝📝:AI 寫的詩已經超越莎士比亞?|AI 在詩詞創作的領域,開始出現「比人更像人」的現象
本文翻譯自《Scientific Reprots》出版於 2024/11/4 的研究,該份研究主要由匹茲堡大學(University of Pittsburgh)科學史與科學哲學系(Department of History and Philosophy of Science)的教授 Brian Porter 和 Edouard Machery 所主持的項目。
𝑨𝑰-𝒈𝒆𝒏𝒆𝒓𝒂𝒕𝒆𝒅 𝒑𝒐𝒆𝒕𝒓𝒚 𝒊𝒔 𝒊𝒏𝒅𝒊𝒔𝒕𝒊𝒏𝒈𝒖𝒊𝒔𝒉𝒂𝒃𝒍𝒆 𝒇𝒓𝒐𝒎 𝒉𝒖𝒎𝒂𝒏-𝒘𝒓𝒊𝒕𝒕𝒆𝒏 𝒑𝒐𝒆𝒕𝒓𝒚 𝒂𝒏𝒅 𝒊𝒔 𝒓𝒂𝒕𝒆𝒅 𝒎𝒐𝒓𝒆 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒚
AI 生成的詩歌難辨真偽
現今,非專業讀者幾乎無法區分人類詩人和人工智慧生成的詩歌。
研究發現,參與者認為 AI 生成的詩為人類作品的機率,比真正人類作品還要高。造成此現象的部分原因是,人們普遍認為 AI 無法創作出高品質詩歌,因此當他們遇到喜歡的詩時,便誤認為那是人類的作品。
-
AI 模型的詩歌生成方法
本研究使用 ChatGPT 3.5 模型生成詩歌。
研究人員採用「人類排除」的模式,也就是說,除了提供「以詩人的風格寫一首短詩」的指示之外,沒有對模型進行任何微調或從多首詩中選擇最佳作品。模型生成的前五首詩直接被用於研究。
研究人員選擇了 10 位英語詩人,涵蓋了廣泛的流派、風格和時期,包括:
喬叟 (Geoffrey Chaucer)
莎士比亞 (William Shakespeare)
巴特勒 (Samuel Butler)
拜倫 (Lord Byron)
惠特曼 (Walt Whitman)
狄金森 (Emily Dickinson)
艾略特 (T. S. Eliot)
金斯堡 (Allen Ginsberg)
普拉斯 (Sylvia Plath)
拉斯基 (Dorothea Lasky)
他們從線上詩歌數據庫 mypoeticside.com 收集了每位詩人的五首詩,並使用 ChatGPT 3.5 模仿每位詩人的風格生成了五首詩。
值得注意的是,研究人員並沒有詳細說明 ChatGPT 3.5 模型如何生成詩歌的具體技術細節。 例如:他們沒有說明模型使用了哪些訓練數據、使用了哪些算法、模型的架構是什麼等等。
-
該份研究主要有三個發現值得參考,分別為:辨識能力低於機率水平、AI 詩歌更受青睞、先入為主的偏差。以下將逐項介紹。
辨識能力低於擲硬幣
在第一項實驗中,參與者幾乎無法區分 AI 生成的詩歌與著名詩人的創作。
參與者辨識 AI 生成詩歌的準確率為 46.6%,隨機擲硬幣猜答案都比較高,顯示一般大眾在區分 AI 與人類詩歌方面存在顯著困難。
AI 詩歌更受青睞
在多數評比類目上,AI 生成詩歌的得分顯著高於人類詩歌,例如:節奏感(rhythm)、美感(beautiful)、意境(imagery)傳達等。特別是,AI 詩歌被評為「更具節奏感」,這一指標在各項評分中表現尤為突出。
先入為主的偏差|人類的最好
當參與者得知詩歌由 AI 生成時,他們的評價普遍偏低;反之,當被告知詩歌由人類創作時,評價則提高。然而,在不提供任何資訊的情況下,參與者更傾向認為 AI 詩歌是人類創作。
結論:比人更像人
作者認為,AI 生成詩歌開始出現的「比人類更像人類」現象,源於讀者對於 AI 能力的誤解,以及自身審美偏好的影響。
讀者通常期望人類詩歌更能引起共鳴,但實際上他們卻更容易理解 AI 詩歌所傳達的意象、主題和情感。這種理解上的差異,導致讀者誤將 AI 詩歌歸類為人類作品。
此外,詩歌作為文學創作的一部分,其創作過程本身蘊含的意義和價值值得深思。兩位作者都呼籲:在大力推廣生成式 AI 的同時,應平衡科技進步與人類創作獨特性的維護。
作者也提到,隨著 AI 生成模型的演進,人們對於「聽起來像人類」的詩歌標準也可能隨之改變。 例如,過去 GPT-2 生成的詩歌還可以與人類作品區分,但現在 ChatGPT 3.5 生成的詩歌已經難以辨別。
Like my work? Don't forget to support and clap, let me know that you are with me on the road of creation. Keep this enthusiasm together!
- Author
- More