創作者與他的AI．ㄩㄐ黃昱嘉》圖像、文案、程式碼和一點點幽默感

2 月 26 日

當任務換成翻譯，ChatGPT 便能中規中矩輸出，Bard 卻會突然寫出不存在於原文的內容。Bard 就像能力不錯，卻熱心過頭的同事，太想幫忙反而造成困擾。於是，我開始將任務分類。需要精準與穩定，便交給 ChatGPT 完成；需要更多創意與解釋，就交給 Bard。況且，我們暫時不需要照顧 AI 的情緒。結果不盡人意，就微調提示詞、要求再次輸出。大不了開啟新對話，AI 便會忘記曾與你經歷的一切。

文｜黃昱嘉（作家）

想像一個24小時待命的助理，可以隨時為你提供建議、解惑、處理交辦事項。2023年以Chatgpt為首的人工智慧程式讓這樣便利的科技願景產生可能，是智慧型手機之後又一資訊科技的突破。那對創作者來說，AI還能有什麼樣的幫助？「創作者與他的AI」專欄邀請各界創作者，分享他們使用AI融入生活、工作或作品的的過程與體悟，探索人機合作的全新可能。

身為文字創作者、軟體工程師與自由工作者，我的每日工作流程已經脫不開 AI。

AI 省的不只是時間，更是「省意志力」。需要克服不情願、耗費注意力才能完成的無趣工作，如今都可以讓 AI 代勞，降低工作啟動門檻。修改 AI 的初版草稿，似乎比從無到有更加輕鬆。

因為長期關注科技與商業領域，幾年前我已經聽說過 GPT；在 ChatGPT 發佈第一天，被社群洗版而開始使用。Midjourney 開放後，工作所需插圖便全面改用 AI 生成。我追蹤不少 AI 趨勢帳號，筆記下的待用清單早已塞滿。

相較於其他社群上的 AI 狂熱愛好者，我的使用需求相當務實：開箱即用、解決問題、只需少量修改便能完成任務。也因此，我較少嘗試自行下載或微調模型，大多使用現成的 AI 產品。

其中，圖像生成、翻譯與撰寫行銷文案，是我目前最仰賴 AI 的任務。一些難度不高的程式片段，也會丟給 AI 生成，以節省腦力。這也讓單人作業的我，像多了好幾位同事，有時還會感受到擬人的安慰與趣味。

➤生成圖像，卻意外感受到 AI 的幽默

圖像生成是我感受最深的流程改進。過往工作，常需要花許多時間逛圖庫，或請求設計師同事幫忙畫幾張插圖。現在，幾乎全部都可以交給 AI 生成。起初我曾付費訂閱 Midjourney，後來愛上微軟的 Image Creator，並使用 Photoshop 一鍵去背、放大圖片、補完部分區域畫面。

生成的圖片通常可以直接使用，甚至常常超乎我的期待；少數時候，才需要進到繪圖軟體內微調細節。我相當熟悉影像編輯技術，卻只具備很基本的電繪能力。圖片生成 AI 不僅節省時間，更延伸了我的作業範圍。

當然，AI 生成有隨機性，有時一次搞定，有時卻怎麼微調提示詞（prompt）都做不出滿意的圖。也曾出現一些有趣的時刻：有次，我指定可愛風，要 AI 幫我畫個裝滿寶石的木桶。我的想像是遊戲中的 Q 版水桶，AI 卻畫出帶著水汪汪大眼的嘟嘴桶子：

實在太可愛了。一瞬間，我幾乎以為 AI 在和我鬧著玩，像上班時同事在圖片上畫笑臉。無意圖的幽默，對於總是獨自一人在家的自由工作者，竟也有點撫慰孤單的作用。

➤在翻譯與文案中，發現 AI 的不同個性

若要寫高度精緻的英文文案，以往要花費許多心力查詢道地用法，並注意文字風格，卻還是偶爾出現文法與時態錯誤。更常發生的狀況是，看得出文字不夠漂亮，卻不知道如何下手修改。

有了 ChatGPT 等大型語言模型（LLM）後，工作模式變成：先用簡單直接的英文，將產品特色與想傳達的重點列舉出來，再讓 AI 幫我潤稿。過程通常要反覆數次，要求寫出不同版本草稿，經過人工重組與改寫，再檢查錯誤，並修改得更優雅、簡潔、易讀。

翻譯任務流程相仿。先要求 AI 直譯，再改寫成特定風格，相較一開始就指定風格效果更好。藉此我甚至可以中英夾雜，寫非常粗糙的原稿，最後產出優美的英文文章，大幅省去時間精力。

不同的語言模型，也有不同個性。手邊有個枯燥的任務，內容是幫一堆句子上標籤，例如「我很快樂」會被標成「正向、快樂」，「這東西有夠難吃」會被標成「負向、憤怒」。

我分別使用 ChatGPT 和 Bard 測試：前者起初表現良好，隨後開始偷懶，所有句子都上同一組標籤。我發現後，問為什麼這樣上標，他卻開始道歉，並順從地把標籤移掉。修改提示詞，禁止標籤全上，則會變成每句只上一個標籤。

由Google開發的生成式人工智慧聊天機器人Bard（右），於2024年2月8日更名為Gemini。

Bard 完全不同。當被問到上標的理由，非但不會軟弱道歉，反而充分解釋自己如何理解標籤的背後涵義。我驚訝發現自己被說服。而這簡直是職場縮影：我們都不喜歡做事草率又唯唯諾諾的人，而更喜歡堅定立場、能提出行事原則的同事。

Bard 當然並不完美。積極提供理由的另一個面向是「幻覺」嚴重。當任務換成翻譯，ChatGPT 便能中規中矩輸出，Bard 卻會突然寫出不存在於原文的內容。Bard 就像能力不錯，卻熱心過頭的同事，太想幫忙反而造成困擾。

於是，我開始將任務分類。需要精準與穩定，便交給 ChatGPT 完成；需要更多創意與解釋，就交給 Bard。況且，我們暫時不需要照顧 AI 的情緒。結果不盡人意，就微調提示詞、要求再次輸出。大不了開啟新對話，AI 便會忘記曾與你經歷的一切。

➤程式碼輔助：從不抱怨的菜鳥工程師

程式工作佔據我每日工作的最大一部分。我時常要求 ChatGPT 幫我寫一些簡單的小程式，並使用編輯器外掛的 AI（如 Copilot）生成重複性很高的程式碼。學習一項新技術時，AI 的幫助也非常大。不懂的問題可以直接詢問，並得到詳細的解釋與範例程式碼，大幅加快學習速度。

然而，AI 不總是能帶來正面效果。某次需要排版前端網頁，我認為任務足夠簡單，便要求 ChatGPT 幫忙。他嘗試了兩種不同的寫法都不成功，反而讓我前後花了兩個小時幫他 debug，反覆在提示詞指出哪裡有誤。最後受不了，決定自己重寫，只花了十分鐘的時間。

於是，我在社群上詢問其他工程師的意見，得到的回應大致相仿：AI 善於整理資料、轉換格式，卻不太能勝任更複雜的工作。Vercel （可「一鍵部署」的網站生成雲端平台服務）近期推出的 v0，雖然可以快速生成外觀漂亮的前端網頁元件，許多細部錯誤仍需要人為介入修改。

難以量化，軟體工程師的生產力，向來是企業難解的謎題。看似簡單的任務，背後可能牽扯複雜的架構，甚至因系統限制根本無法做到。而看似複雜的功能，有時可能在解決癥結點後便能快速完成。

軟體工程師的主要工作，並非「量產程式碼」，而是不斷做出一個又一個決策，小至變數宣告，大至系統設計。資深工程師用於團隊溝通、釐清目標以及資料研究的時間，往往遠大於實際寫程式的時間。

AI 幫忙寫程式，很可能只能微幅提升生產力；一旦低品質程式碼大量混入，還會導致未來技術債加重，反而降低生產力。這是工程師版的生產力悖論（productivity paradox）。

生產力悖論又稱索洛悖論（Solow paradox），原先指的是美國在1970、1980年代雖然資訊技術領域發展迅速，生產力成長卻出現減速的情形。

話雖如此，我對於 AI 輔助程式設計的前景還是相當樂觀。現在的 AI 就像是有耐心、出錯率卻很高的菜鳥工程師。對於有經驗的工程師來說，提高產值的方式，並非百分百相信 AI 寫出的程式碼，而是將無趣的工作交由 AI 完成，並將自己的時間與注意力，放在產品目標與系統架構之上。

➤幻覺與真實：當我嘗試自己做 AI 產品

我的「待嘗試 AI 產品清單」裡，還有音樂、人聲、剪輯、影片⋯⋯有些是嘗試過後，未能解決現有的問題，有些則還沒有機會試用。不過，除了使用其他人的產品，我的另一個關注面向是透過串接 API，便快速打造出 AI 產品。

幾年前簡直難以想像。為了熟悉 AI 串接與產品化過程，我做了個看似難度不高的 AI 塔羅牌解讀服務。在這項好玩的專案，花最多時間的竟然是如何要 AI 別再說教。用盡辦法在提示詞中禁止，似乎都無法完全避免。

但最終我還是驚豔於成果。我幾乎沒花太大力氣，就完成了一個可以解讀牌卡的 AI。測試時，偶爾還會被 AI 的回覆打動。

所有 AI 的相關詞彙中，我最喜歡「幻覺（hallucination）」。尤其英文，大量擦音讓這個字眼本身就像夢境一般，輕讀出嘶嘶聲，帶點 ASMR 朦朧奇特的愉悅感。幻覺是指 AI 生成時，出現範圍外失控的內容。詢問聚會推薦地點，卻提供現實中不存在的餐廳；辨識語音，卻在空白段落出現句子。

然而幻覺有時卻也那麼美。生成圖像時，我們往往不稱之為幻覺，而稱之為創意。明明只寫了一句簡單的話，AI 卻能繪製出超乎想像的畫面。幻覺在此時變成魔法。

製作 AI 塔羅解牌服務的時候，我多次感覺，在螢幕那邊確實有個「什麼」，正在傾聽我的煩惱。

這無疑是幻覺，卻是我願意沉浸其中的幻覺。我們不都時而活在幻覺裡，難以分辨是記憶還是夢、是事實還是謊言？AI 擁有幻覺，竟然讓我感到更加真實。●（原文於2024-02-26在Openbook官網首度刊載）

CC BY-NC-ND 4.0 授权