創作者與他的AI.ㄩㄐ黃昱嘉》圖像、文案、程式碼和一點點幽默感
文|黃昱嘉(作家)
想像一個24小時待命的助理,可以隨時為你提供建議、解惑、處理交辦事項。2023年以Chatgpt為首的人工智慧程式讓這樣便利的科技願景產生可能,是智慧型手機之後又一資訊科技的突破。那對創作者來說,AI還能有什麼樣的幫助?「創作者與他的AI」專欄邀請各界創作者,分享他們使用AI融入生活、工作或作品的的過程與體悟,探索人機合作的全新可能。
身為文字創作者、軟體工程師與自由工作者,我的每日工作流程已經脫不開 AI。
AI 省的不只是時間,更是「省意志力」。需要克服不情願、耗費注意力才能完成的無趣工作,如今都可以讓 AI 代勞,降低工作啟動門檻。修改 AI 的初版草稿,似乎比從無到有更加輕鬆。
因為長期關注科技與商業領域,幾年前我已經聽說過 GPT;在 ChatGPT 發佈第一天,被社群洗版而開始使用。Midjourney 開放後,工作所需插圖便全面改用 AI 生成。我追蹤不少 AI 趨勢帳號,筆記下的待用清單早已塞滿。
相較於其他社群上的 AI 狂熱愛好者,我的使用需求相當務實:開箱即用、解決問題、只需少量修改便能完成任務。也因此,我較少嘗試自行下載或微調模型,大多使用現成的 AI 產品。
其中,圖像生成、翻譯與撰寫行銷文案,是我目前最仰賴 AI 的任務 。一些難度不高的程式片段,也會丟給 AI 生成,以節省腦力。這也讓單人作業的我,像多了好幾位同事,有時還會感受到擬人的安慰與趣味。
➤生成圖像,卻意外感受到 AI 的幽默
圖像生成是我感受最深的流程改進。過往工作,常需要花許多時間逛圖庫,或請求設計師同事幫忙畫幾張插圖。現在,幾乎全部都可以交給 AI 生成。起初我曾付費訂閱 Midjourney,後來愛上微軟的 Image Creator,並使用 Photoshop 一鍵去背、放大圖片、補完部分區域畫面。
生成的圖片通常可以直接使用,甚至常常超乎我的期待;少數時候,才需要進到繪圖軟體內微調細節。我相當熟悉影像編輯技術,卻只具備很基本的電繪能力。圖片生成 AI 不僅節省時間,更延伸了我的作業範圍。
當然,AI 生成有隨機性,有時一次搞定,有時卻怎麼微調提示詞(prompt)都做不出滿意的圖。也曾出現一些有趣的時刻:有次,我指定可愛風,要 AI 幫我畫個裝滿寶石的木桶。我的想像是遊戲中的 Q 版水桶,AI 卻畫出帶著水汪汪大眼的嘟嘴桶子:
實在太可愛了。一瞬間,我幾乎以為 AI 在和我鬧著玩,像上班時同事在圖片上畫笑臉。無意圖的幽默,對於總是獨自一人在家的自由工作者,竟也有點撫慰孤單的作用。
➤在翻譯與文案中,發現 AI 的不同個性
若要寫高度精緻的英文文案,以往要花費許多心力查詢道地用法,並注意文字風格,卻還是偶爾出現文法與時態錯誤。更常發生的狀況是,看得出文字不夠漂亮,卻不知道如何下手修改。
有了 ChatGPT 等大型語言模型(LLM)後,工作模式變成:先用簡單直接的英文,將產品特色與想傳達的重點列舉出來,再讓 AI 幫我潤稿。過程通常要反覆數次,要求寫出不同版本草稿,經過人工重組與改寫,再檢查錯誤,並修改得更優雅、簡潔、易讀。
翻譯任務流程相仿。先要求 AI 直譯,再改寫成特定風格,相較一開始就指定風格效果更好。藉此我甚至可以中英夾雜,寫非常粗糙的原稿,最後產出優美的英文文章,大幅省去時間精力。
不同的語言模型,也有不同個性。手邊有個枯燥的任務,內容是幫一堆句子上標籤,例如「我很快樂」會被標成「正向、快樂」,「這東西有夠難吃」會被標成「負向、憤怒」。
我分別使用 ChatGPT 和 Bard 測試:前者起初表現良好,隨後開始偷懶,所有句子都上同一組標籤。我發現後,問為什麼這樣上標,他卻開始道歉,並順從地把標籤移掉。修改提示詞,禁止標籤全上,則會變成每句只上一個標籤。
Bard 完全不同。當被問到上標的理由,非但不會軟弱道歉,反而充分解釋自己如何理解標籤的背後涵義。我驚訝發現自己被說服。而這簡直是職場縮影:我們都不喜歡做事草率又唯唯諾諾的人,而更喜歡堅定立場、能提出行事原則的同事。
Bard 當然並不完美。積極提供理由的另一個面向是「幻覺」嚴重。當任務換成翻譯,ChatGPT 便能中規中矩輸出,Bard 卻會突然寫出不存在於原文的內容。Bard 就像能力不錯,卻熱心過頭的同事,太想幫忙反而造成困擾。
於是,我開始將任務分類。需要精準與穩定,便交給 ChatGPT 完成;需要更多創意與解釋,就交給 Bard。況且,我們暫時不需要照顧 AI 的情緒。結果不盡人意,就微調提示詞、要求再次輸出。大不了開啟新對話,AI 便會忘記曾與你經歷的一切。
➤程式碼輔助:從不抱怨的菜鳥工程師
程式工作佔據我每日工作的最大一部分。我時常要求 ChatGPT 幫我寫一些簡單的小程式,並使用編輯器外掛的 AI(如 Copilot)生成重複性很高的程式碼。學習一項新技術時,AI 的幫助也非常大。不懂的問題可以直接詢問,並得到詳細的解釋與範例程式碼,大幅加快學習速度。
然而,AI 不總是能帶來正面效果。某次需要排版前端網頁,我認為任務足夠簡單,便要求 ChatGPT 幫忙。他嘗試了兩種不同的寫法都不成功,反而讓我前後花了兩個小時幫他 debug,反覆在提示詞指出哪裡有誤。最後受不了,決定自己重寫,只花了十分鐘的時間。
於是,我在社群上詢問其他工程師的意見,得到的回應大致相仿:AI 善於整理資料、轉換格式,卻不太能勝任更複雜的工作。Vercel (可「一鍵部署」的網站生成雲端平台服務)近期推出的 v0,雖然可以快速生成外觀漂亮的前端網頁元件,許多細部錯誤仍需要人為介入修改。
難以量化,軟體工程師的生產力,向來是企業難解的謎題。看似簡單的任務,背後可能牽扯複雜的架構,甚至因系統限制根本無法做到。而看似複雜的功能,有時可能在解決癥結點後便能快速完成。
軟體工程師的主要工作,並非「量產程式碼」,而是不斷做出一個又一個決策,小至變數宣告,大至系統設計。資深工程師用於團隊溝通、釐清目標以及資料研究的時間,往往遠大於實際寫程式的時間。
AI 幫忙寫程式,很可能只能微幅提升生產力;一旦低品質程式碼大量混入,還會導致未來技術債加重,反而降低生產力。這是工程師版的生產力悖論(productivity paradox)。
生產力悖論又稱索洛悖論(Solow paradox),原先指的是美國在1970、1980年代雖然資訊技術領域發展迅速,生產力成長卻出現減速的情形。
話雖如此,我對於 AI 輔助程式設計的前景還是相當樂觀。現在的 AI 就像是有耐心、出錯率卻很高的菜鳥工程師。對於有經驗的工程師來說,提高產值的方式,並非百分百相信 AI 寫出的程式碼,而是將無趣的工作交由 AI 完成,並將自己的時間與注意力,放在產品目標與系統架構之上。
➤幻覺與真實:當我嘗試自己做 AI 產品
我的「待嘗試 AI 產品清單」裡,還有音樂、人聲、剪輯、影片⋯⋯有些是嘗試過後,未能解決現有的問題,有些則還沒有機會試用。不過,除了使用其他人的產品,我的另一個關注面向是透過串接 API,便快速打造出 AI 產品。
幾年前簡直難以想像。為了熟悉 AI 串接與產品化過程,我做了個看似難度不高的 AI 塔羅牌解讀服務。在這項好玩的專案,花最多時間的竟然是如何要 AI 別再說教。用盡辦法在提示詞中禁止,似乎都無法完全避免。
但最終我還是驚豔於成果。我幾乎沒花太大力氣,就完成了一個可以解讀牌卡的 AI。測試時,偶爾還會被 AI 的回覆打動。
所有 AI 的相關詞彙中,我最喜歡「幻覺(hallucination)」。尤其英文,大量擦音讓這個字眼本身就像夢境一般,輕讀出嘶嘶聲,帶點 ASMR 朦朧奇特的愉悅感。幻覺是指 AI 生成時,出現範圍外失控的內容。詢問聚會推薦地點,卻提供現實中不存在的餐廳;辨識語音,卻在空白段落出現句子。
然而幻覺有時卻也那麼美。生成圖像時,我們往往不稱之為幻覺,而稱之為創意。明明只寫了一句簡單的話,AI 卻能繪製出超乎想像的畫面。幻覺在此時變成魔法。
製作 AI 塔羅解牌服務的時候,我多次感覺,在螢幕那邊確實有個「什麼」,正在傾聽我的煩惱。
這無疑是幻覺,卻是我願意沉浸其中的幻覺。我們不都時而活在幻覺裡,難以分辨是記憶還是夢、是事實還是謊言?AI 擁有幻覺,竟然讓我感到更加真實。●(原文於2024-02-26在Openbook官網首度刊載)
Like my work? Don't forget to support and clap, let me know that you are with me on the road of creation. Keep this enthusiasm together!