判斷AIGC合理使用的可能發展趨勢
[前言]
筆者以前碩士論文研究過人工智慧(Artificial Intelligence,AI)的著作權法及相關管理規範,其中討論到在訓練AI過程,大量使用他人著作與資料,是否符合「合理使用」的法律規定或原則。直到去年與今年生成式AI大爆發,也變成法律議題的大熱門,衍生來的AIGC與合理使用的討論方興未艾。
今年我曾受訪或在公開場合討論過這個議題,將一些國內外法制的發展趨勢、觀察與研究,分享到相關的報導、講座、自媒體包括Podcast與短影音,但赫然發現自己尚未整理成一篇文章,因此起心動念撰擬本文,將這個爭點在年末做一番簡要說明與提出淺見。
[從美國歷來的經典案例,來看著作權法的合理使用]
所謂的生成式AI或AIGC(Artificial Intelligence Generated Content),指的是自動化生成全新、原創內容的AI技術,例如ChatGPT聊天機器人、Stable Diffusion生成式繪圖等軟體。不過要注意的是,一般AI與生成式AI的區分。AI是一種涵蓋範圍很廣的技術,它包括機器學習(ML)、深度學習(DL)、自然語言處理(NLP)等多種子領域,而AIGC則是AI的一個特定應用領域,它專注於使用AI建立新的或原創的內容(包括文字、圖片、音樂、影片等各種形式)。
但目前一些AIGC的美國科技大廠都面臨諸多控訴。舉最有名的Open AI為例,跟它有關的美國官司,包括開源碼、書籍文字,甚至還有個資隱私、言論自由與誹謗等方面;至於在圖形影像方面,比較有名的莫過於Midjourney、DeviantArt及Stability AI等公司。Microsoft與Meta公司,也是分別在開源碼及書籍文字方面被控訴侵害著作權。
其實全世界包括台灣都在看美國著作權法制及其相關的訴訟案例發展,因為不論從商業發展、科技應用或法制成熟等方面,其結果總是令人馬首是瞻,作為他山之石,所以我們往往都會看美國AI大廠被訴的最後結果,當作指標型案例(Leading Case)。
又所謂著作,其種類包括語文、音樂、美術、攝影、錄音、視聽,甚至電腦程式等,本文就直接選擇以電腦程式(即軟體或程式碼)為例來說明,像目前Copilot案(Doe 1& Doe 2 v. GitHub, Inc., Microsoft Corp. & Open AI, Inc.)也正是AIGC關於程式碼的重要訴訟案件。
一、軟體或程式碼也是著作權法保護的客體:
所謂的「軟體」,在著作權法上稱之為「電腦程式」,可包括各種應用軟體,以及作業系統軟體。由於軟體的程式碼類似文字,軟體設計師須先以「程式語言」撰寫出「原始碼」,經過「編譯程式」轉譯成電腦所能理解之「目的碼」(即由0、1二位進碼組合的「機器語言」),最後才能被電腦的CPU處理執行。在Oracle v. Google的案例裡,就是涉及電腦程式(API)著作權侵害的情況。
二、從Oracle v. Google的案例看著作權法的合理使用:
從Google公司早期創建Android作業系統平台時,所使用Oracle之應用程式介面(Java API)程式碼,Oracle就起訴指控Google侵犯其API著作權,進行違法的Android銷售與使用,該案的爭點就在於Google Android系統抄襲Java程式語言,是否構成合理使用原則。
一個程式碼很長,本案最高法院說只用其中不到5%,就可以構成合理使用,但如果是換成文學著作例如小說作品,結果也會是合理使用嗎?可能會!換言之,使用的比例雖不高,但佔據不少行數的話,也將會對新作品功能產生重要關鍵,但為避免原告程式設計壟斷,以合理使用讓被告解套,最高法院這種政策性的判決理由很值得關切,因為它也曾經在1980年代Sony錄放影機的訴訟案中出現過類似的策略考量。
我們首先必須瞭解何謂「合理使用」,衡酌「合理使用」的四項判斷基準是哪些。所謂的合理使用(Fair Use),是指著作權法為調和私益與公益,在某些情形下,規定為達到公共利益之目的,得不需要取得著作權人的授權,而直接使用。依美國著作權法第107條之規定,著作之合理使用,不構成著作財產權之侵害(我國著作權法第65條第1項也有相同規定)。而我國著作權法第65條第2項所規定的四個判斷標準:「利用之目的及性質」、「著作之性質」、「所利用的質量及其在整個著作之中所佔的比例」、「使用結果對著作潛在市場與現在價值之影響」,即與美國著作權法上關於「合理使用」原則的標準相同。美國最高法院於1994年的Campbell案(Campbell v. Acuff-Rose Music, Inc. 510 U.S. 569, 579)指出,這四個標準或因素必須獨力判斷,且沒有任何一個因素是決定性因素,最後再綜合考量是否構成合理使用;且該案也提出「轉化性利用」的概念。因此,每一個判決中都會詳細論述這四個因素。如果是商業性使用,但有投入新的創意元素進去,在美國稱之為「具有轉化性價值(transformative value)」者,較易構成合理使用。如果是利用著作開發新市場,由於有較高的轉化性價值,而且市場是新開發的,就不是對既有的著作潛在市場造成傷害,也構成合理使用。
其實可參考Google在Authors Guild, Inc. v. Google, Inc. ( Google Book Search案)一案中打敗著作權人協會獲勝的著作權案例。2013年,美國著作權人協會控告Google違反著作權,原因在於Google以大量的數位化書籍訓練人工智慧,以建構Google Book Search資料庫。本案歷經三級三審,在2019年11月定讞,最終法院判定Google利用他人著作的行為符合著作權法下的「合理使用」原則,因此並未侵犯著作權。法院判定Google勝訴的主要論點在於,Google透過大量書籍訓練人工智慧的行為並未侵犯到書籍著作權人的經濟上利益,並未對於著作權人造成負面影響,因此屬於「合理使用」的保護範疇。
其中關鍵事實在於,2004年、2005年Google公司在圖書介紹頁中提供片段瀏覽(snippet view),及在進行掃描(重製)時未經作者同意或支付相關費用。美國法院認為,是否構成合理使用的關鍵,在於Google的利用行為是否能「達成促進藝術及科學發展之著作權立法精神」,也就是形成「轉化性使用」(transformative use)。美國法院依據「著作權法」第107條中的四項標準來進行判斷,即「利用之目的及性質」、「著作之性質」、「所利用的質量及其在整個著作之中所佔的比例」、「使用結果對著作潛在市場與現在價值之影響」等。
從上面可知道,在Google與Oracle的訴訟案裡面,大法官也是基於相同的理由,認為Google複製API是為創造不同運算環境(智慧型手機)的任務系統及建立一個平台,屬於「轉化性使用」,即加速電腦程式的開發,與著作權法的精神一致。因此最高法院認為,Google複製Java API以重新實作用戶介面,只用了必要的程式碼,以便用戶(開發人員)將其衍生的才智用於新式、轉化的電腦程式中,屬於對API的合理使用。即美國最高法院最後判定Google構成合理使用。
[初探AIGC合理使用的可能判斷原則]—代結論
我國著作權法知名教授章忠信老師日前於其臉書公開表示:「訓練AI過程,大量使用他人受著作權法保護的資料,最後獲取重大利益,很難構成合理使用」;而哈佛教授Lawrence Lessig卻認為,拿大量他人的著作用來連續預訓練語言大模型(即AIGC的LLM)的行為屬於合理使用。
上段內容體現了法界常出現的肯否兩說。肯定說:「生成式AI並不會重現書籍本身,而是創造新內容。新內容不會損害原本作品的市場」;否定說:「使用者能用AI聊天機器人取得片段資訊,就不會去找原始新聞閱讀。有可能成為新聞的替代品,影響原有市場」。
我們根據以往幾個經典、重要的美國判例見解,例如:Campbell、Oracle或Google的案件可知道,認為如果使用別人的作品時,符合轉化性因素的要件,也就是能玩出新花樣或蹦出新滋味,且產生公共利益,那使用上就屬合理。
但最近出現一件安迪沃荷基金會的判例(Andy Warhol Foundation v. Goldsmith)認為,除剛剛講的要件外,還要對原作品或原作者有「回饋的利益」,且有「不同的使用目的或性質」,否則就不符合合理使用原則。
假設我們套用在使用生成式AI創作的時候,不論是生出文字、圖片、音樂、程式碼,如果沒有幫到原作品,還可能害到原作者,那就可能會侵害別人的著作權了!
目前像Stability AI、Midjourney與DeviantArt案,美國法院將來會如何認定,目前尚不明朗,但相當值得我們持續關注。原本筆者是依照以往美國最高法院著重在被告具有轉化性的使用,大膽預測且樂觀看待:就AI的訓練過程,應可符合合理使用;但目前針對AIGC的型態,尤其出現安迪沃荷基金會案的新判斷標準,可能導致轉化性的使用較無法彰顯結果。
或許仍應回歸如同我國著作權法第一條之立法目的與宗旨(保障著作人著作權益,調和社會公共利益,促進國家文化發展)來看,重點應在於生成式AI創造的內容或結果,是否能提升人類科技或人文有進一步的意義或公益,如果沒有,那AIGC就不符合合理使用原則;甚至如果套用美國最高法院在2023年最新的安迪沃荷基金會案「使用在不同之性質與目的」—這個構成「轉化性使用」之關鍵判斷因素,這樣AIGC的使用也將不會是合理的!換句話就是構成侵害他人關於原作之著作權。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
- 来自作者
- 相关推荐