是敵？是友？人類創作者與生成式AI的「不對稱訴訟戰」

发布时间：2024-09-20 21:26:17 作者：玩站小弟

文：閻紀宇阿瓦德Mona Awad）、特倫布雷Paul Tremblay）、凱德瑞Richard Kadrey）、高登Christopher Golden）四位美國驚悚小說家最近兩人一組走上法院，挑戰。

文：閻紀宇

阿瓦德（Mona Awad）、敵友特倫布雷（Paul Tremblay）、人類凱德瑞（Richard Kadrey）、創作稱訴高登（Christopher Golden）四位美國驚悚小說家最近兩人一組走上法院，生成式A訟戰挑戰全球矚目的不對新一代「生成式人工智慧」（Generative AI），並且得到一位大咖名流加持：喜劇女伶／作家、敵友艾美獎（Emmy Awards）得主莎拉席佛曼（Sarah Silverman）也投入戰局。人類

是敵？是友？人類創作者與生成式AI的「不對稱訴訟戰」

前兩位控告生成式AI應用ChatGPT的創作稱訴研發公司OpenAI，後三位還加碼控告另一款AI應用LLaMA的生成式A訟戰研發者Meta，也就是不對臉書（Facebook）的母公司。原告指稱OpenAI與Meta在訓練其AI應用的敵友過程中，「複製並攝取」原告受版權保護的人類作品，而且「未經同意、創作稱訴未做引述、生成式A訟戰未曾付費」，不對顯然構成侵權，而且獲取利益，因此要求損害賠償與禁制令。

是敵？是友？人類創作者與生成式AI的「不對稱訴訟戰」

生成式AI近年來勢洶洶，它能夠與個別人類「聊天」，接收對方的提示（prompt），藉助於海量的資料庫與超人的學習能力，完成各種以自然語言（人類使用的語言）構成的任務。換言之，生成式AI已經可以進行一定品質的「委託創作」，從文案、歌詞、論文、劇本到小說，未必能登大雅之堂，但絕對足以吸引一般讀者／內容使用者。

是敵？是友？人類創作者與生成式AI的「不對稱訴訟戰」

但這類大型語言模型（LLM）AI的訓練過程需要大量文本，尤其是高品質、堪稱「作品」甚至「著作」的文本。一個重要來源是多倫多大學（ UToronto）與麻省理工學院（MIT）建置的「BookCorpus」資料集，擁有逾一萬一千本（近十億字）未出版書籍。但原告指控，合法資料集之外，ChatGPT與LLaMA顯然還用了規模更大、但侵犯著作權的「影子圖書館」（shadow library），五位原告的作品也因此成為AI的訓練材料。

生成式AI的訓練用資料有如恆河沙數，如何證明涉及侵權？其實比想像中簡單：以子之矛攻子之盾，以席佛曼的案子為例，律師團要求ChatGPT「摘要敘述席佛曼《尿床女孩》（The Bedwetter）一書的細節」，於是ChatGPT非常認真、洋洋灑灑寫出一千五百字，充分顯示它真的「讀過」席佛曼這本2010年出版的回憶錄，結果自然是讓控方「人贓俱獲」。

當然，律師團接下來還必須證明AI的侵權行為造成作家的財務損失，並要求相應的賠償，這個過程相對困難。生成式AI前程似錦，OpenAI目前市值上看三百億美元，靠山微軟（Microsoft）更是「兩兆美元俱樂部」成員，Meta也是一兆美元等級，兩巨頭必然會好好呵護旗下的金雞母，最可能的結果是花錢擺平、庭外和解。

看似一場小蝦米對大鯨魚的不對稱訴訟戰，不過有一點值得注意：五位作家打的是一場集體訴訟（class action），所謂的「集體」代表「所有在美國擁有版權、其作品曾被OpenAI語言模型當成訓練資料、在美國居住個人或實體」，這些作者隨時可以共襄盛舉。也就是說，本案的「潛在原告」成千上萬。

五位原告並非孤軍奮戰。美國作家協會（The Authors Guild）上個月發布一封公開信，呼籲兩家生成式AI公司（OpenAI與Stability AI）與科技業四巨頭（Alphabet、Meta、IBM、微軟）的執行長，強調「沒有我們的作品，AI將平平無奇，發展極度受限」，並提出三點要求：AI程式使用有版權材料須獲同意；作品被生成式AI使用的作家須獲合理報酬，並溯及繼往；作品被AI產出使用的作家須獲合理報酬。這封公開信得到四千多位作家聯署。

而且只要是藝術創作者，應該都會非常在意侵權這回事。今年一月，一批視覺藝術家率先發難，控告三家圖像AI大廠Stability AI、Midjourney與DeviantArt侵權。Stability AI另外還被影像公司Getty Images控告。相關案件如果持續發酵，有可能成為美國司法史的一座里程碑，深刻影響AI的發展方向。

回到文本的領域，除了蜂湧而來的版權侵權爭議，依賴大型語言模型的生成式AI還面臨另一項危機：供訓練用的高品質文本日益青黃不接，一項研究甚至預測二〇二六年就將耗盡。畢竟這類文本——書籍、新聞報導、科學文獻、維基百科、篩選過的網路內容——創作主力仍然是人類，而「工人智慧」的生產速度當然跟不上「人工智慧」的消化速度。

這就透顯出多重弔詭。生成式AI對人類創作者生成莫大威脅，動搖「人類創作」作為文化與文明運作基礎的價值。ChatGPT與其AI同儕「寫出」暢銷書指日可待，但《紐約時報》應該將它列入排行榜嗎？作家提告AI一方面是維權，一方面也頗有「打不過它就加入它」的意味，希望至少在這個生態系中站穩有利可圖的一席之地。

然而AI業者也必須有所體悟，不能再堅持「未經同意、未做引述、未曾付費」、竭澤而漁的掠食者／食物模式，如此才不會斷絕文化與文明運作的活水泉源，進而與人類創作者攜手摸索出共存共榮的可能性。AI大軍已經進城，但「征服者」未必是最後的贏家，近來這一波創作者提告潮反倒有可能是一個柳暗花明的契機。

Tag：

仅剩两周！2024华东新能源峰会议程重磅发布
随着新能源产业在全球范围内持续升温，新技术、新材料以及新解决方案层出不穷，为了更好地促进新能源行业交流与发展，2024'中国电子热点解决方案创新峰会(华东站)将于2024年9月27日在苏州太湖
2024-09-20
5G手机何时才能“大卖”
5G手机何时才能“大卖”预计2020年年底销量将出现实质性增长中国信息通信研究院日前发布数据显示，今年前9个月，国内手机市场总体出货量为2.87亿部，同比下降5.7%，其中2G手机1194.6万部、3
2024-09-20
科技题材持续火爆！创业板指放量涨1.42%，创8个月来新高
中美第一阶段协议背景下，内外部不确定因素集中落地，对市场信心恢复起到一定作用。受此影响，近期A股市场持续表现强势，继上周五普涨后，今日两市股指再次震荡攀升，科技仍然是市场炒作的主题，深市股指涨幅明显，
2024-09-20
收评：沪指涨0.69%站上3100 创业板涨1.79% 北向资金净流入逾60亿
午后指数震荡走高，大金融板块发力，沪指一度再次站上3100点，创业板涨逾1.5%，高清视频、转基因、网红、互联网金融等热点纷纷走强，北向资金加大净流入，尾盘阶段券商股走强，截至收盘，上证指数报3104
2024-09-20
海葵滯留高雄近海今清晨二次登陸！氣象粉專：颱風在原地睡了一覺
海葵颱風減弱為輕度颱風，但過去3小時，其中心於高雄、台南沿海附近滯留打轉，今4）日清晨4點左右又從高雄左營接觸陸地，並沿高雄、台南海岸線北上。氣象粉專直呼，「睡醒之後，發現颱風也在原地睡了一覺。」中央
2024-09-20
沪指四连阳涨0.88%，北向资金净流入逾40亿元
新一轮中美经贸高级别磋商在华盛顿开幕，沪深两市股指集体高开，随后维持震荡盘整走势，等待重磅消息的落地。午后，在券商股的引领下，两市股指持续震荡反弹，沪指盘中一度涨逾1%，两市成交量也随之出现放大。盘面
2024-09-20