展會信息港展會大全

數(shù)據(jù)“投喂”大模型訓(xùn)練 AI時代如何劃定版權(quán)邊界
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-04 10:59:41   瀏覽:1950次  

導(dǎo)讀:劃重點 01隨著AI大模型訓(xùn)練數(shù)據(jù)的增多,版權(quán)問題日益凸顯,如何劃定版權(quán)邊界成為關(guān)注焦點。 02專家表示,合理使用制度可以解決AI訓(xùn)練過程中數(shù)據(jù)來源的版權(quán)問題,避免阻礙AI技術(shù)發(fā)展。 03以音樂為例,AI音樂生成大模型可能需要學(xué)習(xí)幾十億首曲子,要求事先獲得...

劃重點

01隨著AI大模型訓(xùn)練數(shù)據(jù)的增多,版權(quán)問題日益凸顯,如何劃定版權(quán)邊界成為關(guān)注焦點。

02專家表示,合理使用制度可以解決AI訓(xùn)練過程中數(shù)據(jù)來源的版權(quán)問題,避免阻礙AI技術(shù)發(fā)展。

03以音樂為例,AI音樂生成大模型可能需要學(xué)習(xí)幾十億首曲子,要求事先獲得許可的交易成本極高。

04事實上,AI技術(shù)的進步促進了行業(yè)發(fā)展,如網(wǎng)易云音樂和小冰公司共同推出了AI音樂合成軟件“X Studio”。

05專家建議,我國《著作權(quán)法》有必要細化復(fù)制權(quán)的調(diào)整范圍,明確被允許使用的“臨時復(fù)制”的構(gòu)成要件。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

AI大模型時代,隨著AI生成內(nèi)容作品的數(shù)量不斷增多,這其中存在的版權(quán)問題顯得愈發(fā)引人注目,用人類的作品“喂給”AI進行訓(xùn)練之后生成的作品,算“借鑒”還是算“抄襲”?如果AI訓(xùn)練必須執(zhí)行嚴格的版權(quán)規(guī)定,那么AI大模型在訓(xùn)練過程中學(xué)習(xí)過一萬個人的作品,是否要經(jīng)過這1萬人一一授權(quán)?如果AI訓(xùn)練不執(zhí)行版權(quán)保護,那么優(yōu)秀的原創(chuàng)作品是否經(jīng)過AI“二創(chuàng)”就會堂而皇之變成他人的作品?

對于AI大模型訓(xùn)練過程中所遭遇的版權(quán)問題,新京報貝殼財經(jīng)記者采訪了多位專家。

聲音、圖像、文字作品成為大模型“養(yǎng)料” 什么情況該維權(quán)?專家:看交易成本

8月26日,北京互聯(lián)網(wǎng)法院發(fā)布服務(wù)保障新質(zhì)生產(chǎn)力十大典型案例,其中包括殷某某訴某智能科技公司等人格權(quán)侵權(quán)案,該案也是全國首例“AI聲音侵權(quán)案”。

在該案中,一名配音演員的聲音在AI畫處理后,成為了文本轉(zhuǎn)語音產(chǎn)品,并被某科技公司運營的云服務(wù)平臺對外出售。而在此過程中,“經(jīng)手”配音演員聲音的除了該云服務(wù)平臺外,還有曾委托該演員錄制錄音制品的某文化傳媒公司,以及進行AI化處理的某軟件公司。最終,法院經(jīng)審理后判決,云服務(wù)平臺、軟件公司向原告書面賠禮道歉,文化傳媒公司、軟件公司賠償原告經(jīng)濟損失25萬元。雙方當事人均未提起上訴。

不過,與該案中AI僅是從一名配音演員中提取聲音相比較,實際上大多數(shù)大模型用以訓(xùn)練數(shù)據(jù)的聲源并不止一個。以音樂為例,AI音樂生成大模型SUNO或許從數(shù)據(jù)庫里學(xué)習(xí)了幾十億首曲子,如此多的音樂素材,如果均要事先獲得許可方能使用,交易成本是極其高昂的。

對此,有技術(shù)從業(yè)者認為,若要過于強調(diào)AI訓(xùn)練過程中數(shù)據(jù)來源的版權(quán)問題,可能AI技術(shù)根本就無法發(fā)展到當前階段。事實上,AI技術(shù)的進步反而促進了行業(yè)發(fā)展,如根據(jù)中國傳媒大學(xué)課題組發(fā)布《中國數(shù)字音樂平臺發(fā)展現(xiàn)狀與展望》報告,以AI為代表的科技創(chuàng)新在數(shù)字音樂產(chǎn)業(yè)的應(yīng)用已日趨成熟,網(wǎng)易云音樂和小冰公司共同推出了AI音樂合成軟件“X Studio”,酷狗音樂推出了“AI音樂魔法”和“AI音樂制作人”,AI展現(xiàn)出了巨大的潛力和廣闊的發(fā)展前景。

對于這一矛盾,在中央民族大學(xué)法學(xué)院副教授熊文聰在第二十四期E法數(shù)字音樂論壇上分享稱,對此,我國著作權(quán)法有“合理使用”的制度,合理使用有兩種類型:“保障特定公益”型合理使用,如閱讀障礙者使用已發(fā)表作品;“交易成本過高”型合理使用,如對設(shè)置或者陳列在公共場所的藝術(shù)作品進行臨蘑繪畫、攝影、錄像。

“交易成本取決于兩個要素,抓娶復(fù)制和收集的素材內(nèi)容數(shù)量特別大,甚至要到千萬量級。海量作品的版權(quán)人非常分散,沒有集中在個別主體手中,結(jié)果導(dǎo)致想要及時找到這些權(quán)利人一一簽訂許可使用協(xié)議的成本非常高。”熊文聰說,“例如,AI音樂生成所需要訓(xùn)練的音樂素材假使要1000萬首音樂,這1000萬首音樂假如集中在一家音樂公司,前去交易的成本并不高,但如果有1000萬個版權(quán)人,每個人都去簽合同,交易成本就會變得非常高。”

熊文聰告訴貝殼財經(jīng)記者,在北京互聯(lián)網(wǎng)法院發(fā)布的案例中,AI只用了配音演員一個人的聲音,而不是從千萬個配音師的聲音中合成出一個“誰也不像”的聲音,交易成本并不高,事先找到配音師獲取許可也沒有問題,因此在這種情況下,就需要事先獲得授權(quán)。

歐盟《人工智能法》的啟示:我國著作權(quán)制度有必要細化復(fù)制權(quán)的調(diào)整范圍

今年3月13日,歐洲議會議員以523票贊成,46票反對,49票棄權(quán)批準了具有里程碑意義的《人工智能法》。 《人工智能法》的出臺是為了確保在整個歐盟范圍內(nèi)提供一致和高水平的保護,實現(xiàn)可信賴人工智能系統(tǒng)的建立與應(yīng)用,歐盟立法者希望通過統(tǒng)一的制度安排為歐盟市場創(chuàng)造統(tǒng)一、安定、高效的法治框架。

在中央財經(jīng)大學(xué)副教授李陶看來,歐盟的《人工智能法》對我國著作權(quán)制度創(chuàng)新有所啟示,第一,從著作權(quán)保護規(guī)則看,我國的著作權(quán)制度有必要細化復(fù)制權(quán)的調(diào)整范圍,明確被允許使用的“臨時復(fù)制”的構(gòu)成要件。

當前,在全球范圍內(nèi)已經(jīng)出現(xiàn)了多個權(quán)利人依據(jù)復(fù)制權(quán)侵權(quán)維權(quán)的案件,如紐約時報在針對OpenAI的起訴書中認為,聊天機器人向用戶提供了《紐約時報》文章的近乎逐字摘錄,之所以O(shè)penAI和Microsoft特別強調(diào)使用《紐約時報》新聞來訓(xùn)練他們的人工智能程序,因為這些材料被認為是可靠和準確的。

李陶對此建議,我國在《著作權(quán)實施條例》中對臨時復(fù)制行為進行必要的界定,以完成技術(shù)發(fā)展和立法目的之間的適配。具體在立法中需要嚴格界定臨時復(fù)制各個構(gòu)成要件的內(nèi)涵,為權(quán)利人和作為使用者的人工智能模型提供者創(chuàng)造可預(yù)期的法律依據(jù)。

熊文聰介紹,近年來歐盟、日本等國家或地區(qū)積極修訂著作權(quán)法,增設(shè)了多項作品使用的例外情形,立法通過明確文本和數(shù)據(jù)挖掘技術(shù)利用他人作品的行為屬于著作權(quán)的限制或例外,掃除AI發(fā)展過程中的法律障礙。其中,美國“合理使用”規(guī)則(特別是“轉(zhuǎn)換性使用”)比較靈活。

在他看來,我國《著作權(quán)法》第24條沒有列明文本和數(shù)據(jù)挖掘情形,且第(13)項“法律、行政法規(guī)規(guī)定的其他情形”是一個半封閉式的立法模式;在新《實施條例》尚未出臺之前,唯一可行的方案是將TDM解釋為第(2)項:為介紹、評論某一作品或者說明某一問題,在作品中適當引用他人已經(jīng)發(fā)表的作品。

李陶表示,我國《著作權(quán)法》有必要增添有關(guān)保障通用人工智能模型提供者開展人工智能訓(xùn)練的合理使用和法定許可規(guī)則,“歐盟《人工智能法》明確了通用人工智能模型的提供者可以使用開源的著作權(quán)保護客體以及在歐盟文本和數(shù)據(jù)挖掘例外制度的適用下進行系統(tǒng)的開發(fā)和訓(xùn)練。我國應(yīng)當盡快通過《著作權(quán)法》修訂增添有關(guān)文本和數(shù)據(jù)挖掘的合理使用制度,以便讓相關(guān)主體(特別是以科學(xué)研究為目的的主體)能夠享受到技術(shù)帶來的開發(fā)利用著作權(quán)法保護客體的便利。”

“但通過概念擴張完全免除以營利為目的相關(guān)主體的付費義務(wù),會背離文本和數(shù)據(jù)挖掘原本產(chǎn)生的立法意圖。因此,也可以在引入有關(guān)文本和數(shù)據(jù)挖掘合理使用規(guī)則的同時,考慮引入新的法定許可機制,以求保障創(chuàng)作者能夠針對人工智能系統(tǒng)對其著作權(quán)法保護客體的開發(fā)與利用獲得適當合理的報酬。”李陶說。

新京報貝殼財經(jīng)記者 羅亦丹

編輯 岳彩周

校對 柳寶慶

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港