展會信息港展會大全

ChatGPT被起訴索賠30億!16人狀告OpenAI未經(jīng)允許使用信息
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-09 08:06:41   瀏覽:8014次  

導(dǎo)讀:明敏 發(fā)自 凹非寺 量子位 | 公眾號 QbitAI 一天吃兩起官司,ChatGPT現(xiàn)在有大麻煩了。 原因都和數(shù)據(jù)有關(guān)。 先是16人匿名起訴OpenAI及微軟,認為他們在未經(jīng)允許的情況下使用并泄露了個人隱私數(shù)據(jù),索賠金額高達 30億美元 。 緊接著,2位全職作者提出,OpenAI未...

明敏 發(fā)自 凹非寺

量子位 | 公眾號 QbitAI

一天吃兩起官司,ChatGPT現(xiàn)在有大麻煩了。

原因都和數(shù)據(jù)有關(guān)。

先是16人匿名起訴OpenAI及微軟,認為他們在未經(jīng)允許的情況下使用并泄露了個人隱私數(shù)據(jù),索賠金額高達30億美元。

緊接著,2位全職作者提出,OpenAI未經(jīng)允許使用了他們的小說訓(xùn)練ChatGPT,構(gòu)成侵權(quán)。

而且兩邊的原告都表示,OpenAI從互聯(lián)網(wǎng)上搜刮的數(shù)據(jù)可太多了,除了他們以外還有非常多人的數(shù)據(jù)正在被違規(guī)使用。

網(wǎng)上的討論很多,有人表示作家就是應(yīng)該維權(quán),并且獲得適當?shù)膱蟪辍?/p>

但也有人認為,生成式AI學(xué)習互聯(lián)網(wǎng)數(shù)據(jù)就像是學(xué)生去參觀藝術(shù)作品一樣,應(yīng)該選擇開放。

現(xiàn)在這兩起訴訟都被遞交到了加利福尼亞舊金山聯(lián)邦法院。

被告方OpenAI暫時沒有做出公開回應(yīng)。

16人索賠30億

先來看第一起訴訟。

6月28日,16位匿名人士向OpenAI及微軟發(fā)起訴訟,他們認為基于ChatGPT的AI產(chǎn)品在沒有告知或獲得本人同意的情況下,收集且泄露了他們的個人信息。

這種行為違反了AI模型數(shù)據(jù)相關(guān)的法律政策,而且沒有付費。

他們從互聯(lián)網(wǎng)、書籍、文章、網(wǎng)站和帖子中抓取了3000億個單詞,其中包括未經(jīng)允許獲取的個人信息。

這其中包含賬戶信息、姓名、聯(lián)系方式、電子郵件、支付信息、交易記錄、瀏覽器數(shù)據(jù)、社交媒體信息、聊天數(shù)據(jù)、cookie等等。

這使得個人信息被嵌入到了他們的AI產(chǎn)品中,而這些信息可以反映出個人愛好、觀點、工作履歷甚至家庭照片等。

原告認為OpenAI沒能充分將這些敏感信息進行過濾,會導(dǎo)致數(shù)百萬人面臨信息被泄露的風險。

而且他們指控如上抓取數(shù)據(jù)的行為,OpenAI是“秘密進行”的,沒有按照適用法律要求的那樣注冊為數(shù)據(jù)代理商。

負責這次起訴的律師事務(wù)所Clarkson,此前曾負責過數(shù)據(jù)泄露和虛假廣告等問題的大規(guī)模集體訴訟。

但能否勝訴目前還很不確定。

知識產(chǎn)權(quán)律師凱瑟琳加德納(Katherine Gardner)表示,當用戶將內(nèi)容上傳到社交平臺或者其他網(wǎng)站時,他們都會授予平臺廣泛許可,允許平臺使用他們的內(nèi)容。

因此,普通用戶想要就AI模型的數(shù)據(jù)獲取問題獲得賠償,具有比較高的挑戰(zhàn)性。

以及有人發(fā)現(xiàn)在這份長達157頁的訴訟書中,大量引用了媒體及學(xué)界在AI倫理道德方面的討論和警告,但是對于造成實際影響的具體案例列舉不多。

另一邊,兩位美國作家也在同一天起訴OpenAI,認為他們的作品被拿去訓(xùn)練ChatGPT。

具體的證據(jù)是,ChatGPT能為他們的書生成“非常準確”的摘要,這足以說明這些書被收錄在數(shù)據(jù)庫中。

保羅特朗布萊(Paul Tremblay)和莫娜阿瓦德(Mona Awad)表示,ChatGPT未經(jīng)許可就從數(shù)千本書中拷貝數(shù)據(jù),這侵犯了作者們的版權(quán)。

起訴書中預(yù)估,OpenAI的訓(xùn)練數(shù)據(jù)中至少包含30萬本書,其中很多來自侵權(quán)網(wǎng)站。

比如OpenAI在披露GPT-3訓(xùn)練數(shù)據(jù)情況時,就表示其中包含兩個互聯(lián)網(wǎng)圖書語料庫,大概占比為15%。起訴作者認為這些數(shù)據(jù)就是來自影子圖書館網(wǎng)站的,比如Library Genesis、Sci-Hub等。

以及在2018年,OpenAI透露他們給GPT-1喂的數(shù)據(jù)中包含7000+本小說。起訴方認為這些書是研究人員從一些盜版網(wǎng)站上復(fù)制下來的,而沒有獲得作者的同意或授權(quán)。

目前OpenAI方面沒有進行公開回應(yīng)。

實際上,從生成式AI大火以來,AI公司吃版權(quán)、數(shù)據(jù)隱私官司,也真的不稀奇了。

OpenAI一直深陷數(shù)據(jù)風波

早在去年11月時,OpenAI和GitHub一起推出的代碼助手Copilot,就被程序員們告上了法庭。

原告?zhèn)冋J為Copilot侵犯了眾多原創(chuàng)代碼作者的版權(quán),同時還泄露了用戶隱私,因此向法院提起訴訟,索賠達90億美元

但到目前為止,這個案件還沒有最終定論。

AI畫畫那邊,Stability AI、Midjourney等也同樣官司纏身。

因為發(fā)現(xiàn)只要輸入自己的名字,就能生成個人風格的畫作,畫家凱利麥柯南(Kelly McKernan)聯(lián)合另外兩位創(chuàng)作者一起提起訴訟。

律師團隊和上面起訴Copilot的都是同一家。

以及網(wǎng)站平臺方也不愿意被白嫖數(shù)據(jù)。

這不最近馬斯克給推特限流,給出的理由就是“不想讓AI白嫖數(shù)據(jù)了”。目前限制措施還在實行中,還不知道之后會有怎么樣的變化。

Reddit則表示自家平臺上的數(shù)據(jù)非常有價值,所以推出了付費API,價格并不低,這個操作導(dǎo)致不少第三方應(yīng)用被迫關(guān)閉。

總之,AI在網(wǎng)絡(luò)上大規(guī)模抓取數(shù)據(jù)訓(xùn)練后,帶來的隱私安全問題、版權(quán)問題層出不窮,被牽扯進來的人也越來越多。

但目前版權(quán)問題該怎么算,業(yè)內(nèi)還沒有形成確定的規(guī)范。

只有日本方面?zhèn)鞒鲞^消息,不會對訓(xùn)練AI所使用的數(shù)據(jù)實施版權(quán)保護,因為這能加速AI發(fā)展。

參考鏈接:

[1]https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/

[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/

[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/

贊助本站

人工智能實驗室

相關(guān)熱詞: ChatGPT 起訴 索賠 30億 16人 狀告 OpenA

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港