展會(huì)信息港展會(huì)大全

美國斯坦福抄襲中國大模型事件背后,讓國人重新評(píng)估中美 AI 差距與價(jià)值|鈦媒體AGI
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-05 22:42:53   瀏覽:7685次  

導(dǎo)讀:(圖片來源:鈦媒體App編輯拍攝) 美國斯坦福AI團(tuán)隊(duì)抄襲清華系大模型事件持續(xù)發(fā)酵,引起輿論嘩然。 鈦媒體6月4日消息,針對(duì)斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的 Llama3-V 開源模型被證實(shí)套殼抄襲國內(nèi)開源模型MiniCPM-Llama3-V 2.5一事,斯坦福Llama3-V團(tuán)隊(duì)作者之一的Aksh...

(圖片來源:鈦媒體App編輯拍攝)

美國斯坦福AI團(tuán)隊(duì)抄襲清華系大模型事件持續(xù)發(fā)酵,引起輿論嘩然。

鈦媒體6月4日消息,針對(duì)斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的 Llama3-V 開源模型被證實(shí)套殼抄襲國內(nèi)開源模型MiniCPM-Llama3-V 2.5一事,斯坦福Llama3-V團(tuán)隊(duì)作者之一的Aksh Garg(阿克沙加格)最新表示致歉。

4日凌晨,Aksh Garg發(fā)推文稱,“首先,我們要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa(穆斯塔法)一起發(fā)布了Llama3-V,Mustafa為這個(gè)項(xiàng)目編寫了代碼,但從昨天起就無法聯(lián)系他。我與Siddharth Sharma主要負(fù)責(zé)幫助Mustafa進(jìn)行模型推廣。我們倆查看了最新的論文,以驗(yàn)證這項(xiàng)工作的新穎性,但并未被告知或意識(shí)到OpenBMB(清華團(tuán)隊(duì)支持發(fā)起的模型庫)之前的任何工作。我們向作者道歉,并對(duì)自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對(duì)所發(fā)生的事情承擔(dān)全部責(zé)任,并已撤下Llama3-V,再次致歉。”

而另一位作者Siddharth Sharma(森德哈斯沙瑪)也表示致歉,并稱將Llama3-V模型悉數(shù)撤下。另外,美國斯坦福人工智能實(shí)驗(yàn)室主任Christopher David Manning也發(fā)文譴責(zé)這一抄襲行為,并贊揚(yáng)MiniCPM中國開源模型工作。

這一消息近期持續(xù)引發(fā)關(guān)注和熱議,并于4日上午登上微博熱搜第二位、第四位。

事件起源于5月29日,一個(gè)斯坦福AI 團(tuán)隊(duì)在網(wǎng)絡(luò)上宣傳只需500美元就可訓(xùn)練出一個(gè)超越GPT-4V的SOTA多模態(tài)大模型。隨后網(wǎng)友發(fā)現(xiàn),該團(tuán)隊(duì)的Llama3-V模型使用的模型結(jié)構(gòu)和代碼與面壁智能不久前發(fā)布的MiniCPM-Llama3-V2.5極為相似,僅修改了部分變量名。Llama3-V也具有與MiniCPM-Llama3-V 2.5相同的分詞器,包括后者新定義的特殊符號(hào)。

此前,Garg在介紹Llama3-V的文章中提到,Llama3-V是首個(gè)基于Llama-3構(gòu)建的多模態(tài)大模型,訓(xùn)練費(fèi)用不到500美元。并且與多模態(tài)大模型Llava相比,Llama3-V性能提升了10-20%。同時(shí),Llama3-V的性能表現(xiàn)與其參數(shù)大小100倍的閉源模型非常相近。

然而,萬萬沒想到,這個(gè)大模型最后被網(wǎng)友曝光出抄襲了面壁智能和清華聯(lián)合研發(fā)的MiniCPM-Llama3-V 2.5大模型產(chǎn)品。

6月2日深夜,面壁智能團(tuán)隊(duì)證實(shí),斯坦福大模型項(xiàng)目Llama3-V與MiniCPM一樣,可以識(shí)別出“清華簡”戰(zhàn)國古文字,“不僅對(duì)得一模一樣、連錯(cuò)得都一模一樣”。這一古文字?jǐn)?shù)據(jù)為研究團(tuán)隊(duì)花費(fèi)數(shù)月從清華簡上逐字掃描并人工標(biāo)注得來,并未對(duì)外公開,證實(shí)抄襲事實(shí)。

面壁智能聯(lián)合創(chuàng)始人、CEO李大海發(fā)朋友圈表示,“我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式,另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。”

面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家、清華大學(xué)長聘副教授劉知遠(yuǎn)表示,人工智能的飛速發(fā)展離不開全球算法、數(shù)據(jù)與模型的開源共享,讓人們始終可以站在SOTA的肩上持續(xù)前進(jìn)。面壁開源的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作為語言模型基座。而開源共享的基石是對(duì)開源協(xié)議的遵守,對(duì)其他貢獻(xiàn)者的信任,對(duì)前人成果的尊重和致敬,Llama3-V團(tuán)隊(duì)無疑嚴(yán)重破壞了這一點(diǎn)。他們?cè)谑艿劫|(zhì)疑后已在Huggingface刪庫,該團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生,未來還有很長的路,如果知錯(cuò)能改,善莫大焉。

據(jù)悉,北京面壁智能科技有限責(zé)任公司成立于2022年8月,今年4月,面壁智能完成新一輪數(shù)億元融資,由哈勃領(lǐng)投,春華創(chuàng)投、北京市人工智能產(chǎn)業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。同時(shí),面壁智能發(fā)布MiniCPM 2系列開源端側(cè)模型。李大海表示,推動(dòng)大模型在端側(cè)的落地是面壁目前的重點(diǎn)工作之一。

因此,這件事讓大模型“套殼”的回旋鏢,結(jié)結(jié)實(shí)實(shí)地“扎”到了美國科研團(tuán)隊(duì)身上,同時(shí)也促使國內(nèi)重新評(píng)估中國 AI 的差距和價(jià)值。很顯然,差距并沒有那么大、開源大模型并沒有落后,甚至國外“套殼”中國大模型,說明國內(nèi)大模型技術(shù)處于全球領(lǐng)先水平。

但同時(shí),人們也要清醒看到,目前全球?qū)τ诖竽P?ldquo;套殼”沒有明確的界定,中國80%以上的大模型數(shù)據(jù)訓(xùn)練來源都包含Meta Llama系列模型,以及國內(nèi)外互聯(lián)網(wǎng)平臺(tái)數(shù)據(jù),國內(nèi)存在很多非Meta授權(quán)的模型。因此,這其中的知識(shí)產(chǎn)權(quán)和法律界定模糊不清,所謂“抄襲”上升不到法律問題。

據(jù)Meta Llama官網(wǎng)顯示,國內(nèi)除了海天瑞聲之外,至今沒有任何中國公司獲得Meta Llama的國際合作伙伴(global partners)授權(quán),基本上都是從Hugging Face、官網(wǎng)填寫表格或者是其他非官方平臺(tái)下載的模型數(shù)據(jù),更不用談這些企業(yè)是否拿到Meta官方的商業(yè)化授權(quán)了。

Meta Llama 2開源模型協(xié)議中曾指出,“該模型可以用于商業(yè)用途,除非你的產(chǎn)品的月活躍用戶數(shù)超過7億。需要填寫一個(gè)表格才能獲得訪問權(quán)限,這個(gè)表格也會(huì)讓你從HuggingFace的網(wǎng)站上下載模型。”

開源大模型以及開源社區(qū)的構(gòu)建本意,是促進(jìn)技術(shù)的共享和交流,加速AI的發(fā)展,大眾應(yīng)該重新認(rèn)知到開源大模型的技術(shù)優(yōu)勢(shì)。

一位行業(yè)專家曾對(duì)鈦媒體App表示,使用開源項(xiàng)目,主要有兩點(diǎn),一是要聲明原作者是誰,你用的是哪個(gè)項(xiàng)目,而且要遵循開源項(xiàng)目里的開源協(xié)議、作者聲明,不能修改且不能刪除;二是關(guān)注項(xiàng)目對(duì)商業(yè)化的友好程度,有些是表明可用于商業(yè)項(xiàng)目,還有一種不允許商業(yè)化、二次開發(fā)等因素的開源項(xiàng)目,這部分需要開發(fā)者重新去溝通與評(píng)估。

未知資本常務(wù)董事william wong曾表示,“現(xiàn)在很多初創(chuàng)公司,后臺(tái)接入ChatGPT,前端做了個(gè)UI設(shè)計(jì),就上架蘋果商店鼓吹自己在做AIGC創(chuàng)業(yè)了。”而他認(rèn)為,這種AIGC項(xiàng)目沒有技術(shù)壁壘和商業(yè)邏輯,只是“蹭熱度”。

截至發(fā)稿前,美國斯坦福大學(xué)官方層面對(duì)此并未做出更進(jìn)一步回應(yīng)。

(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|胡潤峰)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港