欧美激情区二区一区三,欧美精品一区二区在线观看,斗罗大陆之邪神传承小说txt

美國斯坦福抄襲中國大模型事件背后，讓國人重新評(píng)估中美 AI 差距與價(jià)值｜鈦媒體AGI

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-06-05 22:42:53 瀏覽：7685次

導(dǎo)讀：（圖片來源：鈦媒體App編輯拍攝）美國斯坦福AI團(tuán)隊(duì)抄襲清華系大模型事件持續(xù)發(fā)酵，引起輿論嘩然。鈦媒體6月4日消息，針對(duì)斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的 Llama3-V 開源模型被證實(shí)套殼抄襲國內(nèi)開源模型MiniCPM-Llama3-V 2.5一事，斯坦福Llama3-V團(tuán)隊(duì)作者之一的Aksh...

（圖片來源：鈦媒體App編輯拍攝）

美國斯坦福AI團(tuán)隊(duì)抄襲清華系大模型事件持續(xù)發(fā)酵，引起輿論嘩然。

鈦媒體6月4日消息，針對(duì)斯坦福大學(xué)AI團(tuán)隊(duì)主導(dǎo)的 Llama3-V 開源模型被證實(shí)套殼抄襲國內(nèi)開源模型MiniCPM-Llama3-V 2.5一事，斯坦福Llama3-V團(tuán)隊(duì)作者之一的Aksh Garg（阿克沙加格）最新表示致歉。

4日凌晨，Aksh Garg發(fā)推文稱，“首先，我們要向MiniCPM原作者道歉。我、Siddharth Sharma，以及Mustafa（穆斯塔法）一起發(fā)布了Llama3-V，Mustafa為這個(gè)項(xiàng)目編寫了代碼，但從昨天起就無法聯(lián)系他。我與Siddharth Sharma主要負(fù)責(zé)幫助Mustafa進(jìn)行模型推廣。我們倆查看了最新的論文，以驗(yàn)證這項(xiàng)工作的新穎性，但并未被告知或意識(shí)到OpenBMB（清華團(tuán)隊(duì)支持發(fā)起的模型庫）之前的任何工作。我們向作者道歉，并對(duì)自己沒有努力驗(yàn)證這項(xiàng)工作的原創(chuàng)性感到失望。我們對(duì)所發(fā)生的事情承擔(dān)全部責(zé)任，并已撤下Llama3-V，再次致歉。”

而另一位作者Siddharth Sharma（森德哈斯沙瑪）也表示致歉，并稱將Llama3-V模型悉數(shù)撤下。另外，美國斯坦福人工智能實(shí)驗(yàn)室主任Christopher David Manning也發(fā)文譴責(zé)這一抄襲行為，并贊揚(yáng)MiniCPM中國開源模型工作。

這一消息近期持續(xù)引發(fā)關(guān)注和熱議，并于4日上午登上微博熱搜第二位、第四位。

事件起源于5月29日，一個(gè)斯坦福AI 團(tuán)隊(duì)在網(wǎng)絡(luò)上宣傳只需500美元就可訓(xùn)練出一個(gè)超越GPT-4V的SOTA多模態(tài)大模型。隨后網(wǎng)友發(fā)現(xiàn)，該團(tuán)隊(duì)的Llama3-V模型使用的模型結(jié)構(gòu)和代碼與面壁智能不久前發(fā)布的MiniCPM-Llama3-V2.5極為相似，僅修改了部分變量名。Llama3-V也具有與MiniCPM-Llama3-V 2.5相同的分詞器，包括后者新定義的特殊符號(hào)。

此前，Garg在介紹Llama3-V的文章中提到，Llama3-V是首個(gè)基于Llama-3構(gòu)建的多模態(tài)大模型，訓(xùn)練費(fèi)用不到500美元。并且與多模態(tài)大模型Llava相比，Llama3-V性能提升了10-20%。同時(shí)，Llama3-V的性能表現(xiàn)與其參數(shù)大小100倍的閉源模型非常相近。

然而，萬萬沒想到，這個(gè)大模型最后被網(wǎng)友曝光出抄襲了面壁智能和清華聯(lián)合研發(fā)的MiniCPM-Llama3-V 2.5大模型產(chǎn)品。

6月2日深夜，面壁智能團(tuán)隊(duì)證實(shí)，斯坦福大模型項(xiàng)目Llama3-V與MiniCPM一樣，可以識(shí)別出“清華簡”戰(zhàn)國古文字，“不僅對(duì)得一模一樣、連錯(cuò)得都一模一樣”。這一古文字?jǐn)?shù)據(jù)為研究團(tuán)隊(duì)花費(fèi)數(shù)月從清華簡上逐字掃描并人工標(biāo)注得來，并未對(duì)外公開，證實(shí)抄襲事實(shí)。

面壁智能聯(lián)合創(chuàng)始人、CEO李大海發(fā)朋友圈表示，“我們對(duì)這件事深表遺憾。一方面感慨這也是一種受到國際團(tuán)隊(duì)認(rèn)可的方式，另一方面呼吁大家共建開放、合作、有信任的社區(qū)環(huán)境。我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可，但不是以這種方式。”

面壁智能聯(lián)合創(chuàng)始人、首席科學(xué)家、清華大學(xué)長聘副教授劉知遠(yuǎn)表示，人工智能的飛速發(fā)展離不開全球算法、數(shù)據(jù)與模型的開源共享，讓人們始終可以站在SOTA的肩上持續(xù)前進(jìn)。面壁開源的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作為語言模型基座。而開源共享的基石是對(duì)開源協(xié)議的遵守，對(duì)其他貢獻(xiàn)者的信任，對(duì)前人成果的尊重和致敬，Llama3-V團(tuán)隊(duì)無疑嚴(yán)重破壞了這一點(diǎn)。他們?cè)谑艿劫|(zhì)疑后已在Huggingface刪庫，該團(tuán)隊(duì)三人中的兩位也只是斯坦福大學(xué)本科生，未來還有很長的路，如果知錯(cuò)能改，善莫大焉。

據(jù)悉，北京面壁智能科技有限責(zé)任公司成立于2022年8月，今年4月，面壁智能完成新一輪數(shù)億元融資，由哈勃領(lǐng)投，春華創(chuàng)投、北京市人工智能產(chǎn)業(yè)投資基金等跟投，知乎作為戰(zhàn)略股東持續(xù)跟投支持。同時(shí)，面壁智能發(fā)布MiniCPM 2系列開源端側(cè)模型。李大海表示，推動(dòng)大模型在端側(cè)的落地是面壁目前的重點(diǎn)工作之一。

因此，這件事讓大模型“套殼”的回旋鏢，結(jié)結(jié)實(shí)實(shí)地“扎”到了美國科研團(tuán)隊(duì)身上，同時(shí)也促使國內(nèi)重新評(píng)估中國 AI 的差距和價(jià)值。很顯然，差距并沒有那么大、開源大模型并沒有落后，甚至國外“套殼”中國大模型，說明國內(nèi)大模型技術(shù)處于全球領(lǐng)先水平。

但同時(shí)，人們也要清醒看到，目前全球?qū)τ诖竽Ｐ?ldquo;套殼”沒有明確的界定，中國80%以上的大模型數(shù)據(jù)訓(xùn)練來源都包含Meta Llama系列模型，以及國內(nèi)外互聯(lián)網(wǎng)平臺(tái)數(shù)據(jù)，國內(nèi)存在很多非Meta授權(quán)的模型。因此，這其中的知識(shí)產(chǎn)權(quán)和法律界定模糊不清，所謂“抄襲”上升不到法律問題。

據(jù)Meta Llama官網(wǎng)顯示，國內(nèi)除了海天瑞聲之外，至今沒有任何中國公司獲得Meta Llama的國際合作伙伴（global partners）授權(quán)，基本上都是從Hugging Face、官網(wǎng)填寫表格或者是其他非官方平臺(tái)下載的模型數(shù)據(jù)，更不用談這些企業(yè)是否拿到Meta官方的商業(yè)化授權(quán)了。

Meta Llama 2開源模型協(xié)議中曾指出，“該模型可以用于商業(yè)用途，除非你的產(chǎn)品的月活躍用戶數(shù)超過7億。需要填寫一個(gè)表格才能獲得訪問權(quán)限，這個(gè)表格也會(huì)讓你從HuggingFace的網(wǎng)站上下載模型。”

開源大模型以及開源社區(qū)的構(gòu)建本意，是促進(jìn)技術(shù)的共享和交流，加速AI的發(fā)展，大眾應(yīng)該重新認(rèn)知到開源大模型的技術(shù)優(yōu)勢(shì)。

一位行業(yè)專家曾對(duì)鈦媒體App表示，使用開源項(xiàng)目，主要有兩點(diǎn)，一是要聲明原作者是誰，你用的是哪個(gè)項(xiàng)目，而且要遵循開源項(xiàng)目里的開源協(xié)議、作者聲明，不能修改且不能刪除；二是關(guān)注項(xiàng)目對(duì)商業(yè)化的友好程度，有些是表明可用于商業(yè)項(xiàng)目，還有一種不允許商業(yè)化、二次開發(fā)等因素的開源項(xiàng)目，這部分需要開發(fā)者重新去溝通與評(píng)估。

未知資本常務(wù)董事william wong曾表示，“現(xiàn)在很多初創(chuàng)公司，后臺(tái)接入ChatGPT，前端做了個(gè)UI設(shè)計(jì)，就上架蘋果商店鼓吹自己在做AIGC創(chuàng)業(yè)了。”而他認(rèn)為，這種AIGC項(xiàng)目沒有技術(shù)壁壘和商業(yè)邏輯，只是“蹭熱度”。

截至發(fā)稿前，美國斯坦福大學(xué)官方層面對(duì)此并未做出更進(jìn)一步回應(yīng)。

（本文首發(fā)于鈦媒體App，作者｜林志佳，編輯｜胡潤峰）

美國斯坦福抄襲中國大模型事件背后，讓國人重新評(píng)估中美 AI 差距與價(jià)值｜鈦媒體AGI
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-06-05 22:42:53 瀏覽：7685次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

美國斯坦福抄襲中國大模型事件背后，讓國人重新評(píng)估中美 AI 差距與價(jià)值｜鈦媒體AGI 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-06-05 22:42:53 瀏覽：7685次