展會(huì)信息港展會(huì)大全

AI模型抄襲中國(guó)?背后有更值得關(guān)注的信息
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-05 22:42:43   瀏覽:4560次  

導(dǎo)讀:斯坦福團(tuán)隊(duì)抄襲中國(guó)開(kāi)源大模型,事件曝光后連夜刪庫(kù)跑路。 對(duì)這條新聞,恐怕不少人第一反應(yīng)和科工力量一樣,有種一吐胸中郁悶的感受。此前很長(zhǎng)一段時(shí)間,從美國(guó)朝野鎖死中國(guó)AI研究能力的叫囂,到中文網(wǎng)絡(luò)上對(duì)國(guó)產(chǎn)大模型怪話(huà)連篇的調(diào)侃,讓很多人對(duì)中國(guó)AI產(chǎn)業(yè)...

斯坦福團(tuán)隊(duì)抄襲中國(guó)開(kāi)源大模型,事件曝光后連夜刪庫(kù)跑路。

對(duì)這條新聞,恐怕不少人第一反應(yīng)和科工力量一樣,有種一吐胸中郁悶的感受。此前很長(zhǎng)一段時(shí)間,從美國(guó)朝野鎖死中國(guó)AI研究能力的叫囂,到中文網(wǎng)絡(luò)上對(duì)國(guó)產(chǎn)大模型怪話(huà)連篇的調(diào)侃,讓很多人對(duì)中國(guó)AI產(chǎn)業(yè)的發(fā)展倍感焦慮,而通過(guò)這次事件,這樣的焦慮恐怕可以得到相當(dāng)程度的紓解。

經(jīng)過(guò)近兩天的發(fā)酵,這個(gè)事件本身毫無(wú)疑問(wèn)已經(jīng)“實(shí)錘”,不僅Llama3-V團(tuán)隊(duì)發(fā)布了道歉聲明,作為被抄襲方的面壁智能,也由CEO李大海透露了核查結(jié)果,Llama3-V和MiniCPM-Llama3-V-2.5這兩個(gè)模型即便在高斯擾動(dòng)驗(yàn)證后,在正確和錯(cuò)誤表現(xiàn)方面都高度相似。

兩個(gè)模型的代碼對(duì)比

不過(guò)繼續(xù)挖掘信息的話(huà)可以發(fā)現(xiàn),其實(shí)所謂的斯坦福團(tuán)隊(duì)只是兩個(gè)印度裔本科生自己攢的局,闖禍之后,他們還第一時(shí)間把鍋甩給了實(shí)際干活的槍手,聲稱(chēng)自己是被阿拉伯裔碼農(nóng)描繪的多模態(tài)架構(gòu)忽悠了,他們實(shí)際只是在社交媒體平臺(tái)幫著后者宣傳推廣。

而扛下了所有的碼農(nóng)“槍手”Mustafa Aljadery,也是個(gè)妙人,在網(wǎng)上簡(jiǎn)歷目前同時(shí)寫(xiě)了三份全職工作,除了兩個(gè)自己注冊(cè)的小微企業(yè),還包括量化投資大廠Citadel“即將入職的暑期實(shí)習(xí)生”。

總之,這個(gè)“斯坦福團(tuán)隊(duì)”里的臥龍鳳雛,倒是讓人見(jiàn)識(shí)到了美國(guó)科技產(chǎn)業(yè)最底層的一個(gè)微觀切片,相互忽悠攢項(xiàng)目、海投注水論文“抽獎(jiǎng)”、絞勁腦汁包裝履歷,灣區(qū)大學(xué)生的求職“內(nèi)卷”也著實(shí)是不容易。

斯坦福的作者在中午時(shí)間做出了最新的回應(yīng),但現(xiàn)在這條回應(yīng)已刪除 圖源:網(wǎng)友截圖

Aljadery之所以抄上MiniCPM-Llama3-V-2.5,則很可能是因?yàn)檫@個(gè)模型前一段時(shí)間在HuggingFace趨勢(shì)榜上連續(xù)霸榜,性能表現(xiàn)非常亮眼,OpenCompass性能基準(zhǔn)榜單上平均得分65.1,甚至超過(guò)了GPT-4V、Gemini Pro 這些主流商用模型,而開(kāi)發(fā)者在美國(guó)似乎又沒(méi)有什么關(guān)注度,所以認(rèn)為抄過(guò)來(lái)交差應(yīng)該沒(méi)什么風(fēng)險(xiǎn),不過(guò)這次東窗事發(fā)之后,幾個(gè)年輕人恐怕都會(huì)面臨“偷雞不成蝕把米”的后果。

斯坦福人工智能實(shí)驗(yàn)室主任Christopher Manning也發(fā)文譴責(zé)抄襲行為,他認(rèn)為團(tuán)隊(duì)在事發(fā)后避重就輕,并對(duì)MiniCPM 這一中國(guó)開(kāi)源模型表示贊揚(yáng)。

在科工力量看來(lái),這次事件背后,其實(shí)還有著更值得關(guān)注和探討的信息。

自從ChatGPT亮相以來(lái),有關(guān)國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展的討論中,已逐漸形成了所謂的技術(shù)派和市場(chǎng)派分野,前者以入局企業(yè)為代表,往往用“相當(dāng)于GPT-x.x”來(lái)衡量技術(shù)能力,力求追上乃至反超美國(guó)巨頭,而后一派則以PE/VC投資人為代表,認(rèn)為OpenAI等企業(yè)連續(xù)不斷的突破已經(jīng)說(shuō)明,國(guó)內(nèi)沒(méi)有可能也沒(méi)有必要繼續(xù)在基礎(chǔ)大模型上苦苦追趕,應(yīng)該利用開(kāi)源大模型成果,聚焦于挖掘場(chǎng)景應(yīng)用價(jià)值;谶@樣的認(rèn)識(shí),甚至有人喊出了“不會(huì)投場(chǎng)上任何一家中國(guó)大模型公司”。

在過(guò)去一兩年,這樣的爭(zhēng)論或許是各有理?yè)?jù)的,不過(guò)今天的中國(guó)畢竟不同于技工貿(mào)和貿(mào)工技只能二選一的年代了,我們所擁有的基礎(chǔ)和資源,已經(jīng)足以支撐“成年人不做選擇”。

所以我們會(huì)看到,一方面,技術(shù)派的突破在2024年已經(jīng)有加速態(tài)勢(shì),像月之暗面Kimi、幻方DeepSeek這些產(chǎn)品,近期在美國(guó)業(yè)界也引發(fā)了廣泛關(guān)注,而另一方面,就像這次事件所展現(xiàn)的,國(guó)內(nèi)基于開(kāi)源大模型的派生模型開(kāi)發(fā)水平也越來(lái)越高,像MiniCPM-Llama3-V 2.5是基于SigLip-400M和Llama38B-Instruct構(gòu)建,而開(kāi)發(fā)者面壁智能最新發(fā)布的開(kāi)源大模型Eurux-8x22B,則是基于Mixtral-8x22B,號(hào)稱(chēng)早于Llama3、比肩Llama3、推理超越Llama3,刷新開(kāi)源大模型推理性能SOTA。

月之暗面Kimi與幻方DeepSeek的平臺(tái)界面

當(dāng)然,這些進(jìn)展令人欣喜,不過(guò)無(wú)論技術(shù)派還是市場(chǎng)派,未來(lái)要走的路還有很長(zhǎng),比如國(guó)內(nèi)基礎(chǔ)大模型開(kāi)發(fā)者在實(shí)現(xiàn)GPT-4o乃至未來(lái)GPT-5的技術(shù)能力后,如何培育開(kāi)發(fā)工具鏈和應(yīng)用生態(tài),仍將是一大挑戰(zhàn),而對(duì)于聚焦場(chǎng)景與領(lǐng)域應(yīng)用落地的企業(yè),則有必要回答這樣一個(gè)追問(wèn):開(kāi)源大模型是否永遠(yuǎn)是免費(fèi)的午餐?

誠(chéng)然,目前開(kāi)源大模型社區(qū),尚未受到地緣因素的明顯干擾,但即便沒(méi)有人興風(fēng)作浪“拖后腿”,長(zhǎng)期安于使用別人的基礎(chǔ)模型成果,也意味著將制高點(diǎn)拱手讓給他人。

值得注意的是,在開(kāi)源大模型原始創(chuàng)新上,歐洲、特別是法國(guó)正占據(jù)不容忽視的地位,AI大模型的美中法“三國(guó)殺”格局已隱約可見(jiàn)。

具體來(lái)看,上文提到的Mixtral-8x22B,就來(lái)自于法國(guó)初創(chuàng)企業(yè)Mistral AI,至于Llama系列,盡管名義上是美國(guó)巨頭Meta的產(chǎn)品,但其開(kāi)發(fā)團(tuán)隊(duì)則主要位于法國(guó),相關(guān)人才和知識(shí)自然也主要在法國(guó)流動(dòng)。

在斯坦福大學(xué)編制的《AI指數(shù)報(bào)告2024》中,主要機(jī)器學(xué)習(xí)模型的“原產(chǎn)地”排名上,美、中、歐盟已分別占據(jù)前三排名

可資參照的是,在斯坦福大學(xué)編制的《AI指數(shù)報(bào)告2024》中,主要機(jī)器學(xué)習(xí)模型的“原產(chǎn)地”排名上,美、中、法已分別占據(jù)前三排名,而歐盟加英國(guó)合計(jì),更是已經(jīng)超越中國(guó)。

這樣的格局中,蘊(yùn)含著不言自明的威脅性,如果國(guó)內(nèi)AI產(chǎn)業(yè)界繼續(xù)對(duì)開(kāi)源基礎(chǔ)模型秉持“拿來(lái)主義”,長(zhǎng)此以往則可能進(jìn)一步增強(qiáng)歐洲在產(chǎn)業(yè)競(jìng)爭(zhēng)中的主動(dòng)性,畢竟在基礎(chǔ)模型之外,歐洲獲得高端算力的便利性也遠(yuǎn)強(qiáng)于國(guó)內(nèi)。

總體而言,以這一事件為標(biāo)志,隨著中國(guó)AI大模型產(chǎn)業(yè)的迅速成長(zhǎng),其對(duì)美國(guó)產(chǎn)業(yè)生態(tài)的“反作用力”也會(huì)越來(lái)越頻繁而顯著,能否在多邊博弈中穩(wěn)中求進(jìn),離不開(kāi)每一個(gè)產(chǎn)業(yè)人的共同努力。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港