展會(huì)信息港展會(huì)大全

我們離OpenAI還有多遠(yuǎn)?“代差”不止幾個(gè)月,試錯(cuò)成本仍較高
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-29 19:29:00   瀏覽:5723次  

導(dǎo)讀:來(lái)自大洋彼岸的OpenAI以及ChatGPT的出現(xiàn),如同一場(chǎng)颶風(fēng)暴席卷了整個(gè)科技圈,自從發(fā)布后,就一直是國(guó)內(nèi)的頂流話題。為什么中國(guó)沒(méi)有誕生ChatGPT?在這個(gè)問(wèn)題出現(xiàn)后的近半年時(shí)間里,約30家國(guó)內(nèi)科技大廠、創(chuàng)業(yè)公司、機(jī)構(gòu)相繼宣布推出大模型。 此后,業(yè)界最為關(guān)注...

來(lái)自大洋彼岸的OpenAI以及ChatGPT的出現(xiàn),如同一場(chǎng)颶風(fēng)暴席卷了整個(gè)科技圈,自從發(fā)布后,就一直是國(guó)內(nèi)的頂流話題。為什么中國(guó)沒(méi)有誕生ChatGPT?在這個(gè)問(wèn)題出現(xiàn)后的近半年時(shí)間里,約30家國(guó)內(nèi)科技大廠、創(chuàng)業(yè)公司、機(jī)構(gòu)相繼宣布推出大模型。

此后,業(yè)界最為關(guān)注、也充滿爭(zhēng)議的一個(gè)話題是,國(guó)內(nèi)的大模型距離OpenAI有多遠(yuǎn)?關(guān)于企業(yè)家兩三個(gè)月以及兩三年的言論推測(cè)都曾刷屏網(wǎng)絡(luò)。在近期和不同領(lǐng)域相關(guān)從業(yè)者的交流中,第一財(cái)經(jīng)發(fā)現(xiàn),盡管有一些樂(lè)觀的看法,身處一線的研究者們都較為謹(jǐn)慎。

復(fù)旦大學(xué)MOSS系統(tǒng)負(fù)責(zé)人邱錫鵬對(duì)第一財(cái)經(jīng)表示,“我們不得不說(shuō),不光是國(guó)內(nèi)的模型,包括谷歌,離OpenAI的GPT4都還是存在代差的,差距非常大,遠(yuǎn)遠(yuǎn)不是幾個(gè)月就可以追趕上的。”

網(wǎng)梯科技創(chuàng)始人張震認(rèn)為,在追趕OpenAI方面,算力并不是問(wèn)題,雇傭全球云服務(wù)商夜里的“垃圾時(shí)間”就解決了,核心是算法、數(shù)據(jù)能不能真的產(chǎn)生智能,這是挑戰(zhàn)。“業(yè)界認(rèn)為一年時(shí)間能追到GPT3.5,我覺(jué)得不一定追得上,除非把核心程序員挖出來(lái),否則只是看起來(lái)很像。”

上海國(guó)創(chuàng)中心理事長(zhǎng)、領(lǐng)中資本管理合伙人黃巖認(rèn)為,短期內(nèi)并不存在追上的說(shuō)法,因?yàn)檫@個(gè)領(lǐng)域需要巨額投入,目前國(guó)內(nèi)沒(méi)有哪家大模型廠商投下了OpenAI那樣規(guī)模的資金,對(duì)于這個(gè)高投入、高風(fēng)險(xiǎn)、高回報(bào)的領(lǐng)域,國(guó)內(nèi)的資本也還在持幣觀望。

盡管如此,邱錫鵬認(rèn)為,很多人會(huì)思考為什么中國(guó)沒(méi)造出ChatGPT,“能思考這個(gè)問(wèn)題本身就是一個(gè)很大的進(jìn)步,放在10年前我們不會(huì)思考這個(gè)問(wèn)題,會(huì)覺(jué)得一個(gè)先進(jìn)技術(shù)發(fā)展在美國(guó)是應(yīng)當(dāng)?shù)摹?rdquo;現(xiàn)在我們思考,并且去追趕,本身就是一種進(jìn)步。

代差不是幾個(gè)月就能追上

“在過(guò)去的幾個(gè)月,有十幾個(gè)大語(yǔ)言模型的發(fā)布會(huì),這些模型都大同小異,現(xiàn)狀就是,在全球范圍內(nèi)只有OpenAI能夠達(dá)到通用人工智能的商業(yè)化,并且有絕大部分用戶(hù)的市常”在長(zhǎng)三角科技產(chǎn)業(yè)創(chuàng)新論壇上,竹間智能創(chuàng)始人兼CEO簡(jiǎn)仁賢認(rèn)為,幾乎除OpenAI以外的AGI大語(yǔ)言模型都只是發(fā)布會(huì)的階段,沒(méi)有達(dá)到可商用化的程度。

簡(jiǎn)仁賢表示,從發(fā)布會(huì)到可商用化,中間有很大一段距離,這個(gè)差距還很大。目前的情況是,OpenAI具有幾億人的使用數(shù)據(jù),它用這些使用數(shù)據(jù)再去微調(diào)其模型,“GPT4已經(jīng)非常厲害,更不用說(shuō)未來(lái)會(huì)有GPT5。”

邱錫鵬的團(tuán)隊(duì)此前嘗試用大模型去做高考題,但并沒(méi)有用MOSS去測(cè)試,在采訪中他直言是因?yàn)橛X(jué)得“它應(yīng)該考不了多少分”。 邱錫鵬表示,團(tuán)隊(duì)之前讓ChatGPT做高考題,用人工評(píng)價(jià)大概判斷得分在500分左右,后來(lái)用一些更嚴(yán)格的方式、用程序來(lái)評(píng)判,得分大概400分不到。不過(guò)此后GPT4又將高出非常多。近期,以“火星”命名的千億級(jí)模型參數(shù)的更新版MOSS模型即將上線,邱錫鵬的團(tuán)隊(duì)計(jì)劃讓更新版MOSS參加今年的高考,以測(cè)試其分析和推理能力。

國(guó)內(nèi)有部分企業(yè)認(rèn)為我們與ChatGPT的差距很小,邱錫鵬認(rèn)為,作為聊天軟件,國(guó)產(chǎn)大模型或許與ChatGPT差別不太大,但作為生產(chǎn)力工具,兩者能力仍然存在代差,這個(gè)代差不是幾個(gè)月就能追上的。

深思考是華為投資的人工智能企業(yè),此前發(fā)布了針對(duì)專(zhuān)業(yè)場(chǎng)景的多模態(tài)大模型,作為身處一線的觀察者,深思考創(chuàng)始人、AI算法科學(xué)家楊志明對(duì)第一財(cái)經(jīng)表示,從通用層面來(lái)說(shuō),國(guó)內(nèi)大模型與OpenAI大概有1-2代的代差,這個(gè)代差代表了整個(gè)模型層的技術(shù),包括學(xué)習(xí)的知識(shí)、能力等等方面的差距。

楊志明認(rèn)為,很難從時(shí)間上去衡量這個(gè)差距,因?yàn)樗俣炔灰粯,可能(chē)?guó)內(nèi)基于一些公開(kāi)論文和模型,學(xué)習(xí)先行者會(huì)快一點(diǎn),但也并非是幾個(gè)月這么簡(jiǎn)單。關(guān)鍵在于,OpenAI還在往前走,會(huì)越跑越快,“在垂直領(lǐng)域,我們有可能追上,在通用這塊還會(huì)有一段時(shí)間。”他表示。

國(guó)內(nèi)迫切呼喚通用大模型。在長(zhǎng)三角科技產(chǎn)業(yè)創(chuàng)新論壇上,上海市徐匯區(qū)委常委、副區(qū)長(zhǎng)俞林偉就表示,目前最重要的是大模型,因?yàn)檫@個(gè)是真正的國(guó)之大者。“也有充滿危機(jī)感的行業(yè)的領(lǐng)軍人物講,如果我們今年下半年仍然不能做出中國(guó)的通用大模型,因?yàn)槊绹?guó)還在不斷地往前走,以后可能我們連汽車(chē)的尾燈都看不見(jiàn),這個(gè)絕對(duì)不是危言聳聽(tīng)。”

在論壇現(xiàn)場(chǎng),俞林偉“廣發(fā)英雄帖”表示,徐匯愿意以事業(yè)合伙人的胸襟和擔(dān)當(dāng),真金白銀拿出辦公的載體、算力資源以及研發(fā)費(fèi)用的補(bǔ)貼。“只要誰(shuí)能夠把這個(gè)干出來(lái),我們是愿意盡最大的努力來(lái)支持,盡最大的意愿來(lái)做好服務(wù)。前一段時(shí)間我們已經(jīng)服務(wù)了幾家這樣的企業(yè),拿出來(lái)的載體價(jià)格至少這兩年我從來(lái)沒(méi)有見(jiàn)到過(guò)。”

據(jù)黃巖團(tuán)隊(duì)的統(tǒng)計(jì),截至2023年4月,AGI賽道目前在國(guó)外已出現(xiàn)了13家獨(dú)角獸。在國(guó)內(nèi)目前只有小冰公司已明確成為獨(dú)角獸。超一半初創(chuàng)企業(yè)的融資進(jìn)度在A輪或天使輪,行業(yè)仍處于發(fā)展初期。

目前,最受頭部資本關(guān)注的機(jī)構(gòu)均與底層大模型或AI領(lǐng)軍人物下場(chǎng)相關(guān),如已退休的美團(tuán)聯(lián)合創(chuàng)始人王慧文、搜狗創(chuàng)始人王小川、創(chuàng)新工場(chǎng)董事長(zhǎng)李開(kāi)復(fù)等。此前王慧文公開(kāi)動(dòng)態(tài)透露,光年之外的下輪融資已有頂級(jí)VC認(rèn)購(gòu)2.3億美元。

試錯(cuò)成本仍然較高

在談及與OpenAI的差距時(shí),此前有投資人表達(dá)了相對(duì)樂(lè)觀的態(tài)度。一方面,大模型的架構(gòu)已經(jīng)確定,后發(fā)者很容易去學(xué)習(xí)。此外未來(lái)三年算力的成本會(huì)下降,同時(shí)又有不少開(kāi)源模型作為基礎(chǔ)支持。站在巨人的肩膀上,節(jié)省了從頭開(kāi)始的試錯(cuò)成本。

邱錫鵬對(duì)第一財(cái)經(jīng)記者表示,整體從技術(shù)能力上,國(guó)內(nèi)外沒(méi)有太大的差距,差距更可能來(lái)自于在前期有風(fēng)險(xiǎn)、道路不明確的時(shí)候,有沒(méi)有投入巨資,類(lèi)似于**式去做這件事。

另一方面,盡管OpenAI已經(jīng)走通的路徑能幫后來(lái)者節(jié)省很大的成本,但其具體每一步的細(xì)節(jié)外界并不知道。雖然都是Transformer的架構(gòu),但是Transformer也有很多版本,每家都不一樣。

“這都是研究者根據(jù)自己在研究中的一些經(jīng)驗(yàn)或者理論等推導(dǎo)出來(lái)的,應(yīng)該做哪些修改等等外界完全不知道。我們自己做的時(shí)候,也需要去試錯(cuò),這個(gè)成本依然非常高。”邱錫鵬說(shuō)。

黃巖認(rèn)為,雖然可以參考一些開(kāi)源的內(nèi)容,但是一方面數(shù)據(jù)的標(biāo)注仍然需要人為去標(biāo)識(shí),這需要大量的投入。另一方面,現(xiàn)在算法也開(kāi)始自AI,即自動(dòng)生成算法,這個(gè)結(jié)果出來(lái)不可控,研究者并不知道是怎么算出來(lái)的,因此這個(gè)過(guò)程并不容易。

此外,大模型需要巨額投入,此前有投資人測(cè)算,對(duì)標(biāo)一個(gè)GPT3.5,基于目前已有的公開(kāi)資源,大概需要的投入至少是1億到2億美金。

但與國(guó)外融資環(huán)境相比,國(guó)內(nèi)AIGC目前融資頻次與體量有一定差距。黃巖認(rèn)為,通用大模型有著高投入、高風(fēng)險(xiǎn)、高回報(bào)的投資特點(diǎn),商業(yè)價(jià)值很難在短期內(nèi)產(chǎn)生。“以微軟130億美元投資OpenAI為例,在沒(méi)有看到其產(chǎn)品效果以及真正商業(yè)化之前,很難有機(jī)構(gòu)敢去做這個(gè)規(guī)模的投資。”目前大部隊(duì)還處在缺乏明確邏輯和標(biāo)的的觀望狀態(tài),黃巖表示。

在采訪中,商湯科技智能產(chǎn)業(yè)研究院院長(zhǎng)田豐還對(duì)第一財(cái)經(jīng)提到,算力之外,數(shù)據(jù)是一個(gè)很重要的成本。大模型訓(xùn)練需要需要跨語(yǔ)言、跨行業(yè)、跨領(lǐng)域的龐大數(shù)據(jù)集,上至天文下至地理等領(lǐng)域的數(shù)據(jù)都需要有效覆蓋,但一方面是訓(xùn)練數(shù)據(jù)集可獲得的難易程度問(wèn)題,另一方面則是獲得的質(zhì)量問(wèn)題,以及背后還有不可忽視的人工糾偏、合規(guī)審查等重投入工作。

在中文語(yǔ)料庫(kù)里,通過(guò)互聯(lián)網(wǎng)獲得高質(zhì)量數(shù)據(jù)并不占優(yōu)。根據(jù)調(diào)研公司 W3Techs的數(shù)據(jù),全球的網(wǎng)站有55%是英文的,而中文網(wǎng)站的比例只有1.4%,排名第12位,和越南相近。因此中文內(nèi)容在人工智能訓(xùn)練上沒(méi)有優(yōu)勢(shì)。

另一方面是數(shù)據(jù)獲得的難易程度以及標(biāo)準(zhǔn)化程度,田豐提到,國(guó)際上多邊跨國(guó)數(shù)據(jù)政策互通、全球訓(xùn)練數(shù)據(jù)集易于獲取,而中國(guó)尚缺乏大模型國(guó)際標(biāo)準(zhǔn)深度參與、多國(guó)數(shù)據(jù)流動(dòng)機(jī)制、國(guó)際標(biāo)準(zhǔn)互認(rèn)、大規(guī)模中文語(yǔ)言開(kāi)源訓(xùn)練數(shù)據(jù)集。

如此前歐盟委員會(huì)法規(guī)已構(gòu)建起歐盟與英日韓等多個(gè)國(guó)家的跨境數(shù)據(jù)流動(dòng)充分性權(quán)限許可。在4月底的G7會(huì)議上,通過(guò)聯(lián)合聲明明確提出建立“可信賴(lài)的AI”國(guó)際技術(shù)標(biāo)準(zhǔn)、基于“可信的數(shù)據(jù)自由流通”(DFFT)構(gòu)建起國(guó)際機(jī)制,促進(jìn)跨國(guó)數(shù)據(jù)流通。

田豐認(rèn)為,類(lèi)似通過(guò)舉國(guó)體制去建立全球最大的公共開(kāi)源中文數(shù)據(jù)集,以加速中文大模型的訓(xùn)練速度與質(zhì)量刻不容緩。OpenAI之所以有工程上的奇跡,關(guān)鍵就在于其開(kāi)放的技術(shù)鏈條,能夠把全球產(chǎn)業(yè)鏈上最前沿的技術(shù)融合到一起。如果都只有各自那一塊領(lǐng)域的數(shù)據(jù)很難訓(xùn)練出大模型。

“我們希望政產(chǎn)學(xué)研一起去做這個(gè)事情,龍頭企業(yè)有行業(yè)數(shù)據(jù),科技公司有較強(qiáng)的大模型基礎(chǔ)研發(fā)能力與人才,國(guó)家實(shí)驗(yàn)室、國(guó)家數(shù)據(jù)局作為多方信任的中立機(jī)構(gòu),能夠有效將全球中文數(shù)據(jù)集合法合規(guī)集中于一個(gè)國(guó)家共享開(kāi)放生態(tài),發(fā)揮出AGI時(shí)代舉國(guó)體制的巨大價(jià)值。”田豐呼吁。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港