展會信息港展會大全

WAIC上演大模型競技賽,“國家隊”百度進(jìn)化到哪兒了?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-10 08:40:47   瀏覽:13964次  

導(dǎo)讀:文/王慧瑩 編輯/陳鋒 今年5月,中國科學(xué)技術(shù)信息研究院發(fā)布了《中國人工智能大模型地圖研究報告》,這份報告顯示,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型,至少已經(jīng)發(fā)布了79個。 這一百模大戰(zhàn)的盛況,在這兩天舉辦的2023世界人工智能大會(WAIC)上...

文/王慧瑩

編輯/陳鋒

今年5月,中國科學(xué)技術(shù)信息研究院發(fā)布了《中國人工智能大模型地圖研究報告》,這份報告顯示,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型,至少已經(jīng)發(fā)布了79個。

這一“百模大戰(zhàn)”的盛況,在這兩天舉辦的2023世界人工智能大會(WAIC)上,得到了集中體現(xiàn)。

一方面,這屆WAIC,堪稱是大模型的主常據(jù)連線Insight觀察,大會現(xiàn)場展出的大模型新品,超過了30余款。

另一方面,除了展出大模型之外,圍繞大模型相關(guān)的前沿算法、智能芯片等基礎(chǔ)設(shè)施,也成了另一個重頭戲。

比如百度展示了文心大模型3.5版本、文心一言、業(yè)內(nèi)首個一站式企業(yè)級大模型平臺文心千帆,還重點展出了其全棧自研的AI大底座。

百度在展會現(xiàn)場展示AI大底座

從這屆WAIC來看,業(yè)內(nèi)“做不做”大模型的討論已經(jīng)告一段落了,新的焦點是,各家的大模型到底有哪些差異化?底層技術(shù)上到底怎么樣?以及接下來他們將怎么布局?

值得注意的一點是,大會上發(fā)布的《2022 全球人工智能創(chuàng)新指數(shù)報告》指出,當(dāng)前全球人工智能處于加速發(fā)展期,其中有兩個趨勢較為關(guān)鍵:

數(shù)據(jù)和算力基礎(chǔ)設(shè)施建設(shè)持續(xù)推進(jìn);人工智能產(chǎn)業(yè)化進(jìn)程明顯加快。

不難發(fā)現(xiàn),這兩點趨勢所指向的,正是當(dāng)前大模型產(chǎn)業(yè)最為關(guān)鍵的兩個問題:

第一是技術(shù)側(cè),支撐大模型能力的底層基礎(chǔ)設(shè)施是否完善,決定著一家企業(yè)能否做出大模型、做好大模型的能力迭代;

第二是應(yīng)用側(cè),大模型如何落地,如何賦能到千行百業(yè)、如何真正釋放出產(chǎn)業(yè)化價值,決定著一家企業(yè)在大模型賽道的上限。

而真正值得討論的是,在接下來的這場馬拉松中,擁有怎樣特質(zhì)的企業(yè),將持續(xù)成為領(lǐng)跑者?

1、WAIC成大模型“秀場”:“國家隊”來了,秀產(chǎn)品也秀技術(shù)

大模型賽道到底有多熱?這屆WAIC是一個最佳的觀察窗口。

連線Insight觀察到,包括但不限于互聯(lián)網(wǎng)/云計算大廠陣營的百度、華為等;運營商陣營的中國移動、中國電信等;知名AI企業(yè)陣營的商湯科技等;大模型初創(chuàng)企業(yè)陣營的瀾舟科技、銜遠(yuǎn)科技等,都帶來了大模型的最新產(chǎn)品及最新進(jìn)度。

與此同時,在百花齊放的態(tài)勢下,大模型“國家隊”也確定了陣容。

7月7日的大會論壇上,國家標(biāo)準(zhǔn)委指導(dǎo)的國家人工智能標(biāo)準(zhǔn)化總體組,宣布我國首個大模型標(biāo)準(zhǔn)化專題組組長,由上海人工智能實驗室與百度、華為、阿里等企業(yè)聯(lián)合擔(dān)任,現(xiàn)場進(jìn)行了證書頒發(fā)并正式啟動大模型測試國家標(biāo)準(zhǔn)制訂。

這意味著,過去混沌的大模型格局,正在逐漸變得越來越清晰。

再綜合來看,這屆以大模型為絕對重心的大會上,呈現(xiàn)出了以下幾個特征:

市場上幾乎所有的大模型廠商都來了;

圍繞大模型,廠商展出的重點,還包括了大模型底座、MaaS解決方案等;

通用大模型之外,面向垂直場景的行業(yè)大模型也不在少數(shù),以及能夠為客戶提供私有化部署的大模型也不在少數(shù)。

基于這幾點,這屆WAIC實則為我們提供了一個觀察大模型行業(yè)現(xiàn)狀,及接下來發(fā)展趨勢的最佳機會。

其中,作為大模型產(chǎn)業(yè)最具代表性的玩家之一,百度又是一個很好的觀察切口它是最先探索將產(chǎn)品落地的AI企業(yè)之一,也是率先推出通用大模型產(chǎn)品的廠商之一。

除了展示了文心大模型的最新進(jìn)展、大語言模型文心一言的最新進(jìn)展外,百度還重點展示了業(yè)內(nèi)首個一站式企業(yè)級大模型平臺文心千帆、全棧自研的AI大底座。

文心千帆大模型平臺,圖源百度智能云微信公眾號

自下而上層層拆解就不難發(fā)現(xiàn),百度在這次大會上的動作,不僅僅是對外展示過去一段時間在大模型領(lǐng)域的最新成果,同樣也在進(jìn)一步向外界傳達(dá)其大模型的布局思路。

一方面,通過AI大底座的展示,百度透露出一個信號,布局大模型,最關(guān)鍵的還是要看技術(shù)。

另一方面,重點展出文心大模型、大語言模型文心一言和一站式企業(yè)級大模型平臺文心千帆的最新進(jìn)展,這意味著,百度做大模型,最終的思路是通過底層的技術(shù)迭代以及開放的平臺生態(tài),推動大模型的場景落地。

其中邏輯在于,文心大模型是百度的基礎(chǔ)大模型,文心一言是知識增強大語言模型,是文心大模型中的一種,而文心千帆平臺要做的事情,就是將百度的這些模型以及第三方模型整合到一起,提供給客戶使用,在這一基礎(chǔ)上,文心千帆還提供覆蓋全生命周期的大模型工具鏈,同時支持大模型定制開發(fā)。

對此,王海峰指出,在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。

據(jù)百度透露,目前文心大模型已經(jīng)在能源、汽車、政務(wù)、交通、金融等十余個行業(yè)率先落地。

透過百度,不難發(fā)現(xiàn),在當(dāng)下的大模型賽道,真正的角逐重心,首先是技術(shù),緊接著是場景落地,可以肯定的是,這將是一場馬拉松。

2、技術(shù)要夠硬核,也要有長期主義

大模型時代到來后,IT技術(shù)棧也發(fā)生了根本性變化,即從芯片層(CPU為主)、操作系統(tǒng)層、應(yīng)用層的三層架構(gòu),發(fā)展成為了四層架構(gòu):芯片層(GPU為主)+框架層+模型層+應(yīng)用層。

賽道中的任何一家入局企業(yè),都需要適應(yīng)這一新的變化,在底層能力上持續(xù)進(jìn)化、迭代。

百度是其中最有代表性的一家,從昆侖芯到飛槳深度學(xué)習(xí)框架,到文心大模型,再到上層的應(yīng)用,在每一層技術(shù)棧都有布局和自研技術(shù)。百度也是全球為數(shù)不多的進(jìn)行全棧布局的AI公司。

在大會現(xiàn)場,王海峰也指出,尤其是在框架層和模型層,百度的自研優(yōu)勢更加突出。

框架層,飛槳是我國第一個自助研發(fā)的產(chǎn)業(yè)級深度學(xué)習(xí)開放開源平臺,在中國深度學(xué)習(xí)平臺綜合市場份額上連續(xù)兩年位居第一。截至目前飛槳已凝聚 750萬名開發(fā)者,這也是百度2023年以來首次對外披露飛槳生態(tài)最新數(shù)據(jù)。

模型層,王海峰在現(xiàn)場指出,文心大模型現(xiàn)在已經(jīng)迭代至3.5,實現(xiàn)了基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強等,模型效果提升了50%,訓(xùn)練速度提升了2倍,推理速度提升了30倍。

而文心大模型的迭代,正是一個通過技術(shù)創(chuàng)新推動大模型能力迭代的范本。

在基礎(chǔ)模型訓(xùn)練上,文心大模型3.5采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,這加快了模型迭代速度,同時提升了模型效果和安全性。

同時,文心大模型3.5采取了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎勵模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),使模型效果及場景適配能力進(jìn)一步提升。

此外,在知識增強和檢索增強基礎(chǔ)上,文心大模型3.5提出了“知識點增強技術(shù)”,提升了大模型掌握和運用知識的能力。

在推理方面,則是通過大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識建模、多粒度語義知識組合以及符號神經(jīng)網(wǎng)絡(luò)技術(shù),提升了文心大模型3.5在邏輯推理、數(shù)學(xué)計算及代碼生成等任務(wù)上的表現(xiàn)。

值得注意的是,文心大模型3.5 還新增了插件機制,默認(rèn)的內(nèi)置插件“百度搜索”,使得文心一言具備生成實時準(zhǔn)確信息的能力;長文本摘要和問答插件“ChatFile”支持超長文本輸入等等。

王海峰表示,文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,讓用戶能夠更好地應(yīng)用文心大模型,同時也將逐步開放插件生態(tài),幫助開發(fā)者基于文心大模型打造自己的應(yīng)用。

這一系列能力迭代背后,百度靠的是其在AI領(lǐng)域長期的投入和積累。

2013年開始,百度就開始布局AI相關(guān)技術(shù),累計十年下來已經(jīng)投入超過1000億元,其中核心研發(fā)投入多個季度占比超過20%。截至2022年4月,百度全球AI專利申請已經(jīng)超過2.2萬件。

當(dāng)然,所有的技術(shù)優(yōu)勢,最終都要轉(zhuǎn)化為可落地的成果,在大模型賽道,這意味著,大模型能否落地,將價值最大化。

3、從技術(shù)中來,到產(chǎn)業(yè)中去

大模型熱潮持續(xù)到現(xiàn)在,行業(yè)的競賽將進(jìn)入到更深一層,既拼技術(shù),也拼場景落地。

不斷探索大模型的能力邊界,推動大模型在具體行業(yè)場景下的落地,也成了當(dāng)前市場參與者的重中之重。

據(jù)連線Insight了解,4月17日,文心一言在百度內(nèi)部全面應(yīng)用在智能工作平臺“如流”。百度此次在內(nèi)部發(fā)布的智能工作工具,涵蓋了文本和圖片生成、代碼推薦兩大場景。

簡單來說,文心一言在實際的辦公、會議、編碼等場景的表現(xiàn),就像一個“超級助手”,幫助員工在日常工作中的思路構(gòu)建、協(xié)作溝通、方案策劃、代碼編寫等方面大幅提升效率。

王海峰也表示,凡是要跟語言文字或程序代碼打交道的應(yīng)用場景,都可能有文心一言的用武之地。他透露,目前在能源、金融、教育、辦公、媒體等諸多領(lǐng)域,已經(jīng)有很多在積極應(yīng)用文心一言的場景。

在這之前,百度還曾展示了文心一言+電商的場景:你只需要把商品的信息告訴AI,AI就會自動生成多種風(fēng)格的商品帶貨腳本和風(fēng)格,再搭配數(shù)字人主播,就可以進(jìn)行直播帶貨。

7月6日,百度智能云事業(yè)群總裁沈抖在2023中國國際數(shù)字和軟件服務(wù)交易會上透露,目前已經(jīng)有15萬家企業(yè)申請接入文心一言測試這說明,文心一言的潛在落地場景,還在不斷拓寬。

同樣值得一提的還有文心一格,同樣是百度依托于飛槳、文心大模型的一款,在“AI作圖”方面的產(chǎn)品。

據(jù)悉,文心一格既能為畫師、設(shè)計師等視覺內(nèi)容創(chuàng)作者啟發(fā)靈感,輔助藝術(shù)創(chuàng)作,又能為媒體、作者等文字內(nèi)容創(chuàng)作者提供高質(zhì)量、高效率的配圖。用戶就算完全沒有繪畫經(jīng)驗,也能在文心一格畫出無限創(chuàng)意。

聚焦到企業(yè)客戶,同樣可以在文心一格體驗到業(yè)界領(lǐng)先的文生圖水平。

不過,相比起文心一言、文心一格正在不斷釋放的應(yīng)用場景,百度探索大模型落地產(chǎn)業(yè)場景的思路,更值得被關(guān)注。

連線Insight 觀察到,百度的大模型產(chǎn)業(yè)布局中,有兩個信息尤為關(guān)鍵。

第一是一站式企業(yè)級大模型平臺文心千帆的推出。

如我們上文所提及,文心千帆實質(zhì)上是一個大模型的集約平臺,百度將這一平臺開放,結(jié)合自身完善的大模型工具鏈,通過公有云服務(wù)、私有化部署等方式提供給企業(yè)客戶。

這一布局思路下,平臺具備了易用性、全面性、安全性、高效、開放、易拓展等特點,進(jìn)而幫助企業(yè)高效、低成本地獲取大模型能力。

百度透露,截至目前,已有超過300家百度智能云生態(tài)伙伴參與到了“文心千帆大模型平臺”內(nèi)測,包括工業(yè)、金融、政務(wù)、互聯(lián)網(wǎng)、運營商、教育等行業(yè)頭部企業(yè)。

第二是百度飛槳深度學(xué)習(xí)平臺,對大模型適配產(chǎn)業(yè)場景能力的提升。

一方面,為了讓大模型產(chǎn)業(yè)落地更高效便捷,飛槳提供了全流程產(chǎn)業(yè)化工具與平臺,包括大模型開發(fā)套件、場景模型生產(chǎn)線等,極大降低了應(yīng)用門檻。“通過高效構(gòu)建與快速迭代基于大模型的多樣化場景模型,讓大模型的落地像流水線一樣高效”。百度如此表示。

另一方面,飛槳的開放屬性也決定了,隨著越來越多的開發(fā)者快速在這里實現(xiàn)AI想法、創(chuàng)新AI應(yīng)用,飛槳作為基礎(chǔ)平臺支撐,更利于支撐越來越多行業(yè)實現(xiàn)產(chǎn)業(yè)智能化升級。

而將這些聯(lián)系起來重新審視百度在大模型賽道的布局思路、落地方向,就不難發(fā)現(xiàn),百度大模型的起點、轉(zhuǎn)折點、未來的錨點,都集中在“技術(shù)”這兩個字上。

回顧百度過去十年堅定的技術(shù)投入歷程,我們很清楚地能看到百度對于技術(shù)的長期主義,以及這種堅守帶來的成效。

但對百度而言,大模型的戰(zhàn)事才剛剛展開,接下來在“大模型落地”這場馬拉松中,如何繼續(xù)保持領(lǐng)先,對百度而言極為重要。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港