當(dāng)前位置：人工智能實驗室> 展會會議 > WAIC上演大模型競技賽，“國家隊”百度進(jìn)化到哪兒了？

WAIC上演大模型競技賽，“國家隊”百度進(jìn)化到哪兒了？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-10 08:40:47 瀏覽：13964次

導(dǎo)讀：文/王慧瑩編輯/陳鋒今年5月，中國科學(xué)技術(shù)信息研究院發(fā)布了《中國人工智能大模型地圖研究報告》，這份報告顯示，截至5月28日，國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型，至少已經(jīng)發(fā)布了79個。這一百模大戰(zhàn)的盛況，在這兩天舉辦的2023世界人工智能大會（WAIC）上...

文/王慧瑩

編輯/陳鋒

今年5月，中國科學(xué)技術(shù)信息研究院發(fā)布了《中國人工智能大模型地圖研究報告》，這份報告顯示，截至5月28日，國內(nèi)10億級參數(shù)規(guī)模以上基礎(chǔ)大模型，至少已經(jīng)發(fā)布了79個。

這一“百模大戰(zhàn)”的盛況，在這兩天舉辦的2023世界人工智能大會（WAIC）上，得到了集中體現(xiàn)。

一方面，這屆WAIC，堪稱是大模型的主常據(jù)連線Insight觀察，大會現(xiàn)場展出的大模型新品，超過了30余款。

另一方面，除了展出大模型之外，圍繞大模型相關(guān)的前沿算法、智能芯片等基礎(chǔ)設(shè)施，也成了另一個重頭戲。

比如百度展示了文心大模型3.5版本、文心一言、業(yè)內(nèi)首個一站式企業(yè)級大模型平臺文心千帆，還重點展出了其全棧自研的AI大底座。

百度在展會現(xiàn)場展示AI大底座

從這屆WAIC來看，業(yè)內(nèi)“做不做”大模型的討論已經(jīng)告一段落了，新的焦點是，各家的大模型到底有哪些差異化？底層技術(shù)上到底怎么樣？以及接下來他們將怎么布局？

值得注意的一點是，大會上發(fā)布的《2022 全球人工智能創(chuàng)新指數(shù)報告》指出，當(dāng)前全球人工智能處于加速發(fā)展期，其中有兩個趨勢較為關(guān)鍵：

數(shù)據(jù)和算力基礎(chǔ)設(shè)施建設(shè)持續(xù)推進(jìn)；人工智能產(chǎn)業(yè)化進(jìn)程明顯加快。

不難發(fā)現(xiàn)，這兩點趨勢所指向的，正是當(dāng)前大模型產(chǎn)業(yè)最為關(guān)鍵的兩個問題：

第一是技術(shù)側(cè)，支撐大模型能力的底層基礎(chǔ)設(shè)施是否完善，決定著一家企業(yè)能否做出大模型、做好大模型的能力迭代；

第二是應(yīng)用側(cè)，大模型如何落地，如何賦能到千行百業(yè)、如何真正釋放出產(chǎn)業(yè)化價值，決定著一家企業(yè)在大模型賽道的上限。

而真正值得討論的是，在接下來的這場馬拉松中，擁有怎樣特質(zhì)的企業(yè)，將持續(xù)成為領(lǐng)跑者？

1、WAIC成大模型“秀場”：“國家隊”來了，秀產(chǎn)品也秀技術(shù)

大模型賽道到底有多熱？這屆WAIC是一個最佳的觀察窗口。

連線Insight觀察到，包括但不限于互聯(lián)網(wǎng)/云計算大廠陣營的百度、華為等；運營商陣營的中國移動、中國電信等；知名AI企業(yè)陣營的商湯科技等；大模型初創(chuàng)企業(yè)陣營的瀾舟科技、銜遠(yuǎn)科技等，都帶來了大模型的最新產(chǎn)品及最新進(jìn)度。

與此同時，在百花齊放的態(tài)勢下，大模型“國家隊”也確定了陣容。

7月7日的大會論壇上，國家標(biāo)準(zhǔn)委指導(dǎo)的國家人工智能標(biāo)準(zhǔn)化總體組，宣布我國首個大模型標(biāo)準(zhǔn)化專題組組長，由上海人工智能實驗室與百度、華為、阿里等企業(yè)聯(lián)合擔(dān)任，現(xiàn)場進(jìn)行了證書頒發(fā)并正式啟動大模型測試國家標(biāo)準(zhǔn)制訂。

這意味著，過去混沌的大模型格局，正在逐漸變得越來越清晰。

再綜合來看，這屆以大模型為絕對重心的大會上，呈現(xiàn)出了以下幾個特征：

市場上幾乎所有的大模型廠商都來了；

圍繞大模型，廠商展出的重點，還包括了大模型底座、MaaS解決方案等；

通用大模型之外，面向垂直場景的行業(yè)大模型也不在少數(shù)，以及能夠為客戶提供私有化部署的大模型也不在少數(shù)。

基于這幾點，這屆WAIC實則為我們提供了一個觀察大模型行業(yè)現(xiàn)狀，及接下來發(fā)展趨勢的最佳機會。

其中，作為大模型產(chǎn)業(yè)最具代表性的玩家之一，百度又是一個很好的觀察切口它是最先探索將產(chǎn)品落地的AI企業(yè)之一，也是率先推出通用大模型產(chǎn)品的廠商之一。

除了展示了文心大模型的最新進(jìn)展、大語言模型文心一言的最新進(jìn)展外，百度還重點展示了業(yè)內(nèi)首個一站式企業(yè)級大模型平臺文心千帆、全棧自研的AI大底座。

文心千帆大模型平臺，圖源百度智能云微信公眾號

自下而上層層拆解就不難發(fā)現(xiàn)，百度在這次大會上的動作，不僅僅是對外展示過去一段時間在大模型領(lǐng)域的最新成果，同樣也在進(jìn)一步向外界傳達(dá)其大模型的布局思路。

一方面，通過AI大底座的展示，百度透露出一個信號，布局大模型，最關(guān)鍵的還是要看技術(shù)。

另一方面，重點展出文心大模型、大語言模型文心一言和一站式企業(yè)級大模型平臺文心千帆的最新進(jìn)展，這意味著，百度做大模型，最終的思路是通過底層的技術(shù)迭代以及開放的平臺生態(tài)，推動大模型的場景落地。

其中邏輯在于，文心大模型是百度的基礎(chǔ)大模型，文心一言是知識增強大語言模型，是文心大模型中的一種，而文心千帆平臺要做的事情，就是將百度的這些模型以及第三方模型整合到一起，提供給客戶使用，在這一基礎(chǔ)上，文心千帆還提供覆蓋全生命周期的大模型工具鏈，同時支持大模型定制開發(fā)。

對此，王海峰指出，在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中，可以采用“集約化生產(chǎn)，平臺化應(yīng)用”的模式，即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來，通過低門檻、高效率的生產(chǎn)平臺，為千行百業(yè)提供大模型服務(wù)。

據(jù)百度透露，目前文心大模型已經(jīng)在能源、汽車、政務(wù)、交通、金融等十余個行業(yè)率先落地。

透過百度，不難發(fā)現(xiàn)，在當(dāng)下的大模型賽道，真正的角逐重心，首先是技術(shù)，緊接著是場景落地，可以肯定的是，這將是一場馬拉松。

2、技術(shù)要夠硬核，也要有長期主義

大模型時代到來后，IT技術(shù)棧也發(fā)生了根本性變化，即從芯片層（CPU為主）、操作系統(tǒng)層、應(yīng)用層的三層架構(gòu)，發(fā)展成為了四層架構(gòu)：芯片層（GPU為主）+框架層+模型層+應(yīng)用層。

賽道中的任何一家入局企業(yè)，都需要適應(yīng)這一新的變化，在底層能力上持續(xù)進(jìn)化、迭代。

百度是其中最有代表性的一家，從昆侖芯到飛槳深度學(xué)習(xí)框架，到文心大模型，再到上層的應(yīng)用，在每一層技術(shù)棧都有布局和自研技術(shù)。百度也是全球為數(shù)不多的進(jìn)行全棧布局的AI公司。

在大會現(xiàn)場，王海峰也指出，尤其是在框架層和模型層，百度的自研優(yōu)勢更加突出。

框架層，飛槳是我國第一個自助研發(fā)的產(chǎn)業(yè)級深度學(xué)習(xí)開放開源平臺，在中國深度學(xué)習(xí)平臺綜合市場份額上連續(xù)兩年位居第一。截至目前飛槳已凝聚 750萬名開發(fā)者，這也是百度2023年以來首次對外披露飛槳生態(tài)最新數(shù)據(jù)。

模型層，王海峰在現(xiàn)場指出，文心大模型現(xiàn)在已經(jīng)迭代至3.5，實現(xiàn)了基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強等，模型效果提升了50%，訓(xùn)練速度提升了2倍，推理速度提升了30倍。

而文心大模型的迭代，正是一個通過技術(shù)創(chuàng)新推動大模型能力迭代的范本。

在基礎(chǔ)模型訓(xùn)練上，文心大模型3.5采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計算策略，并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布，這加快了模型迭代速度，同時提升了模型效果和安全性。

同時，文心大模型3.5采取了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎勵模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù)，使模型效果及場景適配能力進(jìn)一步提升。

此外，在知識增強和檢索增強基礎(chǔ)上，文心大模型3.5提出了“知識點增強技術(shù)”，提升了大模型掌握和運用知識的能力。

在推理方面，則是通過大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識建模、多粒度語義知識組合以及符號神經(jīng)網(wǎng)絡(luò)技術(shù)，提升了文心大模型3.5在邏輯推理、數(shù)學(xué)計算及代碼生成等任務(wù)上的表現(xiàn)。

值得注意的是，文心大模型3.5 還新增了插件機制，默認(rèn)的內(nèi)置插件“百度搜索”，使得文心一言具備生成實時準(zhǔn)確信息的能力；長文本摘要和問答插件“ChatFile”支持超長文本輸入等等。

王海峰表示，文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件，讓用戶能夠更好地應(yīng)用文心大模型，同時也將逐步開放插件生態(tài)，幫助開發(fā)者基于文心大模型打造自己的應(yīng)用。

這一系列能力迭代背后，百度靠的是其在AI領(lǐng)域長期的投入和積累。

2013年開始，百度就開始布局AI相關(guān)技術(shù)，累計十年下來已經(jīng)投入超過1000億元，其中核心研發(fā)投入多個季度占比超過20%。截至2022年4月，百度全球AI專利申請已經(jīng)超過2.2萬件。

當(dāng)然，所有的技術(shù)優(yōu)勢，最終都要轉(zhuǎn)化為可落地的成果，在大模型賽道，這意味著，大模型能否落地，將價值最大化。

3、從技術(shù)中來，到產(chǎn)業(yè)中去

大模型熱潮持續(xù)到現(xiàn)在，行業(yè)的競賽將進(jìn)入到更深一層，既拼技術(shù)，也拼場景落地。

不斷探索大模型的能力邊界，推動大模型在具體行業(yè)場景下的落地，也成了當(dāng)前市場參與者的重中之重。

據(jù)連線Insight了解，4月17日，文心一言在百度內(nèi)部全面應(yīng)用在智能工作平臺“如流”。百度此次在內(nèi)部發(fā)布的智能工作工具，涵蓋了文本和圖片生成、代碼推薦兩大場景。

簡單來說，文心一言在實際的辦公、會議、編碼等場景的表現(xiàn)，就像一個“超級助手”，幫助員工在日常工作中的思路構(gòu)建、協(xié)作溝通、方案策劃、代碼編寫等方面大幅提升效率。

王海峰也表示，凡是要跟語言文字或程序代碼打交道的應(yīng)用場景，都可能有文心一言的用武之地。他透露，目前在能源、金融、教育、辦公、媒體等諸多領(lǐng)域，已經(jīng)有很多在積極應(yīng)用文心一言的場景。

在這之前，百度還曾展示了文心一言+電商的場景：你只需要把商品的信息告訴AI，AI就會自動生成多種風(fēng)格的商品帶貨腳本和風(fēng)格，再搭配數(shù)字人主播，就可以進(jìn)行直播帶貨。

7月6日，百度智能云事業(yè)群總裁沈抖在2023中國國際數(shù)字和軟件服務(wù)交易會上透露，目前已經(jīng)有15萬家企業(yè)申請接入文心一言測試這說明，文心一言的潛在落地場景，還在不斷拓寬。

同樣值得一提的還有文心一格，同樣是百度依托于飛槳、文心大模型的一款，在“AI作圖”方面的產(chǎn)品。

據(jù)悉，文心一格既能為畫師、設(shè)計師等視覺內(nèi)容創(chuàng)作者啟發(fā)靈感，輔助藝術(shù)創(chuàng)作，又能為媒體、作者等文字內(nèi)容創(chuàng)作者提供高質(zhì)量、高效率的配圖。用戶就算完全沒有繪畫經(jīng)驗，也能在文心一格畫出無限創(chuàng)意。

聚焦到企業(yè)客戶，同樣可以在文心一格體驗到業(yè)界領(lǐng)先的文生圖水平。

不過，相比起文心一言、文心一格正在不斷釋放的應(yīng)用場景，百度探索大模型落地產(chǎn)業(yè)場景的思路，更值得被關(guān)注。

連線Insight 觀察到，百度的大模型產(chǎn)業(yè)布局中，有兩個信息尤為關(guān)鍵。

第一是一站式企業(yè)級大模型平臺文心千帆的推出。

如我們上文所提及，文心千帆實質(zhì)上是一個大模型的集約平臺，百度將這一平臺開放，結(jié)合自身完善的大模型工具鏈，通過公有云服務(wù)、私有化部署等方式提供給企業(yè)客戶。

這一布局思路下，平臺具備了易用性、全面性、安全性、高效、開放、易拓展等特點，進(jìn)而幫助企業(yè)高效、低成本地獲取大模型能力。

百度透露，截至目前，已有超過300家百度智能云生態(tài)伙伴參與到了“文心千帆大模型平臺”內(nèi)測，包括工業(yè)、金融、政務(wù)、互聯(lián)網(wǎng)、運營商、教育等行業(yè)頭部企業(yè)。

第二是百度飛槳深度學(xué)習(xí)平臺，對大模型適配產(chǎn)業(yè)場景能力的提升。

一方面，為了讓大模型產(chǎn)業(yè)落地更高效便捷，飛槳提供了全流程產(chǎn)業(yè)化工具與平臺，包括大模型開發(fā)套件、場景模型生產(chǎn)線等，極大降低了應(yīng)用門檻。“通過高效構(gòu)建與快速迭代基于大模型的多樣化場景模型，讓大模型的落地像流水線一樣高效”。百度如此表示。

另一方面，飛槳的開放屬性也決定了，隨著越來越多的開發(fā)者快速在這里實現(xiàn)AI想法、創(chuàng)新AI應(yīng)用，飛槳作為基礎(chǔ)平臺支撐，更利于支撐越來越多行業(yè)實現(xiàn)產(chǎn)業(yè)智能化升級。

而將這些聯(lián)系起來重新審視百度在大模型賽道的布局思路、落地方向，就不難發(fā)現(xiàn)，百度大模型的起點、轉(zhuǎn)折點、未來的錨點，都集中在“技術(shù)”這兩個字上。

回顧百度過去十年堅定的技術(shù)投入歷程，我們很清楚地能看到百度對于技術(shù)的長期主義，以及這種堅守帶來的成效。

但對百度而言，大模型的戰(zhàn)事才剛剛展開，接下來在“大模型落地”這場馬拉松中，如何繼續(xù)保持領(lǐng)先，對百度而言極為重要。