文|周效敬
編|王一粟
去年是百模大戰(zhàn),今年走到了應(yīng)用的深水區(qū)。
“應(yīng)用,還是應(yīng)用”,去年都是技術(shù)大咖在前臺分享,今年更多是應(yīng)用的負責(zé)人。論壇太多,嘉賓都不夠用了。
這是光錐智能在2024 世界人工智能大會(WAIC)現(xiàn)場最直觀的感受。500+家企業(yè)參展,1500+項展品展出,200+位重磅嘉賓演講,這個占地5萬多平米的會場上人頭攢動,到處彌漫著對技術(shù)落地和應(yīng)用的關(guān)切。
去年的WAIC,行業(yè)更關(guān)注大模型技術(shù)的追趕和突破,那么今年WAIC則更加聚焦于商業(yè)化落地,探索可行的商業(yè)模式和盈利途徑。
世界人工智能大會是中國大模型玩家集中“秀肌肉”的一個絕佳舞臺,大會現(xiàn)場展示了上百款大模型產(chǎn)品,不僅有百度文心一言、訊飛星火、阿里通義千問、騰訊元寶、華為盤古等這些來自頭部廠商的熱門產(chǎn)品,也有Minimax、百川智能、智譜AI等新晉玩家的產(chǎn)品展出。
“人是被忽視的因素,不是企業(yè)里所有人都擁抱AI。小企業(yè)把AI當成革命的工具,大企業(yè)把AI當成工具的革命。當大企業(yè)也意識到AI是革命的工具,變化就會到來。”中國工程院院士、之江實驗室主任、阿里云創(chuàng)始人王堅在大會上說。
中國工程院院士、之江實驗室主任、阿里云創(chuàng)始人 王堅
王堅道出的是中國大模型商業(yè)化落地的基本現(xiàn)狀。
據(jù)《中國新一代人工智能科技產(chǎn)業(yè)發(fā)展報告2024》,2023年中國人工智能核心產(chǎn)業(yè)規(guī)模達5784億元,增長13.9%;中國生成式人工智能的企業(yè)采用率15%,市場規(guī)模約為14.4萬億元。
與去年相比,今年大模型的應(yīng)用更加深入,但這依然不夠。
拼應(yīng)用,大模型廠商使出渾身解數(shù)
在大模型剛剛興起時,由于技術(shù)和經(jīng)驗的限制,大模型在落地過程中需要投入更多的資源進行研發(fā)和調(diào)試,導(dǎo)致當時的落地比較重,不少人也停留在AI 1.0時代的舊思路中。一年過去,大模型廠商的落地策略發(fā)生了不小的變化。
首先,在商業(yè)模式上更加成熟,新的商業(yè)模式也在探索。2023年,大模型商業(yè)化處于早期探索階段,主要通過API接口調(diào)用付費,面向C端用戶則以訂閱制,嘗試通過PaaS平臺以及MaaS模式進行商業(yè)化嘗試。
2024年,隨著產(chǎn)品和工具的完善,再加上大模型的降價潮,讓可商用邁入了一個全新的階段。
另一個變化是,從通用大模型占主流,到垂直領(lǐng)域大模型興起。
一個大模型沒法解決全世界的問題,更細分、更專業(yè)的大模型和應(yīng)用不斷涌現(xiàn)。在醫(yī)療領(lǐng)域,潤達醫(yī)療與華為云合作研發(fā)了“良醫(yī)小慧”,螞蟻集團推出百靈大模型,支撐起金融AI助理“支小寶”和AI就醫(yī)助理的落地;在教育領(lǐng)域,網(wǎng)易有道推出了“子曰”教育大模型,猿輔導(dǎo)也推出了看云大模型;“攜程問道”則是旅游大模型,這些都是垂直趨勢下的產(chǎn)物。
大模型正在從“通用”向著“有用”發(fā)展,垂直化、專業(yè)化則是表現(xiàn)出的一個必然趨勢。
此外,將大模型與Agent技術(shù)結(jié)合,也是實現(xiàn)大模型業(yè)務(wù)價值落地的一個途徑。在中國,已有多家廠商發(fā)布了自己的Agent智能體平臺,這些平臺利用大模型技術(shù),提供從任務(wù)自動化到軟件開發(fā)等一系列智能服務(wù)。
比如,騰訊推出了AppAgent項目,一個通過自主學(xué)習(xí)和模仿人類行為在手機上執(zhí)行任務(wù)的多模態(tài)代理;字節(jié)跳動上線了一站式 AI 開發(fā)平臺“Coze 扣子”,可支持 30 秒無代碼生成 AI Bot,集成了超過 60 種不同的插件,覆蓋新聞閱讀、旅行規(guī)劃、生產(chǎn)力工具等多個領(lǐng)域;百度也升級了產(chǎn)業(yè)級AI原生應(yīng)用開發(fā)平臺“千帆AppBuilder”,大幅降低AI原生應(yīng)用開發(fā)門檻,提升開發(fā)效率。
光錐智能了解到,基于訊飛星火大模型構(gòu)建的“星火企業(yè)智能體平臺”,已陸續(xù)應(yīng)用到金融、能源、工業(yè)、運營商等領(lǐng)域,已與金山等20余家生態(tài)廠商建立互認證生態(tài)。推廣市場3個月,累計使用次數(shù)已超過500萬次,覆蓋57個企業(yè)崗位,單次企業(yè)辦事效率提升10倍以上。
為了盡快落地,大模型玩家對to B和to C兩個方向的選擇截然不同且充滿爭議。
按企業(yè)服務(wù)領(lǐng)域的慣性來說,大模型to B應(yīng)用可以帶來更大的行業(yè)價值,可以更快實現(xiàn),但傳統(tǒng)企業(yè)普遍不敢用、高管不想用、企業(yè)不愿為軟件付費。因此,創(chuàng)新工場創(chuàng)始人、零一萬物CEO李開復(fù)認為,短期來看大模型在中國to C的應(yīng)用更有機會,但挑戰(zhàn)在于推理成本高,在考慮產(chǎn)品市場匹配度時,還要考慮技術(shù)需求、技術(shù)難度和成本等因素,而且還需要把握時間窗口。
大模型在B端落地更難,但也不全是如此。過去一年里,在多數(shù)廠商仍處于POC階段時,盤古大模型已在30多個行業(yè)、400多個場景中落地,覆蓋了從高鐵巡檢、氣象預(yù)報到鋼廠場景仿真、具身智能,再到工業(yè)互聯(lián)網(wǎng)等場景。
華為在B端落地的經(jīng)驗?zāi)芊駨?fù)制?坦白說有點難。華為擁有強大的to B和to G能力是不爭的事實,經(jīng)驗積累多、資源多,深耕行業(yè)多年,亦建有20大產(chǎn)業(yè)軍團。另一方面,盤古的快速落地也離不開多年來ISV(獨立軟件提供商)的生態(tài)建設(shè),比如中軟動力、軟通動力、南威軟件等,都是深耕各行業(yè)的軟件服務(wù)商,其他大模型廠商很少具備這些優(yōu)勢。
大模型玩家并沒有擺脫互聯(lián)網(wǎng)領(lǐng)域的發(fā)展路徑,為了快速落地,這一年來大模型廠商也掀起了激烈的價格戰(zhàn)。接近地板的價格雖然降低了開發(fā)者和企業(yè)的使用門檻,加快了大模型技術(shù)的推廣,但弊端也不可忽視,可能引發(fā)惡性競爭,造成市場混亂,影響消費者對大模型價值的判斷,長期可能對市場信心造成負面影響。
百度董事長兼CEO 李彥宏
百度董事長兼CEO李彥宏在大會上說,過去這一年多來,行業(yè)處在非常熱鬧的“卷模型”之中,一度出現(xiàn)了百模大戰(zhàn)的盛況,造成了極大的算力浪費。
但卷模型的成果也是顯而易見的,國產(chǎn)大模型的能力躋身世界領(lǐng)先水平。
智譜AI首席執(zhí)行官張鵬坦言:“(打價格戰(zhàn))這個階段用戶是獲益的,但是這種事情肯定無法長久,它不是一個正常的商業(yè)邏輯。”
除了拼價格,大模型玩家在技術(shù)上依然在瘋狂內(nèi)卷,因為技術(shù)是未來大規(guī)模商業(yè)化落地的基矗階躍星辰在會上發(fā)布了三款Step系列通用大模型新品:Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。
多模態(tài)是當前的熱門技術(shù)方向,此前華為云發(fā)布的盤古5.0也是多模態(tài),規(guī)模也達到了萬億級。
當下,在落地這件更加緊迫的事項面前,并非所有的模型都在強調(diào)參數(shù)。百度最近發(fā)布的文心大模型4.0 Turbo并未明確具體的參數(shù),百度也提到通過技術(shù)升級,降低了大模型推理的成本,這意味著百度可能在保持或提高模型性能的同時,優(yōu)化了模型的效率和資源消耗。
在WAIC展區(qū),光錐智能看到了大模型在各領(lǐng)域的最新成果,拼應(yīng)用可謂使出了渾身解數(shù)。
阿里通義APP以“通義十二時辰體驗AI助手陪伴的一天”為主題,圍繞對話、效率、智能體、視覺四大核心板塊進行功能集中展示和互動體驗。參觀者可以體驗“定制個性化聲音”,觀看“動態(tài)版韓熙載夜宴圖”,創(chuàng)作“涂鴉作畫個性扇子”等特色打卡互動活動。
螞蟻集團展示的支付寶智能助理是國內(nèi)首款辦事型的智能助理,用戶不用找入口,問一問就為你辦事、問診、打車等,不僅“有腦有嘴能對話”,還“有手有腳能辦事”,AI越來越像“掃碼支付”一樣,讓每個人的生活更加便利。
智能終端方面,大會展出了小鵬的AI天璣系統(tǒng),該系統(tǒng)基于小鵬自研大模型和通義大模型能力,將AI全面應(yīng)用于座艙和智駕,千人千面,提升車輛的智能化體驗。
在大會上,網(wǎng)易伏羲發(fā)布首個機器人品牌“靈動”,產(chǎn)品已落地50個重點工程項目。網(wǎng)易靈動是網(wǎng)易伏羲基于自研工業(yè)大模型和AOP技術(shù)思想打造的機器人品牌,旗下的挖掘機器人和裝載機器人兩款核心產(chǎn)品,已參與10多個省份的50個重點建設(shè)項目,覆蓋礦山、港口、攪拌站、學(xué)校等多種應(yīng)用場景。
本屆大會展出智能機器人45款,其中人形機器人25款。觀察大模型落地,人形機器人這塊繞不開,人形機器人集成了人工智能、高端制造等先進技術(shù),它將深刻變革人類的生產(chǎn)生活方式。
人形機器人
現(xiàn)場發(fā)布了全球首個全尺寸開源公版人形機器人青龍、國內(nèi)首個全尺寸人形機器人開源社區(qū)、特斯拉Optimus二代產(chǎn)品,同時宇樹科技展示了國內(nèi)首款實現(xiàn)奔跑功能的全尺寸通用人形機器人H1等。
其中,青龍身高185厘米,體重82公斤,全身多達43個主動自由度,最大關(guān)節(jié)峰值扭矩400牛米,算力支持400TOPs,支持快速行走、敏捷避障、穩(wěn)健上下坡和抗沖擊干擾等四大運動功能,是通用人工智能軟硬件開發(fā)的理想載體。
特斯拉帶來的Optimus 二代人形機器人比第一代更靈活,可操作的任務(wù)更復(fù)雜,借助大模型技術(shù),身體控制能力增強,手指部分搭載觸覺傳感器,甚至能完成抓雞蛋等精細動作。特斯拉在Optimus的落地上頗有雄心:目標年產(chǎn)10億臺,計劃切走市場10%以上份額。據(jù)了解,Optimus預(yù)計在2025年開始限量生產(chǎn),會有1000+臺在特斯拉工廠協(xié)助人類完成生產(chǎn)任務(wù)。
各大模型廠商為了商業(yè)化落地做出各種商業(yè)模式、使用場景的探索,進行技術(shù)的突破,落地和應(yīng)用比去年更有深度。人群在眼花繚亂的產(chǎn)品中攢動,興奮之余,大家最關(guān)心的問題還是大模型如何大規(guī)模商業(yè)化落地。
看落地,當下的難點是什么?
據(jù)公開數(shù)據(jù),截至2024年4月底,國內(nèi)共推出305個大模型,10億參數(shù)規(guī)模以上的大模型數(shù)量已超100個,大模型廠商的數(shù)量客觀,但在落地上還存在不少問題。
“人的因素容易被忽略,當我們講AI對每個部門都會產(chǎn)生影響,AI是革命性力量的時候,要所有部門的所有人都去擁抱AI,這在很多大企業(yè)是很難的。小企業(yè)跟大企業(yè)的差別就是,大企業(yè)會覺得AI是工具的革命,而小企業(yè)一定會覺得這是革命的工具。”
王堅在大會上說,當大企業(yè)也意識到AI是革命的工具,變化才會到來。
王堅觀察到的現(xiàn)象是中國企業(yè)對AI的態(tài)度之現(xiàn)狀,讓所有企業(yè)都去擁抱AI、擁抱大模型并不容易。中國移動從2023年年初開始啟動大模型研發(fā)工作,當年就推出了139億參數(shù)的大語言模型,在公司內(nèi)部和客戶中加快推進大模型落地,但面臨的一大挑戰(zhàn)是,行業(yè)如何看待和擁抱大模型,行業(yè)內(nèi)部對于大模型的看法和接受程度不一,存在思維方式的轉(zhuǎn)變問題。
“我們見行業(yè)客戶,他們都會問:大模型到底能干什么?能帶來什么價值?要先從哪些領(lǐng)域開始用?這些對客戶而言都是很現(xiàn)實的問題。”中國移動研究院AI中心副總經(jīng)理金鏑介紹說,在成本上也存在很多現(xiàn)實問題,比如用大模型需要買多少算力,投多少人做數(shù)據(jù)治理和訓(xùn)練模型,需要多少人做運維等等。
“我們今天并沒有找到AI產(chǎn)生如此效果的本質(zhì),沒有人能用數(shù)學(xué)的方法描述它。這就好比鉆木取火,火有用處,但鉆木并非最好的方法。今天的AI依然處在鉆木取火階段,因此成本高昂。”螞蟻集團CTO何征宇近日表示,在大模型的“鉆木取火”階段,規(guī)模落地需要攻堅三大挑戰(zhàn):可靠性、經(jīng)濟性、易用性。
在具體的場景里面,我們可以看到更細節(jié)性的問題。
螞蟻集團大模型應(yīng)用負責(zé)人顧進杰在談及“嚴謹產(chǎn)業(yè)需要怎樣的AI”時說,領(lǐng)域知識相對缺乏,復(fù)雜決策難以勝任,對話交付并非端到端的體驗,這些是行業(yè)存在的問題。他們的應(yīng)對策略是,針對知識缺乏,構(gòu)建大規(guī)模知識引擎;針對復(fù)雜決策,讓智能體借鑒人類的思考方式等等。
在大模型落地工業(yè)場景方面,施耐德電氣數(shù)字化總設(shè)計師毛春景提到一個“兩難問題”:由于制造業(yè)企業(yè)的數(shù)據(jù)、知識、經(jīng)驗等無法分享,導(dǎo)致數(shù)據(jù)流動差,難以出現(xiàn)垂直行業(yè)大模型;然而,如果單個企業(yè)出面做私有化垂直的微調(diào)大模型,又會面臨訓(xùn)練成本高、維護難度大的問題。
此外,大模型需要進行二次預(yù)訓(xùn)練,對算力的需求非常迫切,目前存在較大的算力缺口,特別是在國產(chǎn)算力方面。算力不足限制了模型的訓(xùn)練速度和規(guī)模,也可能影響模型的最終性能。
總的來看,大模型落地難的直接原因在于客戶側(cè)的擁抱程度,接受不接受,經(jīng)濟不經(jīng)濟,可靠不可靠等等。而根本的原因還得往大模型本身上找,技術(shù)夠不夠好,成本夠不夠低等等。當然,大模型的成本高低也與客戶的規(guī)模大小密切相關(guān),模型廠商與客戶是一個互相促進、螺旋式上升的關(guān)系。
下一輪能力的最大突破在多模態(tài)
有段子說,AI能夠解放人類的生產(chǎn)力,能夠讓人類關(guān)心詩和遠方,但是我們現(xiàn)在更多看到是AI在詩和遠方,我們?nèi)祟愡是在做我們原來的這些事情。這個段子一定程度上反映了AI當下存在的問題。
以大模型作為代表的新一輪的人工智能技術(shù)浪潮洶涌澎湃,它的能力究竟如何?在千行百業(yè)落地的過程中有哪些新的可能性?新價值鏈的形態(tài)是什么,影響又會如何?一些大模型創(chuàng)業(yè)者給出了自己的思考。
產(chǎn)業(yè)發(fā)展主論壇圓桌對話
MiniMax創(chuàng)始人、首席執(zhí)行官閆俊杰認為,GPT 4存在30%~40%的錯誤率,國內(nèi)大模型整體上存在60%~70%的錯誤率,要想讓AI從一個輔助人類的工具到能夠獨立完成工作,為社會創(chuàng)造更大的價值,最核心的一點是整體降低大模型的錯誤率。
“當模型的錯誤率變成個位數(shù)的時候,即在人類定義的測試上都可以接近人類最好水平的時候,它在實體經(jīng)濟里面產(chǎn)生更大的效益就變得更加自然了。”閆俊杰說。
在AI的感知智能時代,AI已經(jīng)在特定場景的語音識別、圖像識別等指標上超過人類的水平,但離能思考和決策的階段還差很遠,更不用提AGI(通用人工智能)。
“大模型帶來了新的機遇,它能夠在一個模型上提供泛化能力,解決一系列場景和應(yīng)用的多樣需求,從而解決成本和收益的平衡問題,這是它的本質(zhì)特點。” 智譜AI首席執(zhí)行官張鵬說。
對于如何用新一代生成式AI的技術(shù)和大模型的技術(shù)賦能實體經(jīng)濟,張鵬認為,一定要構(gòu)建更通用的、更基礎(chǔ)的能力,利用這個通用和基礎(chǔ)的能力去解決多新的問題,然后用收益的總和去除以投入成本,一定要從這個方向去解題。
未來大模型要更好地幫助人,更好地落地,下一輪能力的最大突破點會是什么?張鵬的答案是多模態(tài)。
人在現(xiàn)實世界中解決問題時,需要輸入的信息本身就是多模態(tài),除了自然語言以外,還有視覺、聽覺、觸覺、常識等,所有這些要素綜合起來才能解決現(xiàn)實世界中的問題。
所以,大模型的能力在多模態(tài)方面的突破,會帶來AI的普惠,為AI開啟更多的可能性。原來的投入產(chǎn)出是一個金字塔型結(jié)構(gòu),即投入很大,但是收益很。恢挥袑⑺兂梢粋倒金字塔結(jié)構(gòu),這樣才能真正放大它的價值。
新技術(shù)在催生新的產(chǎn)業(yè)變遷的同時,也會構(gòu)建一個新的價值鏈,AI產(chǎn)業(yè)也是如此,從單點爆發(fā)到各行業(yè)的全方位突破,AI所創(chuàng)造的價值也將是指數(shù)級的。
王堅是一個樂觀主義者,他認為GPT的潛力還沒有被完整地探索,所有的問題要在動態(tài)的過程中解決不能以現(xiàn)在這個時刻的狀態(tài)來解決十年以后的問題,要拿十年以后的狀態(tài)來解決十年以后的問題。
因此,我們有理由相信,中國大模型在商業(yè)化落地中遇到的問題,也必然會在大模型的動態(tài)發(fā)展中得到解決。