展會信息港展會大全

云+AI治標不治本,產業(yè)需要“一云多芯”的AI原生云
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-18 08:58:16   瀏覽:2985次  

導讀:過去一年的云計算市場,冷熱交織。價格戰(zhàn)、下云潮,以及越來越單向度的內卷等因素下,云計算遭遇全球IT疲軟,而AIGC領域卻是另一番景象。 規(guī)模化的云廠商均將AI作為拉動業(yè)務的馬車,只是諸多嘗試還停步在布局AI基礎設施與云產品的智能化之上。這種路徑盡管對...

過去一年的云計算市場,冷熱交織。價格戰(zhàn)、“下云潮”,以及越來越單向度的內卷等因素下,云計算遭遇全球IT疲軟,而AIGC領域卻是另一番景象。

規(guī)模化的云廠商均將AI作為拉動業(yè)務的馬車,只是諸多嘗試還停步在布局AI基礎設施與云產品的智能化之上。這種路徑盡管對自身業(yè)務流程的幫助不小,但在向外輸出方面卻非常匱乏,這客觀造成了產業(yè)智能化進程局限于點與線,無法推進到面。此外,大模型的出現(xiàn)將人類知識壓縮,云上開發(fā)的管理對象也悄然生變。

AI時代用云與云上AI開發(fā)需要一個嶄新的動能,好比正在逐步替代傳統(tǒng)內燃機列車的高鐵一般,雖當下的鐵路網(wǎng)絡中仍有不少普快徐徐慢行,但它們已不再是人們便捷出行的首眩

云+AI是跑在舊鐵軌的綠皮車,而AI云則是一條全新的高鐵線路。

要AI云,而非云+AI

“傳統(tǒng)的云計算系統(tǒng)依然重要,但不再是主角,我們需要一個全新的操作系統(tǒng),對新的計算平臺,也就是智能計算做好抽象和封裝,重新定義人機交互,為開發(fā)者提供更簡單、更流暢的開發(fā)體驗。”百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖近期表示。

過去一年,大模型不斷演進,已開始深度重構人機交互。例如,隨著NLP的成熟,通過自然語言處理編程不再是無法落地的事情。事實上,由于應用場景、技術發(fā)展、語言競爭等因素,編程早已陷入“巴別塔魔咒”之中,單常見的計算機編程語言便有C語言、C++、Java、Python、Go等等。這導致編程不得不面向過程與對象,而無法正視需求。

當編程過程變?yōu)殚_發(fā)者表達愿望的過程時,整個操作系統(tǒng)的迭代便是題中之義。例如底層硬件,過去以CPU的算力為主,主要依賴低延遲、高復雜性運算,應用于算數(shù)與邏輯運算。而誕生于圖形渲染的GPU則依賴于高吞吐量、低復雜性運算,長于處理大規(guī)模數(shù)據(jù)集。

此外,大模型的出現(xiàn)將人類知識壓縮,操作系統(tǒng)管理的對象也悄然發(fā)生了改變。

AI大模型從最初的框架構建,逐步走到落地階段。然而,隨著AI大模型深入到千行百業(yè)中,市場開始意識到通用大模型雖然功能強大,但卻難以滿足個性化需求,導致服務商成為“高科技施工隊”,而用戶遇到問題處于兩眼一抹黑的極端情況。

“上云容易下云難”,過去幾年,部分行業(yè)在上云與下云之間反復橫跳。

南方某醫(yī)療機構技術中心負責人此前提到,因為一把手都意識到上云是一種趨勢,在一次會后,便拍上云。他們先在業(yè)務量不大的分院將影像歸檔和通信系統(tǒng)上云,等到成本、應用、維護等一系列驗證有效后再復刻到總部。然而,當時的云上系統(tǒng)多次出現(xiàn)變慢,也曾受宕機拖累。

“我們排查不出問題,找云服務廠商、影像歸檔和通信系統(tǒng)廠商、檢查本地系統(tǒng),而且還要在院里協(xié)調各部門,簡直自找麻煩。”最終,這家醫(yī)療機構決定下云,花錢將數(shù)據(jù)遷移回來,回到此前“膈應”的老系統(tǒng)。

各行各業(yè)面臨的共性問題,如今似乎看到了答案。

4月16日,Create2024百度AI開發(fā)者大會期間,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖正式發(fā)布了新一代智能計算操作系統(tǒng)萬源。

萬源主要由Kernel(內核)、Shell(外殼)、Toolkit(工具)三層構成。并且第一次增加了硬件和軟件以外的資源,也就是被大模型壓縮的世界知識。通過對AI原生時代的智能計算平臺進行抽象與封裝設計,為用戶屏蔽掉云原生系統(tǒng)與異構算力的復雜性,提升AI原生應用開發(fā)效率與體驗。

這意味著,模型與AI原生開發(fā)的操作、算力、語言等門檻的進一步下放。更關鍵的是,百度憑此“橋接”不同開發(fā)深度的生態(tài)以及其中的不同角色,一個需求驅動的動態(tài)耦合的大系統(tǒng)就此形成。

“一云多芯”發(fā)起算力革命

每個時代都有其對應的底層載體作支撐,工業(yè)革命的蒸汽機、發(fā)動機或是信息時代的CPU均是如此。因循此邏輯,AIGC開啟的全面智能化同樣需要必須一個核心載體作為支撐,這便是上文提到的智能計算系統(tǒng)。

值得注意的是,智能計算并非既往計算技術的替代或是簡單整合。相反,它是一種計算形式,根據(jù)任務要求系統(tǒng)地、全面地優(yōu)化現(xiàn)有的計算方法和資源來解決實際問題。

要知道,算力早在在過去一年多內便被公認為是制約AIGC商業(yè)化與進一步發(fā)展的卡點,即使中國算力總規(guī)模位居全球第二,算力規(guī)模近5年更是年均增速近30%,算力卡脖子的焦慮依舊蔓延于行業(yè)上空英偉達GPU一“芯”難求,而向開發(fā)者提供GPU托管服務的“算力黃牛”CoreWeave卻在短短四年內估值增長至560億元。

為了彌合算力供需之間的溝壑,也讓算力更好用,萬源為智能計算打出的“銀彈”是百舸AI異構計算平臺。

在萬源的內核層,在算力資源管理方面,百度百舸AI異構計算平臺針對大模型訓練、推理等任務,對智算集群的設計、調度、容錯等環(huán)節(jié)進行了專項優(yōu)化。目前,百舸能夠實現(xiàn)萬卡集群上的模型有效訓練時長占比超過98.8%,線性加速比、帶寬有效性分別高達95%,算力效能業(yè)界領先。

要知道,即使是在國內頂尖的大模型廠商的視域內,模型有效訓練時長占比達到90%的智算集群,大多都還局限于千卡集群。此外,百舸更關鍵的突破在于“一云多芯”在模型訓練場景中的優(yōu)異表現(xiàn),稱得上是從根本上緩解算力焦慮。

目前,百舸能夠兼容昆侖芯、騰、海光DCU、英偉達、英特爾等國內外主流AI芯片,支持用戶以最小代價完成算力適配。

過去,智算集群中的多個模型訓練任務往往是單一廠商芯片服務于單一任務,不論是不同廠商芯片算力切分、芯片間通信效率或是根本的模型訓練效率問題,都使得算力焦慮在在硬件差異之下被無限放大。

不過,在百舸的智能調度下,不同廠商芯片在單一任務混合訓練已經(jīng)成為現(xiàn)實,且百卡規(guī)模性能損失不超過3%,千卡規(guī)模性能損失不超過5%。百度方面表示,百舸平臺的應用能最大程度上屏蔽硬件之間差異,幫助用戶擺脫單一芯片的依賴,實現(xiàn)更優(yōu)成本,打造更具彈性的供應鏈體系。

面對業(yè)內領先的重大突破,百度內部狂喜的同時也有些無奈。“以這么小的性能損耗完成混合多種芯片的單任務訓練,業(yè)界基本沒有廠商能做到,甚至我們的一些用戶都不敢相信這是真的”。

當硬件差異在計算調度層面被盡可能抹平后,模型訓練的成本與使用門檻也將隨之降低,甚至直擊算力需求與供給的錯配也未嘗不可。在硬件設施未有根本性變化的情況下,百度的底層技術打響了智能算力革命的發(fā)令槍。

授人以漁,重塑開發(fā)生態(tài)

借由對智能的管理能力,萬源得以成為百度“橋接”算力效能與應用創(chuàng)新的橋梁,Kernel(內核)、Shell(外殼)、ToolKit(工具)三層高效互聯(lián)起來,并形成了端到端的效能優(yōu)化閉環(huán)。

內核層除了百舸AI異構計算平臺之外,還包含不同規(guī)格文心模型和第三方模型,外殼層是解決模型的管理、調度與二次開發(fā)ModelBuilder,而工具層則是具體應用的開發(fā)平臺即AgentBuilder、AppBuilder。

行業(yè)視域下,大多模型服務商均在2024年前后推出了觸達C端的開發(fā)工具,面向C端用戶的封裝應用、面向開發(fā)者的AI原生開發(fā)工具以及企業(yè)側的精細定制化MaaS不一而足。百度根據(jù)基礎設施、模型和AI原生應用構建三種不同開發(fā)深度而設計的分層于業(yè)內并非鮮見。

但難能可貴的是,百度通過萬源,更進一步地將相互隔離的小體系整合成為一個大的體系。閉環(huán)之內,用戶、開發(fā)者與企業(yè)側三種角色都能共享生態(tài)內的計算資源與模型能力來進行高效開發(fā)。

用戶或開發(fā)者可以通過自然語言的形式,以極少的計算資源進行有針對性的智能體等AI原生應用開發(fā)。例如,百度CEO李彥宏在大會上演示的“新加坡旅游局”智能體,只需在直接生成的基礎智能體之上添加知識庫內容,即可在數(shù)分鐘內打造一個經(jīng)驗豐富的專屬“背包客”。

正如沈抖所言,“隨著大模型技術的不斷演進,通過自然語言進行編程正在成為現(xiàn)實。編程將不再面向過程或者面向對象,而是面向需求”。百度以萬源為基底,向業(yè)界提供了一個達到“編輯器”級別的開發(fā)工具與分發(fā)平臺,帶動AI原生應用進入下一階段。

端云協(xié)同的飛輪

一個開發(fā)生態(tài)的初步完善僅是開啟下一個想象空間的第一步,我們需要尋找的還有展現(xiàn)開發(fā)價值的載體。

對于開啟智能手機時代的“iPhone時刻”而言,第一個展現(xiàn)巨大價值的載體是以《憤怒的小鳥》為代表的移動游戲;于AIGC而言,AI原生開發(fā)側的價值落地在于端側與端云協(xié)同。

僅需粗略掃視而今的手機行業(yè),足見智能手機+AI已然成為各大手機廠商的核心戰(zhàn)略。IDC預計2024年全球新一代 AI 手機的出貨量將超過1.7億部,約占智能手機整體出貨量的15%,Counterpoint預計2027年出貨量達到5.22億部,滲透率達到40%。

另一方面,AI的能力觸達同樣需要一個距離用戶最近的載體,無論是個人數(shù)據(jù)的安全讀取還是進一步對人類行為、指令等進行分析、梳理,手機都無疑是當下的絕佳選擇。

事實上,百度早在本次大會前便錨定了萬源系統(tǒng)的價值實現(xiàn)標的。2024年1月10日,在榮耀MagicOS 8.0發(fā)布會及開發(fā)者大會上,榮耀終端有限公司CEO趙明宣布了“百模生態(tài)計劃”,并與百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖共同宣布,百度智能云成為榮耀大模型生態(tài)戰(zhàn)略合作伙伴。

早在2017年11月,榮耀便發(fā)布了搭載AI應用與麒麟970處理器的榮耀view10,在彼時尚未成型的AI手機賽道初露崢嶸,近期更是掏出100億真金白銀與2000余項相關專利,宣告其發(fā)力端側AI的堅定決心。更重要的是,榮耀還是智能手機賽道的頭部玩家,據(jù)IDC數(shù)據(jù),去年第四季度榮耀以16.8%份額占比,排名安卓陣營第一。

以此前披露的合作細節(jié)來看,有別于行業(yè)普遍的拍照、實時通話翻譯、智能搜索等簡單升級,兩者是通過MagicOS來展開端云協(xié)同的范式創(chuàng)新由端側的榮耀魔法大模型負責理解用戶意圖,在后臺將用戶的簡單提示轉化為更專業(yè)的提示,再由云上的文心大模型提供知識問答、生活建議等專業(yè)服務。

例如日常助理需求中的“幫我安排日程表”或“幫我設定運動規(guī)劃”,魔法大模型會分析用戶的出行、健康等使用數(shù)據(jù),生成初步提示詞,以此調度文心大模型來生成足夠全面的規(guī)劃。在此過程中,魔法大模型將通過端側防護網(wǎng),濾掉敏感信息并確保個人隱私不上云,來解決用戶對個人數(shù)據(jù)的隱憂。

然而這僅是AI在這個端云協(xié)同范式下的初步應用,更進一步的是依據(jù)用戶自行上傳的端側數(shù)據(jù)而形成的個人知識庫,以極短的鏈路提高勞動生產率并延伸腦力的可觸達空間。

在安全性、可解釋性、易用性等綜合指標早已成為AI軍備競賽關鍵的當下,打開大模型的黑箱從而觸達公眾認知,無疑是大模型進入“創(chuàng)新擴散”下一周期的勝負手。開發(fā)者視角下的黑箱在于算法和訓練過程,對于用戶而言,不可見的黑箱則是模型能力的易用性與普適性。

面對不同角色的“開箱”需求,客制化產品不斷涌現(xiàn)。然而唯有百度率先向底層進軍,通過智能計算能力大幅降低開發(fā)門檻,將相對隔離的不同開發(fā)與反饋體系融為一體。體系的率先建立往往意味著商業(yè)壁壘,尤其是對于to B賽道而言。

AI與云的深度融合,端云協(xié)同的深度耦合下,我們亦看到了李彥宏在內部講話中堅持閉源路線的底氣所在。“搶灘”智能計算的百度再次在AI軍備競賽中保持了身位的領先。

查看原圖 47K

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港