展會信息港展會大全

人人都要上云的時代,AI部署為何要往本地走?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-14 19:37:26   瀏覽:5803次  

導讀:根據(jù)不完全統(tǒng)計,現(xiàn)在全球每周上線的基于 AI 的手機應(yīng)用高達上千款。在 2022 年 11 月 ChatGPT 發(fā)布后,AI 的發(fā)展迎來了新紀元:生成式 AI 從幕后走到臺前,通過用戶友好型界面和大眾產(chǎn)生直接聯(lián)系。 現(xiàn)如今,如果手機上不安裝幾款 AI 應(yīng)用,似乎都不好意思說...

根據(jù)不完全統(tǒng)計,現(xiàn)在全球每周上線的基于 AI 的手機應(yīng)用高達上千款。在 2022 年 11 月 ChatGPT 發(fā)布后,AI 的發(fā)展迎來了新紀元:生成式 AI 從幕后走到臺前,通過用戶友好型界面和大眾產(chǎn)生直接聯(lián)系。

現(xiàn)如今,如果手機上不安裝幾款 AI 應(yīng)用,似乎都不好意思說自己用的是“智能”手機。這些應(yīng)用可以是基于生成式 AI 的 ChatBox(聊天機器人),或者是 AI 加持下的語言學習軟件、圖片生成類應(yīng)用等等。

如果你以為生成式 AI 只能嵌入進手機,那真的小看了科技公司的想象力。2024 年 1 月 9 日,CES 2024 在美國拉斯維加斯盛大開幕,高通展示了其先進的 AI 實力。利用業(yè)界領(lǐng)先的 AI 硬件和軟件解決方案,驍龍數(shù)字底盤平臺推動汽車領(lǐng)域人工智能向前發(fā)展,F(xiàn)在,驍龍座艙平臺已經(jīng)具備支持生成式 AI 的能力。

彷佛一晃之間,AI 已經(jīng)走入普通消費者這個“尋常百姓家”。

然而,這種變化不是一蹴而就的。

終端側(cè)部署的 AI 更了解用戶需求

2023 年 2 月 23 日,也就是 ChatGPT 發(fā)布后的 3 個月,高通成功在搭載了驍龍芯片的安卓手機上運行了 Stable Diffusion,這是一款風靡全球的從文本生成圖片的應(yīng)用。對于手機用戶而言,安裝一款應(yīng)用僅僅是點擊幾下屏幕,但這背后是相當復雜的配置。Stable Diffusion 模型參數(shù)超過 10 億個,此前只能在云端運行。

還有 ChatGPT,登錄網(wǎng)頁依然是主流的使用方式。由此我們不禁要問,為何一定要在移動端部署 AI?用更專業(yè)的說法,為何要在終端側(cè)部署 AI?這里的終端側(cè)可以指手機、平板電腦、可穿戴設(shè)備、智能汽車等等。

首先,把 AI 部署在本地可以更好的獲知用戶需求。本地 AI 通過捕獲用戶的行為數(shù)據(jù)和位置信息,提供更加個性化的服務(wù)。與此同時,終端側(cè)設(shè)備的使用方式也經(jīng)歷了轉(zhuǎn)變,不再局限于單一應(yīng)用的簡單操作。以發(fā)送短信為例,當我提到參與某個活動并遇到另一個人時,如果之前與這個人拍了照片,AI 將立即給予提示,導航至相冊并識別出相關(guān)照片,使用戶體驗更為無縫。這種智能手機與 AI 的協(xié)同工作,不僅提升了用戶體驗,也為移動設(shè)備帶來了更廣泛的功能。生成式 AI 在此背景下發(fā)揮作用,協(xié)同工作于所有應(yīng)用之間。

高通現(xiàn)任 CEO 安蒙(Cristiano Amon)曾在一次公開演講中說,“真正有趣的地方在于讓生成式 AI 在智能手機本地運行,而不是云端”。在 CES2024 上,安蒙再次強調(diào),“生成式 AI 的變革意義在于終端上的信息能夠幫助 AI 成為無處不在的個人助手……”

圖:高通公司總裁兼 CEO 安蒙 | 來源:高通公司

其次,這關(guān)系到用戶隱私、安全性和網(wǎng)絡(luò)通暢性。請讀者來設(shè)想一種情景,當你在和一款 AI 機器人溝通一些關(guān)于自己的私密問題,聊天記錄是備份在本地更安全,還是云端更安全?如果用戶是一家企業(yè),這其中涉及到的諸多商業(yè)機密,想必不會上傳云端。這就是終端側(cè)部署 AI 的好處之一。

另一方面則是網(wǎng)絡(luò)通暢性,雖然目前 5G 已經(jīng)快速部署,但相比于 AI 產(chǎn)生的海量數(shù)據(jù),網(wǎng)絡(luò)傳輸速度似乎并不能滿足需求。一架波音 787 每秒鐘產(chǎn)生 5GB 數(shù)據(jù),全球每時每刻正在飛行民航飛機何止幾千架。高通發(fā)布的白皮書《混合 AI 是 AI 的未來》指出,相較于傳統(tǒng)方式,生成式 AI 的搜索成本增加了 10 倍,全球每天產(chǎn)生超過 100 億次的搜索查詢量。

所以,最優(yōu)的解決方案是混合式 AI:即在終端側(cè)部署 AI,一部分 AI 計算在終端運行,一部分在云端運行,混合搭配,這會極大的減輕運營壓力,降低算力成本和能耗,同時提升了安全性與用戶體驗。

終端側(cè) AI 的愿景:萬物互聯(lián)、分布式計算

在媒體一輪又一輪的普及和展望之下,大眾對“萬物互聯(lián)”的概念不陌生。然而,由于現(xiàn)實體驗和“未來展望”的差距,相當多的用戶以為萬物互聯(lián)就是“藍牙連接”,更先進一些的,是智能家居之間通過同一個 Wi-Fi 網(wǎng)絡(luò)的數(shù)據(jù)交互。

然后真正的萬物互聯(lián)并非如此。筆者認為,萬物互聯(lián)的基礎(chǔ)首先是萬物智能化,智能化之后的互聯(lián)才更有意義。而“萬物智能化”需要在終端設(shè)備上部署 AI,這便是終端側(cè) AI 的愿景。當你手中的每一款終端都具備了 AI 能力、強大的算力,會產(chǎn)生一些神奇的應(yīng)用場景。

比如推動科學進步,乃至造福社會和人類。

我們以 Folding@home 項目(也稱 FAH)為例做一下展望。這是一個分布式計算項目,科學家通過模式計算的方式研究蛋白質(zhì)動力學,包括蛋白質(zhì)折疊的過程和蛋白質(zhì)運動。這個項目的意義在于,其研究成果可以用在一系列難以攻克的疾病上,比如老年癡呆、癌癥、亨廷頓病等等。這個處在科學前沿的研究項目需要極大的計算量,或者說,計算速度越快,這項研究就能更早突破。

于是,研究人員想到了一個使用大眾“富余算力”的辦法,志愿者可以讓自己的設(shè)備,如電腦參與到科學計算當中。比如,當用戶處于夜間睡眠狀態(tài)時,手機可能正在充電并置于 Wi-Fi 網(wǎng)絡(luò)下,此時它便可以承擔一些科學計算任務(wù),最終這些結(jié)果匯總到一起,從而大大加速整個科研進程。目前 FAH 已經(jīng)是全球最快的計算系統(tǒng)之一,它是全球第一個“億億次計算系統(tǒng)”。據(jù)稱,該項目的模擬結(jié)果也與實驗非常吻合。

這與十多年前互聯(lián)網(wǎng)田園時代的 BT(Bit Torrent)下載十分相似,越多人參與,下載(計算)速度越快。

這或許是未來終端側(cè) AI 的一個重要應(yīng)用:貢獻 AI 能力和算力。在某種程度上,部署了 AI 的終端就是一臺微型分布式計算終端。這或許能給用戶帶來經(jīng)濟上的收益。

這樣“出售算力”的平臺在全球范圍內(nèi)已經(jīng)出現(xiàn)。比如 LoadTeam,這是一個利用用戶閑置算力和內(nèi)存“挖礦”的平臺,根據(jù)用戶終端的運行速度和貢獻值分成。另一個海外平臺叫 Golem,其愿景描述就是“出租您的數(shù)字資源,包括閑置計算能力”,“您可以成為去中心化網(wǎng)絡(luò)生態(tài)中的一部分”。

雖然一些應(yīng)用的細節(jié)還在展望,并沒有實際走進我們?nèi)粘I。但這些變化是可預見的。對于終端用戶來說,部署 AI 成為了一種賦能,而這種賦能不論是轉(zhuǎn)化為用戶體驗,或者是保障安全性,還是用這種能力換取金錢,用戶都將受益。

首個專為生成式 AI 打造的平臺,如何賦能 AI 體驗?

生成式 AI 浪潮到來之后,高通加速了其產(chǎn)品對 AI 的支持力度。2023 年 10 月 24 日,第三代驍龍 8 移動平臺發(fā)布。作為高通技術(shù)公司首個專為生成式 AI 打造的平臺,第三代驍龍 8 帶來了影像、游戲體驗和專業(yè)品質(zhì)的全面提升。

圖:第三代驍龍 8 移動平臺 | 來源:高通公司

ChatGPT 之后,各個手機廠商推出了各自的生成式 AI 應(yīng)用,這些基于 AI 能力開發(fā)的產(chǎn)品,需要一款更先進,更具備 AI 基因的移動平臺搭載。第三代驍龍 8 發(fā)布后,已經(jīng)在全球 OEM 廠商和智能手機品牌的終端得到廣泛采用,這其中包括大家耳熟能詳?shù)男∶、榮耀、甚至以往的汽車廠商蔚來等品牌。

比如在近期推出的小米 14 系列手機中,通過引入本地 AI 大模型,讓手機具備了一系列強大功能AI 擴圖、AI 寫真等。AI 擴圖可以對構(gòu)圖比較拘謹?shù)恼掌M行新增畫面生成擴充,而 AI 寫真可以讓用戶和指定的背景合影,即便沒有去過。這些都僅僅通過端側(cè) AI 計算便可實現(xiàn),無需云端的參與。最新發(fā)布的榮耀 Magic6 系列帶來的基于魔法大模型的“任意門”功能同樣是終端側(cè) AI 應(yīng)用的一個典型代表。

我們在上文提到,在年初的 MWC2023 上,高通展示了在第二代驍龍 8 智能手機上運行 Stable Diffusion,10 億參數(shù)模型,能夠在僅 15 秒內(nèi)完成 20 步推理,將文字提示轉(zhuǎn)化為圖像。這樣的表現(xiàn)已經(jīng)十分驚人,而現(xiàn)在,在第三代驍龍 8 上,高通 AI 引擎的核心 Hexagon NPU 進一步升級了全新的微架構(gòu),性能再度提升了 98%,能效提升了 40%。

依靠強大的 Hexagon NPU,微切片推理單元,性能有加強的張量/標量/矢量單元,同時所有單元共享 2 倍帶寬的大容量共享內(nèi)存,此前第二代驍龍 8 運行的是 10 億參數(shù)模型,第三代驍龍 8 發(fā)布時已經(jīng)能夠運行高達 100 億參數(shù)的生成式 AI 模型,并且以 20 tokens/s 的速度運行大語言模型。

這樣的性能提升速度,意味著手機(也包括其它終端)用戶很快就能流暢的在手機上體驗各項 AI 應(yīng)用。

高通一直以來給公眾的印象就是“手機芯片”,一定程度上已經(jīng)成為了手機芯片的代名詞。除了芯片,高通實際上是 AI 的“原生玩家”。2009 年,谷歌剛開始秘密研發(fā)無人駕駛汽車,2010 年,“數(shù)據(jù)科學家”還是一個新興職業(yè),而高通在 2007 年就已經(jīng)投入研發(fā) AI 了。

圖:高通的 AI 研發(fā)之路丨來源:《混合 AI 是 AI 的未來》白皮書

從 2007 年至今,高通在 AI 領(lǐng)域的一些突破推動了整個行業(yè)的進步。2016 年,一款重磅產(chǎn)品橫空出世,高通驍龍神經(jīng)處理引擎工具包(Snapdragon Neural Processing Engine SDK)正式發(fā)布。這一軟件開發(fā)工具包(SDK)使得原始設(shè)備制造商(OEM)能夠在驍龍 820 設(shè)備上,包括智能手機、安全攝像頭、汽車和無人機等各種設(shè)備上,運行他們自己的神經(jīng)網(wǎng)絡(luò)模型,而無需連接到云端。這意味著下游廠商能夠個性化地開發(fā)場景檢測、文本識別、對象跟蹤與規(guī)避、手勢識別、人臉識別以及自然語言處理等功能。

2022 年 6 月 AI Stack(高通 AI 軟件棧)發(fā)布,解決了困擾行業(yè)多年的重復開發(fā)問題。此前,AI 開發(fā)人員需要針對同一個功能,不同終端做重復開發(fā),而 AI Stack 的出現(xiàn)真正實現(xiàn)了“一次開發(fā),全平臺通用”,把開發(fā)人員從重復性勞動中解放了出來,讓他們把更多精力投入到創(chuàng)新性活動中。

回看高通在推動 AI 行業(yè)發(fā)展中取得的成績,與其說賦能終端側(cè) AI 是戰(zhàn)略,不如說是一種必然,它是目前各個子領(lǐng)域發(fā)展至今的最優(yōu)解。

AI 時代的到來勢不可擋,這是人類社會的發(fā)展趨勢,我們只能擁抱它,而不能逃避 AI。旗艦移動平臺第三代驍龍 8 發(fā)布后,高通又在 2023 年 11 月推出了第三代驍龍 7,將非旗艦移動平臺上的卓越使用體驗和 AI 支持帶給更廣泛的用戶群體。由此覆蓋了中、高端用戶和普惠用戶。

科技的發(fā)展,應(yīng)當塑造一個良善的 AI 行業(yè),每個人都應(yīng)該被賦能,不能讓一人掉隊。AI 時代需要被每一個人共享。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港