機(jī)器之心報(bào)道
編輯:澤南
生成式 AI 的驅(qū)動力,就在這塊「至尊」芯片上?
身處 2024 年末的我們,已經(jīng)能感覺到大模型就在身邊。
新一代的旗艦手機(jī)上,動態(tài)壁紙、AI 畫圖、語音通話總結(jié)等功能一字排開,常用功能也有了新技術(shù)加持。
智能手機(jī)現(xiàn)在獲得了與現(xiàn)實(shí)世界互動的能力。你可以拍照直接問手機(jī)「看到了什么」,它既能向你進(jìn)行介紹,也可以對畫面進(jìn)行圖像增強(qiáng)。
AI 領(lǐng)域最前沿的智能體也被塞進(jìn)了手機(jī),它可以像人類一樣點(diǎn)擊屏幕操縱不同的 App。你可以拿起手機(jī)用自然語言給出指令:「點(diǎn)三杯瑞幸的美式咖啡,大杯。」過一會兒 AI 就自動把外賣的店鋪、商品和口味選好了,只等你來付款。
在新一代大模型和芯片的加持下,很多 AI 手機(jī)的體驗(yàn)有了質(zhì)的升級,新引入的能力包括但不限于端側(cè) AI 智能體、多模態(tài)大模型應(yīng)用、視頻 AI 消除、超級 AI 助手等等。
值得注意的是,這些生成式 AI 的背后,都是高通的「驍龍 8 至尊版」在提供動力。作為業(yè)界最新的旗艦 SoC,它不負(fù)眾望,在部分性能上對同行實(shí)現(xiàn)了「降維打擊」。不僅有顛覆性的性能提升,還有跨時(shí)代的體驗(yàn)升級。
驍龍 8 至尊版:桌面級性能,移動端的能效
今年的驍龍究竟通過什么引發(fā)了端側(cè) AI 的質(zhì)變?
說到「驍龍 8 至尊版」,就不得不從今年如火如荼的 AI PC 領(lǐng)域說起。
今年 6 月,微軟發(fā)布了專為 AI 設(shè)計(jì)的「Windows 11 + PC」。它是迄今為止速度最快、最智能的 Windows 個人電腦。憑借其中搭載的驍龍 X 系列 PC 平臺,能夠?qū)崿F(xiàn)超過 45 TOPS(每秒萬億次操作)的 AI 算力,與此同時(shí)電池續(xù)航時(shí)間長達(dá)一整天。
這種新類型的 PC 結(jié)合先進(jìn)的端側(cè)大模型技術(shù),擁有一系列獨(dú)特的 AI 能力,不僅可以感知、理解世界的多模態(tài)信息,還能與人進(jìn)行自然的交流,并執(zhí)行復(fù)雜任務(wù)。
微軟官方表示:在很長一段時(shí)間里,這是「獨(dú)占」的能力。Windows 11 中的部分生成式 AI,只有在搭載 Oryon CPU 的驍龍芯片上才能正常運(yùn)行。
沒過幾個月,這種級別的能力就進(jìn)入到了手機(jī)上。在上個月的驍龍峰會上,高通正式推出驍龍 8 至尊版(Snapdragon 8 Elite)移動平臺,它是目前全球速度最快的移動端系統(tǒng)級芯片。
與上一代驍龍 8 Gen3 相比,驍龍 8 至尊版在 CPU 單核、多核性能直接提升 45%,GPU 性能提升 40%,NPU 輸出的速度達(dá)到了 70+Tokens 每秒,與此同時(shí)整體 SoC 功耗還降低了 40%。
在性能提升的背后,驍龍 8 至尊版從里到外,有了脫胎換骨的改變:
首先是 CPU,它成功地把高通自研架構(gòu)的桌面級能力帶到了手機(jī)上,采用第二代定制高通 Oryon CPU,由兩個主頻為 4.32 GHz 的「超級內(nèi)核」和六個頻率 3.53 GHz 的性能內(nèi)核組成,取消了以往的能效核,既提供更好的性能,又提升了功耗效率。
GPU 方面,高通對 Adreno GPU 架構(gòu)進(jìn)行了重新設(shè)計(jì),為每個切片分配了專用內(nèi)存,性能提升了 40%,功耗降低 40%,光線追蹤性能也提升了 35%。
AI 能力方面,在驍龍 8 至尊版上,全新架構(gòu)的 Hexagon NPU 性能提升 45%,能效提升 45%,這得益于所有加速器內(nèi)核的吞吐量提升。此外,結(jié)合全面提升的 CPU 和 GPU,該芯片能夠跨所有核心動態(tài)管理 AI 負(fù)載,相比上一代,基礎(chǔ)大語言模型 token 生成速率提升了 100%。
在這些新技術(shù)的加持下,搭載驍龍新平臺的智能手機(jī)不僅可以滿幀跑 3A 游戲大作,還可以運(yùn)行一系列終端側(cè)多模態(tài)生成式 AI 應(yīng)用,帶來改變?nèi)藗兪褂昧?xí)慣的體驗(yàn),包括強(qiáng)大的 AI 影像功能、下一代游戲 AI、超級智能助手等。
重構(gòu)的不止硬件:大模型優(yōu)化「呼朋喚友」
除了芯片本身,高通在做的另一件事是軟硬件的整合。驍龍 8 至尊版的發(fā)布幾乎被辦成了一場生成式 AI 技術(shù)的 Demo 大會。
這塊移動芯片的發(fā)布,獲得了各路科技公司大佬的祝福。在發(fā)布時(shí),OpenAI CEO 山姆·奧特曼、微軟 CEO 薩提亞·納德拉、Meta CEO 馬克·扎克伯格等人紛紛連線進(jìn)行了背書。
這三位分別闡述了生成式 AI 在 PC、增強(qiáng)現(xiàn)實(shí)設(shè)備、大模型應(yīng)用等方向的愿景。此時(shí)此刻,他們都把目光聚焦在了端側(cè) AI 上。
正如奧特曼所說,云端和端側(cè)的生成式 AI 形態(tài)是互相成就的關(guān)系:服務(wù)器擅長訓(xùn)練大模型,而利用端側(cè)設(shè)備的算力則可以保護(hù)個人隱私,同時(shí)提升服務(wù)的可靠性。
由于大語言模型相當(dāng)耗費(fèi)算力,此前生成式 AI 的技術(shù)落地大多是在云端,將更多能力部署在端側(cè)則是未來的必然趨勢。除了微軟、Meta 等硅谷巨頭,很多國內(nèi)廠商也同高通在新一代硬件上展開了合作。
致力于對標(biāo) OpenAI 的智譜就與高通共同宣布,已圍繞驍龍 8 至尊版,對最新一代端側(cè)視覺大模型 GLM-4V 進(jìn)行了深度適配和推理優(yōu)化。在端側(cè)部署后,手機(jī)等設(shè)備現(xiàn)在已可以支持豐富的多模態(tài)交互方式,讓人們獲得更加情境化、個性化的終端側(cè)智能體驗(yàn)。
國內(nèi)大廠騰訊的混元大模型,也在高通的幫助下完成了端側(cè)部署,在驍龍 8 至尊版移動平臺上,混元大模型 7B 和 3B 版本展示了優(yōu)化后的運(yùn)行表現(xiàn)。
結(jié)合高通完善的 AI 軟件棧,包括高通 AI 模型增效工具包(AIMET)等,驍龍 8 至尊版可以為大語言模型提供從底層硬件到框架的全面優(yōu)化。通過使用基于硬件的 INT4 量化技術(shù),驍龍大幅提升了混元大模型在終端側(cè)的運(yùn)行效率,端側(cè)推理可以做到首個 token 生成時(shí)延僅有 150ms,解碼速率超過了 30 token/s。
此前,騰訊混元大模型已為騰訊自家的大量 App 提供了底層支持,包括微信輸入法、騰訊手機(jī)管家、QQ、騰訊視頻、QQ 瀏覽器、企業(yè)微信、騰訊會議等,覆蓋超過 700 個業(yè)務(wù)場景。
在經(jīng)過高通技術(shù)棧的深度優(yōu)化后,很多亟待落地的大模型已經(jīng)達(dá)到了端側(cè)可用的程度。
比如,騰訊手機(jī)管家的短信智能識別功能,基于混元端側(cè)模型現(xiàn)在已經(jīng)跑通,具備了更強(qiáng)的語義理解能力,可以更準(zhǔn)確地理解短信意圖,短信召回率提高了將近 200%,識別準(zhǔn)確率提升 20%。由于短信經(jīng)常會涉及用戶的個人信息,端側(cè) AI 還可以在保證出色性能的同時(shí),有效保護(hù)用戶的個人信息隱私安全。
經(jīng)過高通與合作伙伴們的整合,端側(cè)大模型從芯片到應(yīng)用的優(yōu)化路徑得以打通;蛟S在未來的某一天,你會發(fā)現(xiàn)天天在用的 App 在某次更新后,就多出了生成式 AI 功能。
端側(cè) AI 堆棧,合縱連橫
推出了至尊版芯片的高通,其想要拓展的版圖還不止 PC 和移動端。
高通 CEO 安蒙在驍龍峰會上表示:「高通一直是推動無線通信產(chǎn)業(yè)發(fā)展進(jìn)程的公司,也是最專注于無線技術(shù)的公司。但我們也積極迎接變化,高通不僅僅是一家專注無線連接的公司,更將成為連接的計(jì)算公司以適應(yīng)新時(shí)代的人工智能處理。更令人振奮的是,驍龍現(xiàn)在不僅引領(lǐng)著移動行業(yè)的創(chuàng)新,還在推動著其他行業(yè)的進(jìn)步!
上個月與驍龍 8 至尊版一同發(fā)布的芯片,還有驍龍座艙至尊版(Snapdragon CocKpit Elite)和驍龍 Ride 至尊版(Snapdragon Ride Elite)平臺,它們專為汽車定制,分別面向智能座艙和自動駕駛。
其中,驍龍座艙至尊版使用的 Oryon CPU 圍繞車用平臺進(jìn)行了多方面的提升。它的 CPU 算力較上一代提升了三倍,AI 性能也有飛躍式增長,達(dá)到了前代產(chǎn)品的 12 倍。此外它也通過軟件虛擬化和多操作系統(tǒng)等機(jī)制,支持實(shí)現(xiàn)了車機(jī)任務(wù)的靈活的集中式處理,滿足了汽車安全標(biāo)準(zhǔn)。
現(xiàn)在,車廠能夠在同一塊 SoC 上無縫運(yùn)行數(shù)字座艙和智能駕駛等功能,真正實(shí)現(xiàn)了近年來一直在追求的硬件架構(gòu)統(tǒng)一。
驍龍座艙至尊版平臺和 Snapdragon Ride 至尊版平臺將于 2025 年出樣。理想汽車已經(jīng)官方宣布,將率先搭載高通最新發(fā)布的驍龍至尊版汽車平臺。
在驍龍峰會上,理想展示了自家智能座艙的一系列功能,從語音助手、旅行助手到智能問答。
驍龍至尊版汽車平臺是驍龍「數(shù)字底盤」解決方案組合中的最新產(chǎn)品,除了高算力的芯片,高通還提供智能駕駛和 AI 軟件棧體系,提供端到端的智能駕駛系統(tǒng),具備視覺感知、傳感器融合、路徑規(guī)劃、定位和整車控制等先進(jìn)特性。
在采用 Oryon CPU 的驍龍 8 至尊版發(fā)布之后,再加上高通自研的 Adreno GPU、Spectra ISP 和 Hexagon NPU 等,高通補(bǔ)齊了自研 SoC 的最后一塊拼圖,也統(tǒng)一了 PC、手機(jī)、汽車三條產(chǎn)品線的芯片架構(gòu)。
自研芯片架構(gòu)的意義,在于能夠根據(jù)不同產(chǎn)品線的需求,對 CPU 進(jìn)行微架構(gòu)層面的調(diào)優(yōu)和定制。與此同時(shí),高通 AI 軟件棧(AI Stack)也在不同產(chǎn)品線的 AI 部署中作用顯著。
至此,從芯片、大模型到 App 的縱向,以及從手機(jī)、PC 到汽車的橫向,高通已經(jīng)做到了 AI 能力的全鏈路打通。
正如大模型公司不斷通過新技術(shù)優(yōu)化降低大模型使用門檻,高通的布局正在幫助眾多 OEM 廠商和應(yīng)用公司,把越來越多的生成式 AI 技術(shù),從不可能變?yōu)榭赡堋?br/>
生成式 AI 可能會「無處不在」
大模型的落地推動到現(xiàn)在,人們已經(jīng)越來越重視起端側(cè)能力的體驗(yàn)。
從 AI 技術(shù)領(lǐng)域里,研究「小模型」(SLM)的趨勢開始,在科技公司的努力下,端側(cè)模型從文本到圖像,再到多模態(tài)的一步步逐步落地。如今,高通端側(cè)芯片的 AI 能力,完整的開發(fā)平臺以及統(tǒng)一的生態(tài)體系,已經(jīng)為生成式 AI 的大規(guī)模應(yīng)用鋪平了道路。
不過,高通的「至尊版」芯片只是起點(diǎn)。經(jīng)由全鏈路的技術(shù)推動,我們還將見證不久的未來,很多事物改頭換面。
其實(shí)在最近的發(fā)布活動中,我們已經(jīng)看到了端倪。在《永劫無間》手游的測試版本中,驍龍 8 至尊版除了利用 CPU、GPU 能力帶來高幀且穩(wěn)定的游戲體驗(yàn),還在端側(cè)跑起了 18 億參數(shù)的大語言模型。配合高通 AI 軟件棧從硬件到軟件的全棧優(yōu)化,網(wǎng)易在手游的端側(cè)直接打造出了 AI 隊(duì)友功能。
現(xiàn)在,玩家們在游戲里擁有了可以語音交互的 AI 隊(duì)友,他們在戰(zhàn)斗過程中不僅能夠聽玩家指令行事,還會在你不會的時(shí)候進(jìn)行提示。
如果說在手游這樣高能耗的應(yīng)用上,我們已能用得起大模型的智能體,那么在日常的應(yīng)用上,AI 智能體就更可以為我們架起橋梁,讓很多功能實(shí)現(xiàn)高度的自動化,甚至消除 App 之間的壁壘。再延伸到 AI PC、汽車甚至機(jī)器人,高通的技術(shù)棧,或許還能把不同的硬件連成一體。
正如奧特曼所說,高通在所有邊緣端設(shè)備上都擁有強(qiáng)大的技術(shù),能夠應(yīng)用 AI 模型匯集全球幾十億用戶,F(xiàn)在僅僅是生成式 AI 的開始,未來將會出現(xiàn)什么?是發(fā)揮想象力的時(shí)候了。