展會信息港展會大全

AI 大模型,讓手機真正開始「智能」
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-23 14:04:46   瀏覽:4522次  

導(dǎo)讀:作者 | Jesse 編輯 | 靖宇 經(jīng)過十幾年的發(fā)展,大部分智能手機系統(tǒng)都已走向完善,功能愈發(fā)趨同。 但這只是表象。實際上,各家廠商都在積蓄力量,醞釀革新。今年,隨著大模型的迅速應(yīng)用落地,進化的號角也終于開始吹響。 這場革命必定與大模型息息相關(guān),但又不...

作者 | Jesse

編輯 | 靖宇

經(jīng)過十幾年的發(fā)展,大部分智能手機系統(tǒng)都已走向完善,功能愈發(fā)趨同。

但這只是表象。實際上,各家廠商都在積蓄力量,醞釀革新。今年,隨著大模型的迅速應(yīng)用落地,進化的號角也終于開始吹響。

這場革命必定與大模型息息相關(guān),但又不只關(guān)乎大模型。目前大模型領(lǐng)域的主流,都是圍繞服務(wù)端部署展開。想讓智能手機與大模型結(jié)合,到底意味著什么?有什么局限和優(yōu)勢?

想理解這個問題,需要回到更早的時候。

去年,OPPO 在 ODC2022 上發(fā)布了自研智慧跨端系統(tǒng)「潘塔納爾」。起初它給人的感覺還略顯抽象,但過去一年,潘塔納爾已經(jīng)實現(xiàn)了初步落地。通過智慧跨端和泛在服務(wù)兩大體驗,對下實現(xiàn)跨設(shè)備的協(xié)同,對上支撐了不同應(yīng)用間服務(wù)的智能流轉(zhuǎn)。

剛剛結(jié)束的 ODC2023 上,OPPO 正式推出 AndesGPT,將AIGC 能力與潘塔納爾結(jié)合,融入了 ColorOS 14。表面上,OPPO 早已布局的大模型和智慧跨端系統(tǒng)是兩套不同的技術(shù)底座,但在今天,它們卻產(chǎn)生了重要的化學(xué)反應(yīng)。

這幅手機應(yīng)用、交互革命的未來藍圖,正在一點點變得完整。

01 系統(tǒng)「解耦」,讓服務(wù)與數(shù)據(jù)融合

去年夏天,OPPO 首次推出了自研智慧跨端系統(tǒng)「潘塔納爾」。

當(dāng)時大部分人的注意力都放在「跨端」這個概念上,認為 OPPO 準備做的事,主要是不同硬件之間的數(shù)據(jù)流轉(zhuǎn)、功能接力。比如「手機上復(fù)制,電腦上粘貼」、「手機上接到電話,在平板上接聽」等功能……

但實際上,過去一年,OPPO 通過潘塔納爾做到的最重要的一件事,是像一座橋梁,通過泛在服務(wù)和智慧跨端,把系統(tǒng)、應(yīng)用到服務(wù)做了深層次的打通。

從智能手機誕生之日起,用來組織功能的單位就是 App。早期的智能手機系統(tǒng),以 iOS 為代表,只有兩個核心層級:一層是桌面,排列著一個個 App 的圖標;一層是 App,就是點開 App 后所有的功能。

當(dāng)年蘋果最早喊出了「每個需求都有一個 App 來解決」(There's an app for everything)的口號。

隨著移動互聯(lián)網(wǎng)生態(tài)的發(fā)展,App 的生態(tài)也終于走向飽和,很多 App 都開始變得臃腫,出現(xiàn)了大量的功能重疊。

對用戶來說,臃腫的 App、重復(fù)的功能越來越成為一種負擔(dān)。為了一個小功能,就要在 App 間反復(fù)跳轉(zhuǎn),也變得非常麻煩。典型場景包括一邊回復(fù)消息,一邊關(guān)注外賣的配送進度;在檢查郵件、瀏覽網(wǎng)頁的時候,同時看地圖導(dǎo)航……

App 是智能手機最關(guān)鍵的功能組織形態(tài),但不應(yīng)該是唯一的形態(tài),更不應(yīng)該是一個完全封裝的系統(tǒng)。想要優(yōu)化 App 的體驗,就必須進行「系統(tǒng)解耦」。

這個問題一直存在,所以 Android 很早就推出了「小組件」,嘗試在用戶界面層面解決。但早期的小組件,完全出于 App 開發(fā)者自愿開發(fā),并沒有得到充分推動。

而 OPPO 在推出「潘塔納爾」后,以一個更開放的姿態(tài)參與進來,將整個系統(tǒng)解耦,變成了一個個原子化服務(wù),以人為中心,憑借情境感知與計算能力為人提供合適的服務(wù),智能顯示在手機桌面上,手表上,甚至通過耳機播報。

過去一年,潘塔納爾已經(jīng)針對出行、外賣、導(dǎo)航、快遞等應(yīng)用場景,推動了「泛在服務(wù)」落地。首批支持的 App 包括支付寶、美團,這次 ColorOS 14 又支持了小紅書、攜程、去哪兒。

利用泛在服務(wù),用戶可以更靈活、便捷地調(diào)取服務(wù),減少不必要的操作步驟。

這件事并不只有 OPPO 一家在做,蘋果 iOS 的「即時動態(tài)」、「小組件」,也是在做類似的事情。從系統(tǒng)中解耦出 App 的一項項「服務(wù)」,增加配置的靈活性,更高效地利用手機信息的內(nèi)容和優(yōu)先級,降低用戶的認知、操作負擔(dān),已經(jīng)是行業(yè)趨勢。

與此同時,只是做到讓服務(wù)跳出「App」以外其實并不足夠,存在于 App 內(nèi)的文件數(shù)據(jù)也會由于不同系統(tǒng)生態(tài)導(dǎo)致體驗割裂,例如 iPhone 可以打開在微信上收到的 keynote,但 Android 卻沒辦法。這種安卓生態(tài)與蘋果系統(tǒng)之間類似的割裂每天都在上演。

這樣的情況也通過「智慧跨端」正在逐步得到解決。潘塔納爾通過一個 OPPO 賬號打破數(shù)據(jù)壁壘,實現(xiàn)數(shù)據(jù)采集,跨端調(diào)用,讓服務(wù)和數(shù)據(jù)不局限于手機,而是可以實現(xiàn)多設(shè)備多系統(tǒng)之間的流轉(zhuǎn)。這使得服務(wù)能夠流轉(zhuǎn)出現(xiàn)在用戶的不同設(shè)備及系統(tǒng)上:手表、平板、電腦、耳機、電視、汽車……隨時觸手可及。

舉個例子,上個月的 OPPO Find N3 手機發(fā)布會上,蘋果系統(tǒng)辦公軟件格式的文件,可以快速在安卓手機上打開了,而且這個功能無需安裝第三方應(yīng)用。在 ColorOS 14 上通過 PhoneLink,用戶可以直接在 Windows 系統(tǒng)上操作使用手機 App,訪問手機上的相冊,互傳文件。

將手機功能的基本組織單位從系統(tǒng)內(nèi)「App」解耦為「服務(wù)」,允許它在多設(shè)備間靈活流轉(zhuǎn),會帶來非常深遠的變化。

因為隨著泛在服務(wù)場景的豐富,智慧跨端可流轉(zhuǎn)設(shè)備的增加,另一個問題會迅速產(chǎn)生:如何實現(xiàn)準確智能地推薦,讓用戶可以便捷調(diào)用?

這就需要對手機的界面、交互,以及智能推薦的機器學(xué)習(xí)模型,進行革新升級。

大模型的切入點,出現(xiàn)了。

02 大模型,不只要「大」

過去一年,大模型發(fā)展的核心關(guān)鍵詞,就是「大」。

參量是大模型展現(xiàn)出驚人智慧的核心原因,所謂「大力出奇跡」。參數(shù)的規(guī)模越大、層級越多,大模型就能對數(shù)據(jù)進行更細膩的理解,最終擬合出更真實的結(jié)果。

如果把智慧比作聲音,人類智慧是連貫的模擬信號,AI 則像是數(shù)字錄音回放設(shè)備,采樣率決定了音質(zhì)。采樣率越高,就與自然的聲音越接近,到一定程度,人耳就不再能分辨出區(qū)別。同樣的,參量夠大,AI 就能「騙」過人類。

所以,目前宣布將大模型部署到手機上的廠商,都不同程度地遭到了輿論質(zhì)疑。很多人認為手機上可以部署的模型,參量不夠大。進行多端、多模型部署,反而會帶來混亂。

如果大模型應(yīng)用的目標僅僅是打造出一個「能通過圖靈測試,上知天文,下知地理的人工智能」,那確實是,參量決定一切。

但實際上,一個模型是否實用,并不是靠參量來判斷的。一切模型,最終都是為了模擬一部分現(xiàn)實,推演、擬合出合理、正確的結(jié)果,滿足需要即可,并不能武斷地說「越大越好」。

對這個問題,手機廠商有更深的認識,一個典型例子是語音助手。

語音助手的核心模型,就是要把用戶發(fā)出的聲音波形,擬合成自然語言。這個模型的復(fù)雜度和運算量,對于早期的智能手機來說已經(jīng)很大了,大部分手機芯片跑不動。所以早期的語音助手,都會將用戶語音指令的聲音波形,發(fā)送到云端,由服務(wù)器上的模型識別成指令后,再發(fā)回手機執(zhí)行。

但隨著手機上 NPU(神經(jīng)引擎)的算力發(fā)展,以及對聲音識別模型的簡化,手機廠商發(fā)現(xiàn),也可以把這個模型部署到本地,直接讓 NPU 來跑。它帶來的好處也很實際:響應(yīng)速度變快了,無網(wǎng)絡(luò)環(huán)境也可以用,且增強了隱私安全性。

谷歌率先將 Google Assistant 的識別模型縮小到 500M 大小,部署在了手機本地

目前大模型應(yīng)用主要以生成式 AI 為主,并未進入那些更接地氣的復(fù)雜場景。當(dāng)大模型應(yīng)用真正觸及到用戶需求的細枝末節(jié)時,會有更多問題出現(xiàn),其中最關(guān)鍵的兩個就是「數(shù)據(jù)安全」和「響應(yīng)速度」。

從這個角度,就不難理解 OPPO 為什么在推出 AndesGPT 的時候,如此篤定地采用了「端云協(xié)同」的技術(shù)架構(gòu)。

從十億參量到千億參量,OPPO 計劃部署一系列不同參數(shù)規(guī)模的大模型,兼顧響應(yīng)速度、安全性,同時追求提升大模型的能力上限。

通過端云分工,AndesGPT 會根據(jù)對指令、任務(wù)需求的梯度理解,來智能調(diào)用不同模型。比如用戶的指令只是查詢手機內(nèi)一個聯(lián)系人,那就通過端側(cè)模型迅速響應(yīng),如果用戶問的是更復(fù)雜的知識,就通過云端大模型,生成更復(fù)雜,準確的回答。

AndesGPT 的能力覆蓋非常廣闊,從「智能摘要」、「智能消除」,到基于語義的多模態(tài)信息搜索,加深對用戶個性化習(xí)慣的理解、記憶……

據(jù) OPPO 內(nèi)部透露,這些能力也將會支持端側(cè)化,目前他們已經(jīng)在端側(cè)跑通 13B(130 億)參量模型,突破了端側(cè)大模型的能力上限。這些模型能力,加上智能手機十億級的用戶規(guī)模,將展開大模型應(yīng)用的廣闊未來。

03 智能手機的二次革命

從潘塔納爾,到 AndesGPT,OPPO 展示了自己推動變革的決心。

ODC2023 上,OPPO 還宣布,計劃將「對話式交互」引入到各個系統(tǒng)應(yīng)用,簡化用戶的用機體驗。

「對話式交互」,會很容易讓人聯(lián)想到 2017 年前后的 voice-first(語音優(yōu)先)風(fēng)潮。當(dāng)時很多人都認為智能音箱、語音助手會成為下一代人機交互的關(guān)鍵。但風(fēng)潮迅速席卷之后,又迅速衰退下去。

其中一大原因就在于,過去的智能語音助手,無論是部署在音箱還是手機上,對語義的理解能力都有限,能調(diào)用的數(shù)據(jù)和服務(wù)更有限。到最后,它能實現(xiàn)的功能與智能手機相比,依然只能算滄海一粟。

但這一次,變革圍繞系統(tǒng)、應(yīng)用到服務(wù)展開,依靠大模型深入。

從 ColorOS 的發(fā)展藍圖里就能看到,它一方面通過潘塔納爾對系統(tǒng)解耦,帶來泛在服務(wù)和智慧跨端,便于用戶在 App 之外調(diào)用功能;同時又通過 AndesGPT,基于自然語義理解用戶需要,推動「對話式交互」發(fā)展。

OPPO 軟件工程事業(yè)部副總裁李杰在接受采訪時表示,OPPO 希望通過 AndesGPT 為用戶提供一個類似「超級助理」的產(chǎn)品。

這正是手機利用大模型的優(yōu)勢所在。

一方面,手機可以利用本地的數(shù)據(jù)去理解用戶,其中很多是最貼近用戶私人生活的數(shù)據(jù),獲得授權(quán)后,這些數(shù)據(jù)可以直接成為 prompt 的「語境」;另一方面,手機可以利用各種本地接口、模塊,調(diào)用更多 App 的功能。

舉一個簡單的想象。當(dāng)用戶問聊天機器人「我晚上應(yīng)該吃點什么?」時,如果不詳細寫在 prompt 里,那些部署在云端的聊天機器人就不會知道用戶的籍貫民族,口味營養(yǎng)的偏好,更難以調(diào)用相關(guān)的服務(wù)。最后大概率只能給出一些較泛化的圖文食物推薦。這個情況,無論把模型的參量提升到什么程度,都很難改進。

但如果利用部署在手機上的大模型,可能并不需要參量多大,就可以基于用戶的位置、時間、歷史訂單記錄,甚至是運動健康數(shù)據(jù),來給出推薦。給出的推薦可以是食譜,可以是一個通向點評 App 的鏈接,以至于直接調(diào)用外賣軟件的服務(wù)模塊,生成一個訂單,用戶一鍵確認發(fā)送,也完全可能。

這是一個最基本的想象,類似的場景還有很多?梢哉f,越是貼近用戶生活的,簡單而具體的需求,手機在結(jié)合大模型之后,輔助用戶的效果就會更好更便捷。

借助大模型,使用手機將不再是一個需要「學(xué)習(xí)」的過程,用戶只需用自然語言表達自己的需求即可。OPPO 目前基于潘塔納爾融合大模型后,在 ColorOS 14 上推出的「用機助手」就已經(jīng)邁出了第一步,通過「對話」理解用戶需求,幫助用戶解決日常高頻使用的復(fù)雜設(shè)置,將傳統(tǒng)交互方式升級為更智能更便捷的對話方式。

它的應(yīng)用邏輯是,潘塔納爾先將各種復(fù)雜的用機設(shè)置,組合構(gòu)建成面向用戶需求的「原子化能力」,再通過 AndesGPT 理解用戶需求之后,去匹配對應(yīng)的能力并完成設(shè)置,僅手機的設(shè)置功能就覆蓋了近 400 項。

所以這場變革,既是從「界面交互」到「對話交互」的轉(zhuǎn)變,更是從「用戶學(xué)習(xí)使用計算機」到「計算機主動理解用戶需要」的轉(zhuǎn)變。

這件事,OPPO 已經(jīng)邁出了第一步。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港