展會信息港展會大全

如何讓用戶獲得最佳AI體驗?高通認(rèn)為這三點尤為重要
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-05 15:23:05   瀏覽:5708次  

導(dǎo)讀:文/騰訊科技 郝博陽 2023年是大模型狂飆的一年,各種研究日新月異,但它和大多數(shù)普通人的關(guān)聯(lián)還遠(yuǎn)未建立。一方面是由于缺乏有效和多樣的用例,大模型在一般人的手中能發(fā)揮出的作用很難超越搜索引擎。另一方面是體驗上的限制。 當(dāng)下主流的大模型應(yīng)用,如ChatG...

文/科技新聞 郝博陽

2023年是大模型狂飆的一年,各種研究日新月異,但它和大多數(shù)普通人的關(guān)聯(lián)還遠(yuǎn)未建立。一方面是由于缺乏有效和多樣的用例,大模型在一般人的手中能發(fā)揮出的作用很難超越搜索引擎。另一方面是體驗上的限制。

當(dāng)下主流的大模型應(yīng)用,如ChatGPT, Charater.AI等,都是以App形式承載的云端應(yīng)用,用戶量一度達(dá)到數(shù)億。但高通高級副總裁Ziad Asghar認(rèn)為,只有當(dāng)智能設(shè)備有更好的AI體驗的時候,AI應(yīng)用才能真正做到普及。因為設(shè)備端的能力能給用戶帶來更快的響應(yīng),更好的個性化配置和更便宜的價格。這三個因素對于消費者最終接受新興產(chǎn)品來講至關(guān)重要。

這種認(rèn)知也來自于科技產(chǎn)業(yè)的歷史經(jīng)驗。Ziad 認(rèn)為新科技的擴散路徑就是從云到端,過往的互聯(lián)網(wǎng)等技術(shù)變革都是在服務(wù)器中,通過PC或移動端覆蓋到更大的用戶技術(shù)的。因此AI也會溯源這一路徑,以設(shè)備為節(jié)點鏈接終端用戶。

除了AI硬件能力的提升之外,高通對AI時代的應(yīng)用和設(shè)備發(fā)展方向也有自己的預(yù)判。Ziad Asghar表示,AI在未來可能會成為一切應(yīng)用的入口。這意味著過往要開啟數(shù)個App才能完成的流程,在未來只需向AI助手提起單個需求即可完成。在這一應(yīng)用程序范式轉(zhuǎn)變的過程中,除了智能手機,AR、VR產(chǎn)品也有可能會成為AI應(yīng)用的優(yōu)質(zhì)載體。

以下為科技新聞對高通高級副總裁Ziad Asghar訪談全文:

高通現(xiàn)在是一家AI公司

科技新聞:高通在2023驍龍峰會上著重強調(diào)了AI能力,在高通的定位中AI是一個怎樣的gamechanger?

Ziad Asghar:高通實際上已經(jīng)在人工智能上投入了超過15年。2022年底ChatGPT出現(xiàn)之后,人們開始每天利用它工作,并尋找在日常中如何更好使用它們的方法。風(fēng)潮過后,我們思考的是從產(chǎn)品方面,如何讓AI能夠為消費者做更多的事情。

在過去,電腦只是一臺電腦,但現(xiàn)在它可以利用AI為你做很多事情。它能讓你以更高效的方式工作,包括內(nèi)容創(chuàng)作,為你寫郵件,完成比以前更多的任務(wù)。

而且在過去,人工智能是在背后默默工作的。它在幕后幫助你改進照片、音頻、語音或視頻質(zhì)量。但隨著生成式人工智能的出現(xiàn),出現(xiàn)了基礎(chǔ)模型和用例,它創(chuàng)造出了新的機會。我們每天都可以看到行業(yè)中出現(xiàn)新的模型,這些模型具有更多的功能,能夠為我們帶來新用途。

因此,從智能手機到PC、從AR/VR到汽車和IoT,我們的產(chǎn)品都在充分利用我們對人工智能的長期投入。這就是我們認(rèn)為AI是行業(yè)真正轉(zhuǎn)折點的原因。它或許會開啟一個新的周期,人們要買新手機,會想要一部AI智能手機;他們想買的下一臺PC,會是一臺AIPC。我認(rèn)為這就是我們能夠為消費者帶來更多價值的地方。

科技新聞:你提到了高通已經(jīng)投入人工智能領(lǐng)域超過15年,所以它能算一家AI公司了嗎?

ZiadAsghar:我們絕對是一家人工智能公司,如今大家更能明顯的感知到我們的這一身份。

科技新聞:高通作為一家硬件公司是如何認(rèn)知自己的AI價值的呢?

ZiadAsghar:所有的技術(shù)創(chuàng)新都會從云端開始,然后隨著時間的推移,逐漸過渡到邊緣設(shè)備上。這正是我們在人工智能領(lǐng)域所看到的:生成式AI模型非常龐大,如果你考慮模型和推理所需的工作量,就會發(fā)現(xiàn)端側(cè)計算的重要性,F(xiàn)在,我們可以在智能手機、PC和XR產(chǎn)品上以非?斓乃俣冗\行70億、100億和130億參數(shù)的像百川或Llama這樣的大語言模型。在智能手機上,我們可以以每秒生成20個token的速度運行70億參數(shù)的大語言模型,在電腦上這個速度達(dá)到了每秒30個token。因此,我們在終端側(cè)已經(jīng)擁有了強大的AI計算能力。

人工智能的應(yīng)用主要有兩個部分:訓(xùn)練和推理。模型訓(xùn)練主要發(fā)生在云端,只要給模型提供大量信息,模型只需要訓(xùn)練一次。但訓(xùn)練好的模型需要進行推理時,計算會多次重復(fù)發(fā)生,這很可能要發(fā)生在終端側(cè)。這其實顯而易見:在2005年,大約有10億人口能夠使用互聯(lián)網(wǎng);但如今,全球有50億人能夠使用互聯(lián)網(wǎng)。這一增長中的很大部分要歸功于智能手機對網(wǎng)絡(luò)的接入。

你完全可以想象人工智能的應(yīng)用發(fā)展也會是同樣的情況。如今,生成式人工智能基本上是在云端進行的,但隨著技術(shù)進一步發(fā)展,它會更多地出現(xiàn)在終端側(cè)。當(dāng)然,終端側(cè)可以與云端協(xié)同工作。這將大大推動AI體驗的普及。

科技新聞:在今年,我們看到所有的芯片公司都在強調(diào)人工智能。他們都在打造AI芯片以增強人工智能體驗。那么,高通對AI芯片的定位和相對優(yōu)勢是什么?

ZiadAsghar:誰能更好地在終端側(cè)運行生成式AI,誰就將成為人工智能的領(lǐng)導(dǎo)者。這就是為什么我們大力投入于進行模型優(yōu)化,以及打造硬件解決方案,讓終端側(cè)能夠在既定功耗下實現(xiàn)更多的AI能力,我們的硬件AI引擎在既定功耗下有著領(lǐng)先的AI推理性能,這使得我們能夠以盡可能低的功耗,在終端上支持更高參數(shù)規(guī)模的模型,進行更多的推理操作。這一點至關(guān)重要。

從硬件角度,我們已經(jīng)開發(fā)了模型量化、壓縮和提煉技術(shù)。很多公司在云端訓(xùn)練模型時,是以浮點運算方式進行訓(xùn)練的。而高通能夠支持整數(shù)運算,使得模型規(guī)模更小,功耗也更低。大語言模型的終端側(cè)運行帶來了許多挑戰(zhàn)。要運行一個非常大的模型,需要將其存儲在終端,在處理時需要占用DRAM內(nèi)存,通過芯片進行推理。如果使用16位浮點運算推理像百川這樣參數(shù)達(dá)到70億的大模型,模型會占用終端大量的DRAM內(nèi)存,許多手機甚至沒有那么大的內(nèi)存容量。但是如果使用4位整數(shù)運算,內(nèi)存的問題就解決了。我們在這方面有著豐富的經(jīng)驗。同時,我們一直在打造軟件工具,結(jié)合我們領(lǐng)先的硬件平臺,我們能夠非常高效地進行模型處理。因此,我覺得我們非常有優(yōu)勢,可以在AI邊緣側(cè)真正取得領(lǐng)導(dǎo)地位。

得益于我們長期的AI投入,我們打造了業(yè)界領(lǐng)先的硬件AI能力。以PC為例,我們剛剛發(fā)布了驍龍XElite,它的高通AI引擎擁有45TOPS的AI性能,而整個芯片的AI性能達(dá)到了75TOPS。在PC領(lǐng)域,我們的AI引擎,包括CPU、GPU和NPU的性能非常領(lǐng)先。

因此我們可以支持在終端側(cè)運行Microsoft Copilot,以低成本打造豐富體驗,不需要接入云端。這為我們帶來了巨大的優(yōu)勢,我們能夠賦能PC廠商打造出領(lǐng)先的AIPC產(chǎn)品。當(dāng)然,在智能手機、汽車、XR等領(lǐng)域也是如此。

科技新聞:您剛才提到了軟件。目前英偉達(dá)在AI服務(wù)器中的壟斷地位,在很大程度上是由CUDAtoolkit的便利性帶來的。高通在配套開發(fā)軟件這方面有什么舉措嗎?

ZiadAsghar:2022年,我們推出了高通AI軟件棧(Qualcomm AIStack)這一AI軟件產(chǎn)品組合,它支持所有的AI開發(fā)框架,包括TensorFlowLite,PyTorch,百度飛槳等等,以及所有AI庫、編譯器等開發(fā)工具,讓開發(fā)者能夠基于任何引擎(包括CPU、GPU、NPU)進行應(yīng)用開發(fā)。同時,我們還推出了高通AI引擎Direct的框架,它能允許開發(fā)者在非常接近硬件的位置進行編碼,這使得他們能夠充分發(fā)揮高通AI引擎的性能。

此外,你將看到我們將通過在世界移動通信大會等活動上推出更多新工具,在開發(fā)者支持方面做出更多努力。

(Qualcomm AIStack 架構(gòu))

從歷史上看,新技術(shù)的擴散都是從云到端

科技新聞:為什么高通選擇了端云混合AI作為你們的主要發(fā)展方向?

ZiadAsghar:這是我們研究了眾多不同的生成式人工智能模態(tài)得出的結(jié)論。首先,對于不論是大語言模型、視覺模型(如StableDiffusion)、還是多模態(tài)模型,大部分模型的運算規(guī)模都不超過150到200億參數(shù)。另一個趨勢是模型參數(shù)規(guī)模在不斷縮小,同時功能越來越強大。像Llama2或者是百川這種規(guī)模的模型,他們相比于ChatGPT這樣規(guī)模更大、需要在云端運行的模型來說,能力也非常強大。所以,當(dāng)你把這兩個趨勢結(jié)合起來思考時,就能明白終端也能夠做更多事情。而且在未來,我們的AI能力會持續(xù)提升。

但仍然會有非常龐大的模型,比如推薦模型無法被壓縮。因此,我們認(rèn)為它們可以繼續(xù)在云端運行,在混合AI模式下,模型可以在端側(cè)處理一部分內(nèi)容,這可以保證消費者的數(shù)據(jù)隱私,這對他們來說這非常重要。系統(tǒng)會將其他推理任務(wù)傳遞到云端進行處理。通過混合AI,模型能夠同時利用終端和云端優(yōu)勢,給消費者提供最佳體驗。

假設(shè),你正在利用AI對電腦上的文件進行摘要,如果這個文件有一定版權(quán)性質(zhì),你肯定希望處理工作能在本地進行,那么系統(tǒng)就會在端側(cè)將這個任務(wù)完成。但假設(shè)你需要一個必須在云端處理的推薦模型,我們也可以利用在終端和云端進行分布式處理的技術(shù)。AI處理可以擁有一個云端和終端之間的協(xié)調(diào)層,實現(xiàn)非常出色,統(tǒng)一的跨終端體驗。

科技新聞:除了隱私保護外,終端側(cè)AI還會帶來什么云端無法帶來的用戶體驗?

ZiadAsghar:首先,假設(shè)你在飛機上無法連接網(wǎng)絡(luò),這時候你就無法使用任何云端大語言模型或其他類似的功能。而如果你在終端側(cè)運行AI,雖然斷了網(wǎng),但你仍然可以獲得完全相同的體驗。在汽車數(shù)字座艙中也是如此,當(dāng)用戶駕駛到?jīng)]有網(wǎng)絡(luò)覆蓋的地方,也可以利用終端側(cè)AI。

第二點,端側(cè)模型可以實現(xiàn)非?焖俚捻憫(yīng)。消費者的耐心有限,如果不能夠迅速地回答他們的問題,他們就會去其他地方尋找答案。因此,我認(rèn)為即時性是非常重要的。

第三點是成本。成本是非常重要的因素。如果你不是在終端側(cè),而是在云端運行生成式AI,那就會用到高算力的GPU,耗費大量的電力。這些GPU會消耗數(shù)百瓦的電力,而你的設(shè)備只需要幾毫瓦。因此,當(dāng)有更多的生成式人工智能用例出現(xiàn),有更多的人使用生成式AI時,云端計算規(guī)模也會對應(yīng)增長,成本就會增加。而在終端側(cè)運行則基本解決了這個問題:基本可以說是免費的。

最后的一個非常重要的優(yōu)勢是,智能手機會知道現(xiàn)在的時間,你在美國還是在中國;智能手機知道你是在行走,還是在交談,還是在開車。如果我在云端大語言模型上提問尋求幫助,它給我的答案和它給我11歲的女兒的答案不會有任何差別。但如果我們能夠利用終端側(cè)可用的信息,使得查詢更加精準(zhǔn),AI就可以給我一個更優(yōu)化的答案,比如一個根據(jù)我所處位置不同的答案。所以,終端側(cè)AI對實現(xiàn)個性化體驗非常重要。甚至可以想象,隨著時間的推移,手機或電腦上的模型會基于用戶特征進行持續(xù)的個性化優(yōu)化,這是云端模型難以做到的。

訊科技:前幾年流行的“全部上云”風(fēng)潮,包括蘋果的云游戲策略等,都是通過云技術(shù)的發(fā)展,延遲的降低,在很大程度上也降低了游戲機等設(shè)備的端側(cè)能力需求。這一發(fā)展潮流是否會在AI模型方面出現(xiàn)?所以端云混合是否只是一個階段性的解決方法?

ZiadAsghar:云游戲是很多公司嘗試過的東西。但如果你仔細(xì)觀察,會注意到能夠在云上運行的游戲類型很有限,只有那些對時延不敏感的游戲才行,比如策略游戲。但如果是像多人聯(lián)網(wǎng)動作游戲這種對時延要求很高的游戲類型,就不適用于在云端進行。在AI用例方面,比如車機系統(tǒng)中的ADAS應(yīng)用(高級輔助駕駛),它必須支持在終端側(cè)進行操作,因為它對即時性的要求會非常嚴(yán)格。所以云系統(tǒng)在很多方面是非常受限的。

另外,這些服務(wù)許多都是需要付費的。我認(rèn)為這也是云端和終端的區(qū)別所在。我們在終端側(cè)所做的,你可以隨時進行,而且不會產(chǎn)生費用。放在云端的所有東西,都會持續(xù)收取費用。

AI未來就是一切應(yīng)用的入口

科技新聞:在目前,AI大模型還主要是以App的形式出現(xiàn)在智能設(shè)備之中的。您覺得后續(xù)隨著AI能力的加強,應(yīng)用程序生態(tài)會發(fā)生怎樣的變化?

ZiadAsghar:實際上,這正是我們目前所設(shè)想的情況。假設(shè)你要預(yù)訂一張去中國的機票,現(xiàn)在你要做的第一件事是打開一個應(yīng)用,然后找到里面價格最便宜的航班,把它添加到另一個日歷應(yīng)用里,然后再查看你的日歷確認(rèn)你什么時候出發(fā)。這是現(xiàn)在你定航班的流程。

那如果你的虛擬AI助手就是你所使用的終端上的唯一交互對象,你就只需要和它交互,而它再在幕后啟動三、四個應(yīng)用,為你直接返回結(jié)果,找到最優(yōu)的航班,提供你可以選擇的時間,F(xiàn)在即使在家里使用一些智能家居應(yīng)用,我也必須打開三四個不同的應(yīng)用才能弄清楚該怎么操作。但有了AI你就不再需要這樣做。

這同樣也適用于汽車。今天它的交互非常機械化,但在未來你可以跟它說,“我還有大概三個小時就要去機場,你能給我找家好吃的日料店嗎?”汽車就能夠在不耽誤航班的情況下滿足你的需求。這是一種全新的體驗,就像《霹靂游俠(Knight Rider)》里那樣,我就是看著《霹靂游俠》長大的。所以我們現(xiàn)在有了這樣的技術(shù),可以改變過往的用戶交互界面。

(美劇《霹靂游俠》,1982年開播,其中的智慧汽車K.I.T.T.由AI驅(qū)動,可以對話和自動駕駛)

科技新聞:所以在你看來,AI會成為一個萬能應(yīng)用嗎?

ZiadAsghar:我認(rèn)為這正是未來的發(fā)展方向:你不用再打開4-5個應(yīng)用去完成一件事,而只需要和AI虛擬助手交互即可。它會搜集需要的信息并直接給你答案。這就是人工智能幫助我們節(jié)省時間的方式。我們不需要再進行這些繁瑣的工作了,生活也會更加輕松。

科技新聞:那在這樣一種萬能應(yīng)用的背景下,電子設(shè)備本身會發(fā)生什么改變呢?新型的AI設(shè)備會是什么樣的?

ZiadAsghar:智能手機當(dāng)然會從中受益,因為這是人們最常用的終端。但是我們做了更多準(zhǔn)備,我們有AR/VR產(chǎn)品,未來可能會有虛擬助手出現(xiàn)在你的AR眼鏡上,它也可以出現(xiàn)在AIPin上。高通致力于賦能廣泛的邊緣側(cè)智能網(wǎng)聯(lián)終端,我們認(rèn)為其他終端類型也將不斷發(fā)展,AI設(shè)備的形態(tài)創(chuàng)新還有很大空間,我認(rèn)為這就是初創(chuàng)公司能盡力進行創(chuàng)新的地方。

科技新聞:你提到了VR、AR。這些XR設(shè)備之所以不流行很大程度上是因為沒有合適的交互方式。AI的出現(xiàn)會改變這種情況嗎?

ZiadAsghar:絕對會。比如AR眼鏡,你不能像智能手機那樣在上面輸入文字,所以最好通過語音進行交互,或者你要指著某樣?xùn)|西,那這個設(shè)備需要有出色的手部追蹤技術(shù)。它需要不同種類的互動方式,而人工智能非常適合將這些交互形式變?yōu)楝F(xiàn)實。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港