展會信息港展會大全

計算成本太高或壓垮科技巨頭 移動設(shè)備成AIGC新賽道
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-21 19:04:01   瀏覽:4247次  

導(dǎo)讀:劃重點 騰訊科技訊 生成式人工智能模型正以創(chuàng)作文本、圖像甚至視頻的能力吸引用戶,但生成這些內(nèi)容所需的計算資源相當(dāng)龐大,因此它們目前只能在云端或高性能計算機上運行。不過,將爆火聊天機器人ChatGPT背后的技術(shù)帶到移動設(shè)備上的競賽已經(jīng)開始。從這項技術(shù)...

劃重點

科技新聞訊 生成式人工智能模型正以創(chuàng)作文本、圖像甚至視頻的能力吸引用戶,但生成這些內(nèi)容所需的計算資源相當(dāng)龐大,因此它們目前只能在云端或高性能計算機上運行。不過,將爆火聊天機器人ChatGPT背后的技術(shù)帶到移動設(shè)備上的競賽已經(jīng)開始。從這項技術(shù)驚人的發(fā)展速度來看,它可能會以超出人們想象的速度改變移動通信和計算領(lǐng)域。

利用手機上冗余的處理能力分擔(dān)成本

隨著科技公司急于將生成式人工智能嵌入其軟件和服務(wù)中,它們面臨著計算成本大幅上升的問題。這種擔(dān)憂對谷歌的影響尤其大,華爾街分析師警告稱,如果互聯(lián)網(wǎng)搜索用戶開始期望在標(biāo)準(zhǔn)搜索結(jié)果中出現(xiàn)人工智能生成的內(nèi)容,谷歌的利潤率可能會受到擠壓。

在移動設(shè)備上運行生成式人工智能,而不是通過大型科技公司運營的服務(wù)器上的云計算系統(tǒng),有望解決最新人工智能技術(shù)潮流中一個最大的成本問題。

谷歌上周表示,該公司已經(jīng)成功在三星Galaxy手機上運行了其最新大語言模型PaLM 2。盡管該公司沒有公開展示這種被稱為Gecko的縮小模型,但此舉堪稱是一個最新跡象,表明一種只需要數(shù)據(jù)中心計算資源支持的人工智能正迅速開始進(jìn)入更多地方。

這一轉(zhuǎn)變可能會使聊天機器人等服務(wù)的運行成本大大降低,并為使用生成性人工智能的更具變革性的應(yīng)用程序鋪平道路。

移動芯片公司高通首席執(zhí)行官克里斯蒂亞諾阿蒙(Cristiano Amon)表示:“你需要開發(fā)人工智能混合技術(shù),讓它能同時在數(shù)據(jù)中心和本地運行,否則成本太高。”他補充說,利用手機上未使用的處理能力是分擔(dān)成本的最佳方式。

小模型爆發(fā)式增長拉近愿景

去年年底,當(dāng)ChatGPT的推出引起了人們對生成式人工智能的廣泛關(guān)注時,將其帶到移動設(shè)備上的愿景似乎還很遙遠(yuǎn)。除了對這類服務(wù)背后的所謂大語言模型進(jìn)行培訓(xùn)外,推理(或運行模型以產(chǎn)生結(jié)果)的工作也需要計算。手機缺乏足夠的內(nèi)存來容納像ChatGPT這樣的大型模型,也缺乏運行這些模型所需的處理能力。

在移動設(shè)備上生成對查詢的響應(yīng),而不是等待遠(yuǎn)程數(shù)據(jù)中心產(chǎn)生結(jié)果,可以減少使用應(yīng)用程序的延遲。當(dāng)用戶的個人數(shù)據(jù)被用來提煉生成性反應(yīng)時,將所有處理過程保留在手機上也可以增強隱私保護(hù)。

最重要的是,生成性人工智能可以讓在智能手機上進(jìn)行的常見活動變得更容易,例如涉及到生成文本的事宜。阿蒙解釋稱:“你可以將人工智能嵌入到每個辦公應(yīng)用程序中:你會收到一封電子郵件,它會建議你做出回應(yīng),但你將需要在本地和數(shù)據(jù)中心運行這些東西的能力。”

有些基礎(chǔ)模型的快速發(fā)展已經(jīng)改變了這一平衡。最大和最先進(jìn)的模型總是占據(jù)頭條的位置,如谷歌的PaLM 2和OpenAI的GPT-4。但隨著較小模型的爆炸式增長,有些同樣的功能可以以技術(shù)要求較低的方式獲得。它們部分受益于新技術(shù),這些技術(shù)基于對語言模型進(jìn)行更仔細(xì)的培訓(xùn)來微調(diào),從而減少了語言模型需要保存的信息量。

IBM首席執(zhí)行官阿爾溫德克里希納(Arvind Krishna)表示,大多數(shù)希望在自己的服務(wù)中使用生成式人工智能的公司,將通過組合許多這樣的小型模型來滿足自己的需求。上周,IBM宣布推出專門的技術(shù)平臺,以幫助其客戶利用生成式人工智能?死锵<{稱,許多公司會選擇使用開源模型。這種模型的代碼更透明,同時使用他們自己的數(shù)據(jù)對技術(shù)進(jìn)行微調(diào)會更容易。

有些較小的模型已經(jīng)展示了令人驚訝的能力,其中包括由Facebook母公司Meta發(fā)布的開源語言模型LLaMa,據(jù)稱它與大型系統(tǒng)的許多功能相媲美。

LLaMa有各種各樣的規(guī)模,其中最小的只有70億個參數(shù),遠(yuǎn)遠(yuǎn)少于OpenAI在2020年發(fā)布的突破性語言模型GPT-3的1750億個參數(shù),更不用說今年發(fā)布的GPT-4,后者的參數(shù)數(shù)量尚未披露。斯坦福大學(xué)基于LLaMa開發(fā)的研究模型已經(jīng)在谷歌的Pixel 6手機上運行。

除了規(guī)模更小外,這類模型的開源特性也使研究人員和開發(fā)人員更容易適應(yīng)不同的計算環(huán)境。高通今年早些時候展示了據(jù)稱是首款運行Stable Diffusion圖像生成模型的安卓手機,該模型擁有約10億個參數(shù)。高通高級副總裁齊亞德阿斯加爾(Ziad Asghar)表示,這家芯片制造商“量化”了這款模型,即縮小了它的尺寸,以便更容易在手機上運行,同時又不會失去任何準(zhǔn)確性。

平臺轉(zhuǎn)移將為蘋果帶來機會?

Creative Strategies的分析師本巴加林(Ben Bajarin)說,由于針對手機定制的大部分功能仍處于試驗階段,現(xiàn)在評估這些努力是否會帶來真正有用的移動應(yīng)用還為時過早。他預(yù)測,從第一波擁有10億至100億個參數(shù)的移動模型中,會出現(xiàn)相對初級的應(yīng)用程序,比如語音控制的照片編輯功能和簡單的問答功能。

谷歌旗下人工智能研究部門DeepMind副總裁佐賓加赫拉馬尼(Zoubin Ghahramani)表示,其Gecko移動模型每秒可以處理16個令牌。令牌是大型語言模型處理的短文本單位數(shù)量。大多數(shù)大型模型每生成一個單詞使用1-2個令牌,這表明Gecko在手機上每秒可以生成10-15個單詞,這可能使它適合于提示短信或簡短的電子郵件回復(fù)。

高通的阿斯加爾表示,移動手機的特殊要求意味著,人們的注意力可能會迅速轉(zhuǎn)向所謂的多模態(tài)模型,這種模型可以處理一系列圖像、文本和其他輸入。他補充說,移動應(yīng)用程序可能會非常依賴語音和圖像,而不是個人電腦上更常見的大量文本應(yīng)用程序。

與此同時,生成式人工智能開始以驚人的速度向智能手機等移動平臺上轉(zhuǎn)移,這將增加人們對蘋果的關(guān)注。盡管迄今為止,蘋果始終沒有就這波人工智能浪潮做出動作。

巴加林說,生成式人工智能存在眾所周知的缺陷,比如大型模型容易產(chǎn)生“幻覺”,或者聊天機器人會用捏造的信息做出反應(yīng)。這意味著,蘋果在一段時間內(nèi)不太可能將這項技術(shù)嵌入iPhone的操作系統(tǒng)中。相反,他預(yù)測該公司將尋找方法,讓應(yīng)用開發(fā)者更容易在自己的服務(wù)中測試這項技術(shù)。

巴加林表示:“這也是微軟和谷歌的態(tài)度:他們都希望為開發(fā)者提供工具,讓他們能夠與生成式人工智能應(yīng)用競爭。”

蘋果的全球開發(fā)者大會將于6月5日召開,在此之前,微軟也將舉行名為Build的開發(fā)者大會,爭奪開發(fā)者注意力的斗爭將變得更加激烈。生成式人工智能可能仍處于起步階段,但進(jìn)入更多用戶移動設(shè)備的賽道已經(jīng)啟動超速行駛狀態(tài)。(金鹿)

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港