當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > CES觀察：AI無(wú)處不在，撐不起大模型的硬件家電，用助理機(jī)器人做外掛

CES觀察：AI無(wú)處不在，撐不起大模型的硬件家電，用助理機(jī)器人做外掛
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-01-15 14:53:04 瀏覽：7939次

導(dǎo)讀：文 / 騰訊科技郝博陽(yáng) 2024年的電子春晚的CES落幕了，四天的展會(huì)吸引了超過13萬(wàn)觀眾的參與，恢復(fù)了疫情前的繁華。很多展臺(tái)之前都排起等待參觀的長(zhǎng)龍，人頭攢動(dòng)。那些吸引最多人流的站臺(tái)往往都有個(gè)明顯的標(biāo)簽AI。展會(huì)之前，Moor Insights Strategy的資深分析...

文 / 科技新聞郝博陽(yáng)

2024年的電子"春晚"的CES落幕了，四天的展會(huì)吸引了超過13萬(wàn)觀眾的參與，恢復(fù)了疫情前的繁華。很多展臺(tái)之前都排起等待參觀的長(zhǎng)龍，人頭攢動(dòng)。那些吸引最多人流的站臺(tái)往往都有個(gè)明顯的標(biāo)簽AI。

展會(huì)之前，Moor Insights & Strategy的資深分析師Anshel Sag就表示，“在去年的CES上，AI還沒有權(quán)力開火，如果你認(rèn)為AI是去年的浪潮的話，那今年它就是海嘯。”

AI確實(shí)如海嘯般洶涌的卷過CES的會(huì)常電腦廠商從聯(lián)想到ROG，家電廠商從三星到海信，汽車廠商從奔馳到大眾，幾乎每家大企業(yè)的展臺(tái)中都有一個(gè)或大或小的區(qū)域?qū)ｉT介紹AI方面的升級(jí)。

然而實(shí)際體驗(yàn)下來，從電腦到到小家電之間，AI化的程度存在著不小的差異，但對(duì)于席卷全球的大語(yǔ)言模型而言，幾乎所有的產(chǎn)品都只能算是淺嘗輒止。只能說有了，但很難說它和產(chǎn)品已經(jīng)有了比較成功的融合。

這次科技新聞將根據(jù)CES現(xiàn)場(chǎng)的觀察和與廠商的交流，分別針對(duì)AIPC、手機(jī)端AI、AI上車、家電AI化和機(jī)器人這幾個(gè)本屆CES上AI相關(guān)性最高的領(lǐng)域逐一進(jìn)行闡述。

AIPC：現(xiàn)階段只是能用AI的PC

行業(yè)認(rèn)為，2024年將成為AI PC年，從聯(lián)想到Intel今年都在講AI PC的故事。但在今年的CES上，我們看到的更多是像HP Spectre x360 14一樣只是裝載了AI芯片的PC；或者是如戴爾XPS 13、聯(lián)想Yoga Pro 9等，在PC上多設(shè)置了一個(gè)直接喚起Windows Copilit的按鍵而已；走得最遠(yuǎn)的，是聯(lián)想在端側(cè)直接內(nèi)置了AI NOW大模型能力的嘗試。

正如聯(lián)想CEO楊元慶在CES過程中的采訪中所說，當(dāng)下的AIPC還處于AI Ready的階段，也就是把硬件提升到支持大語(yǔ)言模型的階段。而現(xiàn)實(shí)是，更好的產(chǎn)品AI化體驗(yàn)和AI應(yīng)用的成熟的AI ON階段還沒有完全到來。

Dell XPS 13上的Windows Copilit 按鍵

手機(jī)AI：半年前發(fā)布會(huì)上的餅剛熟

手機(jī)上的AI與系統(tǒng)融合進(jìn)度也相對(duì)緩慢。

在CES谷歌的展臺(tái)上，到處都有AI的身影，但還是和半年前Palm 2發(fā)布會(huì)上所帶來的驚喜差距不大。

如魔法相機(jī)，用戶可以移動(dòng)照片里的對(duì)象或者更換環(huán)境光色；智能回復(fù)功能：你可以讓AI替你回電話或者自動(dòng)生成幾種不同情緒和態(tài)度的回復(fù)文本。

當(dāng)有人問谷歌站臺(tái)的工作人員“Bard現(xiàn)在有內(nèi)置App嗎？”以及“Bard能否關(guān)聯(lián)到手機(jī)的本地信息？”時(shí)，得到的答案都是否定的。

這也許是因?yàn)槭謾C(jī)算力的限制。本屆展會(huì)上谷歌用來展示其AI能力的設(shè)備主要是其最新的手機(jī)系列Pixel 8，它所搭載的Tensor G3雖然在AI能力上做了一些提升，但相對(duì)于競(jìng)品的蘋果A14或驍龍Gen8 3在性能上仍有很大差距，預(yù)期能本地運(yùn)作的大模型參數(shù)不會(huì)超過4B參數(shù)。

至于幾個(gè)月前Youtube AI就宣布的創(chuàng)作工具，我們?cè)贑ES展會(huì)上能看到的仍然是只能作為視頻演示的beta版本，且三項(xiàng)演示的功能分別為智能聲音降噪、智能分辨音樂節(jié)奏點(diǎn)和智能字幕，確實(shí)有些新意不足。它的主要競(jìng)品剪映在至少一年前就上線了這三個(gè)功能中的兩個(gè)。

其他手機(jī)廠商在系統(tǒng)中展現(xiàn)的AI能力也都比較平庸，ROG Phone 8 Pro主推的AI功能也是AI自動(dòng)生成壁紙，人工智能降噪這些不疼不癢的應(yīng)用場(chǎng)景。

谷歌在CES上的智能回復(fù)功能展示攝影：科技新聞

汽車AI：上了車，但還沒完全起步

在汽車領(lǐng)域，AI融合的階段和PC相對(duì)類似：大模型上了車機(jī)，但主要的應(yīng)用還是作為語(yǔ)音助手。它可以調(diào)用起地圖、娛樂系統(tǒng)等車上應(yīng)用，但這也是大模型上車之前那些NLP語(yǔ)音助手就已經(jīng)擁有的能力。

AI上車最簡(jiǎn)單粗暴，拿來主義的方式就是接入現(xiàn)有模型。這種模式的核心范例就是大眾汽車，其最新的ID3、4、5系列將是第一款接入ChatGPT的汽車。寶馬汽車也類似，只不過接入的是亞馬遜的Alexa 大語(yǔ)言模型。

除了簡(jiǎn)單的AI上車機(jī)之外，奔馳對(duì)AI的調(diào)教相對(duì)走得最遠(yuǎn)。它在CES最新發(fā)布的車機(jī)系統(tǒng)MBUX是基于MB.OS操作系統(tǒng)打造，具有四個(gè)“性格特征”：自然、預(yù)測(cè)、個(gè)性和同理心，可以和用戶像朋友一樣交流。

雖然奔馳未透露該模型的合作方，但這些描述能讓人首先想到Inflection AI（它是一家同樣強(qiáng)調(diào)有同理心的AI助手的大模型公司，是OpenAI的主要競(jìng)爭(zhēng)對(duì)手之一）。但奔馳并沒有開放MBUX的實(shí)機(jī)測(cè)試，因此也無(wú)法評(píng)價(jià)它的實(shí)際體驗(yàn)到底如何。

高通在它驍龍數(shù)字底盤概念車系統(tǒng)展現(xiàn)了AI與汽車定制化結(jié)合的更具體范例。這款系統(tǒng)提供了基于Llama2和Whisper的純端側(cè)大模型能力，除了一般的對(duì)話娛樂功能外，AI的定制化展現(xiàn)在它對(duì)車況的了解上：當(dāng)你的汽車出故障的時(shí)候，它能語(yǔ)音告訴你故障顯示的意思和準(zhǔn)確原因，而且還會(huì)給你建議最近的維修店地址。

但這一了解似乎主要出自于某種故障排查手冊(cè)，而非對(duì)整車情況的實(shí)時(shí)監(jiān)控。所以雖然進(jìn)行了融合，但還只是最初步的融合，很難帶來真正體驗(yàn)上的提升。

在高通車機(jī)系統(tǒng)上，AI調(diào)出的故障手冊(cè) 攝影：科技新聞

家電AI：撐不起大模型的硬件，用助理機(jī)器人做外掛

在家電領(lǐng)域，AI和家電功能性的融合的點(diǎn)更多，整體邏輯也更成熟。但很主要來自對(duì)之前智能家具能力的升級(jí)，而非對(duì)新誕生的大模型的應(yīng)用。原因其實(shí)很明確：對(duì)于一款主要功能并不是和用戶聊天的家電產(chǎn)品來說，要用高成本的AI芯片來接入大語(yǔ)言模型實(shí)在太不經(jīng)濟(jì)。

比如AI口號(hào)喊得最響，乃至打出了“AI for All”招牌的三星，在CES展出了AI融合明星產(chǎn)品BESPOKE冰箱：它的AI融合點(diǎn)在擁有一整套Family Hub智能系統(tǒng)，可以通過內(nèi)置攝像頭+圖像識(shí)別AI冰箱內(nèi)的物體，提醒用戶食材數(shù)量大概還能食用多久, 還可以通過選擇幾種食材在社區(qū)中為你推薦相關(guān)菜譜。然而這些功能中能和AI掛鉤的就只有圖像識(shí)別部分。至于看起來很AI的對(duì)話功能則是通過它內(nèi)置的語(yǔ)音助手Bixby完成的，這個(gè)系統(tǒng)初代版本可以追溯到2017年，和Siri、微軟小冰的定位一致，是當(dāng)時(shí)很流行的手機(jī)語(yǔ)言支持系統(tǒng)，在家具智能化的大潮之中逐漸普及到三星的家電用品上的。

考慮到當(dāng)下的家電芯片算力，也許它會(huì)在未來幾年內(nèi)與大語(yǔ)言模型產(chǎn)生結(jié)合，但在現(xiàn)下的版本中它應(yīng)該還是由NLP專家模型主導(dǎo)，只能有效回答固定的命令。

三星的BESPOKEN冰箱攝影：科技新聞

三星的另一款不那么受關(guān)注的產(chǎn)品更好的顯示了AI處理能力與傳感器融合的傾向：BESPOKE AI洗烘一體機(jī)，這臺(tái)洗衣機(jī)可以根據(jù)其內(nèi)置的重量、視覺、濕度傳感器去判斷需清洗衣物的質(zhì)料、量和污濁程度，再將這些信息傳輸給AI系統(tǒng)用以調(diào)控水量、溫度、清洗強(qiáng)度和時(shí)間。AI在這里和更多的傳感器融合，獲得了更全面的感知能力，進(jìn)而能做到更復(fù)雜的控制。但和BESPOKE冰箱一樣，它的對(duì)話和控制系統(tǒng)也不是基于大語(yǔ)言模型的。

另一個(gè)AI化傾向明顯的產(chǎn)品領(lǐng)域是電視。LG、三星、TCL、海信等電視品牌今年都推出了AI芯片驅(qū)動(dòng)的電視。AI帶來的一個(gè)主要能力是Upscale，也就是畫質(zhì)升格。LG，三星的電視今年都支持將4k畫質(zhì)提升到8k畫質(zhì)。這一功能對(duì)于目前在主推8k電視的高端電視品牌來講確實(shí)很有價(jià)值，因?yàn)楝F(xiàn)有流媒體中8k片源非常稀少，買了8k電視也沒有用武之地。這一最新的畫質(zhì)升格技術(shù)確實(shí)用到了深度學(xué)習(xí)和GAN神經(jīng)網(wǎng)絡(luò)，因此必須借助AI芯片才能達(dá)成。但它依然和大模型的關(guān)聯(lián)也并不大。

以上的這些產(chǎn)品都在應(yīng)用層邏輯上找到了與AI能夠結(jié)合的方向以及可適用的場(chǎng)景，但都還沒在應(yīng)用到大語(yǔ)言模型。

但有一個(gè)現(xiàn)象值得關(guān)注：這些家電廠商陸續(xù)開始推出私人助理機(jī)器人。

在這次CES上，LG推出了Q9機(jī)器人，三星則針鋒相對(duì)的升級(jí)了Ballie機(jī)器人，定位都在家庭私人助理。在兩個(gè)廠商的講解和展示中可以確認(rèn)這些機(jī)器人都確實(shí)裝載了大語(yǔ)言模型；他們能夠完成相對(duì)復(fù)雜的交互，理解乃至通過感應(yīng)系統(tǒng)預(yù)判用戶的需求（比如你在健身時(shí)從站著變成橫躺，那它就會(huì)把投影投向屋頂），并可以調(diào)用智能家居中的其他一切設(shè)備用最合適的方式來完成用戶的需求。

這可能就是家電廠商對(duì)AI智能化成本的解決方式：與其所有的產(chǎn)品都使用高成本的芯片，不如就做一個(gè)統(tǒng)合助理來調(diào)用所有智能家電產(chǎn)品。

除此之外，據(jù)兩家廠商宣稱，它還可以通過學(xué)習(xí)用戶的個(gè)人習(xí)慣和偏好，來更好地做出適合其情感或生活需求的判斷，而這一功能目前連ChatGPT都還做不到。

這兩款機(jī)器人目前都是概念階段，比如Ballie，從它2020年第一代展示到現(xiàn)在從沒有任何發(fā)售的跡象，但它們展示出了是當(dāng)AI Agent實(shí)體化后所能給我們生活帶來的改變。

這也是我們?cè)谶@場(chǎng)展會(huì)中看到的最接近AI真正融入電子產(chǎn)品后的一種樣態(tài)之一。

三星展臺(tái)的Ballie在投影菜譜視頻攝影：科技新聞

機(jī)器人AI：大模型還在實(shí)驗(yàn)室里

在今年CES的機(jī)器人展區(qū)中的機(jī)器人很多，但并沒有出現(xiàn)借由大模型訓(xùn)練的機(jī)器人。這本來是今年學(xué)術(shù)界的一個(gè)熱門方向，如今年李飛飛團(tuán)隊(duì)帶來的基于語(yǔ)言模型訓(xùn)練的機(jī)器人RT2，斯坦福大學(xué)另一組團(tuán)隊(duì)做出的火爆全網(wǎng)的AI機(jī)器人，都能自主學(xué)習(xí)，完成多任務(wù)。但可惜的是，他們應(yīng)該都還在實(shí)驗(yàn)室里。

在CES展區(qū)中，有來自Richtech Robotics的雙臂機(jī)器人ADAM，這引來微軟CEO Stella圍觀的開普勒人形機(jī)器人和宇樹科技的H1人形機(jī)器人這樣偏向傳統(tǒng)意義的動(dòng)力型 / 工業(yè)型機(jī)器人，雖然在靈活程度和機(jī)械協(xié)調(diào)性上表現(xiàn)的更加出色，但和這波AI浪潮的關(guān)聯(lián)并不強(qiáng)。其智能處理能力主要來自于編程或傳統(tǒng)機(jī)器學(xué)習(xí)方法訓(xùn)練，而非大模型。

微軟CEO Stella參觀CES上的開普勒人形機(jī)器人

CES上，我們能看到的四個(gè)趨勢(shì)

毫無(wú)疑問，在本屆CES上，AI與各種場(chǎng)景的融合都在加深，這種融合從各個(gè)方面都在提升著智能產(chǎn)品的能力。但帶來AI浪潮的大語(yǔ)言模型在其中扮演的角色卻并不那么重要，目前的階段，只是將生成功能簡(jiǎn)單地平移到各個(gè)場(chǎng)景中去，而非深度融合。

盡管如此，但本屆CES毫無(wú)疑問是應(yīng)用層面上將大語(yǔ)言模型從網(wǎng)頁(yè)、手機(jī)上進(jìn)入實(shí)體生活的第一次地集中展示，同時(shí)也給“生成AI 融合萬(wàn)物”的未來期許開了一個(gè)好頭。從這些“實(shí)體化”了的AI中，我們能夠一些未來潛在的趨勢(shì)。

趨勢(shì)一.傳感器與AI的深度結(jié)合

在現(xiàn)有的大語(yǔ)言模型中，AI獲得的信息大多來自預(yù)訓(xùn)練的文本或者圖像。但在實(shí)際生活用例中，場(chǎng)景中的信息是較之圖像、聲音和文字更多元的，比如溫度，重量等。部分傳感器提供的是圖像或圖像信息的抽象（雷達(dá)），是可以被多模態(tài)模型直接應(yīng)用的；而更多傳感器提供的是多元環(huán)境數(shù)據(jù)信息，對(duì)整合文字、聲音、圖像、視頻這四個(gè)最主要人類感知信息源的多模態(tài)模型提供盒更多了環(huán)境信息的補(bǔ)充。有了傳感器的結(jié)合，AI才有了真正的環(huán)境理解能力和在場(chǎng)性。

目前的大語(yǔ)言模型在這方面的實(shí)踐還很初期，雖然它可以理解用戶的部分意圖并作出判斷，但環(huán)境信息的接收有限，能將環(huán)境和應(yīng)該做的操作聯(lián)系起來的路徑還沒建立。這也是為什么它在當(dāng)下和產(chǎn)品結(jié)合時(shí)更多讓人感覺飄浮和分離的重要原因之一。

從三星BESPOKEN洗衣機(jī)那里，我們可以想象當(dāng)大語(yǔ)言能夠真的依靠傳感器在多模態(tài)的應(yīng)用上取得進(jìn)一步突破，我們將進(jìn)入一個(gè)全新的智能化領(lǐng)域。

趨勢(shì)二AI的進(jìn)一步偏好個(gè)人化

在今年的CES上很多車機(jī)或者家電公司都強(qiáng)調(diào)要通過AI給用戶帶來更個(gè)人化的體驗(yàn)，不論是在情緒還是在生活偏好上的體驗(yàn)。但當(dāng)下的AI個(gè)人化在很大程度上是基于AI對(duì)文字表達(dá)需求的理解上的，但很多人的偏好可能是通過行為，而非語(yǔ)言表達(dá)的。只有在具體的需求場(chǎng)景下，AI才有可能通過觀察人類行為的信息并推斷出相應(yīng)的偏好。這是創(chuàng)造一個(gè)真正的理解你的個(gè)人AI助手的核心需求之一。為了達(dá)到這個(gè)目的，AI的發(fā)展會(huì)在后續(xù)持續(xù)向這種可能性進(jìn)發(fā)。

趨勢(shì)三.AI Agent作為一個(gè)統(tǒng)合的入口

今年在CES上最火爆的AI產(chǎn)品就是Rabbit R1，它的底層邏輯就是通過AI Agent的能力將某一個(gè)應(yīng)用或者設(shè)備變成所有應(yīng)用的入口。

Rabbit R1

這個(gè)邏輯其實(shí)和亞馬遜的Alexa，上文提到的Ballie、Q9智能家居助手都很像，用一個(gè)AI系統(tǒng)調(diào)起所有自己支持的API（智能家居，車輛能力），并成為用戶意圖和多產(chǎn)品功能之間的中轉(zhuǎn)站。

在科技新聞在CES期間對(duì)高通副總裁Zarid Asghar的專訪中，他也認(rèn)為AI在后續(xù)發(fā)展中會(huì)成為作為一切應(yīng)用的入口，由此誕生出新一代的AI智能設(shè)備。

Rabbit R1 正是走在這條路上，我們認(rèn)為，這也將成為后續(xù)AI智能設(shè)備發(fā)展的的主流方向。

趨勢(shì)四.發(fā)掘大語(yǔ)言模型聊天之外的潛力，找到更具體的場(chǎng)景應(yīng)用

大語(yǔ)言模型在語(yǔ)言交互、知識(shí)檢索之外有一個(gè)很強(qiáng)的泛化能力，即統(tǒng)合信息進(jìn)行預(yù)測(cè)。

當(dāng)這些信息是一些非語(yǔ)言，或者我們難以理解的語(yǔ)言時(shí)，預(yù)測(cè)在很大程度上就成為了翻譯。比如很多科學(xué)家試圖利用大語(yǔ)言模型理解鯨魚、狐貍的語(yǔ)言并取得了一定的效果。

今年的兩個(gè)非常有創(chuàng)意的AI產(chǎn)品都是基于大語(yǔ)言模型這一能力的使用的。比如獲得了CES今年創(chuàng)新大獎(jiǎng)的Anura MagicMirror，它就是通過其情感技術(shù)DeepAffex識(shí)別并分析人的面部血流，將其轉(zhuǎn)譯為包括血壓各種健康指數(shù)，并預(yù)測(cè)患病概率的產(chǎn)品。

Anura MagicMirror

另一個(gè)更直接利用這種轉(zhuǎn)譯的產(chǎn)品是Cappella，其手機(jī)應(yīng)用程序可以基于大模型“翻譯”寶寶的哭聲，告訴你他們是餓了、不舒服、累了還是需要換尿布。Cappella聲稱，利用人工智能和機(jī)器學(xué)習(xí)來解讀嬰兒的需求，其技術(shù)的準(zhǔn)確率約為95%，而對(duì)于試圖猜測(cè)嬰兒需求的人類來說，準(zhǔn)確率約30%。

所以，其實(shí)除了聊天之外，大語(yǔ)言模型邏輯下的AI，還是有很多應(yīng)用邏輯和場(chǎng)景有待發(fā)掘。期待在明年的CES上，會(huì)有更多企業(yè)能發(fā)現(xiàn)這些可能性，讓AI真正進(jìn)入數(shù)字設(shè)備中。