展會(huì)信息港展會(huì)大全

CES觀察:AI無(wú)處不在,撐不起大模型的硬件家電,用助理機(jī)器人做外掛
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-15 14:53:04   瀏覽:7939次  

導(dǎo)讀:文 / 騰訊科技 郝博陽(yáng) 2024年的電子春晚的CES落幕了,四天的展會(huì)吸引了超過13萬(wàn)觀眾的參與,恢復(fù)了疫情前的繁華。很多展臺(tái)之前都排起等待參觀的長(zhǎng)龍,人頭攢動(dòng)。那些吸引最多人流的站臺(tái)往往都有個(gè)明顯的標(biāo)簽AI。 展會(huì)之前,Moor Insights Strategy的資深分析...

文 / 科技新聞 郝博陽(yáng)

2024年的電子"春晚"的CES落幕了,四天的展會(huì)吸引了超過13萬(wàn)觀眾的參與,恢復(fù)了疫情前的繁華。很多展臺(tái)之前都排起等待參觀的長(zhǎng)龍,人頭攢動(dòng)。那些吸引最多人流的站臺(tái)往往都有個(gè)明顯的標(biāo)簽AI。

展會(huì)之前,Moor Insights & Strategy的資深分析師Anshel Sag就表示,“在去年的CES上,AI還沒有權(quán)力開火,如果你認(rèn)為AI是去年的浪潮的話,那今年它就是海嘯。”

AI確實(shí)如海嘯般洶涌的卷過CES的會(huì)常電腦廠商從聯(lián)想到ROG,家電廠商從三星到海信,汽車廠商從奔馳到大眾,幾乎每家大企業(yè)的展臺(tái)中都有一個(gè)或大或小的區(qū)域?qū)iT介紹AI方面的升級(jí)。

然而實(shí)際體驗(yàn)下來,從電腦到到小家電之間,AI化的程度存在著不小的差異,但對(duì)于席卷全球的大語(yǔ)言模型而言,幾乎所有的產(chǎn)品都只能算是淺嘗輒止。只能說有了,但很難說它和產(chǎn)品已經(jīng)有了比較成功的融合。

這次科技新聞將根據(jù)CES現(xiàn)場(chǎng)的觀察和與廠商的交流,分別針對(duì)AIPC、手機(jī)端AI、AI上車、家電AI化和機(jī)器人這幾個(gè)本屆CES上AI相關(guān)性最高的領(lǐng)域逐一進(jìn)行闡述。

AIPC:現(xiàn)階段只是能用AI的PC

行業(yè)認(rèn)為,2024年將成為AI PC年,從聯(lián)想到Intel今年都在講AI PC的故事。但在今年的CES上,我們看到的更多是像HP Spectre x360 14一樣只是裝載了AI芯片的PC;或者是如戴爾XPS 13、聯(lián)想Yoga Pro 9等,在PC上多設(shè)置了一個(gè)直接喚起Windows Copilit的按鍵而已;走得最遠(yuǎn)的,是聯(lián)想在端側(cè)直接內(nèi)置了AI NOW大模型能力的嘗試。

正如聯(lián)想CEO楊元慶在CES過程中的采訪中所說,當(dāng)下的AIPC還處于AI Ready的階段,也就是把硬件提升到支持大語(yǔ)言模型的階段。而現(xiàn)實(shí)是,更好的產(chǎn)品AI化體驗(yàn)和AI應(yīng)用的成熟的AI ON階段還沒有完全到來。

Dell XPS 13上的Windows Copilit 按鍵

手機(jī)AI:半年前發(fā)布會(huì)上的餅剛熟

手機(jī)上的AI與系統(tǒng)融合進(jìn)度也相對(duì)緩慢。

在CES谷歌的展臺(tái)上,到處都有AI的身影,但還是和半年前Palm 2發(fā)布會(huì)上所帶來的驚喜差距不大。

如魔法相機(jī),用戶可以移動(dòng)照片里的對(duì)象或者更換環(huán)境光色;智能回復(fù)功能:你可以讓AI替你回電話或者自動(dòng)生成幾種不同情緒和態(tài)度的回復(fù)文本。

當(dāng)有人問谷歌站臺(tái)的工作人員“Bard現(xiàn)在有內(nèi)置App嗎?”以及“Bard能否關(guān)聯(lián)到手機(jī)的本地信息?”時(shí),得到的答案都是否定的。

這也許是因?yàn)槭謾C(jī)算力的限制。本屆展會(huì)上谷歌用來展示其AI能力的設(shè)備主要是其最新的手機(jī)系列Pixel 8,它所搭載的Tensor G3雖然在AI能力上做了一些提升,但相對(duì)于競(jìng)品的蘋果A14或驍龍Gen8 3在性能上仍有很大差距,預(yù)期能本地運(yùn)作的大模型參數(shù)不會(huì)超過4B參數(shù)。

至于幾個(gè)月前Youtube AI就宣布的創(chuàng)作工具,我們?cè)贑ES展會(huì)上能看到的仍然是只能作為視頻演示的beta版本,且三項(xiàng)演示的功能分別為智能聲音降噪、智能分辨音樂節(jié)奏點(diǎn)和智能字幕,確實(shí)有些新意不足。它的主要競(jìng)品剪映在至少一年前就上線了這三個(gè)功能中的兩個(gè)。

其他手機(jī)廠商在系統(tǒng)中展現(xiàn)的AI能力也都比較平庸,ROG Phone 8 Pro主推的AI功能也是AI自動(dòng)生成壁紙,人工智能降噪這些不疼不癢的應(yīng)用場(chǎng)景。

谷歌在CES上的智能回復(fù)功能展示 攝影:科技新聞

汽車AI:上了車,但還沒完全起步

在汽車領(lǐng)域,AI融合的階段和PC相對(duì)類似:大模型上了車機(jī),但主要的應(yīng)用還是作為語(yǔ)音助手。它可以調(diào)用起地圖、娛樂系統(tǒng)等車上應(yīng)用,但這也是大模型上車之前那些NLP語(yǔ)音助手就已經(jīng)擁有的能力。

AI上車最簡(jiǎn)單粗暴,拿來主義的方式就是接入現(xiàn)有模型。這種模式的核心范例就是大眾汽車,其最新的ID3、4、5系列將是第一款接入ChatGPT的汽車。寶馬汽車也類似,只不過接入的是亞馬遜的Alexa 大語(yǔ)言模型。

除了簡(jiǎn)單的AI上車機(jī)之外,奔馳對(duì)AI的調(diào)教相對(duì)走得最遠(yuǎn)。它在CES最新發(fā)布的車機(jī)系統(tǒng)MBUX是基于MB.OS操作系統(tǒng)打造,具有四個(gè)“性格特征”:自然、預(yù)測(cè)、個(gè)性和同理心,可以和用戶像朋友一樣交流。

雖然奔馳未透露該模型的合作方,但這些描述能讓人首先想到Inflection AI(它是一家同樣強(qiáng)調(diào)有同理心的AI助手的大模型公司,是OpenAI的主要競(jìng)爭(zhēng)對(duì)手之一)。但奔馳并沒有開放MBUX的實(shí)機(jī)測(cè)試,因此也無(wú)法評(píng)價(jià)它的實(shí)際體驗(yàn)到底如何。

高通在它驍龍數(shù)字底盤概念車系統(tǒng)展現(xiàn)了AI與汽車定制化結(jié)合的更具體范例。這款系統(tǒng)提供了基于Llama2和Whisper的純端側(cè)大模型能力,除了一般的對(duì)話娛樂功能外,AI的定制化展現(xiàn)在它對(duì)車況的了解上:當(dāng)你的汽車出故障的時(shí)候,它能語(yǔ)音告訴你故障顯示的意思和準(zhǔn)確原因,而且還會(huì)給你建議最近的維修店地址。

但這一了解似乎主要出自于某種故障排查手冊(cè),而非對(duì)整車情況的實(shí)時(shí)監(jiān)控。所以雖然進(jìn)行了融合,但還只是最初步的融合,很難帶來真正體驗(yàn)上的提升。

在高通車機(jī)系統(tǒng)上,AI調(diào)出的故障手冊(cè) 攝影:科技新聞

家電AI:撐不起大模型的硬件,用助理機(jī)器人做外掛

在家電領(lǐng)域,AI和家電功能性的融合的點(diǎn)更多,整體邏輯也更成熟。但很主要來自對(duì)之前智能家具能力的升級(jí),而非對(duì)新誕生的大模型的應(yīng)用。原因其實(shí)很明確:對(duì)于一款主要功能并不是和用戶聊天的家電產(chǎn)品來說,要用高成本的AI芯片來接入大語(yǔ)言模型實(shí)在太不經(jīng)濟(jì)。

比如AI口號(hào)喊得最響,乃至打出了“AI for All”招牌的三星,在CES展出了AI融合明星產(chǎn)品BESPOKE冰箱:它的AI融合點(diǎn)在擁有一整套Family Hub智能系統(tǒng),可以通過內(nèi)置攝像頭+圖像識(shí)別AI冰箱內(nèi)的物體,提醒用戶食材數(shù)量大概還能食用多久, 還可以通過選擇幾種食材在社區(qū)中為你推薦相關(guān)菜譜。然而這些功能中能和AI掛鉤的就只有圖像識(shí)別部分。至于看起來很AI的對(duì)話功能則是通過它內(nèi)置的語(yǔ)音助手Bixby完成的,這個(gè)系統(tǒng)初代版本可以追溯到2017年,和Siri、微軟小冰的定位一致,是當(dāng)時(shí)很流行的手機(jī)語(yǔ)言支持系統(tǒng),在家具智能化的大潮之中逐漸普及到三星的家電用品上的。

考慮到當(dāng)下的家電芯片算力,也許它會(huì)在未來幾年內(nèi)與大語(yǔ)言模型產(chǎn)生結(jié)合,但在現(xiàn)下的版本中它應(yīng)該還是由NLP專家模型主導(dǎo),只能有效回答固定的命令。

三星的BESPOKEN冰箱 攝影:科技新聞

三星的另一款不那么受關(guān)注的產(chǎn)品更好的顯示了AI處理能力與傳感器融合的傾向:BESPOKE AI洗烘一體機(jī),這臺(tái)洗衣機(jī)可以根據(jù)其內(nèi)置的重量、視覺、濕度傳感器去判斷需清洗衣物的質(zhì)料、量和污濁程度,再將這些信息傳輸給AI系統(tǒng)用以調(diào)控水量、溫度、清洗強(qiáng)度和時(shí)間。AI在這里和更多的傳感器融合,獲得了更全面的感知能力,進(jìn)而能做到更復(fù)雜的控制。但和BESPOKE冰箱一樣,它的對(duì)話和控制系統(tǒng)也不是基于大語(yǔ)言模型的。

另一個(gè)AI化傾向明顯的產(chǎn)品領(lǐng)域是電視。LG、三星、TCL、海信等電視品牌今年都推出了AI芯片驅(qū)動(dòng)的電視。AI帶來的一個(gè)主要能力是Upscale,也就是畫質(zhì)升格。LG,三星的電視今年都支持將4k畫質(zhì)提升到8k畫質(zhì)。這一功能對(duì)于目前在主推8k電視的高端電視品牌來講確實(shí)很有價(jià)值,因?yàn)楝F(xiàn)有流媒體中8k片源非常稀少,買了8k電視也沒有用武之地。這一最新的畫質(zhì)升格技術(shù)確實(shí)用到了深度學(xué)習(xí)和GAN神經(jīng)網(wǎng)絡(luò),因此必須借助AI芯片才能達(dá)成。但它依然和大模型的關(guān)聯(lián)也并不大。

以上的這些產(chǎn)品都在應(yīng)用層邏輯上找到了與AI能夠結(jié)合的方向以及可適用的場(chǎng)景,但都還沒在應(yīng)用到大語(yǔ)言模型。

但有一個(gè)現(xiàn)象值得關(guān)注:這些家電廠商陸續(xù)開始推出私人助理機(jī)器人。

在這次CES上,LG推出了Q9機(jī)器人,三星則針鋒相對(duì)的升級(jí)了Ballie機(jī)器人,定位都在家庭私人助理。在兩個(gè)廠商的講解和展示中可以確認(rèn)這些機(jī)器人都確實(shí)裝載了大語(yǔ)言模型;他們能夠完成相對(duì)復(fù)雜的交互,理解乃至通過感應(yīng)系統(tǒng)預(yù)判用戶的需求(比如你在健身時(shí)從站著變成橫躺,那它就會(huì)把投影投向屋頂),并可以調(diào)用智能家居中的其他一切設(shè)備用最合適的方式來完成用戶的需求。

這可能就是家電廠商對(duì)AI智能化成本的解決方式:與其所有的產(chǎn)品都使用高成本的芯片,不如就做一個(gè)統(tǒng)合助理來調(diào)用所有智能家電產(chǎn)品。

除此之外,據(jù)兩家廠商宣稱,它還可以通過學(xué)習(xí)用戶的個(gè)人習(xí)慣和偏好,來更好地做出適合其情感或生活需求的判斷,而這一功能目前連ChatGPT都還做不到。

這兩款機(jī)器人目前都是概念階段,比如Ballie,從它2020年第一代展示到現(xiàn)在從沒有任何發(fā)售的跡象,但它們展示出了是當(dāng)AI Agent實(shí)體化后所能給我們生活帶來的改變。

這也是我們?cè)谶@場(chǎng)展會(huì)中看到的最接近AI真正融入電子產(chǎn)品后的一種樣態(tài)之一。

三星展臺(tái)的Ballie在投影菜譜視頻 攝影:科技新聞

機(jī)器人AI:大模型還在實(shí)驗(yàn)室里

在今年CES的機(jī)器人展區(qū)中的機(jī)器人很多,但并沒有出現(xiàn)借由大模型訓(xùn)練的機(jī)器人。這本來是今年學(xué)術(shù)界的一個(gè)熱門方向,如今年李飛飛團(tuán)隊(duì)帶來的基于語(yǔ)言模型訓(xùn)練的機(jī)器人RT2,斯坦福大學(xué)另一組團(tuán)隊(duì)做出的火爆全網(wǎng)的AI機(jī)器人,都能自主學(xué)習(xí),完成多任務(wù)。但可惜的是,他們應(yīng)該都還在實(shí)驗(yàn)室里。

在CES展區(qū)中,有來自Richtech Robotics的雙臂機(jī)器人ADAM,這引來微軟CEO Stella圍觀的開普勒人形機(jī)器人和宇樹科技的H1人形機(jī)器人這樣偏向傳統(tǒng)意義的動(dòng)力型 / 工業(yè)型機(jī)器人,雖然在靈活程度和機(jī)械協(xié)調(diào)性上表現(xiàn)的更加出色,但和這波AI浪潮的關(guān)聯(lián)并不強(qiáng)。其智能處理能力主要來自于編程或傳統(tǒng)機(jī)器學(xué)習(xí)方法訓(xùn)練,而非大模型。

微軟CEO Stella參觀CES上的開普勒人形機(jī)器人

CES上,我們能看到的四個(gè)趨勢(shì)

毫無(wú)疑問,在本屆CES上,AI與各種場(chǎng)景的融合都在加深,這種融合從各個(gè)方面都在提升著智能產(chǎn)品的能力。但帶來AI浪潮的大語(yǔ)言模型在其中扮演的角色卻并不那么重要,目前的階段,只是將生成功能簡(jiǎn)單地平移到各個(gè)場(chǎng)景中去,而非深度融合。

盡管如此,但本屆CES毫無(wú)疑問是應(yīng)用層面上將大語(yǔ)言模型從網(wǎng)頁(yè)、手機(jī)上進(jìn)入實(shí)體生活的第一次地集中展示,同時(shí)也給“生成AI 融合萬(wàn)物”的未來期許開了一個(gè)好頭。從這些“實(shí)體化”了的AI中,我們能夠一些未來潛在的趨勢(shì)。

趨勢(shì)一.傳感器與AI的深度結(jié)合

在現(xiàn)有的大語(yǔ)言模型中,AI獲得的信息大多來自預(yù)訓(xùn)練的文本或者圖像。但在實(shí)際生活用例中,場(chǎng)景中的信息是較之圖像、聲音和文字更多元的,比如溫度,重量等。部分傳感器提供的是圖像或圖像信息的抽象(雷達(dá)),是可以被多模態(tài)模型直接應(yīng)用的;而更多傳感器提供的是多元環(huán)境數(shù)據(jù)信息,對(duì)整合文字、聲音、圖像、視頻這四個(gè)最主要人類感知信息源的多模態(tài)模型提供盒更多了環(huán)境信息的補(bǔ)充。有了傳感器的結(jié)合,AI才有了真正的環(huán)境理解能力和在場(chǎng)性。

目前的大語(yǔ)言模型在這方面的實(shí)踐還很初期,雖然它可以理解用戶的部分意圖并作出判斷,但環(huán)境信息的接收有限,能將環(huán)境和應(yīng)該做的操作聯(lián)系起來的路徑還沒建立。這也是為什么它在當(dāng)下和產(chǎn)品結(jié)合時(shí)更多讓人感覺飄浮和分離的重要原因之一。

從三星BESPOKEN洗衣機(jī)那里,我們可以想象當(dāng)大語(yǔ)言能夠真的依靠傳感器在多模態(tài)的應(yīng)用上取得進(jìn)一步突破,我們將進(jìn)入一個(gè)全新的智能化領(lǐng)域。

趨勢(shì)二AI的進(jìn)一步偏好個(gè)人化

在今年的CES上很多車機(jī)或者家電公司都強(qiáng)調(diào)要通過AI給用戶帶來更個(gè)人化的體驗(yàn),不論是在情緒還是在生活偏好上的體驗(yàn)。但當(dāng)下的AI個(gè)人化在很大程度上是基于AI對(duì)文字表達(dá)需求的理解上的,但很多人的偏好可能是通過行為,而非語(yǔ)言表達(dá)的。只有在具體的需求場(chǎng)景下,AI才有可能通過觀察人類行為的信息并推斷出相應(yīng)的偏好。這是創(chuàng)造一個(gè)真正的理解你的個(gè)人AI助手的核心需求之一。為了達(dá)到這個(gè)目的,AI的發(fā)展會(huì)在后續(xù)持續(xù)向這種可能性進(jìn)發(fā)。

趨勢(shì)三.AI Agent作為一個(gè)統(tǒng)合的入口

今年在CES上最火爆的AI產(chǎn)品就是Rabbit R1,它的底層邏輯就是通過AI Agent的能力將某一個(gè)應(yīng)用或者設(shè)備變成所有應(yīng)用的入口。

Rabbit R1

這個(gè)邏輯其實(shí)和亞馬遜的Alexa,上文提到的Ballie、Q9智能家居助手都很像,用一個(gè)AI系統(tǒng)調(diào)起所有自己支持的API(智能家居,車輛能力),并成為用戶意圖和多產(chǎn)品功能之間的中轉(zhuǎn)站。

在科技新聞在CES期間對(duì)高通副總裁Zarid Asghar的專訪中,他也認(rèn)為AI在后續(xù)發(fā)展中會(huì)成為作為一切應(yīng)用的入口,由此誕生出新一代的AI智能設(shè)備。

Rabbit R1 正是走在這條路上,我們認(rèn)為,這也將成為后續(xù)AI智能設(shè)備發(fā)展的的主流方向。

趨勢(shì)四.發(fā)掘大語(yǔ)言模型聊天之外的潛力,找到更具體的場(chǎng)景應(yīng)用

大語(yǔ)言模型在語(yǔ)言交互、知識(shí)檢索之外有一個(gè)很強(qiáng)的泛化能力,即統(tǒng)合信息進(jìn)行預(yù)測(cè)。

當(dāng)這些信息是一些非語(yǔ)言,或者我們難以理解的語(yǔ)言時(shí),預(yù)測(cè)在很大程度上就成為了翻譯。比如很多科學(xué)家試圖利用大語(yǔ)言模型理解鯨魚、狐貍的語(yǔ)言并取得了一定的效果。

今年的兩個(gè)非常有創(chuàng)意的AI產(chǎn)品都是基于大語(yǔ)言模型這一能力的使用的。比如獲得了CES今年創(chuàng)新大獎(jiǎng)的Anura MagicMirror,它就是通過其情感技術(shù)DeepAffex識(shí)別并分析人的面部血流,將其轉(zhuǎn)譯為包括血壓各種健康指數(shù),并預(yù)測(cè)患病概率的產(chǎn)品。

Anura MagicMirror

另一個(gè)更直接利用這種轉(zhuǎn)譯的產(chǎn)品是Cappella,其手機(jī)應(yīng)用程序可以基于大模型“翻譯”寶寶的哭聲,告訴你他們是餓了、不舒服、累了還是需要換尿布。Cappella聲稱,利用人工智能和機(jī)器學(xué)習(xí)來解讀嬰兒的需求,其技術(shù)的準(zhǔn)確率約為95%,而對(duì)于試圖猜測(cè)嬰兒需求的人類來說,準(zhǔn)確率約30%。

所以,其實(shí)除了聊天之外,大語(yǔ)言模型邏輯下的AI,還是有很多應(yīng)用邏輯和場(chǎng)景有待發(fā)掘。期待在明年的CES上,會(huì)有更多企業(yè)能發(fā)現(xiàn)這些可能性,讓AI真正進(jìn)入數(shù)字設(shè)備中。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港