智東西(公眾號(hào):zhidxcom)
作者 | 羅添瑾
編輯 |云鵬
AI正燃爆上海!
智東西7月5日?qǐng)?bào)道,第六屆世界人工智能大會(huì)(WAIC 2024)在上海舉辦。WAIC 2024帶著超過(guò)1500項(xiàng)展品熱鬧開(kāi)場(chǎng),其中首發(fā)新品數(shù)量超過(guò)50件,現(xiàn)場(chǎng)人潮涌動(dòng)。
WAIC 2024場(chǎng)館內(nèi)外熱鬧非凡,相較于去年AI模型百舸爭(zhēng)流的廝殺,今年的展會(huì)更多的是讓人眼花繚亂的AI應(yīng)用和姿態(tài)各異的機(jī)器人。這些機(jī)器人在展會(huì)上列陣,組成“十八金剛”,還時(shí)不時(shí)的向場(chǎng)館內(nèi)的觀眾揮手致意。
各家企業(yè)持續(xù)發(fā)力,AI大模型和應(yīng)用依舊是主場(chǎng):騰訊混元大模型推出的“騰訊元寶”可以由用戶自己構(gòu)建智能體、螞蟻集團(tuán)研發(fā)的支付寶智能助手現(xiàn)場(chǎng)用機(jī)器臂制作咖啡、商湯的可控人物視頻生成大模型Vimi可實(shí)現(xiàn)生成1分鐘長(zhǎng)視頻、阿里云出品的通義靈碼可以智能報(bào)錯(cuò)、百川智能的AI健康顧問(wèn)現(xiàn)場(chǎng)展示智能問(wèn)診、WPS AI可以實(shí)現(xiàn)智能“伴寫(xiě)”。
各類智能終端產(chǎn)品的展出也十分熱鬧,國(guó)創(chuàng)中心首秀青龍人形機(jī)器人、復(fù)旦大學(xué)研發(fā)的“光華一號(hào)”人形機(jī)器人可以讀懂人的表情,特斯拉的賽博越野旅行車十分搶眼。在展會(huì)的無(wú)人駕駛體驗(yàn)區(qū),上汽賽可智能L4級(jí)Robotaxi、小馬智行第六代L4級(jí)Robotaxi等組成了試駕車隊(duì),eVTOL智能飛行器、美團(tuán)的第四代無(wú)人機(jī)也作為低空智能飛行產(chǎn)品出現(xiàn)在展會(huì)中。
WAIC 2024云逛展!和智東西一起解鎖展會(huì)多重看點(diǎn)就是現(xiàn)在~
一、卷完模型卷應(yīng)用,AI技能已在“Next Level”
AI大模型和應(yīng)用這條賽道已經(jīng)卷的起飛。
在大會(huì)上,商湯展示了可控人物視頻生成大模型Vimi,商湯介紹,與圖片表情控制類技術(shù)只能控制頭部表情不同,Vimi可以精準(zhǔn)實(shí)現(xiàn)表情、自然肢體、發(fā)型、服飾、背景甚至是光影的變化,并使之協(xié)調(diào)。
更重要的是,Vimi可以實(shí)現(xiàn)穩(wěn)定生成長(zhǎng)達(dá)一分鐘的單鏡頭人物類視頻,并且保證畫(huà)面效果。
▲Vimi演示調(diào)整任務(wù)動(dòng)作表情(圖源:www.sensetime.com)
螞蟻集團(tuán)基于螞蟻百靈大模型推出的支付寶助理于WAIC首發(fā),用戶只要下達(dá)指令,就能迅速獲得相關(guān)資訊,并一鍵直連支付寶生態(tài)內(nèi)掛號(hào)、訂票、充話費(fèi)等服務(wù)。
▲螞蟻集團(tuán)展區(qū)內(nèi)的支付寶智能助理(圖源:智東西)
支付寶的AI智能助手還推出了智能點(diǎn)單這一新功能,首批支持星巴克、瑞幸、霸王茶姬、蜜雪冰城等11個(gè)茶飲品牌的支付寶小程序。用戶通過(guò)支付寶智能助理下達(dá)指令,比如“幫我點(diǎn)一杯瑞幸的大杯冰拿鐵”,AI便會(huì)進(jìn)入小程序自動(dòng)下單,用戶確認(rèn)并付款后,就能到附近的線下門(mén)店取到咖啡。
▲支付寶智能助手展示智能點(diǎn)單(圖源:螞蟻集團(tuán))
在“騰訊元寶”展區(qū),現(xiàn)場(chǎng)觀眾可以與騰訊元寶APP進(jìn)行互動(dòng),通過(guò)互動(dòng)裝置,生成個(gè)人多風(fēng)格專屬頭像。騰訊元寶覆蓋工作提效、生活?yuàn)蕵?lè)兩大場(chǎng)景,除了提供AI搜索、AI總結(jié)、AI寫(xiě)作等核心功能,還提供創(chuàng)意繪畫(huà)、口語(yǔ)陪練、百變AI頭像等有趣好玩的特色應(yīng)用,以及更多用戶創(chuàng)建的智能體。
▲騰訊展區(qū)門(mén)口的“AI照相機(jī)”(圖源:騰訊)
巖芯數(shù)智Rock AI在大會(huì)上特別演示了Yan1.2版本的階段性成果,展示了Yan架構(gòu)在更廣泛、更低算力設(shè)備上的離線部署能力,以及他們首創(chuàng)的”同步學(xué)習(xí)“實(shí)驗(yàn)室示例。Yan1.2多模態(tài)大模型離線部署在手機(jī)中也能流暢運(yùn)行,每秒可達(dá)20+token輸出。通過(guò)自然語(yǔ)言輸入,小智會(huì)理解并處理任務(wù),為用戶提供更優(yōu)質(zhì)的體驗(yàn)。
▲Rock AI演示圖片(圖源:巖芯數(shù)智)
百川智能在大會(huì)上展示了AI健康顧問(wèn),該產(chǎn)品依托百川智能的通用醫(yī)療增強(qiáng)大模型打造,不僅擁有豐富的醫(yī)藥學(xué)知識(shí),并且還具備醫(yī)生思維。百川智能的通用醫(yī)療增強(qiáng)大模型不僅在USMLE(美國(guó)醫(yī)考)的評(píng)測(cè)中超越了GPT-4,并且在由醫(yī)生(協(xié)和、北醫(yī)等頭部三甲高年資主任、主治醫(yī)師)和心理學(xué)專家作為評(píng)測(cè)主體,對(duì)模型進(jìn)行多角度評(píng)測(cè)的真實(shí)人工評(píng)測(cè)中,同樣超越了GPT-4。
▲與百川智能AI健康顧問(wèn)問(wèn)診(圖源:智東西)
新壹科技在展會(huì)上帶來(lái)了新壹視頻大模型2.0版本,這一版本進(jìn)一步提升了其多模態(tài)AIGC模型的核心能力,在視頻生產(chǎn)上,從腳本生成、素材生產(chǎn)和匹配、智能剪輯配音到數(shù)字人播報(bào),新壹視頻大模型2.0讓整個(gè)流程更加智能,模型的交叉推理能力還可以根據(jù)需求快速生成符合場(chǎng)景特點(diǎn)的視頻,并且模型還自帶豐富的素材庫(kù)和模板庫(kù)。
▲新壹科技展區(qū)(圖源:新壹科技)
從讓人眼花繚亂的AI應(yīng)用來(lái)看,AI在為人們“生產(chǎn)力”提速賦能方面已經(jīng)在變著花樣地升級(jí),更多垂類領(lǐng)域已經(jīng)有了AI的身影。
二、人形機(jī)器人霸屏展會(huì),智能眼鏡等終端產(chǎn)品同臺(tái)競(jìng)技
人形機(jī)器人是WAIC 2024一道十分吸睛的風(fēng)景。
國(guó)創(chuàng)中心的“青龍人形機(jī)器人”在WAIC上首次亮相,這是國(guó)內(nèi)首款全尺寸通用人形機(jī)器人的開(kāi)源公版機(jī),支持多模態(tài)機(jī)動(dòng)、感知、交互和操作,全身多達(dá)43個(gè)主動(dòng)自由度,算力支持400 TOPS。青龍可以進(jìn)行不同形狀和重量的物品識(shí)別和抓取能力測(cè)試,它擁有高度仿生的軀干構(gòu)型和擬人化的運(yùn)動(dòng)控制能力,能夠伸出五指準(zhǔn)確地抓起桌面上隨機(jī)擺放的物品,并放進(jìn)桌上的籃子里。
▲青龍人形機(jī)器人(圖源:財(cái)聯(lián)社)
特斯拉人形機(jī)器人擎天柱二代(Optimus)首次亮相,據(jù)工作人員介紹,Optimus的全身控制能力和平衡性得到了顯著的“進(jìn)化”,第二代Optimus最早于2023年12月首次亮相,相比前代產(chǎn)品,其采用了全部由特斯拉自主設(shè)計(jì)和制造的執(zhí)行器和傳感器,整體外觀設(shè)計(jì)更加精細(xì),行走速度提高了30%,重量減輕了10公斤,同時(shí)平衡感和身體控制能力得到改善。
▲特斯拉擎天柱二代人形機(jī)器人(Optimus)(圖源:新浪財(cái)經(jīng))
XREAL帶著最新的Air 2 Ultra智能眼鏡亮相WAIC 2024,這是XREAL面向全球推出的XREAL Air 2系列AR眼鏡的最新成員,尚未在國(guó)內(nèi)開(kāi)售?纱┐髦悄茉O(shè)備頗受關(guān)注。該產(chǎn)品還結(jié)合了國(guó)民級(jí)IP和AIGC技術(shù)為觀眾打造了《仙劍縱橫宇宙》互動(dòng)體驗(yàn)。
▲XREAL Air 2 Ultra智能眼鏡(圖源:XREAL)
聯(lián)想在大會(huì)上展示了它的YOGA Book 9i雙屏翻轉(zhuǎn)本,該筆記本內(nèi)置由天禧大模型驅(qū)動(dòng)的聯(lián)想小天AI智能體,能夠在多個(gè)場(chǎng)景中與用戶自然交互,提供更精準(zhǔn)和個(gè)人化的服務(wù)。同時(shí)該款筆記本升級(jí)搭載英特爾Ultra處理器,標(biāo)配32GB大內(nèi)存,瀑布屏玩法升級(jí),橫屏模式亦可開(kāi)啟,實(shí)現(xiàn)了全新雙屏的跨屏體驗(yàn)。
▲聯(lián)想 YOGA Book 9i雙屏翻轉(zhuǎn)本(圖源:WAIC)
三、走進(jìn)無(wú)人駕駛體驗(yàn)區(qū),“空中出租車”格外吸睛
在展會(huì)中還有一個(gè)特別設(shè)置了無(wú)人駕駛體驗(yàn)區(qū),區(qū)內(nèi)不僅展示了無(wú)人駕駛Robotaxi、“空中出租車”盛世龍eVTOL電動(dòng)垂直起降航空器、無(wú)人巴士等產(chǎn)品,還可以體驗(yàn)自動(dòng)駕駛。
盛世龍是峰飛自主研發(fā)的旗艦產(chǎn)品,可以像多旋翼航空器或直升機(jī)一樣垂直起飛,在空中完成轉(zhuǎn)換飛行后,依靠固定翼飛行模式水平巡航,起降靈活,高效便捷。單次可充電飛行250公里,最大起飛重量達(dá)2200公斤。
▲盛世龍eVTOL電動(dòng)垂直起降航空器(圖源:WAIC)
同時(shí)備受關(guān)注的還有特斯拉的賽博越野旅行車,作為智能電動(dòng)汽車的代表,展示了特斯拉在自動(dòng)駕駛和電動(dòng)汽車技術(shù)上的領(lǐng)先地位。賽博越野旅行車是世界上第一款采用48V低壓架構(gòu)的車,它也是首款采用線控轉(zhuǎn)向的量產(chǎn)車型。
▲特斯拉賽博越野旅行車(圖源:WAIC)
四、央國(guó)企也來(lái)卷AI,多個(gè)AI+案例參展
要在展會(huì)上亮相的還有許多和科技緊密結(jié)合的央國(guó)企,現(xiàn)場(chǎng)展示了許多依托AI技術(shù)賦能實(shí)體行業(yè)的案例。
中國(guó)移動(dòng)帶來(lái)“九天基座大模型”及“5G-A×AI新通話”。九天基座大模型是國(guó)內(nèi)首個(gè)基于近萬(wàn)卡全液冷國(guó)產(chǎn)智算集群、通過(guò)國(guó)家網(wǎng)信辦模型生成式人工智能服務(wù)與算法雙備案的首個(gè)央企大模型,已規(guī);癁檎⻊(wù)、醫(yī)療、工業(yè)等20多個(gè)行業(yè)提供AI+應(yīng)用服務(wù)。
中信集團(tuán)將首次展示特鋼行業(yè)全球首座“燈塔工廠”,在這座工廠采用了大量人工智能技術(shù),可以實(shí)時(shí)獲取生產(chǎn)線狀態(tài),通過(guò)模型的自學(xué)習(xí),獲取最優(yōu)的策略來(lái)指導(dǎo)生產(chǎn)。工業(yè)互聯(lián)網(wǎng)智造協(xié)同平臺(tái)則憑借AI大腦實(shí)現(xiàn)的X光智能評(píng)判,大幅提高了鑄件缺陷識(shí)別效率和判定準(zhǔn)確率,效率提升140%。
結(jié)語(yǔ):AI應(yīng)用大賽進(jìn)入白熱化
本次大會(huì)上的展品大賞,不僅展示了最前沿的AI成果,如超大規(guī)模預(yù)訓(xùn)練模型、AI融合與量子計(jì)算、以及多模態(tài)感知和交互技術(shù)等,更重要的是,這些技術(shù)不再停留于概念演示,而是越來(lái)越多地轉(zhuǎn)化為實(shí)際的產(chǎn)品與服務(wù)。
雖然許多AI應(yīng)用還處于測(cè)試階段,但展會(huì)上許多精妙的設(shè)計(jì)已經(jīng)讓我們頗為激動(dòng),從電商購(gòu)物、智能對(duì)話到大模型、低空經(jīng)濟(jì)、車路協(xié)同,AI正在飛速改變著我們的生活。未來(lái)讓我一起期待!