機(jī)器人前瞻10月17日?qǐng)?bào)道,昨天,美的科技月系列活動(dòng)遠(yuǎn)見者大會(huì)在順德召開。美的研發(fā)專家、業(yè)內(nèi)知名專家等齊聚美的全球創(chuàng)新中心,圍繞機(jī)器人、人工智能與能源轉(zhuǎn)型等熱門技術(shù)話題展開了深刻探討。
參會(huì)嘉賓有中國(guó)科學(xué)院院士、華中科技大學(xué)教授丁漢,中山大學(xué)教授、鵬城實(shí)驗(yàn)室多智能體與具身智能研究所所長(zhǎng)林等,以及美的集團(tuán)副總裁兼工業(yè)技術(shù)事業(yè)群總裁伏擁軍、副總裁兼CDO張小懿、副總裁兼CTO衛(wèi)昶。
在丁漢看來,科技發(fā)展迅速,機(jī)器人技術(shù)備受矚目,有望成為第三次工業(yè)革命切入點(diǎn)。人工智能的發(fā)展為機(jī)器人帶來廣闊應(yīng)用空間,共融機(jī)器人是未來重要方向,機(jī)器人也會(huì)變得更加具有自主性、適應(yīng)性。同時(shí),人形機(jī)器人、養(yǎng)老機(jī)器人、醫(yī)療機(jī)器人也迎來廣闊的發(fā)展前景。
林則是深度分析了大語言模型和具身智能技術(shù)的未來發(fā)展,從離身智能到具備主動(dòng)性、強(qiáng)交互性的具身智能,具身智能可以讓機(jī)器人主動(dòng)、自適應(yīng)地完成改造世界的任務(wù),這是從過去的認(rèn)識(shí)世界走向改造物理世界的跨越。在走向通用人工智能的路上,數(shù)字空間和物理空間對(duì)其也應(yīng)該成為考慮在內(nèi)的重要因素。
目前,美的正在大力推進(jìn)家庭智能體和工業(yè)智能體兩個(gè)戰(zhàn)略項(xiàng)目。其去年發(fā)布的美言大模型已經(jīng)搭載著幾萬臺(tái)設(shè)備走進(jìn)千家萬戶,到 11 月份差不多會(huì)有數(shù)十萬臺(tái)設(shè)備上市,進(jìn)一步推廣美言大模型,為用戶帶來全新的交互體驗(yàn)。
據(jù)悉,美的人工智能研究所早期主要圍繞家電做智能語音相關(guān)研發(fā),2017年美的集團(tuán)完成德國(guó)庫(kù)卡機(jī)器人收購(gòu)后,就增加了機(jī)器人相關(guān)的傳感、視覺、導(dǎo)航算法研究。
美的,1968年創(chuàng)立,從料瓶蓋小作坊起步,1980年開始做家電,從電風(fēng)扇到全球白色家電領(lǐng)軍企業(yè),如今已把機(jī)器人與自動(dòng)化作為五大業(yè)務(wù)板塊之一大力推進(jìn)。
另據(jù)了解,美的正在對(duì)人形機(jī)器人進(jìn)行探索,主要聚焦在核心零部件領(lǐng)域。
以下是遠(yuǎn)見者大會(huì)現(xiàn)場(chǎng),部分主題演講與對(duì)話交流的實(shí)錄:
一、丁漢:機(jī)器人未有望成為第三次工業(yè)革命切入點(diǎn)
▲中國(guó)科學(xué)院院士、華中科技大學(xué)教授 丁漢
科技飛速發(fā)展,機(jī)器人技術(shù)正日益成為備受關(guān)注的焦點(diǎn)。“機(jī)器人技術(shù)未來極有可能成為顛覆性技術(shù),甚至可能成為第三次工業(yè)革命的切入點(diǎn)。美國(guó)的相關(guān)報(bào)告曾指出,機(jī)器人對(duì)美國(guó)經(jīng)濟(jì)的重要性或許可與蒸汽機(jī)相提并論。 ”丁漢說道。
“2020 年人民日?qǐng)?bào)曾報(bào)道過機(jī)器人未來的趨勢(shì),其中提到了機(jī)器人取代人以及未來走向等問題,而我們認(rèn)為一個(gè)重要的切入點(diǎn)是共融機(jī)器人,即實(shí)現(xiàn)機(jī)器人與人、環(huán)境以及機(jī)器人之間的共融,”丁漢說,“例如無人機(jī)、海陸空協(xié)同等機(jī)器人和機(jī)器人共融的形式,共融機(jī)器人將是未來的一個(gè)重要發(fā)展方向。”
丁漢還覺得,從機(jī)器人的發(fā)展趨勢(shì)來看,未來機(jī)器人對(duì)環(huán)境的適應(yīng)性和對(duì)作業(yè)的自主性將不斷增強(qiáng),“人”的因素也會(huì)不斷增加。以前的工業(yè)機(jī)器人基本依靠編程和試教,未來則有望實(shí)現(xiàn)自我學(xué)習(xí)、自我編程和自我規(guī)劃。
不過,與以前的工業(yè)機(jī)器人相比,未來機(jī)器人的發(fā)展面臨著很大的挑戰(zhàn)。首先是核心技術(shù)中的大腦部分,必須模擬人的大腦,實(shí)現(xiàn)大規(guī)模數(shù)據(jù)采集、實(shí)時(shí)處理,支持機(jī)器人的交互能力和全場(chǎng)景應(yīng)用。以前的工作主要是手眼協(xié)同,未來則可能是手眼腦協(xié)同。其次是小腦部分,要保證行為表征、協(xié)同的自主能力以及交互能力,完成生物體復(fù)雜的運(yùn)動(dòng)控制。再者是機(jī)件的本體,以前的機(jī)器人都是剛體機(jī)器人,只能完成固定工作,未來可能會(huì)走向剛?cè)峤Y(jié)合,使機(jī)器人更加靈巧,因?yàn)槿梭w的骨骼就是剛?cè)峤Y(jié)合的。
另外,丁漢也提到,人形機(jī)器人的發(fā)展難點(diǎn)還在于走向通用,即能夠在復(fù)雜場(chǎng)景中自主工作,這仍然具有很大的挑戰(zhàn)性。
“人形機(jī)器人的發(fā)展隨著技術(shù)的進(jìn)步會(huì)不斷走向全自主的方式,但有一個(gè)很大的特點(diǎn),我覺得是能夠帶動(dòng)零部件發(fā)展,會(huì)帶動(dòng)我們國(guó)家本體廠商和下游零部件快速發(fā)展,尤其是在傳感器等方面。”丁漢說道。
總之,人形機(jī)器人的發(fā)展需要產(chǎn)學(xué)研合作,政府、全產(chǎn)業(yè)鏈、高校、企業(yè)共同落地,打造核心技術(shù),才能真正讓人形機(jī)器人賦能經(jīng)濟(jì)高質(zhì)量發(fā)展。未來,人形機(jī)器人在太空、養(yǎng)老、醫(yī)療等各方面都有很好的應(yīng)用場(chǎng)景,還應(yīng)且看且行,不斷探索其發(fā)展?jié)摿Α?/p>
二、林瓊:大語言模型與具身智能技術(shù)驅(qū)動(dòng)下的未來
▲中山大學(xué)教授、鵬城實(shí)驗(yàn)室多智能體與具身智能研究所所長(zhǎng) 林
近期,通用人工智能成為廣泛討論的話題,不少人工智能從業(yè)者一直認(rèn)為,人工智能先有專用領(lǐng)域后有通用領(lǐng)域。“我覺得討論通用人工智能時(shí),應(yīng)該更多從數(shù)字空間和物理空間對(duì)齊的角度考慮,因?yàn)槲覀冮L(zhǎng)期研究數(shù)字空間的圖像識(shí)別、人臉識(shí)別、音頻理解等,而物理空間的機(jī)器人運(yùn)動(dòng)控制在 3D 空間完成,需要考慮如何對(duì)齊這兩個(gè)空間并促進(jìn)通用人工智能的發(fā)展。”林提到。
林覺得,在具身智能之前的人工智能更多是離身智能,而具身智能具有主動(dòng)性、強(qiáng)交互性,是從認(rèn)識(shí)世界走向改造物理世界的跨越。從傳統(tǒng)傳感器構(gòu)成的圖像、視頻、音頻、文本、聲音,到 3D 物理傳感器構(gòu)成的空間,并且能夠讓機(jī)器人主動(dòng)、自適應(yīng)地完成改造世界的任務(wù),這是從離身智能到具身智能的巨大跨越。
這兩年來,大模型在語言和多模態(tài)方面有了顯著發(fā)展,已經(jīng)實(shí)現(xiàn)了相對(duì)標(biāo)準(zhǔn)化的構(gòu)建。但是,面對(duì)新一代復(fù)合機(jī)器人在家居、康養(yǎng)等領(lǐng)域的應(yīng)用,其大腦即決策和推理模型仍處于長(zhǎng)期研究中,如何構(gòu)建感知、規(guī)劃、控制一體化的模型依舊是關(guān)鍵問題,還面臨空間推理能力、長(zhǎng)程任務(wù)規(guī)劃、小腦能力、數(shù)字和仿真等諸多技術(shù)挑戰(zhàn)。
針對(duì)具身智能的關(guān)鍵技術(shù),林總結(jié)了以下了四個(gè)方面:一是傳統(tǒng)感知技術(shù),從計(jì)算機(jī)視覺、多模態(tài)感知,到主動(dòng)感知,包括物理傳感器和真實(shí)世界的感知模型;二是任務(wù)規(guī)劃和決策方面的交叉技術(shù),語言模型和運(yùn)動(dòng)規(guī)劃、機(jī)器人領(lǐng)域的融合;三是虛實(shí)融合,包括圖形學(xué)、機(jī)器人學(xué)和強(qiáng)化學(xué)習(xí)中的虛實(shí)遷移,將數(shù)字空間訓(xùn)練的模型與真實(shí)世界對(duì)齊;四是打造自主可控的具身智能生態(tài)。
三、深度對(duì)話:面向人形機(jī)器人的未來
在遠(yuǎn)見者大會(huì)現(xiàn)場(chǎng),包括機(jī)器人前瞻在內(nèi)的多家行業(yè)媒體與現(xiàn)場(chǎng)美的高管、專家人士等進(jìn)行了深入采訪交流,討論了美的在AI方面的戰(zhàn)略舉措,以及目前在大模型、機(jī)器人特別是人形機(jī)器人方面的最近研究進(jìn)展。
問題:目前美的在 AI 領(lǐng)域的重點(diǎn)工作有哪些?
張小懿:美的確實(shí)非常重視智能化,前段時(shí)間還把 AI 作為集團(tuán)戰(zhàn)略方向?qū)iT發(fā)文強(qiáng)調(diào)以起引導(dǎo)作用。目前在做的事情包括:
一是繼續(xù)深化應(yīng)用原有判決式 AI、分析型 AI、大數(shù)據(jù)等各種基礎(chǔ),并在此基礎(chǔ)上借助 AIGC 發(fā)展推動(dòng)相關(guān)工作。具體來說,首先要做好 AI 就得有基礎(chǔ)設(shè)施,所以美的緊鑼密鼓地推動(dòng) AI 基礎(chǔ)設(shè)施建設(shè),其中算力平臺(tái)已由美的軟件工程院發(fā)布且第一版已上線。
其次是算法平臺(tái),包括內(nèi)外部整個(gè)大模型及各種模型的接入,采用用好開源、閉源、買進(jìn)來及自己訓(xùn)練的模型等策略,根據(jù)不同場(chǎng)景用好,算法平臺(tái)和接入平臺(tái)關(guān)鍵在于解決服務(wù)化問題和信息安全問題,這個(gè)平臺(tái)也已上線并正在使用。
再者是提升各種工具的效率,1 到 9 月份在效率提升上有 1 個(gè)多億的成果,畫圖、翻譯等各種工具使用得如火如荼且產(chǎn)生了一定效果,但更希望在此基礎(chǔ)上進(jìn)一步融入每個(gè)業(yè)務(wù)領(lǐng)域、深化到工作中。目前發(fā)現(xiàn)很多機(jī)會(huì),但挑戰(zhàn)也很大,因?yàn)槟P托в萌Q于喂給它的知識(shí),所以正在組織推動(dòng)知識(shí)整理、閉環(huán)、訓(xùn)練、達(dá)標(biāo)融入每個(gè)人日常工作,希望明年或今年晚些時(shí)候在每個(gè)領(lǐng)域都能看到突破性 AI 應(yīng)用。
最終還是希望,我們的產(chǎn)品和服務(wù)能夠搭上 AI 的列車。我們的家庭智能體戰(zhàn)略項(xiàng)目、工廠智能體項(xiàng)目,以及庫(kù)卡機(jī)器人在內(nèi),現(xiàn)在都在積極推動(dòng)中。
問題:美的正在推進(jìn)業(yè)務(wù)層面的AI應(yīng)用,家庭智能體和工業(yè)智能體兩個(gè)戰(zhàn)略項(xiàng)目正在推進(jìn)中,能透露一下家庭智能體和工業(yè)智能體兩個(gè)戰(zhàn)略項(xiàng)目里包含哪些具體內(nèi)容以及戰(zhàn)略目標(biāo)嗎?去年美的發(fā)布過美言大模型,能否透露一下美言大模型目前的應(yīng)用進(jìn)展以及最新的目標(biāo)?在人形機(jī)器人領(lǐng)域,美的有沒有考慮過從哪些角度切入?
張小懿:這兩個(gè)戰(zhàn)略項(xiàng)目全集團(tuán)很多部門都參與,如家庭智能體包括從中央研究院到每個(gè)事業(yè)部的研發(fā)部、AI 研究院及各個(gè)領(lǐng)域,涉及提供各方面數(shù)據(jù)進(jìn)行培訓(xùn)和訓(xùn)練,最終要與家庭場(chǎng)景和用戶使用聯(lián)系起來,會(huì)改變硬件和軟件形態(tài),工廠智能體也一樣,牽扯美的所有研發(fā)體系人員。
關(guān)于美言大模型,自從去年發(fā)布以來都還在持續(xù)提升和應(yīng)用,現(xiàn)在有幾萬臺(tái)設(shè)備搭載美言大模型走進(jìn)千家萬戶,到 11 月份差不多會(huì)有幾十萬臺(tái)設(shè)備上市,希望進(jìn)一步推廣美言大模型,能夠給用戶帶來與原來完全不同的交互體驗(yàn)。
衛(wèi)昶:美的在人形機(jī)器人方面做了一些初步探索,目前主要在核心零部件方面。