展會信息港展會大全

工業(yè)機器人,因為 AI 迎來 「智能時代」
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-02 21:22:20   瀏覽:8968次  

導(dǎo)讀:編者按: 從 ChatGPT 開始,整個世界都為生成式 AI 瘋狂不已,當大模型開始有能力「像人一樣思考」,那么造一臺真正智能的機器的時代,是否也已經(jīng)到來。 從伊隆馬斯克的特斯拉,再到 OpenAI、微軟和亞馬遜,幾乎所有 AI 巨頭都對人形機器人行業(yè)押下重注。 不...

編者按:

從 ChatGPT 開始,整個世界都為生成式 AI 瘋狂不已,當大模型開始有能力「像人一樣思考」,那么造一臺真正智能的機器的時代,是否也已經(jīng)到來。

從伊隆馬斯克的特斯拉,再到 OpenAI、微軟和亞馬遜,幾乎所有 AI 巨頭都對人形機器人行業(yè)押下重注。

不過,具身智能在真正進入千萬家庭之前,他們的第一個真正的應(yīng)用場景,反而可能是工廠讓工業(yè)機器人因為 AI 而具備更高的智能,才可能是具身智能發(fā)展起來的根本。而人們頭腦中想象的人形機器人,可能并不是具身智能工業(yè)機器人的最佳形態(tài)。

為此,微億智造科技有限公司 CTO 趙何博士、上海捷勃特機器人有限公司 CTO 賀巖,前者主攻工業(yè) AI+機器人智能控制,后者是專業(yè)的工業(yè)機器人研發(fā)及制造商,兩位深耕在 AI 和機器人領(lǐng)域的專家,從機器人智能的歷史出發(fā),撰文論述為什么具身智能工業(yè)機器人的時代,已經(jīng)到來。

01「你好,具身智能」

具身智能 :「探索-利用」的學習范式

具身智能理論根源于「具身認知」(Embodied Recognition),包括人類在內(nèi)的一切智能體的認知能力是由智能體自身結(jié)構(gòu)決定的,并在此基礎(chǔ)上構(gòu)建自己的世界模型。而這種認知又直接影響智能體的高級心理活動,諸如:推理,決策等。

從認知產(chǎn)生的機制到智能體決策依賴的世界模型,均受制于智能體具體的物質(zhì)形態(tài)。具身智能理論挑戰(zhàn)了包括笛卡爾二元論在內(nèi)的諸多認知理論,建立起了將「身」與「智」統(tǒng)一的理論框架,將智能體和周圍環(huán)境看作一個系統(tǒng),通過「軀體」與外界環(huán)境進行互動,再從外界對智能體的動作產(chǎn)生的反饋獲取信息,建立對環(huán)境的認知。整個認知過程遵循「探索-利用」(exploration-exploitation)的范式。

具身智能理論強調(diào)了智能體與環(huán)境之間的強關(guān)聯(lián),「智能」本質(zhì)上是這兩個實體的總和。以建立這個總和為共同目的,具身智能體必須具有一些最基本的通用能力。包括:

空間認知能力

空間認知能力是這個世界里智能體的基本能力之一,這個過程其實是智能體對外部物理世界的實體先進行「解構(gòu)」,然后用抽象的幾何模型在心理層面對外部世界進行「建構(gòu)」的過程。

移動導(dǎo)航能力

如果空間認知能力是智能體對宏觀世界的抽象,那么移動導(dǎo)航能力則是智能體對自身所處的微觀環(huán)境的適應(yīng)。通過「探索-利用」的學習范式發(fā)現(xiàn)知識,積累經(jīng)驗,提高智能,在自然進化中勝出。

具身智能

硬件為「智能」而生

長期以來,人工智能的發(fā)展主要致力于如何在通用的硬件上實現(xiàn)更好的智能,而沒有充分考慮如何以智能需求為導(dǎo)向驅(qū)動新型硬件的開發(fā)。也許,將「硬件為智能而生」提升到具身智能發(fā)展應(yīng)秉持的原則高度并不為過。從近些年的行業(yè)發(fā)展來看,這種趨勢其實已經(jīng)初見端倪。可以預(yù)見,具身智能的發(fā)展會將這一原則擴散到所有硬件的設(shè)計生產(chǎn)中,促使應(yīng)用從「自發(fā)」走向「自覺」。

以具身智能為共同理論基礎(chǔ)的硬件,它們在基本功能的要求上存在共性,歸納起來表現(xiàn):在多模態(tài)的環(huán)境認知及通過語言、視覺方式的交互能力;智能的任務(wù)學習和理解能力,并基于內(nèi)部世界模型把任務(wù)轉(zhuǎn)化成內(nèi)部結(jié)構(gòu)化表示;在自身軟硬件系統(tǒng)上,實現(xiàn)高度自主的智能決策能力,以應(yīng)對全新、突發(fā)的情況;智能高效的單任務(wù)執(zhí)行能力,基本不需要、或僅偶爾需要非常少量的人工干預(yù);以及智能的多任務(wù)切換能力。

具身智能理論明確了智能與軀體之間的耦合,論述了智能體和環(huán)境之間的關(guān)系。因此,在設(shè)計具身智能產(chǎn)品時,不能把它從任務(wù)環(huán)境中剝離出來孤立地考慮。

02 你好,具身智能工業(yè)機器人

早期工業(yè)機器人主要用于重復(fù)性、單一性的任務(wù)。隨著新技術(shù)的發(fā)展,逐漸實現(xiàn)自動化,能執(zhí)行更復(fù)雜、精細的任務(wù)。然而發(fā)展到今天,工業(yè)機器人正遭遇技術(shù)發(fā)展瓶頸,面臨成本、復(fù)雜性、靈活性和人機協(xié)作等困難和挑戰(zhàn)。

與此同時人工智能技術(shù)迅猛發(fā)展,深度學習技術(shù)在語音及圖像識別、自然語言處理等任務(wù)上取得了突破性的進展。近兩年多模態(tài)大模型技術(shù)的發(fā)展,更是奠定了實現(xiàn)人機自然交互的技術(shù)基矗「人工智能+」成為積極探索的領(lǐng)域。

一邊是早已發(fā)展成熟、遭遇瓶頸、苦苦尋找新發(fā)展的行業(yè);一邊是如日中天、帶著變革、顛覆的光環(huán)急于尋找用武之地的新興技術(shù)。人類固有的敏感和直覺告訴我們,歷史到了一個迫切需要將兩者融合的時刻,結(jié)出最驚艷的果實:你好,具身智能工業(yè)機器人!

以具身智能理論作為指導(dǎo),將成熟的工業(yè)機器人與新興的人工智能技術(shù)融合,誕生了「具身智能工業(yè)機器人」(Embodied Intelligent Industrial Robots, EIIR)。

EIIR 的本質(zhì):解放「人」超越「人」

EIIR 的生存環(huán)境就是工業(yè)生產(chǎn)環(huán)境。充分考察 EIIR 的生存環(huán)境可以幫助我們識別其應(yīng)該具有的形態(tài)。由此我們可以得出結(jié)論:人形機器人不是 EIIR 的形態(tài)。相對于自然環(huán)境,生產(chǎn)環(huán)境是一個閉合、簡單的環(huán)境。從邏輯上講,「人形」作為開放環(huán)境下的產(chǎn)物天然不會是閉合環(huán)境最佳的軀體形態(tài)。其次,生產(chǎn)環(huán)境是人為設(shè)計制造出來的,如果可以由機器自主完成而不需要人的參與,那么對應(yīng)的生產(chǎn)環(huán)境可以設(shè)計成對機器更加友好,而完全不用考慮人類體形的局限,從而讓生產(chǎn)過程更加高效可靠。

「人形」適配的是人的生存環(huán)境,而非工業(yè)的生產(chǎn)環(huán)境 | 來源:視覺中國

EIIR 需要替代的是人在生產(chǎn)過程中被異化后的投影,不是人的本質(zhì),更不是人的外形。進一步,EIIR 還需要把替代的人類能力在生產(chǎn)環(huán)境中放大、強化,充分利用 EIIR 作為機器的同時,發(fā)揮出超出人類的性能,使得將人類從生產(chǎn)活動中解放出來成為可能和必要。相比精確的自動化控制,EIIR 可以更好的實現(xiàn)真正的無人化生產(chǎn),正是因為:

生產(chǎn)場景的不確定性

從定性角度來看,工業(yè)場景在宏觀上是閉合有界的。但在微觀層面,工業(yè)場景下也存在諸多不確定因素,是一個定量上開放的環(huán)境,這就需要有靈巧的智能能力來應(yīng)對這類不確定性。

生產(chǎn)環(huán)境閉合邊界不一

不同的生產(chǎn)任務(wù)都有與之對應(yīng)確定的生產(chǎn)環(huán)境,它們之間閉合的邊界是不一樣的。生產(chǎn)任務(wù)間切換的可能性是開放、近乎無限的,這就要求足夠高的智能水平或在少量人類幫助下,完成這種環(huán)境的切換和適應(yīng)。

標準產(chǎn)品具有標準智能

標準產(chǎn)品具有一定水平的標準智能,使得它在被部署到具體的生產(chǎn)場景時,可以較低的時間、人力成本學會具體的生產(chǎn)任務(wù),盡可能適用不同的生產(chǎn)場景,使大規(guī)模應(yīng)用成為可能。

EIIR 的模樣:具象化的具身智能

如果對 EIIR 的本質(zhì)沒有太多的疑問,不妨想象一下 EIIR 的模樣。具身智能理論認為智能體由感知系統(tǒng)、運動系統(tǒng)和世界模型三部分組成,這個論述對于 EIIR 仍然適用。為了更好的說明,我們以微億智造的技術(shù)探索實踐為例,進一步展開探討。微億智造作為工業(yè) AI 領(lǐng)域先行者,長期布局「視覺 AI+機器人智能控制」全棧技術(shù),深耕工業(yè)場景,持續(xù)技術(shù)創(chuàng)新。

感知系統(tǒng)多模態(tài)泛傳感器系統(tǒng)

通過合理選型、配置,輔以高效智能的數(shù)據(jù)算法,建立起比人類強大得多的感知系統(tǒng),無論是周邊環(huán)境還是 EIIR 自身,都將進行連續(xù)、不間斷的狀態(tài)感知,為決策提供精準的信息。如在工業(yè)檢測中挑戰(zhàn)最大的外觀缺陷檢測領(lǐng)域,微億智造樹立了機器感知的典范:識別和分析對象姿態(tài)和特征,自主生成檢測序列,以高精度的圖像傳感器來追蹤形態(tài)不定、位置不定的缺陷,實現(xiàn)柔性的、超越人類的缺陷檢測能力。并在此基礎(chǔ)上,基于動力學原理進行建模,通過信息反欄認知」自身能力,并實時更新。

通過「感知系統(tǒng)」對環(huán)境及自身持續(xù)采樣,并基于聯(lián)合認知進行決策

運動系統(tǒng)閉環(huán)控制系統(tǒng)

打通、融合上下層系統(tǒng),實現(xiàn)狀態(tài)反饋和控制的聯(lián)合處理、合并計算,共同優(yōu)化、協(xié)作以滿足靈活、精準、快速的要求。以「關(guān)節(jié)電機」為例,其「視覺伺服」系統(tǒng)由多個控制器、按層級嵌套組合而成,每一層都有自身需要優(yōu)化的控制指標與對象。從整體到局部逐層細化,實現(xiàn)閉環(huán)控制。比如微億智造自研的整套多軸實時控制系統(tǒng),結(jié)合動力學和運動學算法,計算時間和狀態(tài)最優(yōu)的運動軌跡,并以毫秒級速度閉環(huán)運動控制,以 10 毫秒級別的速度使用圖像模型完成閉環(huán)運動的規(guī)劃。

通過「視覺伺服」實現(xiàn)感知系統(tǒng)與運動系統(tǒng)的閉環(huán)控制

世界模型對生產(chǎn)環(huán)境的總結(jié)和抽象

世界模型是智能體根據(jù)自身結(jié)構(gòu)特點構(gòu)建起來、用于解釋世界的認知框架。它是動態(tài)變化的,智能體與環(huán)境的每一次互動都在不同程度上影響著它。而大模型技術(shù)結(jié)合工業(yè)數(shù)據(jù)又為世界模型提供了一個共享的基礎(chǔ)版本,故且稱之為「基礎(chǔ)世界模型」。當然,這個「基礎(chǔ)世界模型」賦予了 EIIR 強大的理解能力,能夠通過人類習慣的模式與人類進行信息交換。而人類訓(xùn)練 EIIR 的方式也發(fā)生了根本性變化,只需通過自然語言、圖片、視頻、動作示教等,就可與 EIIR 建立起「示教-學習-反攔的互動模式,通過多輪對話將知識進行傳遞。這樣的持續(xù)學習會一直貫穿在 EIIR 整個生命周期里。

通過「基礎(chǔ)世界模型」建立「示教-學習-反攔的互動模式

EIIR 的關(guān)鍵:智能化柔性適配

如何讓標準、通用的 EIIR 產(chǎn)品很快具備執(zhí)行具體生產(chǎn)任務(wù)的能力,或者如何把人類的專業(yè)技能輕便地轉(zhuǎn)移到 EIIR 上,核心在于通過「人機交互」實現(xiàn)「智能化柔性適配」。以 ChatGPT 為例,它第一次在人和機器之間建立起了一種高效的溝通方式,從根本上打破了人機交流的障礙,變革了人機交互范式。

而大模型加持下的 EIIR 將徹底逆轉(zhuǎn)人機關(guān)系。人類可以用自身習慣的方式與 EIIR 溝通,如自然語言、肢體語言、動作、行為示范等,從根本上打破人與機器間的語義隔離。軟件方面,大模型的加持使得 EIIR 具備了快速學習的能力,保證了智能上的柔性。隨著芯片技術(shù)的發(fā)展,軟硬件的功能邊界將變得模糊,「軟件硬化」的趨勢將會越來越明顯。伴隨更強大的運算能力及集成密度,EIIR 的算力密度也將實現(xiàn)質(zhì)的提升。機械構(gòu)型方面,新材料、新技術(shù)的廣泛應(yīng)用將為 EIIR 提供更多不同的外部形態(tài),甚至根據(jù)任務(wù)的要求實時調(diào)整機械結(jié)構(gòu)。這種能力最忠實地還原了具身智能理論的根本要求,實現(xiàn)了智能和機體最深程度的融合。

03 EIIR,未來已來

EIIR 的誕生和歷史使命就是接管人類社會物質(zhì)資料的生產(chǎn),為人類的發(fā)展提供持續(xù)的物質(zhì)支持,這也是它唯一的歷史歸宿。作為機器,隨著技術(shù)的進步,EIIR 的發(fā)展勢必將循序漸進。前期階段,它將長期和人類共處在同一生產(chǎn)環(huán)境下。伴隨技術(shù)的發(fā)展,其智能化程度會越來越高,越來越多時候?qū)⒉恍枰c人協(xié)作就可獨立完成任務(wù)。而發(fā)展的高級階段,將會實現(xiàn)真正的「無人工廠」。

到這個階段,工廠、產(chǎn)線的組織形式將完全不同于現(xiàn)在,而人類也將實現(xiàn)從使之異化的物質(zhì)生產(chǎn)中徹底解放出來。這對人類社會的發(fā)展所起的作用是無法估量的,將極大加快人類自我解放的步伐。誠然,這會是一個漫長的過程,但值得我們期待,值得我們努力,因為它終將到來!

贊助本站

人工智能實驗室

相關(guān)熱詞: 工業(yè) 機器人 因為 迎來 智能 時代

AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港