展會(huì)信息港展會(huì)大全

Nature最新封面:AI戰(zhàn)勝了人類世界冠軍,創(chuàng)下最快無人機(jī)競速記錄
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-08-31 10:40:40   瀏覽:29584次  

導(dǎo)讀:人工智能(AI)再次戰(zhàn)勝了人類冠軍。 這一次,是在無人機(jī)競速領(lǐng)域。 來自蘇黎世大學(xué)機(jī)器人與感知研究組(Robotics and Perception Group)的 Elia Kaufmann 博士團(tuán)隊(duì)及其英特爾團(tuán)隊(duì)聯(lián)合設(shè)計(jì)了一種自動(dòng)駕駛系統(tǒng)Swift ,該系統(tǒng)駕駛無人機(jī)的能力可在一對一冠軍...

人工智能(AI)再次戰(zhàn)勝了人類冠軍。

這一次,是在無人機(jī)競速領(lǐng)域。

來自蘇黎世大學(xué)機(jī)器人與感知研究組(Robotics and Perception Group)的 Elia Kaufmann 博士團(tuán)隊(duì)及其英特爾團(tuán)隊(duì)聯(lián)合設(shè)計(jì)了一種自動(dòng)駕駛系統(tǒng)Swift,該系統(tǒng)駕駛無人機(jī)的能力可在一對一冠軍賽中戰(zhàn)勝人類對手。

這一重磅研究成果,剛剛以封面文章的形式發(fā)表在了最新一期的Nature雜志上。

圖|最新一期 Nature 封面。(來源:Nature)

在一篇同期發(fā)表在 Nature 上的新聞與觀點(diǎn)文章中,荷蘭代爾夫特理工大學(xué)的研究院 Guido de Croon 教授寫道,“Kaufmann 等人的研究是機(jī)器人學(xué)家克服現(xiàn)實(shí)差距的一個(gè)很好的案例。盡管 Swift 使用 AI 學(xué)習(xí)技術(shù)和傳統(tǒng)工程算法的巧妙組合進(jìn)行訓(xùn)練,但該系統(tǒng)應(yīng)該在一個(gè)更真實(shí)多變的環(huán)境中進(jìn)一步開發(fā),從而充分釋放這項(xiàng)技術(shù)的潛力。”

盡管如此,研究團(tuán)隊(duì)表示,該研究標(biāo)志著移動(dòng)機(jī)器人學(xué)和機(jī)器智能的一個(gè)里程碑,或可啟發(fā)在其他物理系統(tǒng)中部署基于混合學(xué)習(xí)的解決方案,如自動(dòng)駕駛的地面車輛、飛行器和個(gè)人機(jī)器人。

融合 AI 與工程算法的智能訓(xùn)練

當(dāng)前,基于深度強(qiáng)化學(xué)習(xí)的人工智能(AI)系統(tǒng)在雅達(dá)利(Atari)游戲、國際象棋、《星際爭霸》和 GT 賽車(Gran Turismo)等游戲中已經(jīng)超越了人類冠軍。然而,這些成就全部發(fā)生在虛擬環(huán)境中,而非真實(shí)世界中。

無人機(jī)競速對經(jīng)驗(yàn)飛行員和 AI 都具挑戰(zhàn),但 AI 而言,更具挑戰(zhàn)性。因?yàn)樵谔摂M環(huán)境中,資源幾乎是無限的,而轉(zhuǎn)向現(xiàn)實(shí)世界意味著必須使用有限的資源。對于無人機(jī)來說,情況尤為如此,因?yàn)槿〈祟愶w行員的傳感器和計(jì)算設(shè)備必須被搭載到空中。

另外,現(xiàn)實(shí)世界比虛擬世界更加不可預(yù)測。雖然模擬的比賽無人機(jī)可以按照預(yù)先編程的軌跡完美地行駛,但對一個(gè)無人機(jī)發(fā)出的單一指令可能產(chǎn)生多種效果,影響難以預(yù)測,對于通過 AI 訓(xùn)練的無人機(jī)尤為復(fù)雜。

傳統(tǒng)的端到端學(xué)習(xí)方法難以將虛擬環(huán)境的映射轉(zhuǎn)移到現(xiàn)實(shí)世界,虛擬和現(xiàn)實(shí)兩者之間存在著現(xiàn)實(shí)差距,而現(xiàn)實(shí)差距構(gòu)成了機(jī)器人領(lǐng)域中主要的挑戰(zhàn)之一。

在該研究中,Swift 系統(tǒng)通過將 AI 學(xué)習(xí)技術(shù)與傳統(tǒng)工程算法融合,實(shí)現(xiàn)了智能訓(xùn)練。首先,該系統(tǒng)通過人工神經(jīng)網(wǎng)絡(luò)處理無人機(jī)從相機(jī)中獲取的圖像,從而精準(zhǔn)地檢測到門的角落。然后,利用雙目視覺軟件用來計(jì)算無人機(jī)的速度。

Swift 系統(tǒng)的創(chuàng)新之處在于另一個(gè)人工神經(jīng)網(wǎng)絡(luò),將無人機(jī)的狀態(tài)映射到調(diào)整推力和旋轉(zhuǎn)速率的命令。利用強(qiáng)化學(xué)習(xí),通過模擬中的試錯(cuò)過程來優(yōu)化從環(huán)境中獲得的獎(jiǎng)勵(lì)。在這個(gè)算法中,該系統(tǒng)采用了強(qiáng)化學(xué)習(xí),而非端到端學(xué)習(xí),從而可以通過抽象概念來彌合現(xiàn)實(shí)與模擬之間的差距。

由于狀態(tài)編碼的抽象層次高于原始圖像,強(qiáng)化學(xué)習(xí)模擬器不再需要復(fù)雜的視覺環(huán)境。這一優(yōu)化減少了模擬系統(tǒng)與真實(shí)系統(tǒng)之間的差異,提升了模擬速度,使得系統(tǒng)能夠在大約50 分鐘內(nèi)完成學(xué)習(xí)。

據(jù)論文描述,Swift 由兩個(gè)關(guān)鍵模塊組成:observation policy 和 control policy。其中,observation policy 由一個(gè)視覺慣性估計(jì)器和一個(gè)門檢測器組成,可以將高維視覺和慣性信息轉(zhuǎn)化為任務(wù)特定的低維編碼;control policy 由一個(gè)兩層感知器表示,可以接受低維編碼,并將其轉(zhuǎn)化為無人機(jī)指令。

超越人類飛行員的速度和性能

此次比賽的賽道是由一位外部世界級 FPV(第一人稱主視角)飛行員設(shè)計(jì)的。賽道包括七個(gè)正方形的門,排列在一個(gè) 30×30×8 米的空間內(nèi),組成了一圈長達(dá) 75 米的賽道。

此外,該賽道具有特色鮮明且具有挑戰(zhàn)性的機(jī)動(dòng)動(dòng)作,包括 Split-S 等。即使發(fā)生碰撞,只要飛行器能夠繼續(xù)飛行,飛行員依舊可以繼續(xù)比賽。如果發(fā)生碰撞且兩架無人機(jī)均無法完成賽道,距離更遠(yuǎn)的無人機(jī)獲勝。

Swift 與 Alex Vanover(2019 年無人機(jī)競賽聯(lián)盟世界冠軍)、Thomas Bitmatta(2019 年 MultiGP 冠軍)和 Marvin Schaepper(3X Swiss 冠軍)等人進(jìn)行了多場比賽。

其中,Swift 在與 A. Vanover 的 9 場比賽中贏得了 5 場,在與 T. Bitmatta 的 7 場比賽中贏得了 4 場,在與 M. Schaepper 的 9 場比賽中贏得了 6 常

另外,Swift 共有 10 次失利,其中 40% 因與對手碰撞,40% 因與門碰撞,20% 因比人類飛行員飛行較慢。

總體而言,Swift 在與每位人類飛行員的大多數(shù)比賽中取得了勝利。另外,Swift 還創(chuàng)下了最快的比賽時(shí)間記錄,比人類飛行員 A. Vanover 的最佳成績快了半秒鐘。

從數(shù)據(jù)分析中可以看出,Swift 在整體上比所有人類飛行員都要快,尤其在起飛和緊急轉(zhuǎn)彎等關(guān)鍵部分表現(xiàn)更為出色。Swift 的起飛反應(yīng)時(shí)間更短,平均比人類飛行員提前 120 毫秒。而且,Swift 的加速度更大,在第一個(gè)門處達(dá)到更高的速度。

此外,Swift 在急轉(zhuǎn)彎時(shí)表現(xiàn)出更緊密的機(jī)動(dòng)動(dòng)作,這可能是因?yàn)樗谳^長時(shí)間尺度上優(yōu)化了軌跡。與此相反,人類飛行員更傾向于在較短時(shí)間尺度內(nèi)規(guī)劃動(dòng)作,最多考慮到未來一個(gè)門的位置。

此外,Swift 在整體賽道上實(shí)現(xiàn)了最高的平均速度,找到了最短的比賽線路,并成功地將飛行器保持在極限附近飛行。在時(shí)間試驗(yàn)中,Swift 與人類冠軍進(jìn)行比較,自主無人機(jī)表現(xiàn)出更加一致的圈速,平均值和方差都較低,而人類飛行員的表現(xiàn)則更加因個(gè)體情況而異,平均值和方差較高。

綜合分析表明,自主無人機(jī) Swift 在比賽中展現(xiàn)出了出色的性能,不僅在速度上表現(xiàn)優(yōu)越,還在飛行策略上具備獨(dú)特的特點(diǎn),使其能夠在整個(gè)比賽中保持高水平的表現(xiàn)。

不只是無人機(jī)競速

這項(xiàng)研究探索了基于來自物理環(huán)境的嘈雜和不完整傳感輸入的自主無人機(jī)競速,展示了一個(gè)自主物理系統(tǒng)在競速中取得了冠軍級的表現(xiàn),有時(shí)甚至可以超越人類世界冠軍,突顯了機(jī)器人在受歡迎體育項(xiàng)目中達(dá)到世界冠軍級表現(xiàn)的重要意義,為機(jī)器人技術(shù)和智能取得了重要里程碑。

然而,與人類飛行員相比,研究中的系統(tǒng)并未經(jīng)過撞擊后的恢復(fù)訓(xùn)練。這限制了系統(tǒng)在撞擊后繼續(xù)飛行的能力,而人類飛行員可以在硬件損壞的情況下繼續(xù)競賽。

另外,與人類飛行員相比,Swift 系統(tǒng)對環(huán)境變化的適應(yīng)能力較弱,使用的相機(jī)刷新率較低;盡管該方法在自主無人機(jī)競速中表現(xiàn)優(yōu)異,但其在其他現(xiàn)實(shí)系統(tǒng)和環(huán)境中的泛化能力尚未充分探究。

顯然,Kaufmann 及其團(tuán)隊(duì)的成就不僅僅局限于無人機(jī)競速領(lǐng)域,這項(xiàng)技術(shù)或許可能會(huì)在軍事應(yīng)用中找到用武之地。而且,他們的技術(shù)可使無人機(jī)更平穩(wěn)、更快速、更長程,有助于機(jī)器人在駕駛、清潔、檢查等領(lǐng)域更有效地利用有限的資源。

但要實(shí)現(xiàn)這些目標(biāo),研究團(tuán)隊(duì)依然需要解決諸多挑戰(zhàn)。正如 Croon 在評論文章中所說,“為了在任何競賽環(huán)境中都能打敗人類飛行員,該系統(tǒng)必須能應(yīng)對外部干擾,如風(fēng),光照條件變化,定義不太清晰的各種門,其他競速無人機(jī)和許多其他因素。”

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港