展會信息港展會大全

英國公司使用類ChatGPT技術訓練無人車,讓車輛在街頭接受實時AI訓練
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-15 19:15:22   瀏覽:11065次  

導讀:初創(chuàng)公司 Wayve 的無人駕駛汽車現(xiàn)在支持了語音交流,乘客可以詢問系統(tǒng)的駕駛決策,并得到答案。背后的想法是使用與 ChatGPT 相同的技術來幫助訓練無人駕駛汽車。 該公司將其現(xiàn)有的自動駕駛軟件與一個大型語言模型相結合,創(chuàng)建了一個名為 LINGO-1 的混合模型...

初創(chuàng)公司 Wayve 的無人駕駛汽車現(xiàn)在支持了語音交流,乘客可以詢問系統(tǒng)的駕駛決策,并得到答案。背后的想法是使用與 ChatGPT 相同的技術來幫助訓練無人駕駛汽車。

該公司將其現(xiàn)有的自動駕駛軟件與一個大型語言模型相結合,創(chuàng)建了一個名為 LINGO-1 的混合模型。LINGO-1 可以將視頻數(shù)據(jù)和駕駛數(shù)據(jù)(汽車每秒采取的行動),與捕捉汽車所見所做的自然語言描述同步。

(來源:WAYVE)

這家總部位于英國的公司在過去幾年里取得了一系列突破。2021 年,它展示了自己的車輛可以在倫敦街頭接受人工智能訓練,并在英國其他四個城市使用人工智能駕駛汽車,這一挑戰(zhàn)通常需要進行重大的工程再造。2022 年,它使用同樣的人工智能駕駛了不止一種類型的車輛,這也是該行業(yè)的首創(chuàng),F(xiàn)在它實現(xiàn)了和汽車聊天。

在該公司本周給我的一個演示中,其 CEO 艾利克斯肯德爾(Alex Kendall)播放了一輛捷豹 I-PACE 汽車拍攝的視頻,然后跳到視頻的一個隨機時間點,并開始提問:“天氣怎么樣?”答:天氣多云。“你看到了什么危險?”答:左邊有一所學校。“你為什么停車?”答:因為紅綠燈是紅色的。

肯德爾說:“在過去的幾周里,我們看到了一些了不起的事情。我從來沒有想過要問這樣的問題,但是你看這個。”他輸入:“右邊的建筑有多少層?”答:三層。

“看到?jīng)]!”他說,聽起來像個驕傲的爸爸。“我們從未訓練它去實現(xiàn)這一點。這真的讓我們感到驚訝。我們認為這是人工智能安全方面的突破。”

“我對 LINGO-1 的能力印象深刻,”美國加州大學伯克利分校的機器人研究員、機器人公司 Covariant 的聯(lián)合創(chuàng)始人皮特阿比爾(Pieter Abbeel)表示,他嘗試了這項技術的演示。阿比爾問 LINGO-1,如果“如果燈是綠色的,你會怎么辦?”

“它幾乎每次都給出了非常準確的答案,”他說。

Wayve 希望通過詢問自動駕駛軟件的每一步行為,準確了解其汽車為什么以及如何做出某些決定。大多數(shù)時候,汽車開得很好。但當汽車行駛出現(xiàn)問題時,就可能很難辦,正如Cruise 和 Waymo 等行業(yè)領先者所發(fā)現(xiàn)的那樣。

這兩家公司都在美國幾個城市部署了小規(guī)模的無人駕駛出租車車隊。但技術遠非完美。Cruise 和 Waymo 的汽車發(fā)生了多起輕微碰撞(據(jù)報道 Waymo 殺死了一只狗),并在不知所措時阻礙了交通。

舊金山官員聲稱,2023 年 8 月兩輛 Cruise 汽車擋住了一輛載有一名傷者的救護車,該傷者后來在醫(yī)院不治身亡。Cruise 否認了官方的說法。

Wayve 希望,當自己的汽車做錯了什么時,可以要求它們解釋自己的行為,這將比仔細查看視頻回放或單純查看錯誤報告更快地發(fā)現(xiàn)缺陷。

阿比爾說:“自動駕駛最關鍵的挑戰(zhàn)是安全。有了 LINGO-1 這樣的系統(tǒng),我想你會更好地了解它對駕駛的理解。”他說,這使得弱點識別變得更容易。

肯德爾說,下一步是用語言來訓練汽車。為了訓練 LINGO-1,Wayve 讓其專業(yè)司機團隊,其中一些是前駕駛教練,在駕駛時大聲說話,解釋他們在做什么以及為什么這樣做:他們?yōu)槭裁醇铀伲瑸槭裁礈p速,他們意識到了什么危險。

該公司利用這些數(shù)據(jù)對模型進行微調,為其提供駕駛技巧,就像教練指導人類學員一樣?系聽栒f,告訴汽車如何做某事,而不僅僅是展示它,可以大大加快訓練速度。

Wayve 并不是第一個在機器人技術中使用大型語言模型的公司。其他公司,包括谷歌和 Abbeel 的 Covariant 公司,正在使用自然語言測試或指導家用或工業(yè)機器人。這種混合技術甚至有一個名字:視覺語言動作模型(VLAM,visual-language-action models)。但 Wayve 是第一個將 VLAM 用于自動駕駛的公司。

肯德爾說:“人們經(jīng)常說一圖勝千言,但在機器學習中,情況恰恰相反。幾句話抵得上一千張圖片。”一張圖片包含大量冗余數(shù)據(jù)。他說:“當你開車的時候,你不在乎天空,也不在乎前車的顏色,或者諸如此類的東西。文字可以集中在重要的信息上。”

紐約大學機器人研究員樂瑞爾賓圖(Lerrel Pinto)說:“Wayve 的方法特別有趣且獨特。”他尤其喜歡 LINGO-1 解釋其行為的方式。

但他很好奇當模型瞎編亂造時會發(fā)生什么。“我不相信大型語言模型會完全輸出真實的東西,”他說,“我不確定我是否可以信任它們來接管我的車。”

佐治亞理工學院的研究員烏云普爾愛桑(Upol Ehsan)也有類似的保留意見,他致力于研究讓人工智能向人類解釋其決策的方法。愛桑說:“用簡單的話說,大型語言模型可以生成很棒的廢話。我們需要貼上亮黃色的‘警告’標簽,確保生成的語言不包含‘幻覺’。”

Wayve 非常清楚這些問題,并正在努力使 LINGO-1 盡可能準確。肯德爾說:“我們在任何大型語言模型中都看到了同樣的挑戰(zhàn)。這當然還不完美。”

與非混合模型相比,LINGO-1 的一個優(yōu)勢是,它的回應是基于相關的視頻數(shù)據(jù)的。理論上,這應該使 LINGO-1 更加真實可信。

肯德爾說,這不僅僅是關于汽車的。“人類進化出語言是有原因的:這是我們所知道的、交流復雜話題最有效的方式。我認為智能機器也是如此。我們未來與機器人互動的方式將是通過語言完成的。”

阿比爾對此表示贊同。“我認為我們即將看到機器人技術的革命,”他說。

作者簡介:威爾道格拉斯海文(Will Douglas Heaven)是《麻省理工科技評論》人工智能欄目的高級編輯,他在這里報道新的研究、新興趨勢及其背后的人。此前,他是英國廣播公司(BBC)科技與地緣政治網(wǎng)站 Future Now 的創(chuàng)始編輯,也是 New Scientist 雜志的首席技術編輯。他擁有英國倫敦帝國理工學院計算機科學博士學位,深諳與機器人合作的體驗。

支持:Ren

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港