展會信息港展會大全

華為乾崑智駕真的能讓AI像人一樣開車嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-05 22:49:40   瀏覽:7062次  

導(dǎo)讀:出品|虎嗅智庫 作者|張婷婷 編輯|冀玉潔 頭圖丨視覺中國 4月24日,華為召開發(fā)布會,推出乾ADS 3.0智能駕駛解決方案,圍繞提升駕駛安全性和為用戶釋放時間兩大目標(biāo),致力于打造讓AI像人一樣開車的智駕系統(tǒng)。 乾ADS3.0背后的技術(shù)邏輯,成為智駕從業(yè)人員及團...

出品|虎嗅智庫

作者|張婷婷

編輯|冀玉潔

頭圖丨視覺中國

4月24日,華為召開發(fā)布會,推出乾ADS 3.0智能駕駛解決方案,圍繞提升駕駛安全性和為用戶釋放時間兩大目標(biāo),致力于打造讓AI像人一樣開車的智駕系統(tǒng)。

乾ADS3.0背后的技術(shù)邏輯,成為智駕從業(yè)人員及團隊領(lǐng)導(dǎo)者關(guān)心的話題。

乾ADS3.0是對傳統(tǒng)智能駕駛技術(shù)的一次創(chuàng)新。華為智能駕駛解決方案總裁李文廣對虎嗅智庫表示:華為在智能駕駛領(lǐng)域雖然算是后來者,但他們有信心并敢于挑戰(zhàn)一些別人未曾嘗試過的事情,做到領(lǐng)先。

這些創(chuàng)新,主要體現(xiàn)在ADS3.0全面摒棄BEV,完全基于GOD網(wǎng)絡(luò)實現(xiàn)對道路結(jié)構(gòu)、目標(biāo)障礙物的感知以及場景的理解,同時,使用PDP神經(jīng)網(wǎng)絡(luò),實現(xiàn)預(yù)測決策和規(guī)劃,做到模塊化的端到端網(wǎng)絡(luò)架構(gòu)。而同期的業(yè)界技術(shù)現(xiàn)狀還停留在BEV+transformer的感知范式,對于通用障礙物的識別上存在很大缺陷,要通過白名單的機制實現(xiàn)中國這種復(fù)雜場景的泛化是不現(xiàn)實的,GOD網(wǎng)絡(luò)很有效的解決了這個問題。

值得一提的是,ADS3.0不僅是一個前沿的技術(shù)解決方案,更是一個面向消費者的產(chǎn)品。華為智駕團隊運用IPD(集成產(chǎn)品開發(fā))流程管理體系,并將其與華為一貫的為用戶創(chuàng)造價值的企業(yè)文化相結(jié)合,進(jìn)行ADS3.0的開發(fā)管理,確保產(chǎn)品的質(zhì)量和用戶體驗。

為了更深入了解華為乾ADS3.0背后的技術(shù)邏輯,以及華為是如何運用IPD流程管理體系進(jìn)行產(chǎn)品開發(fā)管理的,虎嗅智庫與華為智能駕駛解決方案總裁李文廣進(jìn)行了深度對話。

以下為華為智能駕駛解決方案總裁李文廣對話精華部分:

01.把激光雷達(dá)用深用好,是多感知融合方案成功的關(guān)鍵

虎嗅智庫:華為做自動駕駛解決方案的初衷是什么,圍繞這樣的初衷,華為選擇了怎樣的技術(shù)路線?

李文廣:回歸本質(zhì),自動駕駛解決方案也是一個to C的產(chǎn)品,我們內(nèi)部討論最多的是它作為一個產(chǎn)品,能給用戶帶來的核心價值是什么?傮w來看,是為了達(dá)成兩個目標(biāo),一個是通過減少碰撞提升安全性,一個是幫用戶釋放時間。

基于這些考量,我們做了很多工作,從傳感器能力提升到算法優(yōu)化,再到數(shù)據(jù)采集和專題訓(xùn)練等,都有配套相應(yīng)的措施。華為做智能駕駛的時候,特斯拉已在智駕行業(yè)里投入了十幾年,是領(lǐng)頭羊,他走的是純視覺路線。但我們基于安全考量,強化安全屬性,還是選擇走多傳感器融合的技術(shù)路線,一開始就采用了激光雷達(dá)、視覺和毫米波雷達(dá)融合的方式。這一點很好理解,在黑夜,特別是對向來車開大燈的場景,視覺檢測能力很受限,而這時激光雷達(dá)卻可以正常工作。

做內(nèi)部技術(shù)決策前,我們也研究了大量碰撞案例,看到很多碰撞案例都是在這種場景下發(fā)生的,我們?nèi)绻x擇純視覺路線,肯定也會遇到同樣的問題。這只是視覺不足的一種場景,視覺在明暗快速變化、目標(biāo)與背景色差不明顯以及空間深度感知上都存在不足。加上華為在光產(chǎn)品技術(shù)和產(chǎn)品化上有很好的積累,通過自研的激光雷達(dá)可以做到ADS系統(tǒng)軟件和傳感器硬件的深度協(xié)同,所以我們選擇了多傳感器融合的技術(shù)路線。

虎嗅智庫:多傳感器融合的技術(shù)路線,國內(nèi)一些新勢力車企也在做,華為的融合感知方案跟他們有哪些不同之處?

李文廣:多傳感器融合也有很多種方案,包括國內(nèi)一些新勢力也都在走這條路線,但是各家差別也很大,主要是對激光雷達(dá)的使用方法和深度不同。簡單舉個例子,2022年,我們合作激光雷達(dá)的伙伴公司跟我們講,他們的激光雷達(dá)在其他車型上都用了大半年,已經(jīng)很成熟了。結(jié)果我們拿來一用,發(fā)現(xiàn)很多問題,比如很多場景下存在大量的噪聲,如果要深度使用根本就不行的,后來通過持續(xù)優(yōu)化很長時間才解決。

伙伴說其他車企沒有反饋這些問題,不知道華為為啥有這么多問題。這個事情說明各家拿到激光雷達(dá)的用法不一樣,可能華為用的更深度一些。

各家對激光雷達(dá)的使用方法和深度不一樣,主要體現(xiàn)在對通用障礙物的檢測和判斷方面。我舉個例子,我們的GOD 2.0網(wǎng)絡(luò)里面深度使用了激光雷達(dá),通過多傳感器的融合做通用障礙物的檢測,雖然不能識別出障礙物具體是什么,但是它能夠告知系統(tǒng),做出反應(yīng)動作。這點從主動安全的測試結(jié)果就可以看出,都帶激光雷達(dá)的車AEB表現(xiàn)卻差別很大,因為有的車的激光雷達(dá)在這種場景下并沒起作用。道理都知道,但要讓激光雷達(dá)深度參與并發(fā)揮好作用其實并不容易,這涉及到如何消除激光雷達(dá)的各種干擾,涉及到大量的軟件和傳感器硬件的協(xié)同,這塊是我們的強項。

虎嗅智庫:GOD網(wǎng)絡(luò)跟特斯拉的Occupancy Network這一套方案有什么不同之處?

李文廣:二者想達(dá)到的目的應(yīng)該是一樣的。因為特斯拉也發(fā)現(xiàn)通過視覺白名單的形式,通過純視覺技術(shù)路線很難識別出各種物體,所以想要通過視覺加上時序的關(guān)系來壘。但純視覺方案天然就不如激光雷達(dá)好,因為它對位置的準(zhǔn)確性、深度的判斷等方面,尤其是在晚上,或者在眩光的情況下都會有很大的問題,激光雷達(dá)能很好的克服這些問題。

GOD2.0網(wǎng)絡(luò)使用了激光雷達(dá),會比Occupancy Network在適用范圍、準(zhǔn)確度等各個方面表現(xiàn)更好。這一點其實很重要,因為系統(tǒng)準(zhǔn)確度或置信度不高的話,就會產(chǎn)生一些誤剎或漏報,比如誤啟動AEB,風(fēng)險很大,所以把這個東西做準(zhǔn)很重要。

02.無圖方案需提升自車感知能力,車位到車位是今年智駕比拼重點

虎嗅智庫:是否去高精地圖仍是業(yè)內(nèi)討論熱點,目前華為的解決方案是怎樣的,跟其他車企或自動駕駛方案解決商有何不同?

李文廣:是否使用高精地圖也是個很重要的技術(shù)路線差異,包括是不是走端到端的技術(shù)路線。

先說高精地圖,其實華為走高精地圖這條路線,在城區(qū)開應(yīng)該是國內(nèi)做的最好也是最早的,我們是在2022年推出的。高精地圖方案其實對車端的道路結(jié)構(gòu)認(rèn)知的要求降低了,相當(dāng)于不用看路都能夠知道前方的靜態(tài)結(jié)構(gòu),包括紅綠燈、桿子、路沿等要素。但我們在做的過程中也發(fā)現(xiàn)很多其它問題,比如地圖變更很頻繁,且是不可控的,高精地圖方案雖然精準(zhǔn),但如果一旦變更就會很危險,因為它要求車端不斷的識別出它的變更。

其實二者是有點悖論的,一方面是按照圖來開就行,對靜態(tài)結(jié)構(gòu)感知能力要求不高,另一方面又要能夠把道路變更都識別出來,這其實對感知能力要求又很高。我們就想:系統(tǒng)有這么強的感知能力了,是否可以不需要高精地圖了?再加上高精地圖推進(jìn)上,投入大,周期也長,更可怕的是花半年好不容易完成制圖的城市,上線時就已經(jīng)變了許多。從這兩個方面考量,我們更希望做一個通用化的東西,靠自車感知能力就能夠開,所以我們選擇去掉高精地圖。

智駕行業(yè)不存在無圖方案,起碼導(dǎo)航地圖是需要的。無圖只是去高精地圖的一種說法。對于如何去高精地圖也有很多做法,ADS在這塊做的與行業(yè)不太一樣。友商基本是找國內(nèi)圖商合作,做的可能是比高精地圖弱化一些,如HD-,或者是比導(dǎo)航地圖更精細(xì),車道級的,如SD+,基于這樣一個圖上去開。我們當(dāng)時定的方案是完全基于導(dǎo)航地圖,更多的依賴自車感知能力來開,屬于難度最大的一條路線,實際落地時間比原計劃有點延期,原計劃是到去年底全網(wǎng)開通,延期到了今年2月。

做智駕是個持久的過程,技術(shù)路線的選擇我們還是要看什么樣的技術(shù)路線能夠更好的支撐好用戶的安全和體驗訴求。智能駕駛的需求和方向是明確的,歸根結(jié)底我們還是要把自身的能力建好,這才是最重要的。

虎嗅智庫:AI大模型在這套方案當(dāng)中發(fā)揮了怎樣的作用?

李文廣:我們在車端叫推理,云端叫訓(xùn)練,現(xiàn)在云端會做一些大模型的處理。車端實時跑出來的一些數(shù)據(jù),其實要做一些大量的數(shù)據(jù)標(biāo)注和訓(xùn)練,數(shù)據(jù)的標(biāo)注和模型的訓(xùn)練對車端跑的結(jié)果很關(guān)鍵。這些用于訓(xùn)練的數(shù)據(jù),對正確性要求很高,數(shù)據(jù)標(biāo)注錯誤率越高,訓(xùn)練的結(jié)果越差,我們就需要思考怎么把這些數(shù)據(jù)標(biāo)注的更真更準(zhǔn)確,這時候可能就會用大模型去做一些標(biāo)注,實現(xiàn)自動化和泛化,因為有時候數(shù)據(jù)量太大了,你也不可能都用人來做。

我們當(dāng)時做高精地圖,需要做大量的數(shù)據(jù)標(biāo)注。2022年峰值的時候,僅標(biāo)注人員就有上千人。后面如果真正的要全國都能開,涉及到的數(shù)據(jù)量更大,單純靠人已經(jīng)應(yīng)付不過來了,所以我們用大模型來做一些自動標(biāo)注。

虎嗅智庫:前不久剛剛更新的ADS2.0方案,所有搭載了華為智駕的這些車型,在全國之內(nèi)一下子都能開了,底層能力來源于哪里?

李文廣:第一,很關(guān)鍵的就是車端的感知能力要足夠的強。我們花了最大量的時間把車端的感知能力,尤其是在道路結(jié)構(gòu)認(rèn)知各方面的能力做好,當(dāng)然在規(guī)控方面,也要針對各種場景把預(yù)測和決策的能力提升上來。

第二,就是要把學(xué)習(xí)能力提升上來。因為剛開始時,基本能力可能只需要保證用戶能夠在這里開,但我們想打造的是一個越開越好的系統(tǒng)?赡軇傞_始比較陌生,智駕表現(xiàn)一般,但是隨著時間的推移會越來越好,這也是我們車往軟件走、往AI走、往智能化走很重要的一個特點。

虎嗅智庫:商用一代預(yù)研一代是華為常走的路子,在感知能力提升方面,未來,3.0版本的融合方案將進(jìn)行哪些優(yōu)化?

李文廣:在2.0版本中,我們引入了GOD網(wǎng)絡(luò),旨在提升智駕系統(tǒng)的性能。在即將到來的3.0版本中,我們將進(jìn)行一次重大升級,將原有的BEV模型及傳感器融合信息全部集成到GOD網(wǎng)絡(luò)中。這一改進(jìn)將使我們的系統(tǒng)能夠更準(zhǔn)確地識別各種通用障礙物,即使對于未知物體也能保持良好的識別效果。

此外,3.0版本將大幅提高系統(tǒng)對物體的位置、距離、精度以及速度的判斷能力。這些性能的提升,不僅基于GOD網(wǎng)絡(luò)的優(yōu)化,也與云端的數(shù)據(jù)處理和訓(xùn)練能力密切相關(guān)。華為騰系統(tǒng)的強大性能,將為大模型的構(gòu)建和智駕系統(tǒng)的完善提供有力支持。

我們計劃在今年推出3.0版本,與此同時,2.0版本中的泊車代駕功能預(yù)計將在6月份開展外部用戶beta。在3.0版本中,我們將進(jìn)一步提升這一功能,使其可使用范圍更廣,能夠處理更多復(fù)雜情況。

目前,我們正在快速迭代城區(qū)方案,并預(yù)計在3.0版本中實現(xiàn)顯著的體驗提升。我們的目標(biāo)是將公開道路和非公開道路完全整合,實現(xiàn)從車位到車位的無縫智駕。這一目標(biāo)雖然已經(jīng)被提出多年,但至今仍未有公司實現(xiàn)。我們期待在今年能夠率先達(dá)成這一里程碑。

虎嗅智庫:從單車智能來看,我們離L3的能力還有多遠(yuǎn),還需要克服哪些困難和難題?

李文廣:春節(jié)期間我們余總發(fā)的朋友圈,說智駕開了1300多公里無接管,但要真正做到每個人開1300 多公里都0接管,其實還是有難度,尤其是我們從后臺數(shù)據(jù)看到一些小的物體,可能是前車掉下來的,也可能是山上掉下來的,各種東西都有。針對這些小物體,要求L3能檢測出來,目前對這些特別小物體的檢出還是有難度的,我們還在研究怎樣實現(xiàn)。

首先想到解決方案是可以從傳感器上去想辦法,可以用特別強大的傳感器,算法和系統(tǒng)能力也要做提升。就像人開車,人是具備推理判斷能力的,當(dāng)他感受到某些變化時能及時做出應(yīng)對,比如在地庫里要轉(zhuǎn)彎的時候,看到右前方有光,就能推理出那個方向有車要過來,但前提是要能看到光。智駕也是同理,本質(zhì)上講還是要先接收到這些變化的信息,不然很難推理出結(jié)果。除此之外,路上行駛最容易出問題的就是cut in場景,總會有人不守規(guī)矩,在這種情況下,怎么做到比人駕好一些。

L3真正落地,我認(rèn)為首先要把上面提到的兩大難題解決掉。當(dāng)然L3落地還有一些其他要求,比如風(fēng)險預(yù)警、系統(tǒng)的冗余等,這些可能在技術(shù)難度上還好一點。目前國家層面在做L3準(zhǔn)入測試,華為也在提供支撐。我們也在為L3的落地做積極準(zhǔn)備,預(yù)計在明年實現(xiàn)高速L3的商用。

虎嗅智庫:L3落地對算力的需求是怎樣的,在云端和車端的算力如何分配?

李文廣:現(xiàn)階段來看,L3最先落地的駕駛場景應(yīng)該會是高速路,高速對車端的算力要求不會太高,主要是把車端冗余能力做好,處理好我剛才說的一些異常的各種小物體、cut in這些場景。對云端的算力需求主要看算法,一般來說要幾萬倍到幾十萬倍不等,要看模型規(guī)模、數(shù)據(jù)量的大孝迭代的速度。

對于高速L3的實現(xiàn),華為目前擁有的算力能力已經(jīng)足夠支撐。城區(qū)道路要做到L3,對算力的要求會很高,因為城區(qū)的L3可能比高速的L5難度更大,估計還要3到4年。

03.談?wù)勅A為的IPD流程管理

虎嗅智庫:華為的IPD流程管理體系是很多企業(yè)在學(xué)習(xí)的,它在智駕團隊的管理中發(fā)揮了怎樣的作用,您作為一名管理者是如何使用這些管理工具的?

李文廣:我們團隊現(xiàn)在大概涉及三個領(lǐng)域,有做傳感器的,有做算力平臺的,還有做偏軟件的ADS系統(tǒng)解決方案的,大的架構(gòu)整體是圍繞一個智能駕駛解決方案設(shè)置的。

IPD就是集成產(chǎn)品開發(fā),2000年我剛進(jìn)公司的時候,華為就引入IPD試點,第一個項目就是在我的項目,做的是3G基站的試點。最早是IBM搞了這一套理論,核心是告訴大家如何把一個產(chǎn)品開發(fā)好,需要做很多集成,把所有的領(lǐng)域的代表拉進(jìn)來,包括制造、采購、研發(fā)等,有一個產(chǎn)品經(jīng)理(PDT經(jīng)理)在這,PDT經(jīng)理帶領(lǐng)各個領(lǐng)域負(fù)責(zé)人來開展一些工作,同時對這些人的工作分不同的階段進(jìn)行流程管理,包含前期的產(chǎn)品定義、到后面的產(chǎn)品開發(fā)再到上市階段的管理,不同階段有不同的投資決策的點,它是這樣一套流程管理機制。

在IBM的基礎(chǔ)上,華為結(jié)合中國的國情以及公司的特點,對IPD做了很多改造,到現(xiàn)在我們也一直在用。對于自動駕駛來說,它本質(zhì)上也是個產(chǎn)品解決方案,用在車上對安全性要求更高,我們現(xiàn)在也是按照IPD這套體系進(jìn)行管理,同時按照汽車行業(yè)的要求做了適配,我們叫IPD-IAS。

當(dāng)然,IPD流程管理不是一個簡單的名詞,對于其他企業(yè)可能并不是一學(xué)就能會,或者是立竿見影的達(dá)到一個理想的效果。華為也是經(jīng)過了幾十年的實踐,從一開始很難,到現(xiàn)在跟組織的和企業(yè)的文化相融合,他是需要日積月累的。

虎嗅智庫:流程管理和企業(yè)文化對于華為智駕的成功發(fā)揮了怎樣的作用?

公司做大了,就需要有一套流程用來管理和規(guī)范,但并不是說有了這套流程就能成功,流程只是起到輔助作用,不起主要作用。華為成功肯定也不是因為IPD成功了,它只是一個輔助的工具。

這跟公司的價值觀有關(guān)系,我們堅持以客戶為中心,以奮斗者為本。真正的把這個價值觀做好,我認(rèn)為可能做很多行業(yè)都會成功。因為真正的幫用戶創(chuàng)造了價值,用戶就會喜歡你,買你的產(chǎn)品和服務(wù);真正的讓員工得到了回報,員工都充滿激情,凝聚力很強。

當(dāng)然,華為的技術(shù)或者方向也不一定都是正確的,比如智駕,我們畢竟是后面來的,特斯拉可能已經(jīng)研究了十幾年,后來者就需要去學(xué)習(xí),但只學(xué)習(xí)也做不到領(lǐng)先,所以要敢于去做一些別人沒做過的東西。

華為為什么做很多事情都能成功,就是因為聚焦在為用戶創(chuàng)造價值。需要想清楚價值,圍繞價值創(chuàng)造敢想敢干,而不是別人做什么我們就做什么,以智駕為例,用戶的最終需求,一個是安全,這關(guān)系到生命;另一個是時間,從駕駛中釋放更多時間給用戶,我們就需要圍繞這兩大需求展開工作。

我們提供的核心價值:

及時與優(yōu)質(zhì)的洞察,了解技術(shù)、了解行業(yè)、了解同行與對手;

為決策者技術(shù)與產(chǎn)品戰(zhàn)略決策、產(chǎn)業(yè)規(guī)劃、解決方案選型提供重要參考;

幫助市場全面了解前沿科技及所影響產(chǎn)業(yè)的發(fā)展?fàn)顩r,還有未來趨勢。

贊助本站

人工智能實驗室

相關(guān)熱詞: 華為 乾崑 智駕 真的 像人 一樣 開車

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港