當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > 華為乾崑智駕真的能讓AI像人一樣開車嗎？

華為乾崑智駕真的能讓AI像人一樣開車嗎？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-06-05 22:49:40 瀏覽：7062次

導(dǎo)讀：出品｜虎嗅智庫作者｜張婷婷編輯｜冀玉潔頭圖丨視覺中國 4月24日，華為召開發(fā)布會，推出乾ADS 3.0智能駕駛解決方案，圍繞提升駕駛安全性和為用戶釋放時間兩大目標(biāo)，致力于打造讓AI像人一樣開車的智駕系統(tǒng)。乾ADS3.0背后的技術(shù)邏輯，成為智駕從業(yè)人員及團...

出品｜虎嗅智庫

作者｜張婷婷

編輯｜冀玉潔

頭圖丨視覺中國

4月24日，華為召開發(fā)布會，推出乾ADS 3.0智能駕駛解決方案，圍繞提升駕駛安全性和為用戶釋放時間兩大目標(biāo)，致力于打造讓AI像人一樣開車的智駕系統(tǒng)。

乾ADS3.0背后的技術(shù)邏輯，成為智駕從業(yè)人員及團隊領(lǐng)導(dǎo)者關(guān)心的話題。

乾ADS3.0是對傳統(tǒng)智能駕駛技術(shù)的一次創(chuàng)新。華為智能駕駛解決方案總裁李文廣對虎嗅智庫表示：華為在智能駕駛領(lǐng)域雖然算是后來者，但他們有信心并敢于挑戰(zhàn)一些別人未曾嘗試過的事情，做到領(lǐng)先。

這些創(chuàng)新，主要體現(xiàn)在ADS3.0全面摒棄BEV，完全基于GOD網(wǎng)絡(luò)實現(xiàn)對道路結(jié)構(gòu)、目標(biāo)障礙物的感知以及場景的理解，同時，使用PDP神經(jīng)網(wǎng)絡(luò)，實現(xiàn)預(yù)測決策和規(guī)劃，做到模塊化的端到端網(wǎng)絡(luò)架構(gòu)。而同期的業(yè)界技術(shù)現(xiàn)狀還停留在BEV+transformer的感知范式，對于通用障礙物的識別上存在很大缺陷，要通過白名單的機制實現(xiàn)中國這種復(fù)雜場景的泛化是不現(xiàn)實的，GOD網(wǎng)絡(luò)很有效的解決了這個問題。

值得一提的是，ADS3.0不僅是一個前沿的技術(shù)解決方案，更是一個面向消費者的產(chǎn)品。華為智駕團隊運用IPD（集成產(chǎn)品開發(fā)）流程管理體系，并將其與華為一貫的為用戶創(chuàng)造價值的企業(yè)文化相結(jié)合，進(jìn)行ADS3.0的開發(fā)管理，確保產(chǎn)品的質(zhì)量和用戶體驗。

為了更深入了解華為乾ADS3.0背后的技術(shù)邏輯，以及華為是如何運用IPD流程管理體系進(jìn)行產(chǎn)品開發(fā)管理的，虎嗅智庫與華為智能駕駛解決方案總裁李文廣進(jìn)行了深度對話。

以下為華為智能駕駛解決方案總裁李文廣對話精華部分：

01.把激光雷達(dá)用深用好，是多感知融合方案成功的關(guān)鍵

虎嗅智庫：華為做自動駕駛解決方案的初衷是什么，圍繞這樣的初衷，華為選擇了怎樣的技術(shù)路線？

李文廣：回歸本質(zhì)，自動駕駛解決方案也是一個to C的產(chǎn)品，我們內(nèi)部討論最多的是它作為一個產(chǎn)品，能給用戶帶來的核心價值是什么�？傮w來看，是為了達(dá)成兩個目標(biāo)，一個是通過減少碰撞提升安全性，一個是幫用戶釋放時間。

基于這些考量，我們做了很多工作，從傳感器能力提升到算法優(yōu)化，再到數(shù)據(jù)采集和專題訓(xùn)練等，都有配套相應(yīng)的措施。華為做智能駕駛的時候，特斯拉已在智駕行業(yè)里投入了十幾年，是領(lǐng)頭羊，他走的是純視覺路線。但我們基于安全考量，強化安全屬性，還是選擇走多傳感器融合的技術(shù)路線，一開始就采用了激光雷達(dá)、視覺和毫米波雷達(dá)融合的方式。這一點很好理解，在黑夜，特別是對向來車開大燈的場景，視覺檢測能力很受限，而這時激光雷達(dá)卻可以正常工作。

做內(nèi)部技術(shù)決策前，我們也研究了大量碰撞案例，看到很多碰撞案例都是在這種場景下發(fā)生的，我們?nèi)绻x擇純視覺路線，肯定也會遇到同樣的問題。這只是視覺不足的一種場景，視覺在明暗快速變化、目標(biāo)與背景色差不明顯以及空間深度感知上都存在不足。加上華為在光產(chǎn)品技術(shù)和產(chǎn)品化上有很好的積累，通過自研的激光雷達(dá)可以做到ADS系統(tǒng)軟件和傳感器硬件的深度協(xié)同，所以我們選擇了多傳感器融合的技術(shù)路線。

虎嗅智庫：多傳感器融合的技術(shù)路線，國內(nèi)一些新勢力車企也在做，華為的融合感知方案跟他們有哪些不同之處？

李文廣：多傳感器融合也有很多種方案，包括國內(nèi)一些新勢力也都在走這條路線，但是各家差別也很大，主要是對激光雷達(dá)的使用方法和深度不同。簡單舉個例子，2022年，我們合作激光雷達(dá)的伙伴公司跟我們講，他們的激光雷達(dá)在其他車型上都用了大半年，已經(jīng)很成熟了。結(jié)果我們拿來一用，發(fā)現(xiàn)很多問題，比如很多場景下存在大量的噪聲，如果要深度使用根本就不行的，后來通過持續(xù)優(yōu)化很長時間才解決。

伙伴說其他車企沒有反饋這些問題，不知道華為為啥有這么多問題。這個事情說明各家拿到激光雷達(dá)的用法不一樣，可能華為用的更深度一些。

各家對激光雷達(dá)的使用方法和深度不一樣，主要體現(xiàn)在對通用障礙物的檢測和判斷方面。我舉個例子，我們的GOD 2.0網(wǎng)絡(luò)里面深度使用了激光雷達(dá)，通過多傳感器的融合做通用障礙物的檢測，雖然不能識別出障礙物具體是什么，但是它能夠告知系統(tǒng)，做出反應(yīng)動作。這點從主動安全的測試結(jié)果就可以看出，都帶激光雷達(dá)的車AEB表現(xiàn)卻差別很大，因為有的車的激光雷達(dá)在這種場景下并沒起作用。道理都知道，但要讓激光雷達(dá)深度參與并發(fā)揮好作用其實并不容易，這涉及到如何消除激光雷達(dá)的各種干擾，涉及到大量的軟件和傳感器硬件的協(xié)同，這塊是我們的強項。

虎嗅智庫：GOD網(wǎng)絡(luò)跟特斯拉的Occupancy Network這一套方案有什么不同之處？

李文廣：二者想達(dá)到的目的應(yīng)該是一樣的。因為特斯拉也發(fā)現(xiàn)通過視覺白名單的形式，通過純視覺技術(shù)路線很難識別出各種物體，所以想要通過視覺加上時序的關(guān)系來壘。但純視覺方案天然就不如激光雷達(dá)好，因為它對位置的準(zhǔn)確性、深度的判斷等方面，尤其是在晚上，或者在眩光的情況下都會有很大的問題，激光雷達(dá)能很好的克服這些問題。

GOD2.0網(wǎng)絡(luò)使用了激光雷達(dá)，會比Occupancy Network在適用范圍、準(zhǔn)確度等各個方面表現(xiàn)更好。這一點其實很重要，因為系統(tǒng)準(zhǔn)確度或置信度不高的話，就會產(chǎn)生一些誤剎或漏報，比如誤啟動AEB，風(fēng)險很大，所以把這個東西做準(zhǔn)很重要。

02.無圖方案需提升自車感知能力，車位到車位是今年智駕比拼重點

虎嗅智庫：是否去高精地圖仍是業(yè)內(nèi)討論熱點，目前華為的解決方案是怎樣的，跟其他車企或自動駕駛方案解決商有何不同？

李文廣：是否使用高精地圖也是個很重要的技術(shù)路線差異，包括是不是走端到端的技術(shù)路線。

先說高精地圖，其實華為走高精地圖這條路線，在城區(qū)開應(yīng)該是國內(nèi)做的最好也是最早的，我們是在2022年推出的。高精地圖方案其實對車端的道路結(jié)構(gòu)認(rèn)知的要求降低了，相當(dāng)于不用看路都能夠知道前方的靜態(tài)結(jié)構(gòu)，包括紅綠燈、桿子、路沿等要素。但我們在做的過程中也發(fā)現(xiàn)很多其它問題，比如地圖變更很頻繁，且是不可控的，高精地圖方案雖然精準(zhǔn)，但如果一旦變更就會很危險，因為它要求車端不斷的識別出它的變更。

其實二者是有點悖論的，一方面是按照圖來開就行，對靜態(tài)結(jié)構(gòu)感知能力要求不高，另一方面又要能夠把道路變更都識別出來，這其實對感知能力要求又很高。我們就想：系統(tǒng)有這么強的感知能力了，是否可以不需要高精地圖了？再加上高精地圖推進(jìn)上，投入大，周期也長，更可怕的是花半年好不容易完成制圖的城市，上線時就已經(jīng)變了許多。從這兩個方面考量，我們更希望做一個通用化的東西，靠自車感知能力就能夠開，所以我們選擇去掉高精地圖。

智駕行業(yè)不存在無圖方案，起碼導(dǎo)航地圖是需要的。無圖只是去高精地圖的一種說法。對于如何去高精地圖也有很多做法，ADS在這塊做的與行業(yè)不太一樣。友商基本是找國內(nèi)圖商合作，做的可能是比高精地圖弱化一些，如HD-，或者是比導(dǎo)航地圖更精細(xì)，車道級的，如SD+，基于這樣一個圖上去開。我們當(dāng)時定的方案是完全基于導(dǎo)航地圖，更多的依賴自車感知能力來開，屬于難度最大的一條路線，實際落地時間比原計劃有點延期，原計劃是到去年底全網(wǎng)開通，延期到了今年2月。

做智駕是個持久的過程，技術(shù)路線的選擇我們還是要看什么樣的技術(shù)路線能夠更好的支撐好用戶的安全和體驗訴求。智能駕駛的需求和方向是明確的，歸根結(jié)底我們還是要把自身的能力建好，這才是最重要的。

虎嗅智庫：AI大模型在這套方案當(dāng)中發(fā)揮了怎樣的作用？

李文廣：我們在車端叫推理，云端叫訓(xùn)練，現(xiàn)在云端會做一些大模型的處理。車端實時跑出來的一些數(shù)據(jù)，其實要做一些大量的數(shù)據(jù)標(biāo)注和訓(xùn)練，數(shù)據(jù)的標(biāo)注和模型的訓(xùn)練對車端跑的結(jié)果很關(guān)鍵。這些用于訓(xùn)練的數(shù)據(jù)，對正確性要求很高，數(shù)據(jù)標(biāo)注錯誤率越高，訓(xùn)練的結(jié)果越差，我們就需要思考怎么把這些數(shù)據(jù)標(biāo)注的更真更準(zhǔn)確，這時候可能就會用大模型去做一些標(biāo)注，實現(xiàn)自動化和泛化，因為有時候數(shù)據(jù)量太大了，你也不可能都用人來做。

我們當(dāng)時做高精地圖，需要做大量的數(shù)據(jù)標(biāo)注。2022年峰值的時候，僅標(biāo)注人員就有上千人。后面如果真正的要全國都能開，涉及到的數(shù)據(jù)量更大，單純靠人已經(jīng)應(yīng)付不過來了，所以我們用大模型來做一些自動標(biāo)注。

虎嗅智庫：前不久剛剛更新的ADS2.0方案，所有搭載了華為智駕的這些車型，在全國之內(nèi)一下子都能開了，底層能力來源于哪里？

李文廣：第一，很關(guān)鍵的就是車端的感知能力要足夠的強。我們花了最大量的時間把車端的感知能力，尤其是在道路結(jié)構(gòu)認(rèn)知各方面的能力做好，當(dāng)然在規(guī)控方面，也要針對各種場景把預(yù)測和決策的能力提升上來。

第二，就是要把學(xué)習(xí)能力提升上來。因為剛開始時，基本能力可能只需要保證用戶能夠在這里開，但我們想打造的是一個越開越好的系統(tǒng)�？赡軇傞_始比較陌生，智駕表現(xiàn)一般，但是隨著時間的推移會越來越好，這也是我們車往軟件走、往AI走、往智能化走很重要的一個特點。

虎嗅智庫：商用一代預(yù)研一代是華為常走的路子，在感知能力提升方面，未來，3.0版本的融合方案將進(jìn)行哪些優(yōu)化？

李文廣：在2.0版本中，我們引入了GOD網(wǎng)絡(luò)，旨在提升智駕系統(tǒng)的性能。在即將到來的3.0版本中，我們將進(jìn)行一次重大升級，將原有的BEV模型及傳感器融合信息全部集成到GOD網(wǎng)絡(luò)中。這一改進(jìn)將使我們的系統(tǒng)能夠更準(zhǔn)確地識別各種通用障礙物，即使對于未知物體也能保持良好的識別效果。

此外，3.0版本將大幅提高系統(tǒng)對物體的位置、距離、精度以及速度的判斷能力。這些性能的提升，不僅基于GOD網(wǎng)絡(luò)的優(yōu)化，也與云端的數(shù)據(jù)處理和訓(xùn)練能力密切相關(guān)。華為騰系統(tǒng)的強大性能，將為大模型的構(gòu)建和智駕系統(tǒng)的完善提供有力支持。

我們計劃在今年推出3.0版本，與此同時，2.0版本中的泊車代駕功能預(yù)計將在6月份開展外部用戶beta。在3.0版本中，我們將進(jìn)一步提升這一功能，使其可使用范圍更廣，能夠處理更多復(fù)雜情況。

目前，我們正在快速迭代城區(qū)方案，并預(yù)計在3.0版本中實現(xiàn)顯著的體驗提升。我們的目標(biāo)是將公開道路和非公開道路完全整合，實現(xiàn)從車位到車位的無縫智駕。這一目標(biāo)雖然已經(jīng)被提出多年，但至今仍未有公司實現(xiàn)。我們期待在今年能夠率先達(dá)成這一里程碑。

虎嗅智庫：從單車智能來看，我們離L3的能力還有多遠(yuǎn)，還需要克服哪些困難和難題？

李文廣：春節(jié)期間我們余總發(fā)的朋友圈，說智駕開了1300多公里無接管，但要真正做到每個人開1300 多公里都0接管，其實還是有難度，尤其是我們從后臺數(shù)據(jù)看到一些小的物體，可能是前車掉下來的，也可能是山上掉下來的，各種東西都有。針對這些小物體，要求L3能檢測出來，目前對這些特別小物體的檢出還是有難度的，我們還在研究怎樣實現(xiàn)。

首先想到解決方案是可以從傳感器上去想辦法，可以用特別強大的傳感器，算法和系統(tǒng)能力也要做提升。就像人開車，人是具備推理判斷能力的，當(dāng)他感受到某些變化時能及時做出應(yīng)對，比如在地庫里要轉(zhuǎn)彎的時候，看到右前方有光，就能推理出那個方向有車要過來，但前提是要能看到光。智駕也是同理，本質(zhì)上講還是要先接收到這些變化的信息，不然很難推理出結(jié)果。除此之外，路上行駛最容易出問題的就是cut in場景，總會有人不守規(guī)矩，在這種情況下，怎么做到比人駕好一些。

L3真正落地，我認(rèn)為首先要把上面提到的兩大難題解決掉。當(dāng)然L3落地還有一些其他要求，比如風(fēng)險預(yù)警、系統(tǒng)的冗余等，這些可能在技術(shù)難度上還好一點。目前國家層面在做L3準(zhǔn)入測試，華為也在提供支撐。我們也在為L3的落地做積極準(zhǔn)備，預(yù)計在明年實現(xiàn)高速L3的商用。

虎嗅智庫：L3落地對算力的需求是怎樣的，在云端和車端的算力如何分配？

李文廣：現(xiàn)階段來看，L3最先落地的駕駛場景應(yīng)該會是高速路，高速對車端的算力要求不會太高，主要是把車端冗余能力做好，處理好我剛才說的一些異常的各種小物體、cut in這些場景。對云端的算力需求主要看算法，一般來說要幾萬倍到幾十萬倍不等，要看模型規(guī)模、數(shù)據(jù)量的大孝迭代的速度。

對于高速L3的實現(xiàn)，華為目前擁有的算力能力已經(jīng)足夠支撐。城區(qū)道路要做到L3，對算力的要求會很高，因為城區(qū)的L3可能比高速的L5難度更大，估計還要3到4年。

03.談?wù)勅A為的IPD流程管理

虎嗅智庫：華為的IPD流程管理體系是很多企業(yè)在學(xué)習(xí)的，它在智駕團隊的管理中發(fā)揮了怎樣的作用，您作為一名管理者是如何使用這些管理工具的？

李文廣：我們團隊現(xiàn)在大概涉及三個領(lǐng)域，有做傳感器的，有做算力平臺的，還有做偏軟件的ADS系統(tǒng)解決方案的，大的架構(gòu)整體是圍繞一個智能駕駛解決方案設(shè)置的。

IPD就是集成產(chǎn)品開發(fā)，2000年我剛進(jìn)公司的時候，華為就引入IPD試點，第一個項目就是在我的項目，做的是3G基站的試點。最早是IBM搞了這一套理論，核心是告訴大家如何把一個產(chǎn)品開發(fā)好，需要做很多集成，把所有的領(lǐng)域的代表拉進(jìn)來，包括制造、采購、研發(fā)等，有一個產(chǎn)品經(jīng)理（PDT經(jīng)理）在這，PDT經(jīng)理帶領(lǐng)各個領(lǐng)域負(fù)責(zé)人來開展一些工作，同時對這些人的工作分不同的階段進(jìn)行流程管理，包含前期的產(chǎn)品定義、到后面的產(chǎn)品開發(fā)再到上市階段的管理，不同階段有不同的投資決策的點，它是這樣一套流程管理機制。

在IBM的基礎(chǔ)上，華為結(jié)合中國的國情以及公司的特點，對IPD做了很多改造，到現(xiàn)在我們也一直在用。對于自動駕駛來說，它本質(zhì)上也是個產(chǎn)品解決方案，用在車上對安全性要求更高，我們現(xiàn)在也是按照IPD這套體系進(jìn)行管理，同時按照汽車行業(yè)的要求做了適配，我們叫IPD-IAS。

當(dāng)然，IPD流程管理不是一個簡單的名詞，對于其他企業(yè)可能并不是一學(xué)就能會，或者是立竿見影的達(dá)到一個理想的效果。華為也是經(jīng)過了幾十年的實踐，從一開始很難，到現(xiàn)在跟組織的和企業(yè)的文化相融合，他是需要日積月累的。

虎嗅智庫：流程管理和企業(yè)文化對于華為智駕的成功發(fā)揮了怎樣的作用？

公司做大了，就需要有一套流程用來管理和規(guī)范，但并不是說有了這套流程就能成功，流程只是起到輔助作用，不起主要作用。華為成功肯定也不是因為IPD成功了，它只是一個輔助的工具。

這跟公司的價值觀有關(guān)系，我們堅持以客戶為中心，以奮斗者為本。真正的把這個價值觀做好，我認(rèn)為可能做很多行業(yè)都會成功。因為真正的幫用戶創(chuàng)造了價值，用戶就會喜歡你，買你的產(chǎn)品和服務(wù)；真正的讓員工得到了回報，員工都充滿激情，凝聚力很強。

當(dāng)然，華為的技術(shù)或者方向也不一定都是正確的，比如智駕，我們畢竟是后面來的，特斯拉可能已經(jīng)研究了十幾年，后來者就需要去學(xué)習(xí)，但只學(xué)習(xí)也做不到領(lǐng)先，所以要敢于去做一些別人沒做過的東西。

華為為什么做很多事情都能成功，就是因為聚焦在為用戶創(chuàng)造價值。需要想清楚價值，圍繞價值創(chuàng)造敢想敢干，而不是別人做什么我們就做什么，以智駕為例，用戶的最終需求，一個是安全，這關(guān)系到生命；另一個是時間，從駕駛中釋放更多時間給用戶，我們就需要圍繞這兩大需求展開工作。

我們提供的核心價值：

及時與優(yōu)質(zhì)的洞察，了解技術(shù)、了解行業(yè)、了解同行與對手；

為決策者技術(shù)與產(chǎn)品戰(zhàn)略決策、產(chǎn)業(yè)規(guī)劃、解決方案選型提供重要參考；

幫助市場全面了解前沿科技及所影響產(chǎn)業(yè)的發(fā)展?fàn)顩r，還有未來趨勢。