當前位置：人工智能實驗室> 人物報道 > 對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1478次

導(dǎo)讀：劃重點 01前華為美研CTO胡魯輝回國創(chuàng)業(yè)，創(chuàng)辦智澄AI，旨在讓人工智能直接感知、理解物理世界并進行交互。 02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔任高管，擁有30+專利。 03智澄AI推出低成本通用人工智能機器人學習框架GRLF，使機械...

劃重點

01前華為美研CTO胡魯輝回國創(chuàng)業(yè)，創(chuàng)辦智澄AI，旨在讓人工智能直接感知、理解物理世界并進行交互。

02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔任高管，擁有30+專利。

03智澄AI推出低成本通用人工智能機器人學習框架GRLF，使機械臂具備視覺能力和感知能力。

04然而，通用人工智能仍面臨諸多挑戰(zhàn)，如算力、數(shù)據(jù)量等方面的差距。

05胡魯輝預(yù)計，通用人工智能實現(xiàn)還需3到5年，屆時將重新定義人們的生活方式。

以上內(nèi)容由騰訊混元大模型生成，僅供參考

機器人前瞻（公眾號：robot_pro）

作者 | 許麗思

編輯 |漠影

在柏拉圖的洞穴隱喻里，一群一輩子沒出過山洞的人，對外界唯一的感知來源是投射在洞里墻壁上的影子。他們可以借助影子了解到外界的一些情況，但影子對真實世界的投射不一定是完全真實的。

現(xiàn)在的人工智能，也像處于“洞穴”之中，它對外界的理解來自于人為提供的二手信息，還沒辦法直接去感受真實世界、獲取一手信息。

而對胡魯輝來說，他想做的就是讓人工智能可以直接感知、理解物理世界，然后進行交互，從而逐步接近通用人工智能。

在清華大學、美國留學深造后，進入微軟、亞馬遜、華為美國研究院、Meta這樣的頂尖科技巨頭擔任高管，胡魯輝的履歷堪稱優(yōu)秀。

前年年底，他萌發(fā)了“理解物理世界”的想法。今年，他下決心回國再創(chuàng)業(yè)，創(chuàng)辦了智澄AI，“澄”的意思就是逐步走向真正的智能。“目前，國內(nèi)還沒有類似企業(yè)。我們對標的是美國李飛飛老師創(chuàng)辦的空間智能公司。”胡魯輝說。

AI 2.0時代的到來意味著什么？給機器人裝上模型就可以讓它實現(xiàn)具身智能？通用人工智能將會創(chuàng)造出機器人的“iPhone時刻”？最近，機器人前瞻和智澄AI創(chuàng)始人胡魯輝進行了一場深入交談，從他毅然轉(zhuǎn)向的事業(yè)發(fā)展路徑背后，看到了從多模態(tài)大模型到物理智能，實現(xiàn)通用人工智能的新答案。

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

▲前Meta首席工程師、智澄AI創(chuàng)始人胡魯輝

一、擔任過多家科技巨頭高管，手握30+專利

早年在清華大學畢業(yè)后胡魯輝就收到了美國西北大學等多所高校博士錄取通知，赴美深造。畢業(yè)后，他選擇留在西雅圖，在這樣一座匯集了一眾世界頂尖科技巨頭的城市工作。

他先是在微軟和亞馬遜總部工作了十來年，后面又加入華為美國研究院擔任首席架構(gòu)師兼首席技術(shù)官，最近的一段經(jīng)歷是在Meta擔任首席工程負責人，負責數(shù)據(jù)人工智能方面的工作。

除了各大科技巨頭的高管頭銜，他的從業(yè)生涯中濃墨重彩的一筆，是在美國獲得的三十多項發(fā)明專利及申請。在這些專利里，胡魯輝作為主要負責人，基本都是第一作者。

胡魯輝回憶起在2010年前后，負責了一個亞馬遜線下零售的項目。原本亞馬遜主攻線上業(yè)務(wù)，后來想要拓展以無人店為代表的線下業(yè)務(wù)。但管理線下的商品銷售就需要人工流程，這可能會耗費時間和成本，并且可能難以準確地做出商業(yè)決策。

最初，他選擇用軟件處理這種問題。后來，他開始研發(fā)人工智能，還獲得了一個“用于線下零售業(yè)務(wù)的數(shù)據(jù)驅(qū)動和自適應(yīng)機器學習（ML）平臺和技術(shù)”的專利，可以讓多個機器學習算法為線下零售提供多樣化的支持。

這是胡魯輝第一個與AI相關(guān)的專利發(fā)明，也是從這里開始，他可以說是真正對AI領(lǐng)域產(chǎn)生了濃厚的興趣。那個時候，AI尚未到火爆、備受關(guān)注的程度。

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

▲胡魯輝第一個與AI相關(guān)的專利

二、瞄準AI 2.0的機會，再次投身創(chuàng)業(yè)浪潮

2015年，以CNN卷積神經(jīng)網(wǎng)絡(luò)模型為核心的計算機視覺技術(shù)，正式拉開了AI 1.0感知智能時代的序幕。2016年，AlphaGo擊敗圍棋世界冠軍李世石，AI迎來了重要的高光時刻，受到廣泛關(guān)注。

在AI 1.0時代，胡魯輝看中了其中的機遇，選擇在2018年回國，奔赴上海、北京兩地創(chuàng)業(yè)。

“那次創(chuàng)業(yè)，主要聚焦在智慧零售方面的人工智能技術(shù)的應(yīng)用，”胡魯輝說，“當時AI技術(shù)的特點是垂直性特別強，需要在垂直領(lǐng)域進行應(yīng)用，也和永輝、京東、騰訊等平臺進行了合作。”

而現(xiàn)在，當AI已經(jīng)邁入2.0時代，帶來了平臺式的變革。

在胡魯輝看來，AI 2.0時代蘊藏著比上一個時代更多的機會，會對人類的生活、工作、產(chǎn)業(yè)等產(chǎn)生更大的影響，并且還更容易落地。

所以，他的第二次創(chuàng)業(yè)開始了。他找到了之前在微軟、華為、Meta的一些同事，組成了公司的核心創(chuàng)始團隊，公司的研發(fā)團隊也基本都是畢業(yè)于國內(nèi)外知名高校的碩士、博士、博士后。

面對深圳、上海等地發(fā)出的落地邀約，老家在浙江寧波的胡魯輝最終決定將公司設(shè)立在杭州的菜鳥智谷產(chǎn)業(yè)園。

智澄AI的成立，還得到了投資界、政府部門等多方面的支持。

胡魯輝表示，公司在成立前就已成功融資，不久后投資人還繼續(xù)追加投資。同時當?shù)卣块T也很重視，把智澄評為AI杭州市余杭區(qū)海外高層次領(lǐng)軍人才項目，還在資金等多方面給予大力支持。

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

▲今年7月，智澄AI在杭州開業(yè)

三、低成本機械臂，也能實現(xiàn)具身智能

在AI 2.0時代，下一個爆發(fā)點及落地大方向?qū)⑹茿I for Robotics，而智澄AI正是瞄準了這一點。

“我們是一家通用人工智能公司，核心技術(shù)是理解物理世界的模型，”胡魯輝解釋道，“但是我們的產(chǎn)品并非是模型，而是具身智能，也就是人工智能機器人。”

從前年年底，胡魯輝就誕生了讓人工智能理解物理世界的想法，并開始思考如何實施。這就要求模型不僅理解編程或語言處理，更要深入到物理世界的具體應(yīng)用中去。

今年5月開始，智澄AI的人工智能機器人原型一（TR1）、原型二(TR2)基本完成，已經(jīng)進入了生產(chǎn)環(huán)節(jié)，并且和一些企業(yè)達成了合作，開始了商業(yè)化之路。胡魯輝將智澄AI的人工智能機器人命名為TR，即TransformingRobot。

“雖然模型研發(fā)的時間比較長，但是集成智能本體的時間較短，迭代速度也很快，現(xiàn)在基本上兩個月就實現(xiàn)了一次迭代。”胡魯輝說。

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

▲智澄AI的TR2雙臂機器人

不久前，智澄AI聯(lián)合了來自哈佛大學、清華大學的人工智能專家，推出了一種低成本的通用人工智能機器人學習框架（GRLF）。

把這個框架裝在機械臂上，機械臂仿佛變成了具有視覺能力、感知能力的個體，能夠像人一樣去執(zhí)行精細的模仿學習任務(wù)。

它可以完全擺脫對仿真環(huán)境的依賴，實現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練到模型部署的端到端實景操作，還可以對多種物體進行放置、排序、操縱，具備了一定的通用能力。

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界

▲裝上了通用人工智能機器人學習框架的機械臂正在執(zhí)行不同的任務(wù)

縱觀目前的機器人行業(yè)，胡魯輝覺得，許多企業(yè)的產(chǎn)品還處于演示、研究和教育的階段，難以實現(xiàn)機器人真正的應(yīng)用。機器人行業(yè)不僅面臨著成本高、價格高的挑戰(zhàn)，還存在泛化能力不足的問題，機器人難以適應(yīng)不同場景需求和環(huán)境。

所以，他希望智澄AI能夠?qū)⑼ㄓ萌斯ぶ悄苷嬲龖?yīng)用到大眾的工作和生活中，讓機器人實現(xiàn)像人一樣的智能。

“很多公司都專注于制造機器人，讓機器人能夠完成某項工作。但我們想做的是能夠感知、理解物理世界的機器人，它具有推理和思考能力，能夠與外界進行智能的交互，而目前國內(nèi)還沒有這類企業(yè)。”胡魯輝說。

在他的計劃里，智澄AI會繼續(xù)圍繞實際應(yīng)用場景、通過技術(shù)創(chuàng)新和突破來加快產(chǎn)品的迭代，并且繼續(xù)推進和不同企業(yè)的合作，讓產(chǎn)品的應(yīng)用落到實地。

四、對標李飛飛，讓AI走出“洞穴”

要讓AI走出“洞穴”，就需要AI直接接觸真實的物理世界。

今年4月，“AI教母”李飛飛創(chuàng)辦了一家“致力于構(gòu)建能夠感知、生成并與 3D 世界互動的大型世界模型的空間智能公司”World Labs 。

“我們現(xiàn)在看到的大型語言模型和多模態(tài)語言模型，它們是底層表達其實是一種一維表示，”李飛飛在此前接受的公開采訪中曾說道，“而空間智能是對世界的三維表達，從算法的角度來看，這是在用不同方式處理數(shù)據(jù)并從中獲得不同類型的輸出，最后解決不同的問題。”

簡單來說，李飛飛的空間智能就是要讓人工智能直接繞過一切中間障礙，直接地感受、理解所身處的三維世界，然后采取一些行動。

而胡魯輝的想法，剛好和李飛飛不謀而合。

前年年底，他萌生出了“理解物理世界”的想法。“最初，我們關(guān)于物理智能的想法其實沒有多少人接受，畢竟這是比較有挑戰(zhàn)性的，”胡魯輝說，“通用人工智能有不同的實現(xiàn)方式，很多人都在探索，但通常都會采用大模型的方式。”

但是他認為，現(xiàn)有的多模態(tài)大模型只能局限于訓(xùn)練的范圍中，對外界的理解還是有很大局限性。只有讓人工智能做真正理解物理世界，才能實現(xiàn)通用。

這也正是胡魯輝創(chuàng)辦智澄AI的愿景所在。

不過，在走向通用人工智能的路上，還是面臨著不少的阻礙，不僅包括在算力、數(shù)據(jù)、算法方面，也包括在真正的實際應(yīng)用落地上。胡魯輝歸納出了“兩個20”來概括當前人工智能發(fā)展的差距：

第一個“20”是從算力的角度，他提到如果讓AI和人同時創(chuàng)作一首詩或一幅畫，人可能只需要要20瓦的電量，而AI需要耗費巨大的電量，并且像OpenAI大模型的訓(xùn)練經(jīng)常需要耗費數(shù)億美元。

第二個“20”是從數(shù)據(jù)量的角度，人類可能花費20小時就能掌握很復(fù)雜的事情，例如學車，但是AI可能要花費數(shù)億個小時的數(shù)據(jù)進行訓(xùn)練。

要實現(xiàn)通用人工智能，還是道阻且長。

五、結(jié)語：AGI的到來，會是機器人的“iPhone”時刻”

通用人工智能，到底還需要多久才會到來呢？

沿著物理智能的路徑，胡魯輝覺得，可能還需要3到5年左右。而等到通用人工智能實現(xiàn)的那一刻的到來，也將會給機器人領(lǐng)域帶來顛覆性的變革。

這是機器人“iPhone 時刻”。就如同當年iPhone的橫空出世，它作為一個突破性的硬件平臺，帶動了整個軟件應(yīng)用生態(tài)的發(fā)展一樣，通用人工智能也會創(chuàng)造出一個蘊含著巨大價值的生態(tài)。

它作為一個相對標準化的模型、軟件，會走向平臺化，可以廣泛地應(yīng)用到不同的機器人上，重新定義人們的生活方式。

那個時候，機器人會成為一個更為廣泛的概念，不止是我們現(xiàn)在所熟悉的人形機器人，而是一切都會走向機器人化，重新定義每個人的生活方式。

這個時刻的曙光，已經(jīng)逐漸顯現(xiàn)了。

上一篇：AI連摘諾獎后：AI教父Diss OpenAI，馬斯克借機拉踩，端到端怎么走

下一篇：Counterpoint：2024Q2 AI 服務(wù)器全球市場占比達 29%

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1478次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1478次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

對標李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1478次