劃重點
01前華為美研CTO胡魯輝回國創(chuàng)業(yè),創(chuàng)辦智澄AI,旨在讓人工智能直接感知、理解物理世界并進行交互。
02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔任高管,擁有30+專利。
03智澄AI推出低成本通用人工智能機器人學習框架GRLF,使機械臂具備視覺能力和感知能力。
04然而,通用人工智能仍面臨諸多挑戰(zhàn),如算力、數(shù)據(jù)量等方面的差距。
05胡魯輝預(yù)計,通用人工智能實現(xiàn)還需3到5年,屆時將重新定義人們的生活方式。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
機器人前瞻(公眾號:robot_pro)
作者 | 許麗思
編輯 |漠影
在柏拉圖的洞穴隱喻里,一群一輩子沒出過山洞的人,對外界唯一的感知來源是投射在洞里墻壁上的影子。他們可以借助影子了解到外界的一些情況,但影子對真實世界的投射不一定是完全真實的。
現(xiàn)在的人工智能,也像處于“洞穴”之中,它對外界的理解來自于人為提供的二手信息,還沒辦法直接去感受真實世界、獲取一手信息。
而對胡魯輝來說,他想做的就是讓人工智能可以直接感知、理解物理世界,然后進行交互,從而逐步接近通用人工智能。
在清華大學、美國留學深造后,進入微軟、亞馬遜、華為美國研究院、Meta這樣的頂尖科技巨頭擔任高管,胡魯輝的履歷堪稱優(yōu)秀。
前年年底,他萌發(fā)了“理解物理世界”的想法。今年,他下決心回國再創(chuàng)業(yè),創(chuàng)辦了智澄AI,“澄”的意思就是逐步走向真正的智能。“目前,國內(nèi)還沒有類似企業(yè)。我們對標的是美國李飛飛老師創(chuàng)辦的空間智能公司。”胡魯輝說。
AI 2.0時代的到來意味著什么?給機器人裝上模型就可以讓它實現(xiàn)具身智能?通用人工智能將會創(chuàng)造出機器人的“iPhone時刻”?最近,機器人前瞻和智澄AI創(chuàng)始人胡魯輝進行了一場深入交談,從他毅然轉(zhuǎn)向的事業(yè)發(fā)展路徑背后,看到了從多模態(tài)大模型到物理智能,實現(xiàn)通用人工智能的新答案。
▲前Meta首席工程師、智澄AI創(chuàng)始人 胡魯輝
一、擔任過多家科技巨頭高管,手握30+專利
早年在清華大學畢業(yè)后胡魯輝就收到了美國西北大學等多所高校博士錄取通知,赴美深造。畢業(yè)后,他選擇留在西雅圖,在這樣一座匯集了一眾世界頂尖科技巨頭的城市工作。
他先是在微軟和亞馬遜總部工作了十來年,后面又加入華為美國研究院擔任首席架構(gòu)師兼首席技術(shù)官,最近的一段經(jīng)歷是在Meta擔任首席工程負責人,負責數(shù)據(jù)人工智能方面的工作。
除了各大科技巨頭的高管頭銜,他的從業(yè)生涯中濃墨重彩的一筆,是在美國獲得的三十多項發(fā)明專利及申請。在這些專利里,胡魯輝作為主要負責人,基本都是第一作者。
胡魯輝回憶起在2010年前后,負責了一個亞馬遜線下零售的項目。原本亞馬遜主攻線上業(yè)務(wù),后來想要拓展以無人店為代表的線下業(yè)務(wù)。但管理線下的商品銷售就需要人工流程,這可能會耗費時間和成本,并且可能難以準確地做出商業(yè)決策。
最初,他選擇用軟件處理這種問題。后來,他開始研發(fā)人工智能,還獲得了一個“用于線下零售業(yè)務(wù)的數(shù)據(jù)驅(qū)動和自適應(yīng)機器學習(ML)平臺和技術(shù)”的專利,可以讓多個機器學習算法為線下零售提供多樣化的支持。
這是胡魯輝第一個與AI相關(guān)的專利發(fā)明,也是從這里開始,他可以說是真正對AI領(lǐng)域產(chǎn)生了濃厚的興趣。那個時候,AI尚未到火爆、備受關(guān)注的程度。
▲胡魯輝第一個與AI相關(guān)的專利
二、瞄準AI 2.0的機會,再次投身創(chuàng)業(yè)浪潮
2015年,以CNN卷積神經(jīng)網(wǎng)絡(luò)模型為核心的計算機視覺技術(shù),正式拉開了AI 1.0感知智能時代的序幕。2016年,AlphaGo擊敗圍棋世界冠軍李世石,AI迎來了重要的高光時刻,受到廣泛關(guān)注。
在AI 1.0時代,胡魯輝看中了其中的機遇,選擇在2018年回國,奔赴上海、北京兩地創(chuàng)業(yè)。
“那次創(chuàng)業(yè),主要聚焦在智慧零售方面的人工智能技術(shù)的應(yīng)用,”胡魯輝說,“當時AI技術(shù)的特點是垂直性特別強,需要在垂直領(lǐng)域進行應(yīng)用,也和永輝、京東、騰訊等平臺進行了合作。”
而現(xiàn)在,當AI已經(jīng)邁入2.0時代,帶來了平臺式的變革。
在胡魯輝看來,AI 2.0時代蘊藏著比上一個時代更多的機會,會對人類的生活、工作、產(chǎn)業(yè)等產(chǎn)生更大的影響,并且還更容易落地。
所以,他的第二次創(chuàng)業(yè)開始了。他找到了之前在微軟、華為、Meta的一些同事,組成了公司的核心創(chuàng)始團隊,公司的研發(fā)團隊也基本都是畢業(yè)于國內(nèi)外知名高校的碩士、博士、博士后。
面對深圳、上海等地發(fā)出的落地邀約,老家在浙江寧波的胡魯輝最終決定將公司設(shè)立在杭州的菜鳥智谷產(chǎn)業(yè)園。
智澄AI的成立,還得到了投資界、政府部門等多方面的支持。
胡魯輝表示,公司在成立前就已成功融資,不久后投資人還繼續(xù)追加投資。同時當?shù)卣块T也很重視,把智澄評為AI杭州市余杭區(qū)海外高層次領(lǐng)軍人才項目,還在資金等多方面給予大力支持。
▲今年7月,智澄AI在杭州開業(yè)
三、低成本機械臂,也能實現(xiàn)具身智能
在AI 2.0時代,下一個爆發(fā)點及落地大方向?qū)⑹茿I for Robotics,而智澄AI正是瞄準了這一點。
“我們是一家通用人工智能公司,核心技術(shù)是理解物理世界的模型,”胡魯輝解釋道,“但是我們的產(chǎn)品并非是模型,而是具身智能,也就是人工智能機器人。”
從前年年底,胡魯輝就誕生了讓人工智能理解物理世界的想法,并開始思考如何實施。這就要求模型不僅理解編程或語言處理,更要深入到物理世界的具體應(yīng)用中去。
今年5月開始,智澄AI的人工智能機器人原型一(TR1)、原型二(TR2)基本完成,已經(jīng)進入了生產(chǎn)環(huán)節(jié),并且和一些企業(yè)達成了合作,開始了商業(yè)化之路。胡魯輝將智澄AI的人工智能機器人命名為TR,即TransformingRobot。
“雖然模型研發(fā)的時間比較長,但是集成智能本體的時間較短,迭代速度也很快,現(xiàn)在基本上兩個月就實現(xiàn)了一次迭代。”胡魯輝說。
▲智澄AI的TR2雙臂機器人
不久前,智澄AI聯(lián)合了來自哈佛大學、清華大學的人工智能專家,推出了一種低成本的通用人工智能機器人學習框架(GRLF)。
把這個框架裝在機械臂上,機械臂仿佛變成了具有視覺能力、感知能力的個體,能夠像人一樣去執(zhí)行精細的模仿學習任務(wù)。
它可以完全擺脫對仿真環(huán)境的依賴,實現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練到模型部署的端到端實景操作,還可以對多種物體進行放置、排序、操縱,具備了一定的通用能力。
▲裝上了通用人工智能機器人學習框架的機械臂正在執(zhí)行不同的任務(wù)
縱觀目前的機器人行業(yè),胡魯輝覺得,許多企業(yè)的產(chǎn)品還處于演示、研究和教育的階段,難以實現(xiàn)機器人真正的應(yīng)用。機器人行業(yè)不僅面臨著成本高、價格高的挑戰(zhàn),還存在泛化能力不足的問題,機器人難以適應(yīng)不同場景需求和環(huán)境。
所以,他希望智澄AI能夠?qū)⑼ㄓ萌斯ぶ悄苷嬲龖?yīng)用到大眾的工作和生活中,讓機器人實現(xiàn)像人一樣的智能。
“很多公司都專注于制造機器人,讓機器人能夠完成某項工作。但我們想做的是能夠感知、理解物理世界的機器人,它具有推理和思考能力,能夠與外界進行智能的交互,而目前國內(nèi)還沒有這類企業(yè)。”胡魯輝說。
在他的計劃里,智澄AI會繼續(xù)圍繞實際應(yīng)用場景、通過技術(shù)創(chuàng)新和突破來加快產(chǎn)品的迭代,并且繼續(xù)推進和不同企業(yè)的合作,讓產(chǎn)品的應(yīng)用落到實地。
四、對標李飛飛,讓AI走出“洞穴”
要讓AI走出“洞穴”,就需要AI直接接觸真實的物理世界。
今年4月,“AI教母”李飛飛創(chuàng)辦了一家“致力于構(gòu)建能夠感知、生成并與 3D 世界互動的大型世界模型的空間智能公司”World Labs 。
“我們現(xiàn)在看到的大型語言模型和多模態(tài)語言模型,它們是底層表達其實是一種一維表示,”李飛飛在此前接受的公開采訪中曾說道,“而空間智能是對世界的三維表達,從算法的角度來看,這是在用不同方式處理數(shù)據(jù)并從中獲得不同類型的輸出,最后解決不同的問題。”
簡單來說,李飛飛的空間智能就是要讓人工智能直接繞過一切中間障礙,直接地感受、理解所身處的三維世界,然后采取一些行動。
而胡魯輝的想法,剛好和李飛飛不謀而合。
前年年底,他萌生出了“理解物理世界”的想法。“最初,我們關(guān)于物理智能的想法其實沒有多少人接受,畢竟這是比較有挑戰(zhàn)性的,”胡魯輝說,“通用人工智能有不同的實現(xiàn)方式,很多人都在探索,但通常都會采用大模型的方式。”
但是他認為,現(xiàn)有的多模態(tài)大模型只能局限于訓(xùn)練的范圍中,對外界的理解還是有很大局限性。只有讓人工智能做真正理解物理世界,才能實現(xiàn)通用。
這也正是胡魯輝創(chuàng)辦智澄AI的愿景所在。
不過,在走向通用人工智能的路上,還是面臨著不少的阻礙,不僅包括在算力、數(shù)據(jù)、算法方面,也包括在真正的實際應(yīng)用落地上。胡魯輝歸納出了“兩個20”來概括當前人工智能發(fā)展的差距:
第一個“20”是從算力的角度,他提到如果讓AI和人同時創(chuàng)作一首詩或一幅畫,人可能只需要要20瓦的電量,而AI需要耗費巨大的電量,并且像OpenAI大模型的訓(xùn)練經(jīng)常需要耗費數(shù)億美元。
第二個“20”是從數(shù)據(jù)量的角度,人類可能花費20小時就能掌握很復(fù)雜的事情,例如學車,但是AI可能要花費數(shù)億個小時的數(shù)據(jù)進行訓(xùn)練。
要實現(xiàn)通用人工智能,還是道阻且長。
五、結(jié)語:AGI的到來,會是機器人的“iPhone”時刻”
通用人工智能,到底還需要多久才會到來呢?
沿著物理智能的路徑,胡魯輝覺得,可能還需要3到5年左右。而等到通用人工智能實現(xiàn)的那一刻的到來,也將會給機器人領(lǐng)域帶來顛覆性的變革。
這是機器人“iPhone 時刻”。就如同當年iPhone的橫空出世,它作為一個突破性的硬件平臺,帶動了整個軟件應(yīng)用生態(tài)的發(fā)展一樣,通用人工智能也會創(chuàng)造出一個蘊含著巨大價值的生態(tài)。
它作為一個相對標準化的模型、軟件,會走向平臺化,可以廣泛地應(yīng)用到不同的機器人上,重新定義人們的生活方式。
那個時候,機器人會成為一個更為廣泛的概念,不止是我們現(xiàn)在所熟悉的人形機器人,而是一切都會走向機器人化,重新定義每個人的生活方式。
這個時刻的曙光,已經(jīng)逐漸顯現(xiàn)了。