展會信息港展會大全

梅卡曼德機器人邵天蘭:AI大模型讓萬億工業(yè)市場更平坦
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-11 09:45:28   瀏覽:2837次  

導讀:圖片來源@視覺中國 文 | 華創(chuàng)資本 沒有什么花活兒,就是硬碰硬,梅卡曼德機器人創(chuàng)始人、CEO邵天蘭曾在一次采訪中回憶,自己最喜歡的機器人相關的電影是《環(huán)太平洋》,里面講述了人類為對抗怪獸入侵,制造出巨型機甲戰(zhàn)士進行戰(zhàn)斗。雖然電影情節(jié)簡單甚至無腦,...

圖片來源@視覺中國

文 | 華創(chuàng)資本

“沒有什么花活兒,就是硬碰硬”,梅卡曼德機器人創(chuàng)始人、CEO邵天蘭曾在一次采訪中回憶,自己最喜歡的機器人相關的電影是《環(huán)太平洋》,里面講述了人類為對抗怪獸入侵,制造出巨型機甲戰(zhàn)士進行戰(zhàn)斗。雖然電影情節(jié)簡單甚至無腦,就是比摩天大樓還高的機器人和怪獸一拳一拳貼身肉搏。但邵天蘭覺得這恰恰和機器人行業(yè)很相似 面對大量工程和業(yè)務問題,并不是靠少數(shù)聰明人想出一些絕妙點子就能搞定,只能靠大量的努力來一點點解決。

這也是邵天蘭從2016年創(chuàng)立梅卡曼德起,跑了不下三四百家工廠后感觸頗深的地方,計算機專業(yè)出身的他明顯感受到兩個領域的差異:互聯(lián)網(wǎng)賽道相對較平,但制造業(yè)需求非常碎不僅工藝、環(huán)節(jié)、場景多,且高度碎片化,每家公司的需求也各不一樣。從公司成立之初邵天蘭就清楚地知道: “制造業(yè)遠看是個萬億市場,近看是一萬個一億的市常而服務制造業(yè)最大的挑戰(zhàn)不是滿足特定客戶的特定需求,是如何高效地滿足成千上萬用戶的各種需求。 ”

梅卡曼德在成立伊始就使用AI和3D視覺等智能技術,讓機器人擁有更高級的傳感、感知、規(guī)劃等智能能力,用通用的產(chǎn)品去解決普遍的需求。如果能在1萬個甚至 10 萬個1億的市場中,有效率地整合出其中的100 個,那就是 100 億的市常 而AI大模型讓機器人智能有望進一步飛躍,機器人市場將可能是現(xiàn)有的 10 倍甚至 100 倍大。這無疑給梅卡曼德的未來注入了極大想象力。

為了填平這些市場里非標自動化需求的溝壑,梅卡曼德基于自身AI+3D視覺為核心的技術優(yōu)勢,將機器人做成通用型產(chǎn)品或基礎設施平臺,以減少對非標硬件的需求。經(jīng)過7年摸索,梅卡曼德已經(jīng)成為全球 AI+工業(yè)機器人領域融資額最高、技術能力最全面、落地案例最多、應用領域最廣的公司之一。

如今,技術狂飆下,AI大模型日新月異,這股浪潮也在工業(yè)機器人行業(yè)里涌動。當未來的市場變得客觀標準,產(chǎn)品也無法存在差異化空間時,行業(yè)競爭的終局只能是“硬碰硬”。對此,邵天蘭反倒持樂觀態(tài)度:“ AI大模型讓工業(yè)市場變得更平坦,在沒辦法差異化的市場里,最終會形成少數(shù)的巨頭。 所以接下來三五年,我們就繼續(xù)打磨技術產(chǎn)品,解鎖更多行業(yè),讓智能機器人再上一個臺階。”

Q:華創(chuàng)資本

A:梅卡曼德機器人創(chuàng)始人、CEO 邵天蘭

Q1:2016年底,你從德國回來創(chuàng)立梅卡曼德機器人,當時創(chuàng)業(yè)的契機是什么?看到了哪些機會?

邵天蘭:2016年被稱為“人工智能元年”,那時候不論是Alpha Go戰(zhàn)勝韓國圍棋選手李世石,還是計算機視覺的發(fā)展,都引發(fā)了大家對人工智能的極大關注。與此同時,國內(nèi)的創(chuàng)業(yè)熱潮也在涌動。我身處其中時并沒有預判到后面的發(fā)展趨勢會怎樣,但如今回頭再看,那確實是創(chuàng)業(yè)的一個好時機。

其實梅卡曼德從第一天成立起,初衷一直沒變過讓機器人更智能。我在德國的學習、工作都圍繞著工業(yè)機器人,所以清楚看到了機器人的瓶頸所在,當時我們七八個人的研究生團隊做機器人任務,編程一周才能讓機器人做一些簡單的事情。但如果換做人類,可能只需要一兩句話就能理解任務。因此讓機器人有更好地感知規(guī)劃能力,一直是我們的目標。

2017年4月,華創(chuàng)投資了我們的Pre-A輪, 其實那個時候公司成立不過才半年,沒有任何客戶,完全成型的產(chǎn)品也很少,所以華創(chuàng)真的是在非常早期的時候就認可了我們。如今六年多過去,我們的產(chǎn)品已經(jīng)完成早期探索,成為規(guī);、全球化的應用,公司累計融資也超過15億。但通過人工智能技術,讓機器人更智能,依舊是我們努力在做的事情。

Q2:你也提到2016年是AI+Robot元年,機器人本體、機器臂......諸多賽道中,為何會選擇工業(yè)3D視覺細分領域?

邵天蘭:從行業(yè)來看,過去幾十年整個機器人學科設置更偏機械和控制,無論是清華、上海交大、哈工大,還是日本的院校都是如此。但如今,清華、斯坦福、伯克利,包括我讀的慕尼黑這些大學的計算機相關院系大量在研究機器人。所以我們這一代做機器人其實更“軟”,也就是有更多算法、軟件、人工智能的工作,這點從專業(yè)期刊論文也可以看出來。在數(shù)量和進展方面,也比過去機械和控制為主的時代更多、更快。這是大的技術趨勢,和汽車行業(yè)有異曲同工之處。當然機械和控制等學科仍然是非常重要的基礎,不能偏廢。

而之所以選擇這個領域,也和我過去的經(jīng)歷有關。2012年我從清華大學軟件學院畢業(yè)后,去了德國慕尼黑工業(yè)大學讀機器人研究生,并在德國知名機器人企業(yè)工作,深入?yún)⑴c了先進協(xié)作機器人從研發(fā)到誕生的全過程。我一直在學習和從事機器人相關的事情,這個領域本身非常有意思。當然我也只會做這個領域(笑)。

Q3:相比于互聯(lián)網(wǎng)行業(yè),工業(yè)領域創(chuàng)業(yè)最大的挑戰(zhàn)是什么?

邵天蘭:在我看來, 工業(yè)領域做機器人服務實業(yè),其實是一個更講道理的學科,就是客戶的需求、所需要的指標要和你產(chǎn)品的形態(tài)、性能要求相匹配。

互聯(lián)網(wǎng)面對的是人,而人的需求很難描述,它更像一種藝術,很多事情是很難用道理去預測的。比如微信、抖音,技術上一定有可取之處,但用戶使用這些APP并不完全出于技術考量。

但對工業(yè)機器人而言,能達到多少成功率?達到什么樣的速度?智能的程度怎樣?有多少應用性、可靠性等等這些都是更客觀的標準,對于像我們這些技術出身的人來說,實際上是更好把握的一件事情。

但反過來講,它困難的地方也在于要求高, 比如像我們自建了高標準的相機工廠生產(chǎn)傳感器,下了很大力氣提升生產(chǎn)的聯(lián)動率,既要探索前沿的人工智能技術,又要保證生產(chǎn)制造的一致可靠。從硬件的光學電子算法、人工智能規(guī)劃到銷售交付,整個鏈條非常長且要求高。

相比之下,互聯(lián)網(wǎng)是“一俊遮百丑”,更強調(diào)“長板”,但我們這種機器人產(chǎn)品更要求實用、嚴謹,有長板的同時還不能有過分的短板,因此也會更有難度。

Q4:梅卡曼德主營工業(yè)級3D+AI產(chǎn)品,能否講講你們目前核心的產(chǎn)品品類以及應用布局到了怎樣的階段?

邵天蘭:我們成立到現(xiàn)在,經(jīng)歷了四個發(fā)展階段:技術積累、產(chǎn)品落地與應用、產(chǎn)品迭代與規(guī);约笆袌鋈蚧。

技術層面,我們在相機成像、光學設計、AI視覺算法、機器人運動規(guī)劃、抓取規(guī)劃方面不斷進行迭代。產(chǎn)品包括工業(yè)級高精度3D相機、可視化編程的視覺算法軟件和深度學習平臺軟件等,主要聚焦機器視覺領域,技術圍繞傳感、感知、規(guī)劃展開。公司的核心器件已經(jīng)完全實現(xiàn)自研自產(chǎn),累計授權和申請各項專利350多件。

2019年開始我們進入規(guī)模應用階段,AI+3D視覺解決方案已經(jīng)在汽車、物流、重工等眾多領域規(guī);涞,典型應用包括:無序抓娶上下料、拆垛、檢測、高精度測量、機器人涂膠、噴膠等等。

目前,梅卡曼德的業(yè)務已經(jīng)覆蓋50多個國家和地區(qū),全球落地案例超過了三千個。

Q5:梅卡曼德在2021年下半年開啟全球化,對于一家創(chuàng)業(yè)公司而言,你們?nèi)蚴袌鐾卣沟牟呗允鞘裁?會著重布局哪些國家或地區(qū)?

邵天蘭:目前我們在海外有四家子公司,位于慕尼黑、東京和首爾,海外業(yè)務已經(jīng)占到相當大比例, 現(xiàn)在公司整體每年翻倍以上增長,海外還要快得多,每年能漲幾倍。

我們現(xiàn)在銷售的是第四代產(chǎn)品,連續(xù)三年市占率都是第一,第五代也在研發(fā)中,所以可以理解為梅卡曼德有一個類似 App Store 的東西,里面有我們各種應用,拿到海外直接就可以用。當然,針對每個國家不同的情況,我們也會相應地做本地化,希望能把中國很多成熟的經(jīng)驗帶過去,但也不能生搬硬套,畢竟我們服務的下游企業(yè),每個國家的需求也會不一樣。

至于海外的重點布局,還是會放在發(fā)達國家,因為這些國家地區(qū)本身的需求非常迫切,而且我們的產(chǎn)品在當?shù)匾埠苡懈偁幜Α?/p>

Q6:現(xiàn)在很多行業(yè)的公司為了逃離“內(nèi)卷”會選擇出海,對于你們這個領域來說,出海也是為了找尋更多增長紅利嗎?

邵天蘭:咱們設想一下,如果中國不那么“卷”,那企業(yè)就不出去了嗎?實際上我們這個行業(yè)不存在單純只做中國市場的公司,我們做的工業(yè)核心器件屬于通用型產(chǎn)品,像西門子、基恩士、康耐視都不會生產(chǎn)所謂的本土產(chǎn)品,一定是面向全球的。

從歷史來看更是如此,所有工業(yè)領域的通用器件型公司就沒有l(wèi)ocal的公司,無論中國、日本、還是美國、德國,都沒有,背后的商業(yè)邏輯都是全球市常如果一家公司要做全球十成的市場,而你在國內(nèi)市場做得再大也只能占到兩成,最后無論是產(chǎn)品還是規(guī)模,都無法跟上別人, 所以出海并不是因為國內(nèi)太卷而做出的被動選擇,而是我們這種標準化產(chǎn)品注定要面對全球競爭,既然終局如此,我們就要以始為終,及時入局。

Q7:除了全球領先公司如西門子、基恩士、康耐視以外,還有傳統(tǒng)機器人廠商、制造業(yè)巨頭、初創(chuàng)公司不斷入局,相比之下,梅卡曼德的差異化優(yōu)勢來自于哪里?

邵天蘭:在我看來,這個行業(yè)是注定沒有辦法“差異化”的。

第一,實際上絕大部分人說的“差異化”都是虛假的。“差異化”的意思是目標客群、目標需求的不同,往往意味著面向小眾、細分的客群和需求。如果面向的是同樣的客群,解決的是同樣的需求,只是性能、質(zhì)量、服務、外觀、價格、品牌之類不同,就不叫差異化。比如宮保雞丁,如果只是多放了幾顆花生,口味變化一下,那不叫差異化。但是如果我做了一個無糖的宮保雞丁面向糖尿病患者,這才是差異化。

第二, 公司不是一定要做差異化。實際上主流市場硬碰硬才更容易出巨頭。 消費品市場因為總量非常大,所以做一個小細分也是可以做出來很不錯的公司。但是工業(yè)領域的巨頭,幾乎都是做主流市常

所以我們公司不刻意做所謂差異化競爭,做的都是主流產(chǎn)品、主流行業(yè)、主流應用、主流客戶。不管是3D相機、視覺軟件,還是AI,產(chǎn)品形態(tài)都非常主流,服務的客戶也是來自汽車、家電、物流、電商、工程機械、鋼鐵等大行業(yè)。從技術上來說,人工智能、3D感知、機器人規(guī)劃、包括多模態(tài)大模型等也是非常主流的技術。所以我們做的都是標準產(chǎn)品,并不是找了一個非常細分的小行業(yè)去競爭。

我們幾乎沒有任何一件事情是刻意差異化,包括公司管理方面,如果一件事和所有人都不一樣,那我覺得大概率會是錯的。

至于梅卡曼德的優(yōu)勢,我們首先是抓住了時機,如果做太早,深度學習、傳感等主流技術還沒出現(xiàn),就無法應用在產(chǎn)品中;如果做太晚,這個市場就沒我們什么事兒了。

第三,我們對自己的產(chǎn)品形態(tài)、產(chǎn)品化的理念以及商業(yè)模式一直非常堅定,打從公司成立起就沒有變過,我覺得這也是做得比較好的地方。

所以,技術、產(chǎn)品、客戶、資本各個方面的領先讓我們形成了一個正向循環(huán),這都是梅卡曼德的優(yōu)勢所在。

Q8:如果沒有所謂的差異化,那你們是在現(xiàn)有需求中找尋最優(yōu)解嗎?

邵天蘭:我們所在的視覺領域,整個市場的需求非常多樣,需要做標準化的產(chǎn)品來服務更多客戶。作為創(chuàng)業(yè)公司,如果一上來就挑戰(zhàn)那種最難的事情也不現(xiàn)實,滿足的還是制造業(yè)最普遍的需求。

很多消費品比如女裝,不同品牌設計、消費者審美喜好有很大差異化,仁者見仁智者見智,那這件事就沒有最優(yōu)解;但在工業(yè)領域,比如施耐德、西門子,它追求的都是客觀標準的產(chǎn)品,最后就會達到最優(yōu)解。如果偏離最優(yōu)解,那市場會懲罰你。

所以無法差異化的市場里,我們所追求的指標都非常客觀,它有理論上的最優(yōu)解,就看誰能更接近。而這注定了最后的市場格局會非常統(tǒng)一,面對的是全球性的競爭,這也是我們這個領域的殘酷之處。

Q9:那根據(jù)你的判斷,整個行業(yè)未來的競爭格局會怎樣?之后的發(fā)展態(tài)勢如何?

邵天蘭:這個事情說來也非常簡單,所有沒辦法差異化并且同時有顯著規(guī)模效應的事情,到最后都會形成少數(shù)的巨頭。

我們做的顯然是一個高度標準化的事情,沒有任何差異化空間,同時有非常明顯的規(guī)模效應,后面的競爭格局一定是全球會有少數(shù)幾家公司。當然我們對整個行業(yè)整體是非常樂觀的,因為現(xiàn)在人工智能技術、機器人技術還處于一個非常高速的發(fā)展期, 像華創(chuàng)當時投我們的時候,我們說要做這個事情,但什么時候才能規(guī);渴裁磿r候能做到我們今天的規(guī)模?那個時候說過的話,大家覺得都是理想,但現(xiàn)在已經(jīng)做到了。未來,我們?nèi)匀贿會有這樣的增長空間,因為整個智能技術和機器人技術還處于一個高速發(fā)展的早期階段。

Q10:之前你在和

華創(chuàng)資本創(chuàng)始合伙人熊偉銘的一次對話

中提過,大模型的出現(xiàn)有機會把機器人的技術再推上一個量級,市場也將可能是現(xiàn)有的 10 倍甚至 100 倍大,能展開講講這對你們以及整個行業(yè)帶來了哪些影響?

邵天蘭:大模型真的是一個非常非常重要而且能帶來很多改變的事情,能讓機器人本身的智能更上一個臺階。像我們機器人之前做的,很多是單點能力,比如傳感(像眼睛一樣能對物體進行高速掃描)、感知(能識別物體的種類、姿態(tài)、相互關系),大模型可以帶來更高層級的智能,比如像任務的理解、整體的決策。

它能夠具有更多的常識,理解更復雜的任務。我舉個例子,比如我們中午要吃飯,中間會涉及到切菜做飯刷鍋洗碗一系列的事兒,這就要求機器人能識別黃瓜土豆并把它們拿起來,這個過程中如何組合這些動作,需要機器人具有常識以及復雜的規(guī)劃推理能力,而這是以前單點的、功能性的人工智能所不具備的。

所以大模型讓我們非常興奮,我覺得它會像之前的人工智能的進展一樣,又能打開一系列的應用和場景,讓機器人的智能程度再上一個臺階。

Q11:具體到梅卡曼德,目前你們在大模型方面進行了哪些新的探索?

邵天蘭:不久前,我們與漢堡大學張建偉院士實驗室達成了一項合作協(xié)議,正在共同研發(fā)一種全面融合視覺、語音和語言能力的機器人大模型。這種模型將使機器人能夠感知和理解環(huán)境中的多種信號,并通過自然語言與人類進行交流。研發(fā)成果能夠大幅提升機器人的智能化水平,使其更好地與人類進行自然合作和互動。

在大模型時代下,具身智能現(xiàn)在是人們關注的一大焦點。而張院士就首次提出跨模態(tài)學習機器人的概念,通過綜合大量含有噪聲且多源異構的視覺、聽覺、軀體感覺等多模態(tài)感知信息,來實現(xiàn)通用具身智能。

目前我們的合作還處于科研階段,但將來希望能讓這種機器人大模型進入到餐館、酒店、醫(yī)院以及工業(yè)等更復雜的場景中。

Q12:最近“具身智能”的討論度很高,行業(yè)里也有各式各樣的創(chuàng)新,從RT1和PaLM-E,再到李飛飛的“VoxPoser“和 Deepmind 團隊的RT2,每隔一段就有新成果發(fā)布,你認為現(xiàn)在“具身智能”的發(fā)展到底到了一個什么樣的階段?離真正的“具身智能”還有多遠,還有哪些關鍵問題沒有解決?

邵天蘭:以前“具身智能”還是一種科幻,像是月亮一樣遙不可及,但現(xiàn)在它像是珠穆朗瑪峰一樣,這兩者是有本質(zhì)區(qū)別的,雖然還是很高,但已經(jīng)落到了地上,像攀登珠穆朗瑪峰一樣,人們可以慢慢爬上去,已經(jīng)具備了攀登上去的技術路線。

現(xiàn)在有了大模型,相當于是搭梯子的階段,整個技術路線有了大的方向,知道該怎么上去了。 就像萊特兄弟發(fā)明了飛機一樣,一開始他們做的飛機只飛行了幾十米,但只過了幾十年,就有了波音747。所以,一旦一個有潛力的技術有了大的進展之后,雖然后面還有很多具體工程化的工作要做,工作量也會非常大,但至少我們有了一個比較明確的發(fā)展方向。

Q13:工業(yè)領域場景一般都比較復雜,所以一直以來定制化都比較嚴重,大模型出來以后,這些定制化是不是都能省掉了,比如給機器人一個指令,它就能自動完成所有操作嗎?

邵天蘭:通用的東西其實是產(chǎn)生真正規(guī);瘧玫囊粋非常大的前提,歷史上咱們也都見過,比如電腦在最初是專門算火箭軌跡、彈道,處理人口數(shù)據(jù)的,真正大規(guī)模普及其實是在出現(xiàn)了通用的個人電腦之后。而電腦的通用,也使得它整體的規(guī)模和成本有了巨大的優(yōu)化,才能夠真正推廣開來。 類似的事情非常多,很多專用的設備,必須要形成一個通用的產(chǎn)品才能真正開始去普及。

對我們而言,一定要減輕軟硬件開發(fā)上的定制化,當然有些配置還是要做的,就像電腦是標準產(chǎn)品,用戶還是會安裝不同的軟件。我們盡可能用更加通用的能力,特別是傳感器和算法,來減少非標的定制,這樣成本更好,周期更短,也更具備適應性。

Q14:可以理解為有了大模型和更好的算法后,就可以減少定制化、減少SKU嗎?

邵天蘭:是能減少每一個場景中,整個硬件做定制設計所需要的工作量。我舉個例子,比如在一個自動化的場景里,你是使用通用的機器人即“標準化的產(chǎn)品+通用的視覺”來解決?還是設計非標的、定制的結構?

如果使用的器件越標準,里面用的傳感器和算法越多,那通用的機器人器件也會越多,這樣所需要的定制周期,以及未來改變整個應用的風險就越低,所以自動化要盡可能地使用更加標準的器械,比如機器臂、機器人、AGV,它相比于傳統(tǒng)的輸送線以及定制化的結構來說,就是標準化的產(chǎn)品。因此,盡可能使用標準化產(chǎn)品的組合和配置,而不是使用很多復雜的定制設計。

Q15:聽起來有點像樂高。我們還了解到,現(xiàn)在制造業(yè)里有很多場景還沒有被機器人替代,而且中國每萬名工人的機器人擁有量和很多國家相比滲透率還不高,在你看來原因是什么?還需要在哪些方面進行提升?

邵天蘭:最主要的原因還是技能程度不夠,每次面對一個需求,調(diào)試交付的整體周期會很長,今天自動化也好,機器人也好,整體仍然非常慢。外界經(jīng)常會想象,這個環(huán)節(jié)需要替換人,把機器人拿過來就可以用,其實不是這樣的,一個自動化項目的周期達半年是非常正常的。

這個世界上沒有那么多新鮮事,我打個比方,今天飯店掃碼點單的普及率大概有80%,但自動化點單很早就開始有人做,最初是用專業(yè)的設備點菜,但它從來沒有真正普及過,因為這個系統(tǒng)需要有專業(yè)公司來做,周期長、成本高,而且維護起來也不方便。直到智能手機和移動支付出現(xiàn)后,餐館老板用二維碼就可以自己來操作,技術變得可得和可及了。

再比如洗衣機,某種程度上洗衣機也是機器人,但它依然需要有專業(yè)人士來安裝管子。將來機器人怎么才能實現(xiàn)高度智能化?我們給它下達指令后,它需要用類似人的眼睛識別現(xiàn)場,理解執(zhí)行任務,只有達到一定標準和高度時,未來每個人就會有一臺機器人,甚至機器人數(shù)量會超過人類,就像今天的手機電腦一樣。

Q16:梅卡曼德團隊目前已經(jīng)有700多名員工,管理上你面臨最大的挑戰(zhàn)是什么?未來三到五年,你對公司有怎樣的期待?

邵天蘭:這對我們來說確實是一個非常大的挑戰(zhàn),因為公司內(nèi)部有不同的團隊,文化也會不同。比如研發(fā)團隊在北京,都是來自全球頂尖高校的碩士博士、大公司的優(yōu)秀工程師,整體氛圍會很寬松,辦公室還養(yǎng)了貓;生產(chǎn)團隊的風格就非常嚴謹,還有在上海的銷售團隊,對他們唯一的要求就是讓客戶滿意。所以不同團隊要有不同的組織文化、管理風格,最后還要凝聚起來實現(xiàn)公司共同的目標,這確實是很大的挑戰(zhàn)。

未來三五年,我希望公司能一直保持高速增長,像我們現(xiàn)在做的這種多模態(tài)大模型,包括各種先進傳感器能夠有更多應用,進入更多行業(yè),讓智能機器人再上一個臺階。

贊助本站

人工智能實驗室
相關內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港