展會信息港展會大全

36氪首發(fā)丨前蔚來高管創(chuàng)業(yè):光輪智能獲數(shù)千萬元融資,用生成式AI來訓練AI
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-26 09:00:50   瀏覽:15969次  

導讀:文丨彭蘇平 編輯丨李勤 36氪獲悉,合成數(shù)據(jù)公司「光輪智能」近期完成了天使+輪融資。這家今年剛成立的新公司,已經(jīng)完成種子輪、天使輪、天使+三輪融資,累計融資金額達數(shù)千萬元人民幣,投資方包括SEE Fund、奇績創(chuàng)壇、辰韜資本、變量資本等。 光輪智能致力于...

文丨彭蘇平

編輯丨李勤

36氪獲悉,合成數(shù)據(jù)公司「光輪智能」近期完成了天使+輪融資。這家今年剛成立的新公司,已經(jīng)完成種子輪、天使輪、天使+三輪融資,累計融資金額達數(shù)千萬元人民幣,投資方包括SEE Fund、奇績創(chuàng)壇、辰韜資本、變量資本等。

光輪智能致力于為企業(yè)落地AI提供合成數(shù)據(jù)解決方案,結合生成式AI和仿真技術,為行業(yè)提供3D、物理真實、可泛化的合成數(shù)據(jù),解決自動駕駛、具身智能發(fā)展中真實數(shù)據(jù)利用率低、標注成本高、回環(huán)周期長、長尾場景(Corner Case)缺乏等問題。目前,公司產(chǎn)品已經(jīng)開始服務于數(shù)家自動駕駛和機器人公司。

光輪智能創(chuàng)始人兼CEO謝晨博士是國際頂尖的仿真專家,曾在英偉達、Cruise、蔚來等企業(yè)擔任自動駕駛仿真負責人,國際首創(chuàng)將生成式AI融入仿真,有行業(yè)內最多次從0-1的合成數(shù)據(jù)開發(fā)、落地經(jīng)驗。

數(shù)據(jù)是AI的燃料。在深度學習算法中,通過大量的標注數(shù)據(jù),算法能夠學習不同類型的模式和規(guī)律,也只有大量、完整且高質量的訓練數(shù)據(jù),才能增加算法模型的可靠性。今年爆火的大模型GPT,其進化核心就來自于數(shù)據(jù)和參數(shù)的增加。

在今年的ITF World 2023半導體大會上,英偉達創(chuàng)始人兼CEO黃仁勛提出,下一波AI浪潮是“具身智能(embodied AI)”,即能夠理解、推理并與物理世界互動的智能系統(tǒng),包括機器人、自動駕駛汽車等。這些人工智能的最新發(fā)展,無不需要大量高質量3D數(shù)據(jù)進行訓練。實際上,現(xiàn)階段在自動駕駛領域,特斯拉、Waymo、Cruise等行業(yè)頭部玩家,都在通過大量的路上數(shù)據(jù)回傳方式收集數(shù)據(jù),以提升算法水平。

但大規(guī)模的數(shù)據(jù)獲取是一場曠日持久的資源競賽。

傳統(tǒng)的自動駕駛、機器人等行業(yè)數(shù)據(jù)采集和標注大量依賴人工,成本高且質量難以保證,同時真實數(shù)據(jù)難以跨車型、跨平臺使用,利用率低、存儲成本高。另外,自動駕駛中大量的Corner Case難以捕捉,這些都讓自動駕駛的數(shù)據(jù)獲取拉出了超長戰(zhàn)線,模型算法也得不到突破性提升。

而長久來看,高質量的真實數(shù)據(jù)也會成為越來越稀缺的資源。

當下的算法迭代已經(jīng)“吃”掉了大量數(shù)據(jù),而業(yè)內的一些研究發(fā)現(xiàn),未來自然數(shù)據(jù)的積累可能很難滿足AI對數(shù)據(jù)的需求。一篇麻省理工學院等高校、機構聯(lián)合發(fā)布的論文就推測,高質量的語言數(shù)據(jù)將在2026年前被耗盡,而自動駕駛、機器人需要采集的是3D物理真實的動態(tài)場景數(shù)據(jù),獲取更加困難、相對文本更加稀缺。

“合成數(shù)據(jù)”有望在很大程度上解決AI“數(shù)據(jù)饑渴”的問題。顧名思義,這是一種通過AI和仿真、基于小樣本真實世界數(shù)據(jù)生成的數(shù)據(jù)。合成數(shù)據(jù)的優(yōu)勢是采集成本低、自帶標注、跨平臺通用性強,甚至能有針對性地生成潛在危險場景、補充邊緣場景。

在自動駕駛領域,特斯拉、Waymo、Cruise、英偉達等企業(yè)已經(jīng)不同程度地布局了合成數(shù)據(jù),并將其作為技術棧的核心之一。其中,謝晨就曾主導過Cruise、英偉達、蔚來等合成數(shù)據(jù)技術0-1落地,而合成數(shù)據(jù)也已經(jīng)是他們算法訓練重要的燃料來源。

謝晨告訴36氪,業(yè)內更常見的合成數(shù)據(jù)來源于仿真,但仿真數(shù)據(jù)無法滿足模型訓練的高質量需求。在仿真的基礎上融合生成式AI,以一小部分真實數(shù)據(jù)為藍本,通過生成式AI技術來放大數(shù)據(jù)量級,并基于自研的“端到端真實性評測算法”保證數(shù)據(jù)質量和效能,可生成高信息增量的、用于算法訓練的數(shù)據(jù)。

“生成式AI技術在過去一年飛速發(fā)展,精確可控度、泛化性、質量大幅提升。經(jīng)過生成式AI與仿真結合,我們可以基于客戶的數(shù)據(jù),為他們提供百萬車隊量級的數(shù)據(jù)規(guī)模和能力。你可以想象,通過光輪每個自動駕駛公司、主機廠、機器人公司都可以擁有特斯拉車隊量級的數(shù)據(jù)能力。”謝晨表示,而這些數(shù)據(jù)的成本只有真實數(shù)據(jù)的十分之一。

合成數(shù)據(jù)需要足夠真實、可泛化,代表物理世界的場景分布,且可以給模型訓練提供信息增量,這依賴于合成數(shù)據(jù)廠商自身的AI算法以及仿真能力。

據(jù)介紹,光輪智能組建了一支生成式AI+仿真的國際領先的專家團隊,憑借最多次合成數(shù)據(jù)的落地經(jīng)驗和獨創(chuàng)的真實性評測算法,可保證每一幀數(shù)據(jù)都足夠真實、對模型有價值輸入。近期,光輪智能入選北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃,是數(shù)據(jù)伙伴中唯一合成數(shù)據(jù)廠商。

OpenAI創(chuàng)始人Sam Altman曾公開表示:“合成數(shù)據(jù)是解決大模型數(shù)據(jù)短缺的最有效辦法。”光輪智能希望通過算力驅動的數(shù)據(jù)來替代現(xiàn)有人力驅動的數(shù)據(jù),進而推動數(shù)據(jù)界結構性變革,將數(shù)據(jù)邊際成本變?yōu)楣潭ǔ杀,打造AI時代“數(shù)據(jù)界的英偉達”。

投資人評論

無限基金合伙人 馬麟

無限基金長期關注創(chuàng)新技術,致力于長期陪伴具有創(chuàng)業(yè)精神的優(yōu)秀團隊。人工智能技術的進步,對于數(shù)據(jù)的質量、數(shù)量,提出了更高要求。在未來的行業(yè)變革中,數(shù)據(jù)的邊界決定了模型的邊界,一定會是產(chǎn)業(yè)爭奪的戰(zhàn)略資源。光輪智能創(chuàng)始團隊長期深耕合成數(shù)據(jù)技術,將大幅度提高真實數(shù)據(jù)利用率以及合成數(shù)據(jù)供給,降低數(shù)據(jù)成本。這一類技術與相關企業(yè),對于我國人工智能產(chǎn)業(yè)的進步將貢獻重要的力量。

奇績創(chuàng)壇合伙人 毛圣博

光輪智能團隊憑借其獨特的合成數(shù)據(jù)技術和對自動駕駛、具身智能等領域的深度洞察,展現(xiàn)出了令人印象深刻的創(chuàng)新力和執(zhí)行力。他們將合成數(shù)據(jù)多次成功應用算法訓練中,從而提升了模型的泛化能力。乘著大模型的東風,未來"Data is the New Software",期待光輪智能在AI領域持續(xù)發(fā)光發(fā)熱,推動行業(yè)的進步!

辰韜資本合伙人 蕭伊婷

算法、算力和數(shù)據(jù)是人工智能的三要素,其中合成數(shù)據(jù)是構建高質量AI模型的核心關鍵。真實數(shù)據(jù)的成本過高,目前人工智能領域的頭部公司OpenAI、微軟、Tesla等,都已經(jīng)開始用合成數(shù)據(jù)來訓練AI模型。我們認為用合成數(shù)據(jù)訓練大模型將會很快成為主要趨勢。光輪團隊在合成數(shù)據(jù)領域的能力和經(jīng)驗是非常稀缺的,我們相信光輪在合成數(shù)據(jù)領域能占據(jù)全球領先的地位。

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港