展會(huì)信息港展會(huì)大全

“整數(shù)智能”獲數(shù)千萬Pre A輪融資,AI大模型重構(gòu)數(shù)據(jù)標(biāo)注生產(chǎn)效率
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-05 09:07:11   瀏覽:5461次  

導(dǎo)讀:文丨李安琪 編輯丨李勤 36氪獲悉,AI數(shù)據(jù)公司「整數(shù)智能」于近期完成了數(shù)千萬Pre A輪融資,本輪由翊宙資本、藕舫天使、安益盛銀、圖靈啟真投資,翊尚資本為獨(dú)家融資顧問。 據(jù)悉,本輪融資主要用于智能數(shù)據(jù)工程平臺(tái)(ABAVA Platform)的迭代升級,全新的ABAVA...

文丨李安琪

編輯丨李勤

36氪獲悉,AI數(shù)據(jù)公司「整數(shù)智能」于近期完成了數(shù)千萬Pre A輪融資,本輪由翊宙資本、藕舫天使、安益盛銀、圖靈啟真投資,翊尚資本為獨(dú)家融資顧問。

據(jù)悉,本輪融資主要用于智能數(shù)據(jù)工程平臺(tái)(ABAVA Platform)的迭代升級,全新的ABAVA平臺(tái)將集成AI大模型+小模型,實(shí)現(xiàn)高效自動(dòng)化數(shù)據(jù)標(biāo)注。此外,整數(shù)智能還將集成RLHF(人類反饋強(qiáng)化學(xué)習(xí))數(shù)據(jù)服務(wù)能力,為大語言模型(LLM)的研發(fā)與迭代提供方案。

整數(shù)智能發(fā)展于浙江大學(xué)計(jì)算機(jī)創(chuàng)新技術(shù)研究院,致力于為人工智能企業(yè)及科研院所提供一站式數(shù)據(jù)管理服務(wù)。其提供的智能數(shù)據(jù)工程平臺(tái)(ABAVA Platform)與數(shù)據(jù)集構(gòu)建服務(wù)(ACE Service),能夠滿足自動(dòng)駕駛、AIGC、智慧醫(yī)療等數(shù)十個(gè)應(yīng)用場景的數(shù)據(jù)需求。

目前,公司已合作國內(nèi)外頂級科技公司與科研機(jī)構(gòu)數(shù)百家,擁有知識產(chǎn)權(quán)數(shù)十項(xiàng),多次參與人工智能領(lǐng)域的標(biāo)準(zhǔn)與白皮書撰寫。

整數(shù)智能創(chuàng)始人林群書為浙江大學(xué)計(jì)算機(jī)博士生,聯(lián)合創(chuàng)始人趙子健為浙江大學(xué)法學(xué)碩士生,目前均處于休學(xué)創(chuàng)業(yè)中。

林群書認(rèn)為,正如人工智能公司OpenAI的聯(lián)合創(chuàng)始人Ilya Sutskever所說,“Training data is technology”,OpenAI訓(xùn)練的GPT-3大模型,有1750億參數(shù)。作為AI領(lǐng)域的基礎(chǔ)設(shè)施,數(shù)據(jù)工程是人工智能時(shí)代絕對值得All in的機(jī)會(huì)。

他告訴36氪,當(dāng)下數(shù)據(jù)標(biāo)注正在從人力密集型向自動(dòng)化標(biāo)注過渡。以Tesla為例,在2018年,一段clip數(shù)據(jù)需要花費(fèi)500小時(shí)的人工標(biāo)注。隨著Tesla通過對數(shù)據(jù)引擎及自動(dòng)化標(biāo)注能力的重點(diǎn)建設(shè),到2021年,一段clip數(shù)據(jù)的標(biāo)注只需要花費(fèi)0.5小時(shí)的算力標(biāo)注+0.1小時(shí)的人工標(biāo)注即可。

針對人工智能行業(yè)發(fā)展的大趨勢,整數(shù)智能推出了智能數(shù)據(jù)工程平臺(tái)(ABAVA Platfom),對人工智能所需的數(shù)據(jù)標(biāo)注工具套件進(jìn)行了全域覆蓋,包含圖像、點(diǎn)云、文本、音頻等多模態(tài)標(biāo)注工具。

林群書表示,行業(yè)當(dāng)前的自動(dòng)化標(biāo)注,更多依賴算法工程師打磨特定場景的自動(dòng)化標(biāo)注算法,通用性有限?缧袠I(yè)或跨場景時(shí),如果算法自動(dòng)化標(biāo)注的精度下降,會(huì)需要工程師花費(fèi)額外的時(shí)間精力,對自動(dòng)化標(biāo)注算法進(jìn)行手動(dòng)升級。

而ABAVA平臺(tái),其內(nèi)置的AI Power系統(tǒng)通過結(jié)合AI大模型與小模型各自的優(yōu)點(diǎn),能夠快速在新行業(yè)或新場景進(jìn)行自動(dòng)化標(biāo)注,并且不斷提升自動(dòng)化標(biāo)注的精度,使得獲取高質(zhì)量數(shù)據(jù)的時(shí)間成本與人力成本不斷降低。

簡單來說就是,能夠跨越不同行業(yè)、不同場景實(shí)現(xiàn)自動(dòng)化標(biāo)注;同時(shí)還能利用標(biāo)注好的數(shù)據(jù)來迭代算法模型。“使用時(shí)間越長,沉淀數(shù)據(jù)越多,自動(dòng)化標(biāo)注水平也就越高。”林群書說道。

4D標(biāo)注工作界面 圖源整數(shù)智能

此外,整數(shù)智能針對自動(dòng)駕駛場景,推出了4D標(biāo)注工具,即在三維空間數(shù)據(jù)的基礎(chǔ)上疊加時(shí)間維度的序列信息進(jìn)行場景重建,目前已能支持視覺重建與點(diǎn)云重建。據(jù)林群書介紹,其4D標(biāo)注工具可以把原本需要數(shù)十幀的標(biāo)注工作,極限壓縮到一幀來進(jìn)行,將數(shù)據(jù)標(biāo)注的效率提升數(shù)十倍。

4D標(biāo)注工具的研發(fā)難點(diǎn)在于,其一需要使用算法融合多幀數(shù)據(jù)進(jìn)行場景重建,重建的質(zhì)量尤為重要,直接影響后續(xù)的投影精度;其二在于重建后的點(diǎn)云密度非常高,給Web端點(diǎn)云工具的性能優(yōu)化帶來巨大挑戰(zhàn);其三在于完成標(biāo)注后的結(jié)果如何精確的投影回2D空間,需要做大量的算法優(yōu)化。

總的來看,林群書告訴36氪,人工智能時(shí)代獲雀數(shù)據(jù)能源」將經(jīng)歷人工標(biāo)注、自動(dòng)標(biāo)注、合成數(shù)據(jù)三個(gè)發(fā)展階段。目前整數(shù)智能能夠通過自動(dòng)標(biāo)注大幅降低獲取數(shù)據(jù)的成本。

隨著AI大模型時(shí)代到來,整數(shù)智能也在探索合成數(shù)據(jù)的模式。比如通過AI合成數(shù)據(jù),可以解決自動(dòng)駕駛?cè)狈ornercase場景數(shù)據(jù)的問題。

整數(shù)智能認(rèn)為,AI大模型時(shí)代,數(shù)據(jù)消耗的速度將遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)自然產(chǎn)生的速度,通過合成數(shù)據(jù)的技術(shù)路徑,可以帶來「數(shù)據(jù)能源」獲取方式的一次革命。“AIGC(即AI生成內(nèi)容,如AI生成圖片)的技術(shù)爆炸,技術(shù)效果和效率會(huì)遠(yuǎn)遠(yuǎn)超過自動(dòng)化標(biāo)注。”

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港