展會(huì)信息港展會(huì)大全

銳思智芯創(chuàng)始人兼CEO鄧堅(jiān):Hybrid Vision Sensor,變革智能感知時(shí)代|硬氪·硬科技黃金時(shí)代大會(huì)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-04 13:00:43   瀏覽:6422次  

導(dǎo)讀:12月26日,36氪硬氪在深圳前海召開了硬科技黃金時(shí)代大會(huì)。大會(huì)邀請(qǐng)了硬科技大量一線投資機(jī)構(gòu)、科技公司、專家學(xué)者,共設(shè)立14個(gè)主題演講、2個(gè)圓桌。主題涉及半導(dǎo)體投資、新材料投資、人民幣投資、專精特新成長(zhǎng)等多個(gè)熱門賽道。 26日下午,銳思智芯創(chuàng)始人兼CEO...

12月26日,36氪硬氪在深圳前海召開了硬科技黃金時(shí)代大會(huì)。大會(huì)邀請(qǐng)了硬科技大量一線投資機(jī)構(gòu)、科技公司、專家學(xué)者,共設(shè)立14個(gè)主題演講、2個(gè)圓桌。主題涉及半導(dǎo)體投資、新材料投資、人民幣投資、專精特新成長(zhǎng)等多個(gè)熱門賽道。

26日下午,銳思智芯創(chuàng)始人兼CEO鄧堅(jiān)先生進(jìn)行了《Hybrid Vision Sensor:變革智能感知時(shí)代》的主題分享,以下為演講內(nèi)容:

非常感謝36氪給我們這個(gè)機(jī)會(huì),我和大家分享的是傳感器的變革,順帶也會(huì)把我們的傳感器產(chǎn)品給大家介紹一下。

剛才聽各位嘉賓的分享,感觸很深。產(chǎn)業(yè)鏈的國產(chǎn)化,從材料到設(shè)計(jì),再到系統(tǒng),整個(gè)的變革的確是百年未有之大變局,傳感器也是一樣。

這是162年前的第一個(gè)影像出來的場(chǎng)景,當(dāng)時(shí)是拍一匹馬,是用化學(xué)曝光的圖像進(jìn)行連續(xù)播放形成黑白圖片。這是咱們現(xiàn)在拍的,實(shí)際上它并不是真正的拍攝,而是一個(gè)普通的視頻再加上chatGPT還原,F(xiàn)在圖像的拍攝,它對(duì)畫質(zhì)的追求已經(jīng)到了一個(gè)極致,不過這并不是圖像傳感器或者視覺傳感器的全部。當(dāng)前的圖像和視覺傳感器還承接了更多的工作,從拍照來說,比如手機(jī)和機(jī)器人,除了圖像大家還想從那獲得更多的信息,比如距離信息,光譜信息,還有另外一類信息也是非常重要的,就是運(yùn)動(dòng)信息。運(yùn)動(dòng)信息可以用來干什么呢?我們先說說缺少它會(huì)有什么樣的現(xiàn)象。

162年前的第一個(gè)影像

第一,運(yùn)動(dòng)模糊。在拍照的過程中,我們有個(gè)曝光的時(shí)間,在這個(gè)曝光的時(shí)間,所有運(yùn)動(dòng)過程都被采集,但是它會(huì)合成一張圖片進(jìn)行輸出,就變成了一個(gè)模糊的圖像。

第二,冗余數(shù)據(jù)。比如我們拍照片是靜態(tài)的圖像,我們已經(jīng)知道了它的信息,但是對(duì)于每張圖片進(jìn)行重復(fù)的拍攝,我們需要知道的只是其中的變化,也就是運(yùn)動(dòng)和變化,所有的靜態(tài)信息是被反復(fù)獲得的,它其實(shí)是因?yàn)闆]有辦法區(qū)分動(dòng)態(tài)和靜態(tài)的信息,所以導(dǎo)致了冗余的數(shù)據(jù)量。

第三,在拍攝的時(shí)候,攝像頭通過曝光,就有曝光時(shí)間,曝光時(shí)間是根據(jù)光的強(qiáng)度進(jìn)行調(diào)整,但是人去看一樣?xùn)|西的時(shí)候沒有這樣的概念,所以我們會(huì)發(fā)現(xiàn),圖像在暗的時(shí)候需要的曝光比較長(zhǎng),亮的時(shí)候曝光比較短,但是實(shí)際應(yīng)用場(chǎng)景中,會(huì)有明暗都存在的場(chǎng)景,現(xiàn)在的技術(shù)就用多張圖像進(jìn)行融合。在融合的過程中,這幾張圖片拍攝的時(shí)間點(diǎn)不一樣,中間有誤差、移動(dòng),合成之后就形成鬼影,這是幀與幀之間的圖像信息丟失。

這個(gè)出現(xiàn)之后,大家一直在研究,對(duì)于新型傳感器怎么樣能夠獲取運(yùn)動(dòng)的信息。其中有一個(gè)技術(shù),從90年代開始一直做研究,這個(gè)就是我們今天要介紹的事件傳感技術(shù),它是基于人眼的感知方式,只對(duì)變化敏感。所有的感知都是從像素實(shí)現(xiàn),像素感知到光的變化信息,這個(gè)變化信息在像素內(nèi)進(jìn)行放大,然后在像素里進(jìn)行比較,同時(shí)通過比較的信號(hào),把變化的信息或者是運(yùn)動(dòng)的信息通過一個(gè)數(shù)字域的轉(zhuǎn)換進(jìn)行輸出。直觀來看,它輸出的圖像,就像我們看到的實(shí)際場(chǎng)景,它是一個(gè)小熊掉到水杯里的過程。對(duì)于事件感知,它不顯示靜態(tài)的信息,因?yàn)殪o態(tài)的信息不感知,它只感知變化,而且所有的處理都是連續(xù)的,所以幀率、效率都非常高。也就是說,它通過一種新的感知方式,把運(yùn)動(dòng)和變化的信息進(jìn)行了非常好的提齲比如它與現(xiàn)在攝像頭拍攝的圖片來說,流暢度會(huì)有非常大的提升。

但是問題也很明確,如果我們不看實(shí)際的場(chǎng)景,只看這個(gè)事件感知輸出的畫面,沒有靜態(tài)信息,得到的信息量非常少。它能夠在一些功能上,比如在幀率、數(shù)據(jù)量上有很高的提升,但是因?yàn)樗狈α遂o態(tài)信息,所以它很難在一個(gè)場(chǎng)景里進(jìn)行覆蓋和提升。所以,雖然事件傳感技術(shù)在2021年被索尼量產(chǎn)了,并且在工業(yè)領(lǐng)域有一些應(yīng)用,但很多在座朋友在大部分場(chǎng)景都沒有看到它在實(shí)際應(yīng)用中落地。

事件傳感技術(shù)的技術(shù)原理

在傳統(tǒng)的消費(fèi)電子領(lǐng)域、車載電子等領(lǐng)域,如果要用到事件傳感技術(shù),為了覆蓋這個(gè)場(chǎng)景,需要把事件攝像頭和傳統(tǒng)的攝像頭進(jìn)行組合,同時(shí)輸出事件和圖像兩個(gè)畫面,再進(jìn)行算法的匹配,這是雙攝的方案。但問題是如何做更好的配準(zhǔn),機(jī)器上如何達(dá)到實(shí)際使用的需求。實(shí)際情況,手機(jī)這樣的場(chǎng)景無法添加事件傳感這么單一的攝像頭,所以這個(gè)技術(shù)一直沒有大規(guī)模應(yīng)用的原因也是在于此。

我們提出的方案是,將事件和圖像融合在一個(gè)傳感器里面,它能夠把事件的感知功能和圖像的功能在一個(gè)像素里進(jìn)行一個(gè)集成,這也是我們率先提出的概念,也是我們目前在量產(chǎn)的技術(shù)。這是我們給手機(jī)做的一款芯片,它就是傳統(tǒng)的傳感器一樣的像素結(jié)構(gòu),通過堆疊工藝,把圖像的功能和事件感知功能集成在一個(gè)像素里面,這個(gè)像素可以同時(shí)輸出事件和圖像兩個(gè)圖片,好處是解決了事件沒有靜態(tài)信息,圖像沒有運(yùn)動(dòng)信息的問題;它通過這樣的一種結(jié)合,可以很好的把運(yùn)動(dòng)和靜態(tài)進(jìn)行一個(gè)互補(bǔ),實(shí)現(xiàn)了對(duì)圖像傳感器的運(yùn)動(dòng)信息延拓。

融合式高端視覺傳感器

這是我們做出來的方案,同時(shí)輸出事件和圖像能夠得到的效果。這里需要提到的是我們做傳感器就是做一件事情,傳感器最關(guān)鍵的三個(gè)參數(shù),幀率、數(shù)據(jù)量以及動(dòng)態(tài)范圍,我們做傳感器一直在平衡這3個(gè)參數(shù),在每一個(gè)場(chǎng)景去適配這3個(gè)參數(shù)的平衡,來達(dá)到匹配這個(gè)場(chǎng)景的目的。但是現(xiàn)在很多的一些應(yīng)用里,比如車載,它沒有辦法再去找到這樣的平衡,因?yàn)樗刃枰俣群芸,?duì)數(shù)據(jù)量的要求又非常極致,它在各種各樣的光照環(huán)境下都要能夠很好的工作。傳統(tǒng)的傳感器達(dá)不到,但是事件傳感器就可以平衡這個(gè),比如它的幀率,比如我們現(xiàn)在做到的將近1千萬的像素,幀率可以做到4千幀每秒,這是非常高的速度。

對(duì)于傳統(tǒng)的高速攝像頭來說,這樣的幀率會(huì)形成巨量的數(shù)據(jù)量,因?yàn)槭录蹲降闹皇亲兓,所以它的事件?shù)據(jù)有效性非常高,它能夠在幀率很高的同時(shí),把數(shù)據(jù)量和功耗壓制住,它的環(huán)境適應(yīng)能力極強(qiáng),可以把幀率、數(shù)據(jù)量、運(yùn)動(dòng)范圍進(jìn)行很好的提升,加上傳統(tǒng)的圖像傳感器數(shù)據(jù),拍照、機(jī)器視覺的功能就得到很大的增強(qiáng);谖覀?cè)趥鞲衅鞯姆e累,迭代了3次,現(xiàn)在開始實(shí)現(xiàn)消費(fèi)電子(手機(jī)、安防、AIOT)領(lǐng)域大規(guī)模的應(yīng)用,相信大家不久就能夠看到基于Sensor做出來的產(chǎn)品。

我們公司成立4年,總部在深圳,在南京、北京、蘇黎士都有分公司。我們有超過200多個(gè)發(fā)明專利,涵蓋了從像素到數(shù)據(jù)結(jié)構(gòu)、芯片架構(gòu)、應(yīng)用、算法等一系列的專利,所以這一塊,在全球在融合視覺里布局專利是最多的。

在整個(gè)行業(yè)里,我們所處的這一細(xì)分行業(yè)還是挺受各個(gè)行業(yè)的重視。36氪也對(duì)我們有比較多的報(bào)道,我們也參與了很多評(píng)眩我們現(xiàn)在有兩款芯片,一款是用于消費(fèi)電子,是手機(jī)的應(yīng)用,能夠輸出高質(zhì)量圖像的同時(shí),能夠非常好的輸出運(yùn)動(dòng)的信息,實(shí)現(xiàn)特殊的功能;另外一款是是作為安防的高端芯片,能夠?qū)崿F(xiàn)暗光全彩,以及暗光下對(duì)運(yùn)動(dòng)物體的捕捉,而且通過低功耗的特性實(shí)現(xiàn)安防攝像頭本地智能化,比如可以做事件的判斷,當(dāng)發(fā)生感興趣的事件進(jìn)行推送。

現(xiàn)在大家看到的是消費(fèi)電子用的去模糊。左邊的圖片是實(shí)際拍攝的圖片,拍攝一個(gè)運(yùn)動(dòng)的畫面,它會(huì)有因?yàn)檫\(yùn)動(dòng)造成的模糊,模糊的去除是現(xiàn)在沒有解決的問題,因?yàn)樗枰涝谄毓膺^程中,每一個(gè)像素的拍攝無題運(yùn)動(dòng)軌跡,這是幾乎不可能獲得的。但是基于我們的傳感器,因?yàn)榭梢钥焖俨蹲阶兓,而且這個(gè)變化非常高效,通過這個(gè)能夠獲得整個(gè)特征點(diǎn)的運(yùn)動(dòng)軌跡,然后對(duì)它進(jìn)行反推就能夠形成特別清晰的圖片。

這是慢動(dòng)作,原理是在兩幀之間通過技術(shù)變化,在任意時(shí)間點(diǎn)和原始圖片加上變化的數(shù)據(jù)進(jìn)行結(jié)合,重構(gòu),可以生成高速的圖片出來。它實(shí)現(xiàn)了非常低成本又能夠適應(yīng)不同光照環(huán)境的高速攝像功能。

顯示對(duì)比圖

這是現(xiàn)在用到的傳感器的典型問題,從隧道里出來,外面很亮,這個(gè)時(shí)候傳感器是失效的,左邊的圖是通過事件感知拍攝出來的特征信息,它不會(huì)受到光照的影響,可以有非常穩(wěn)定的輸出。通過事件數(shù)據(jù)和圖像數(shù)據(jù)可以重構(gòu)出中間的視頻,這個(gè)視頻也就是在各種光照情況下輸出的。

端側(cè)智能

這是我們做的端側(cè)智能,歡迎大家到我們的展臺(tái)看,我們有1千幀的結(jié)構(gòu)光,這是用于AR、VR,它可以實(shí)現(xiàn)超低功耗、超高速的3D視覺,比如手勢(shì)識(shí)別、摔倒識(shí)別都可以通過很好的實(shí)現(xiàn)。我們也和一個(gè)大廠做眼動(dòng)追蹤,主要是通過事件高速的特征,和低功耗的特征,來實(shí)現(xiàn)非常靈敏、快速、非常準(zhǔn)確的眼睛的運(yùn)動(dòng)追蹤。我們還做了機(jī)器人的應(yīng)用,這里不仔細(xì)講。

在車的方面,有車內(nèi)的DMS系統(tǒng),在保護(hù)隱私的同時(shí)可以監(jiān)控眼動(dòng)、眨眼等快速細(xì)節(jié)的特征。在車上,也可以做電子后視鏡。我們的傳感器有一個(gè)特點(diǎn),即適合給人觀看,因?yàn)樗軌驇矸浅?yōu)質(zhì)的視頻,而且不容易出現(xiàn)模糊或者是過曝等。它通過事件也可以給機(jī)器視覺提供非常高效的數(shù)據(jù),能夠滿足后視鏡對(duì)人看和對(duì)機(jī)器看的需求。其他的應(yīng)用,包括光流、機(jī)器評(píng)測(cè)、轉(zhuǎn)速評(píng)測(cè)等,這是一個(gè)底層器件。我們也和各個(gè)行業(yè)的巨頭合作比較多,希望通過這樣的生態(tài),能夠一起把新技術(shù)變成一個(gè)能改變大家生活的產(chǎn)品。

非常感謝大家!

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港