展會(huì)信息港展會(huì)大全

中國(guó)所謂的AR領(lǐng)頭羊Rokid,跟Apple Vision Pro產(chǎn)品差距有多大?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-30 19:24:43   瀏覽:14828次  

導(dǎo)讀:文 | aR星人,作者 | 李沛霖 懂行的人知道AR比VR難10倍不止!最近被瘋搶的Apple Vision Pro 屬于外觀滑雪鏡形態(tài)以VST模擬AR功能的VR頭顯,簡(jiǎn)單說(shuō)就是用攝像頭透視的VR。即使對(duì)于蘋果,基于光學(xué)透視OST的AR都堪稱圣杯。 一個(gè)動(dòng)不動(dòng)拿到大額融資的國(guó)內(nèi)AR創(chuàng)企,...

文 | aR星人,作者 | 李沛霖

懂行的人知道AR比VR難10倍不止!最近被瘋搶的Apple Vision Pro 屬于外觀滑雪鏡形態(tài)以VST模擬AR功能的VR頭顯,簡(jiǎn)單說(shuō)就是用攝像頭“透視”的VR。即使對(duì)于蘋果,基于光學(xué)透視OST的AR都堪稱圣杯。

一個(gè)動(dòng)不動(dòng)拿到大額融資的國(guó)內(nèi)AR創(chuàng)企,所謂中國(guó)AR領(lǐng)域的“領(lǐng)頭羊”,之前最早做語(yǔ)音識(shí)別、智能音箱,創(chuàng)始人散發(fā)著滿滿的geek氣息。在許多先行者包括巨頭微軟Hololens和Magic Leap都幾年拿不出一款新品、時(shí)不時(shí)被傳團(tuán)隊(duì)解散,國(guó)內(nèi)相關(guān)企業(yè)如影創(chuàng)倒閉甚至創(chuàng)始人因融資糾紛有牢獄之災(zāi),AR企業(yè)幾乎集體揭不開鍋的時(shí)候,Rokid的風(fēng)光讓人疑竇叢生。

AR的直觀理解

Rokid的AR和Apple Vision的AR截然不同,很難歸類為同一類產(chǎn)品。但兩家都瞄準(zhǔn)著挖掘消費(fèi)電子AR頭顯的金礦。

相比電視機(jī)的大屏幕、PC的中屏幕、手機(jī)的小屏幕,如果你眼前的三維空間成為一個(gè)新的“窗口”,現(xiàn)實(shí)世界的“實(shí)物“全部可以虛擬、任意塑造、增強(qiáng),戴上一副眼鏡或頭顯能夠?qū)崿F(xiàn)眼前空間的徹底數(shù)字化,對(duì)于生活和工作完全是顛覆。

我們見證過(guò)iPhone風(fēng)靡全球,它真正發(fā)明了智能手機(jī),如今跟工作和生活息息相關(guān),出門手機(jī)低電量甚至?xí)䦷?lái)生存焦慮。同樣道理,未來(lái)我們可能也離不開下一代AR消費(fèi)電子,即“空間個(gè)人計(jì)算機(jī)“。

要理解AR,要知道先行一步的VR本質(zhì)上是一個(gè)什么東西。就像你看3D電影,VR眼鏡類似電影幕布整個(gè)“包裹”住你眼睛,你看到的完全是計(jì)算機(jī)生成的視覺(jué)信息,沉浸其中。戴上VR眼鏡會(huì)讓視覺(jué)和外界處于物理斷聯(lián)的狀態(tài),因?yàn)閂R要隔絕外部光線要打造沉浸,現(xiàn)實(shí)里完全隔絕外部視線是危險(xiǎn)的,VR要拓展到工作和生活場(chǎng)景,必須要實(shí)現(xiàn)對(duì)周圍環(huán)境的感知。VST,即Video See Through,就是VR眼鏡感知外部的解決方案,高清攝像頭和相應(yīng)的視頻流處理單元即對(duì)應(yīng)的VST硬件。

AR與之不同的是,它一般是OST,即Optic See Through,它在物理形態(tài)上不遮擋外部光線,不追求完全沉浸,用戶看到的是外部環(huán)境光和計(jì)算機(jī)生成的圖像的疊加。AR可以設(shè)計(jì)成沉浸或不沉浸,類似電鍍調(diào)光技術(shù)還可以隨意調(diào)整環(huán)境光透過(guò)率,當(dāng)外部進(jìn)入的環(huán)境光降低到0,就變成了類似VR。

直觀理解,VR追求沉浸在物理設(shè)計(jì)上隔絕了眼睛能直接看到外部光線,必須借助VST。AR是相對(duì)“透明”設(shè)計(jì),它允許一部分或絕大部份光線穿過(guò)光學(xué)鏡片進(jìn)入眼睛。

蘋果Vision Pro所演示的VST路線

庫(kù)克之前對(duì)AR的興奮完全出于真情流露。收購(gòu)供應(yīng)鏈新銳創(chuàng)企、關(guān)鍵軟硬件默默自研、等待基礎(chǔ)技術(shù)進(jìn)步和成熟,蘋果在推出Vision Pro之前不知道蟄伏了多久,Vision Pro也被期待是下一個(gè)iPhone時(shí)刻。

從終端硬件上看,Apple Vision Pro 的核心處理器M2、專用傳感器數(shù)據(jù)實(shí)時(shí)處理器R1、高度定制的類Pancake的3片式透鏡,來(lái)源于多年自研和收購(gòu)前沿技術(shù)公司,并且做了深度整合。數(shù)量龐大的多種類傳感器,包括用于眼球追蹤的紅外相機(jī)、三維空間感知和建模的LiDar Camera和深度相機(jī)、前向和側(cè)向覆蓋多個(gè)角度的高清RGB攝像頭,帶來(lái)的眼球追蹤+裸手手勢(shì)+語(yǔ)音交互,從硬件到算法上的調(diào)教一出場(chǎng)就站在行業(yè)的頂峰,真實(shí)效果震撼了許多人。Vision Pro在VR頭顯的易用性、使用頻率和可能的場(chǎng)景擴(kuò)張上蘊(yùn)藏巨大潛力。

Vision Pro 所演示的Eyesight功能,覆蓋著玻璃罩的曲面OLED多角度格柵式顯示,基于深度學(xué)習(xí)的臉部建模和數(shù)字頭像(表情)傳遞,外部動(dòng)態(tài)的智能化提醒和切換,讓佩戴頭顯的用戶自然且巧妙地感知外界信息。相比之下,以往佩戴VR頭顯的用戶和其他人幾乎無(wú)法正常“交流”,人與人之間的視覺(jué)割裂,陷入信息孤島,環(huán)境安全和友好幾乎是無(wú)法解決的問(wèn)題。

三言兩語(yǔ)很難完全講清Vision Pro的領(lǐng)先究竟在哪個(gè)層次。相比來(lái)自Meta、字節(jié)Pico的已有同類產(chǎn)品,有些媒體將Vision Pro的領(lǐng)先概括為“硬件堆料“,顯得淺薄且可笑。蘋果公司對(duì)用戶需求的理解,產(chǎn)品形態(tài)和人機(jī)交互“規(guī)范定義”的拉力,富有魔力的營(yíng)銷和對(duì)用戶體驗(yàn)的拿捏,這種自帶的扭曲現(xiàn)實(shí)力場(chǎng)讓Vision Pro被迅速搶購(gòu)一空?梢灶A(yù)見,我們很快就可以看到競(jìng)品在功能上“跟進(jìn)”,外觀上借鑒,甚至直接粗暴抄襲。

Vision Pro可以說(shuō)充分外顯了蘋果領(lǐng)先時(shí)代的產(chǎn)品哲學(xué)和創(chuàng)造底蘊(yùn)。風(fēng)口之下的另一邊,在中國(guó)所謂的AR企業(yè)領(lǐng)頭羊,被媒體描繪為“一杯酒融一個(gè)億“的Rokid,今年上半年推出了Rokid Max折返式光路BirdBath原理的AR眼鏡,這種幾乎只有顯示功能的OST AR眼鏡,產(chǎn)品原理和售價(jià)相比Vision Pro差別巨大。

Rokid在國(guó)內(nèi)資本市場(chǎng)被追捧據(jù)說(shuō)源于這家公司的“人機(jī)交互”基因,但強(qiáng)大的硬件是應(yīng)用、操作系統(tǒng)和完整生態(tài)的基礎(chǔ)載體,沒(méi)有一個(gè)成熟且達(dá)到一定滲透和使用率的硬件終端,Rokid頻繁舉辦的開發(fā)者活動(dòng)、對(duì)于自研空間操作的宣傳,不知道支點(diǎn)在哪。基礎(chǔ)邏輯可以說(shuō)完全不通。

Rokid 相比同行如已經(jīng)倒閉的影創(chuàng),同樣做BirdBath AR眼鏡、經(jīng)常參與國(guó)外專業(yè)技術(shù)組織研討和展覽活動(dòng)的Xreal,以及TCL孵化的、同時(shí)推進(jìn)兩條產(chǎn)品線的雷鳥創(chuàng)新,包括BirdBath AR眼鏡以及全彩顯示Micro LED搭配光波導(dǎo)OST的AR眼鏡,Rokid身上的疑點(diǎn)簡(jiǎn)直不要太多。

Apple Vision Pro對(duì)比Rokid Max,究竟有怎樣的差別?

首先,產(chǎn)品原理。VR/AR頭顯的產(chǎn)品原理其實(shí)并無(wú)本質(zhì)區(qū)隔,它們都可以概括為:由計(jì)算機(jī)生成的圖像經(jīng)過(guò)光學(xué)調(diào)整,在非常近的距離讓眼睛對(duì)焦。

當(dāng)計(jì)算機(jī)實(shí)時(shí)生成的圖像在一小塊“顯示屏“上出發(fā),圖像光源經(jīng)過(guò)透鏡放大,在設(shè)計(jì)好的光路中傳輸,實(shí)現(xiàn)超短距離的對(duì)焦,再進(jìn)入瞳孔,我們就看到了虛擬圖像。AR與之基本類似,不同的是,AR的小屏幕并不像VR一般放在眼睛前方,因?yàn)檫@樣會(huì)遮擋外部視線,它一般設(shè)計(jì)在不遮擋視線的頂部鏡架或側(cè)部鏡腿位置。AR生成的虛擬圖像經(jīng)過(guò)光路,會(huì)和外部真實(shí)光線一起進(jìn)入眼睛。

Apple VisionPro所使用的多透鏡Pancake折疊放大光路,圖像光源來(lái)自眼睛前方的微顯示屏

BirdBath原理AR眼鏡,圖像光源來(lái)自頂部微顯示屏(示意圖來(lái)自鴻蟻光電公司)

第一個(gè)關(guān)鍵對(duì)比,生成圖像的“小屏幕”。這塊小屏幕分辨率必須足夠高,還需要非常高的亮度,因?yàn)椴煌墓鈱W(xué)模組光效率大相徑庭,要保證一定的入眼亮度,以及豐富的的色彩、對(duì)比度,低耗電等。迄今為止最佳的解決方案是硅基OLED屏幕,即硅芯片驅(qū)動(dòng)的超密集OLED微型“顯示器”,索尼已經(jīng)實(shí)現(xiàn)指甲蓋大小的面積上實(shí)現(xiàn)4K分辨率的硅基OLED小屏幕。多家科技巨頭還在研發(fā)Micro LED,不過(guò)Micro LED目前無(wú)法在一塊硅基板上同時(shí)實(shí)現(xiàn)RGB三色超高亮度顯示。

微顯示屏作為新興顯示產(chǎn)業(yè),終端品牌都需要從供應(yīng)鏈廠商采購(gòu)。Apple Vision Pro使用了2塊索尼4K分辨率的OLED微顯示屏作為內(nèi)屏,一塊異形柔性屏AMOLED作為前向eyesight顯示(外屏),后續(xù)傳言還會(huì)將視涯和京東方加入供應(yīng)鏈。微顯示屏需要在分辨率、色彩、功耗、成本上不斷進(jìn)化,頭顯的“空間分辨率”對(duì)于提升產(chǎn)品體驗(yàn)至關(guān)重要,面板巨頭主導(dǎo)著技術(shù)進(jìn)步和批量生產(chǎn)良品率。

之前媒體流傳的BOM清單顯示,售價(jià)3499美元的Apple Vision Pro硬件物料成本約 1509 美元,其中,索尼供應(yīng)的兩片4K分辨率OLED內(nèi)屏一片350美元,合計(jì) 700美元,幾乎占據(jù)了物料成本的一半,為成本最高的零組件。相比之下,臺(tái)積電代工的M2 處理器僅需 120 美元。

2023年年中發(fā)布的Apple Vison Pro,采用了4K分辨率的昂貴OLED微顯示屏,(型號(hào)可能是官網(wǎng)顯示的1.30type ECX344A),相比2023年上半年發(fā)布Rokid Max,還停留在1080P分辨率。

第二個(gè)關(guān)鍵對(duì)比,光路傳輸,即光學(xué)顯示透鏡的設(shè)計(jì),VR頭顯一般有透鏡、涅菲爾透鏡、Pancake透鏡模組三種方案。它們之前的差異就是模組輕薄程度(關(guān)鍵)和一系列影響顯示效果的光學(xué)特性,如FOV、光效率、MTF、雜散光抑制、像差和色差消除、超高分辨率適配等。Pancake最為輕薄,關(guān)鍵光學(xué)參數(shù)綜合最好,但也是近乎10倍于傳統(tǒng)透鏡的價(jià)格。

根據(jù)多方信源,Apple Vision Pro采用了定制的多片式(3片)Pancake透鏡模組。蘋果官方新聞稿中明確提到“定制的折反射透鏡”字樣,Pancake屬于折返射透鏡的其中一類,蘋果已收購(gòu)的光學(xué)公司Limbak就以折反射方案聞名,此前還推出了某種“超級(jí)Pancake”透鏡設(shè)計(jì)。

熟悉光學(xué)透鏡設(shè)計(jì)和制造的人知道,Pancake本身就是一個(gè)剛出來(lái)沒(méi)幾年的前沿高端方案,適配超高分辨率屏幕的Pancake模組,(根據(jù)同行HyperVision解析)Vision Pro使用的還是多片式帶有獨(dú)特非標(biāo)曲面的定制Pancake模組,這意味著對(duì)齊、加工精度和量產(chǎn)一致性是個(gè)非常大的挑戰(zhàn)。透鏡模組的設(shè)計(jì),分光、極化偏振、消除鬼影的各類光學(xué)鍍膜和層片需要有非常深厚的光學(xué)研究和積累。

Apple Vision足夠獨(dú)創(chuàng)且研究艱深,構(gòu)筑了一定的產(chǎn)品壁壘,頭顯整體的精密和復(fù)雜從光學(xué)透鏡一個(gè)組件上就能體現(xiàn)。相比之下,中國(guó)的AR廠商如Rokid Max似乎還是用中國(guó)供應(yīng)鏈廠商的整體BirdBath模組方案;菖!Ⅷ櫹伝蛞曆,直接拿來(lái)用。

嚴(yán)格地說(shuō),Apple Vision Pro這種不同原理的復(fù)雜頭顯、完全不同的產(chǎn)品形態(tài),Rokid不應(yīng)該拿來(lái)對(duì)比。但同類型的BirdBath AR眼鏡,Xreal 能夠獨(dú)立設(shè)計(jì)光引擎+透鏡模組,并且在無(wú)錫有光引擎組件的量產(chǎn)工廠,這也是Xreal能夠在國(guó)外專業(yè)技術(shù)組織SID Display VR/AR專場(chǎng)頻頻亮相的原因。因?yàn)榧幢鉈irdBath,也有PBS偏振分光棱鏡,消除多源頭的雜散光、邊緣炫光、矯正像差和色差的鍍膜,設(shè)計(jì)光路、適眼距、eyebox、改進(jìn)MTF等諸多細(xì)節(jié)。

Rokid即使相比雷鳥創(chuàng)新,雷鳥的BirdBath產(chǎn)品線也是拿來(lái)主義,但起碼雷鳥毫不畏懼另一條產(chǎn)品線Micro LED+光波導(dǎo)方案“真AR眼鏡”的技術(shù)困難。雷鳥創(chuàng)新雖然直接使用了來(lái)自JBD的Micro LED的X-cube RGB三塊小面板方案,但成功落地量產(chǎn),解決了配套的研發(fā)、測(cè)試、量產(chǎn)一致性的諸多問(wèn)題。

沒(méi)有從底層產(chǎn)品原理上最細(xì)微處的洞察,對(duì)光學(xué)的積累和重視,沒(méi)有完全從0到1的獨(dú)創(chuàng)精神,是無(wú)法做出真正領(lǐng)先市場(chǎng)的AR硬件終端。

第三個(gè)關(guān)鍵對(duì)比,傳感、數(shù)據(jù)傳輸&處理、人機(jī)交互和人機(jī)工程對(duì)于視覺(jué)-人腦的深入研究,這是當(dāng)前技術(shù)研發(fā)能夠拉開差距的關(guān)鍵地方。光學(xué)顯示透鏡和小屏幕都有比較成熟的供應(yīng)鏈廠商,昂貴或便宜,好的不好的,大家可以選擇。即使蘋果、Meta、谷歌近10年收購(gòu)的光學(xué)和微顯示領(lǐng)域的研究型創(chuàng)企,也基本上處在實(shí)驗(yàn)室的超前概念預(yù)研階段,能真正落地整合進(jìn)自家產(chǎn)品且商用的很少。體驗(yàn)做不到超前的獨(dú)一檔。

VR跟裹住眼睛的3D幕布不同的是,VR需要能跟外界進(jìn)行交互,比如手勢(shì)交互、眼球運(yùn)動(dòng)、頭部運(yùn)動(dòng)、肢體體感、指環(huán)或手柄。實(shí)現(xiàn)交互的硬件基礎(chǔ),設(shè)計(jì)專門的高精度傳感器,比如基于dToF原理的激光雷達(dá)、基于紅外點(diǎn)陣特征識(shí)別的深度相機(jī)、高清RGB攝像頭,以及相匹配的先進(jìn)算法。傳感器的數(shù)量、分布、精度、算法的效果會(huì)有明顯差異。

以Apple Vision Pro為例,它將眼球追蹤+手勢(shì)交互+語(yǔ)音操作做到了極致,并且將其引導(dǎo)成“空間計(jì)算”最舒服最符合直覺(jué)的交互模式。為此,Apple Vision Pro在傳感器的硬件配置和算法上下了非同一般的功夫,比如為了實(shí)現(xiàn)高精度的眼球追蹤,別家都是左右眼各一個(gè)紅外相機(jī)和數(shù)個(gè)IR LED等,Apple Vision Pro 左右眼各兩個(gè)IR Camera+環(huán)繞眼眶更多的 IR LED。已經(jīng)公開的專利也顯示,蘋果在視網(wǎng)膜透視、特征識(shí)別上進(jìn)行了大量的研究,為了進(jìn)一步提升精度,甚至有工業(yè)級(jí)的激光干涉測(cè)量原理的方案被披露出來(lái)。

Vision Pro 配備了 4 個(gè)定制的紅外相機(jī)(左右眼各 2 個(gè)),使用多達(dá) 34 顆紅外 LED 燈,可以非常精準(zhǔn)的追蹤和預(yù)測(cè)眼球視線的變化,凝視和掃視。數(shù)據(jù)傳輸和處理上,Vison Pro 同時(shí)搭載了 M2 和全新的 R1 芯片,M2是桌面級(jí)性能非常強(qiáng)大的核心處理器,而R1 芯片是蘋果為 vision pro 設(shè)計(jì)的傳感器數(shù)據(jù)實(shí)時(shí)處理定制芯片,類似iPhone協(xié)處理器,是其實(shí)現(xiàn)高性能眼動(dòng)追蹤重要基矗R1 芯片專門處理 12 個(gè)攝像頭、5 個(gè)傳感器和 6 個(gè)麥克風(fēng)的輸入,以確保內(nèi)容實(shí)時(shí)呈現(xiàn)在用戶眼前,R1 芯片能在 12 毫秒內(nèi)將新圖像傳輸?shù)斤@示屏中,降低圖像到屏幕的延遲,以超高的精度、極低的延遲識(shí)別用戶所在的環(huán)境以及用戶的手勢(shì)和眼球的運(yùn)動(dòng),精準(zhǔn)分析出需要渲染的場(chǎng)景,從而實(shí)現(xiàn)動(dòng)態(tài)注視點(diǎn)渲染功能。通過(guò) Vision Pro 提供的低延遲、高精度信息輸入,用戶得以從手柄控制器中解放出來(lái),只需眼睛注視即可準(zhǔn)確地選中元素,以極其自然、優(yōu)雅且直觀的方式與數(shù)字世界進(jìn)行交互。

Vision Pro讓眼球追蹤真正落地成為主要交互方式,還是令一眾觀察家驚訝不已。

微軟HoloLens 2軟件開發(fā)指南中曾提到,人眼視線的運(yùn)動(dòng)是不規(guī)則且跳躍的,并且速度很快?赡茉谟脩敉瓿牲c(diǎn)擊動(dòng)作之前,視線早已經(jīng)飄走,因此將快速眼睛凝視信號(hào)與慢速的控制輸入結(jié)合起來(lái)需要格外小心。

此前Meta Reality Labs的一份關(guān)于“手柄、頭動(dòng)以及眼動(dòng)交互”的一份研究指出,以90Hz運(yùn)行的平均精度誤差低于1°的眼動(dòng)追蹤系統(tǒng)(在無(wú)光標(biāo)或其他反饋的條件下),它在易用性、采用率和疲勞度相較于頭部輸入(Head input )分別提高了66.4%、89.8%和116.1%,而相較于手柄輸入則分別降低了4.2%、8.9% 和 116.1%,不過(guò)它的失誤率是三者當(dāng)中最高的。

除了強(qiáng)大的傳感器和實(shí)時(shí)數(shù)據(jù)處理,在算法方面,蘋果也早早進(jìn)行了布局。根據(jù)外部資料,早在2017年,蘋果收購(gòu)德國(guó)眼動(dòng)追蹤技術(shù)開發(fā)商SensoMotoric Instruments(SMI),這是一家專注于該細(xì)分領(lǐng)域的頭部企業(yè),已有30余年的發(fā)展歷史。

蘋果前員工Sterling Crispin爆料稱,蘋果圍繞Vision Pro有一個(gè)專門研究神經(jīng)技術(shù)的開發(fā)小組,而他所做的工作之一是通過(guò)AI預(yù)判用戶的操作行為。他提到,“你的瞳孔會(huì)在你點(diǎn)擊某物之前作出反應(yīng),部分原因在于用戶對(duì)接下來(lái)發(fā)生的事有所期望。因此,可以通過(guò)觀察用戶的眼睛行為并配合實(shí)時(shí)反饋的UI來(lái)增強(qiáng)用戶大腦的預(yù)測(cè)性瞳孔反應(yīng),從而創(chuàng)建生物反潰”AI算法的加入,是Vision Pro的眼動(dòng)交互備受好評(píng)的重要原因之一。

眼球追蹤只是蘋果Vision Pro在人機(jī)交互體驗(yàn)高出同行一截的顯性部分。在傳感、數(shù)據(jù)傳輸、計(jì)算、人機(jī)交互軟硬件方案上,亮點(diǎn)實(shí)在是太多。

比如在AR/VR剛興起時(shí),業(yè)內(nèi)就幾乎確認(rèn)了裸手交互是重點(diǎn)方向,只是要想做好手勢(shì)交互精準(zhǔn)且流暢,技術(shù)難度不校而裸手交互被蘋果真正推向了極致,展現(xiàn)了與市場(chǎng)上其他玩家完全不同的策略。Vision Pro配備了多個(gè)用于手勢(shì)識(shí)別的攝像頭和傳感器,可以檢測(cè)腰部以下的手勢(shì),用戶還可以把手放在膝蓋上進(jìn)行操作,這是之前VR廠商做不到的。

主流VR的手勢(shì)追蹤必須將手放在攝像頭FOV范圍內(nèi),使用時(shí)雙手必須微抬或舉在身體前面,時(shí)間一長(zhǎng)就非常累,導(dǎo)致用戶體驗(yàn)差。而Vision Pro則擁有6顆SLAM+手勢(shì)攝像頭,其中有兩顆向下的攝像頭專門捕捉手垂放在腿上的視角。另外,還有兩顆斜向下的攝像頭同時(shí)兼顧SLAM和手勢(shì)。甚至為了弱光環(huán)境下手勢(shì)識(shí)別準(zhǔn)確性,蘋果還加入了兩顆紅外LED進(jìn)行輔助。

這種垂直視角的攝像頭,專門用于捕捉大部分時(shí)間、不抬手的時(shí)候的手勢(shì),因?yàn)楹芏鄷r(shí)候雙手應(yīng)該自然垂放在腿或桌子上,符合人體工學(xué)邏輯。蘋果Vision Pro是AR/VR中的首家采用這一方案的設(shè)備,屬于獨(dú)一份。

Apple Vision Pro 眼球追蹤體驗(yàn)刷新了行業(yè)認(rèn)知,多種類型傳感器硬件、分布、算法研究之深很難給出準(zhǔn)確評(píng)估,硬件底層還有專門的傳感器數(shù)據(jù)實(shí)時(shí)處理芯片R1,極限壓縮交互上的反饋(圖像)延遲,Apple Vision Pro在人機(jī)交互的軟硬件的方方面面,幾乎獨(dú)創(chuàng)了整個(gè)方案。其他廠商短時(shí)間幾乎沒(méi)有可能追趕得上。

更值得深度思考的是Eyesight。根據(jù)Vision Pro官方發(fā)布會(huì)的說(shuō)法,Eyesight是一項(xiàng)引進(jìn)先進(jìn)AI后才解決了某項(xiàng)一直阻礙團(tuán)隊(duì)重要難題的交互方案,它完全不同于傳統(tǒng)VR的產(chǎn)品視角,少有人知曉的細(xì)節(jié):Eyesight的硬件實(shí)現(xiàn),讓外部攝像頭傳感器位置偏離常規(guī),相應(yīng)的矯正算法增加了不少的設(shè)計(jì)困難。

為了Eyesight,Vision Pro多用了一塊復(fù)雜的曲面OLED外屏,增加了曲面玻璃罩的“死重“,為此還需要重新調(diào)整傳感器分布,進(jìn)行實(shí)時(shí)畫面矯正,代價(jià)不校蘋果也在發(fā)布會(huì)上花了很大篇幅講Eyesight。

國(guó)外著名的AR專家Karl Guttag在個(gè)人博客上暗示,蘋果在VR頭顯上擊中了關(guān)鍵點(diǎn),深思熟慮后為了Eyesight 在產(chǎn)品上做了重大妥協(xié),體現(xiàn)了這家公司對(duì)產(chǎn)品和用戶的深刻洞察力:Eyesight做到了外圍視覺(jué)的動(dòng)態(tài)感知,佩戴頭顯的用戶能夠真正融入日常環(huán)境,與他人更符合人類的方式互動(dòng),讓VR頭顯開始真正具備大眾消費(fèi)電子產(chǎn)品的可能;究梢灶A(yù)見,Eyesight 馬上也會(huì)成為行業(yè)的“高端標(biāo)配”。

再回過(guò)頭來(lái)看,中國(guó)的AR創(chuàng)企代表Rokid,有位參加Rokid首屆高校XR內(nèi)容創(chuàng)作大賽的選手在媒體上這樣寫道,

Rokid Max Pro,這款眼鏡從外觀和手感/重量上其實(shí)與Rokid Max基本沒(méi)有什么區(qū)別,就是兩眼中間位置增加了一個(gè)攝像頭。而利用這個(gè)攝像頭以及另一款目前還不能公布的硬件,Rokid Max Pro用戶能實(shí)現(xiàn)SLAM( 即Simultaneous Localization And Mapping視覺(jué)定位和建圖)、3D裸手交互等功能。嗯,我相信你一定見過(guò)同類產(chǎn)品上利用雙目視覺(jué)實(shí)現(xiàn)該功能的產(chǎn)品,但Rokid Max Pro卻只用單目,這效果真的OK么?我現(xiàn)在不能透露有關(guān)它的一些技術(shù)細(xì)節(jié),但我可以說(shuō)的是這款產(chǎn)品在定位的“穩(wěn)定性”以及手勢(shì)動(dòng)作識(shí)別“精確度”、“延遲性”上的表現(xiàn)令我驚嘆....

還在糾結(jié)和對(duì)比單目還是雙目的視覺(jué)SLAM...傳感器的精度、數(shù)據(jù)的延遲、數(shù)據(jù)流的處理模式、有沒(méi)有專屬芯片和定制傳感器這種底層創(chuàng)新暫且不表,產(chǎn)品宣傳如此高調(diào),“空間計(jì)算操作系統(tǒng)”、“超前的應(yīng)用開發(fā)生態(tài)”、“人機(jī)交互重大創(chuàng)新”、“AR空間創(chuàng)作工具“,投資人是真不懂嗎?

如此簡(jiǎn)陋,毫無(wú)技術(shù)含量的供應(yīng)鏈組裝品,卻成為中國(guó)AR企業(yè)的代表,融資如喝水一般簡(jiǎn)單,不禁莞爾一笑。底層創(chuàng)新是如此之難。但你剛挖好農(nóng)村宅基地的地基,卻要在這上面壘起來(lái)上海中心大廈?

這一波風(fēng)口,飛上天之后,總該拿出點(diǎn)硬貨。我不信投資人真的不懂Apple Vision Pro的創(chuàng)新有多么深刻。在歷時(shí)兩個(gè)月的深入研究后,我相信真正的創(chuàng)業(yè)者應(yīng)該出發(fā)了。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港