展會(huì)信息港展會(huì)大全

蘋果開(kāi)發(fā)生成式 AI 技術(shù) HUGS:30 分鐘內(nèi)創(chuàng)建“數(shù)字化身”
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-20 09:30:15   瀏覽:3903次  

導(dǎo)讀:IT之家 12 月 20 日消息,蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)近日發(fā)布博文,展示了全新的生成式 AI 技術(shù)-- HUGS, 能夠在 30 分鐘內(nèi)分析短視頻,然后映射創(chuàng)建新的動(dòng)作和角度。 蘋果研究員 Anurag Ranjan 發(fā)布推文,表示 HUGS 的全稱叫作 Human Gaussian Splats,使用機(jī)器...

IT之家 12 月 20 日消息,蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)近日發(fā)布博文,展示了全新的生成式 AI 技術(shù)-- HUGS,能夠在 30 分鐘內(nèi)分析短視頻,然后映射創(chuàng)建新的動(dòng)作和角度。

蘋果研究員 Anurag Ranjan 發(fā)布推文,表示 HUGS 的全稱叫作 Human Gaussian Splats,使用機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué),在原始輸入數(shù)據(jù)較少的情況下,創(chuàng)建出逼真的人像元素。

蘋果官方介紹中表示神經(jīng)渲染技術(shù)目前已經(jīng)有了長(zhǎng)足的進(jìn)步,但最適合的場(chǎng)景依然是靜態(tài)場(chǎng)景的攝影測(cè)量,還無(wú)法推廣到環(huán)境中自由移動(dòng)的人類。

HUGS 使用 3D Gaussian Splatting 的技術(shù),在場(chǎng)景中創(chuàng)建可移動(dòng)的人類。

該方法本身需要少量的主體視頻,通常在場(chǎng)景中運(yùn)動(dòng),并顯示盡可能多的表面供系統(tǒng)工作。

在某些情況下,該技術(shù)對(duì)源輸入數(shù)據(jù)的要求很低,最少可以低至 50 到 100 幀的單目視頻,相當(dāng)于 2 到 4 秒的 24fps 視頻。

蘋果聲稱,該系統(tǒng)已經(jīng)過(guò)訓(xùn)練,可以“在 30 分鐘內(nèi)解開(kāi)靜態(tài)場(chǎng)景和完全可動(dòng)畫化的人類化身”。

蘋果表示 SMPL 體模型雖然用于初始化人類高斯模型,但無(wú)法捕獲每個(gè)細(xì)節(jié)。對(duì)于未建模的元素(如布料和頭發(fā)),該過(guò)程可以偏離 SMPL 模型,來(lái)填補(bǔ)模型捕獲中的空白。

蘋果官方表示從訓(xùn)練視頻到以 60fps 的渲染速度輸出,能夠在半小時(shí)完成人體建模和“最先進(jìn)的渲染質(zhì)量”動(dòng)畫,這比 NeuMan 和 Vid2Avatar 等其它方法快 100 倍。

IT之家附上論文參考地址如下:

Project: https://machinelearning.apple.com/research/hugs

Xiv: https://arxiv.org/abs/2311.17910

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港