展會(huì)信息港展會(huì)大全

思必馳自然場(chǎng)景數(shù)字人生成技術(shù),音畫合一有模有樣
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-08-31 10:52:14   瀏覽:16382次  

導(dǎo)讀:AIGC大爆發(fā),科技革新不斷,數(shù)字人在各種場(chǎng)景中嶄露頭角,如數(shù)字人主播、數(shù)字人解說員、數(shù)字人導(dǎo)購等。根據(jù)真人AI生成數(shù)字人分身,這項(xiàng)技術(shù)已經(jīng)從未來走進(jìn)現(xiàn)實(shí)。 數(shù)字人(Digital Human)是指利用計(jì)算機(jī)技術(shù)和人工智能技術(shù),根據(jù)真實(shí)人類的外貌、動(dòng)作、聲音等特征,...

AIGC大爆發(fā),科技革新不斷,數(shù)字人在各種場(chǎng)景中嶄露頭角,如數(shù)字人主播、數(shù)字人解說員、數(shù)字人導(dǎo)購等。根據(jù)真人AI生成數(shù)字人分身,這項(xiàng)技術(shù)已經(jīng)從未來走進(jìn)現(xiàn)實(shí)。

數(shù)字人(Digital Human)是指利用計(jì)算機(jī)技術(shù)和人工智能技術(shù),根據(jù)真實(shí)人類的外貌、動(dòng)作、聲音等特征,生成的具有高逼真度以及高交互性的虛擬人物,可以為人類提供多樣化的服務(wù)。

近期,【東風(fēng)生萬物】思必馳DFM-2大模型及創(chuàng)新技術(shù)應(yīng)用成果發(fā)布會(huì)上,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱的數(shù)字分身重磅亮相發(fā)布會(huì)現(xiàn)常

圖1.png

(思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱數(shù)字人)

思必馳基于DFM-2大模型推出的自然場(chǎng)景數(shù)字人生成技術(shù),采用擴(kuò)散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,實(shí)現(xiàn)高品質(zhì)數(shù)字人生成,個(gè)性化對(duì)話生成與語音合成模型無縫結(jié)合,構(gòu)建可自由交互的個(gè)性化數(shù)字形象。思必馳打造的數(shù)字人不僅能說會(huì)道,還精通粵語、四川話、上海話各地方言及英語、法語、俄語等各國語言,可應(yīng)用于智能家居、智能車載、智能軌交、市場(chǎng)營銷等場(chǎng)景,為人類生活帶來更多可能。

圖2.jpg

(思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱真人出鏡)

就像視頻中的數(shù)字人俞凱教授,無論是聲音、表情、動(dòng)作還是形象,都與真人高度接近,甚至還可以根據(jù)不同場(chǎng)景,切換語言與人類進(jìn)行交互。

數(shù)字人的打造需要運(yùn)用計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、自然語言處理、智能語音等領(lǐng)域的知識(shí)和技術(shù),從而從形態(tài)到聲音上打造一個(gè)媲美真人的數(shù)字人。

思必馳基于DFM-2大模型推出的自然場(chǎng)景數(shù)字人生成技術(shù),采用擴(kuò)散生成模型,通過小數(shù)據(jù)模型訓(xùn)練,實(shí)現(xiàn)高品質(zhì)數(shù)字人生成,個(gè)性化對(duì)話生成與語音合成模型無縫結(jié)合,構(gòu)建可自由交互的個(gè)性化數(shù)字形象。思必馳打造的數(shù)字人不僅能說會(huì)道,還精通粵語、四川話、上海話等各地方言及英語、法語、俄語等多國語言,可應(yīng)用于智能家居、智能車載、智能軌交、市場(chǎng)營銷等場(chǎng)景,為人類生活帶來更多可能。

聲音復(fù)刻為數(shù)字人賦予真人同款聲音,思必馳聲音復(fù)刻技術(shù)服務(wù),支持男聲、女聲、童聲及中、英文和方言復(fù)刻,可輔助用戶打造不同年齡、不同性別的數(shù)字人形象。

情感合成讓數(shù)字人也能表達(dá)喜怒哀樂,思必馳可合成高音質(zhì)、多情感的音色,呈現(xiàn)“高興、抱歉、撒嬌、中性”等多種情感聲音,為數(shù)字人的情感表達(dá)賦予了更多活力,提升了人機(jī)交互體驗(yàn)。

單人千音讓數(shù)字人也能說方言外語,思必馳單人千音技術(shù)可以在短時(shí)間內(nèi)快速將單個(gè)發(fā)音人的音色,遷移成為粵語、四川話、上海話、蘇州話、閩南語等方言以及俄語、德語、日語、法語、泰語、西班牙語等外語,讓數(shù)字人“青出于藍(lán)而勝于藍(lán)”。

中商產(chǎn)業(yè)研究院發(fā)布的《2023年數(shù)字人產(chǎn)業(yè)發(fā)展白皮書》顯示,2022年我國數(shù)字人產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)1464億元(同比增長57%),預(yù)計(jì)2025年全國數(shù)字人相關(guān)企業(yè)數(shù)量將突破40萬家、數(shù)字人產(chǎn)業(yè)市場(chǎng)規(guī)模將達(dá)到2600億元。數(shù)字人將進(jìn)入大規(guī)模應(yīng)用期,轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力為社會(huì)創(chuàng)造價(jià)值。目前,數(shù)字人可應(yīng)用于智能家居、智能車載、智能軌交、市場(chǎng)營銷等場(chǎng)景。

3.png

在市場(chǎng)營銷領(lǐng)域,數(shù)字人可用于線上直播進(jìn)行產(chǎn)品營銷推廣,降低公司的人力成本;在智能車載領(lǐng)域,數(shù)字人可融入車載系統(tǒng),為用戶提供導(dǎo)航等服務(wù)提供更智慧的出行體驗(yàn);在家居領(lǐng)域,數(shù)字人可入駐家電大屏中,為用戶提供菜譜推薦、家務(wù)規(guī)劃、情感陪伴等服務(wù),成為用戶貼心的數(shù)字人管家;在軌交領(lǐng)域,數(shù)字人可在車站提供路線導(dǎo)航、購票咨詢、信息咨詢等服務(wù),降低軌交領(lǐng)域人力成本。

相較于真人,數(shù)字人可以不受時(shí)間或空間的限制,隨著大模型技術(shù)的應(yīng)用,數(shù)字人也持續(xù)釋放價(jià)值。未來,思必馳將基于DFM-2大模型,綜合全鏈路語音交互技術(shù),為用戶帶來更具特色的數(shù)字人形象,加速推進(jìn)AI技術(shù)的應(yīng)用落地。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港