展會(huì)信息港展會(huì)大全

新壹科技亮出視頻垂直大模型,支持多模態(tài),24小時(shí)訓(xùn)練一個(gè)數(shù)字人
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-28 16:29:55   瀏覽:22097次  

導(dǎo)讀:智東西(公眾號(hào):zhidxcom) 作者 | 周炎 編輯 | 云鵬 智東西7月27日?qǐng)?bào)道,剛剛,新壹科技發(fā)布了國(guó)內(nèi)首款聚焦視頻的大模型新壹視頻大模型,以及AIGC視頻生成平臺(tái)秒創(chuàng)視頻創(chuàng)作平臺(tái),首款基于商用的數(shù)字人平臺(tái)新壹數(shù)字人平臺(tái),此外,還發(fā)布了國(guó)內(nèi)首款明星數(shù)字...

智東西(公眾號(hào):zhidxcom)

作者 | 周炎

編輯 | 云鵬

智東西7月27日?qǐng)?bào)道,剛剛,新壹科技發(fā)布了國(guó)內(nèi)首款聚焦視頻的大模型“新壹視頻大模型”,以及AIGC視頻生成平臺(tái)“秒創(chuàng)視頻創(chuàng)作平臺(tái)”,首款基于商用的數(shù)字人平臺(tái)“新壹數(shù)字人平臺(tái)”,此外,還發(fā)布了國(guó)內(nèi)首款明星數(shù)字人祝福視頻制作產(chǎn)品“秒祝”。

其中,“秒創(chuàng)視頻創(chuàng)作平臺(tái)”可以在用戶創(chuàng)作內(nèi)容的過(guò)程中提供AI生成服務(wù),其中包括文字續(xù)寫、文字轉(zhuǎn)語(yǔ)音、文生圖、圖文轉(zhuǎn)視頻等,至此新壹科技的AI生成能力已覆蓋文本、圖像、音視頻等內(nèi)容模態(tài)。

新壹科技CEO雷濤稱,AI賦能視頻生產(chǎn),進(jìn)一步降低了視頻生產(chǎn)門檻,用戶可以更方便快捷地生產(chǎn)更高質(zhì)量的視頻,這樣更多人參與到視頻創(chuàng)作中,視頻行業(yè)的格局或?qū)⒃俣雀淖儭?/p>

一、具備多模態(tài)感知、實(shí)時(shí)學(xué)習(xí)等核心能力,“秒創(chuàng)”幾分鐘內(nèi)生成科普視頻

新壹科技發(fā)布的新壹視頻大模型,基于深度學(xué)習(xí)海量視頻樣本,具有從腳本生成、素材匹配、智能剪輯配音到數(shù)字人播報(bào)的AI全流程視頻生產(chǎn)能力,有助于讓用戶實(shí)現(xiàn)高質(zhì)量、高效率、低成本、無(wú)門檻視頻創(chuàng)作。

▲新壹科技創(chuàng)始人、董事長(zhǎng)韓坤發(fā)布會(huì)現(xiàn)場(chǎng)發(fā)表演講

新壹視頻大模型具備多模態(tài)感知、實(shí)時(shí)學(xué)習(xí)、自迭代及多場(chǎng)景交叉推理的核心能力。能夠處理多模態(tài)的輸入信息,可以理解文字的含義,識(shí)別圖像的內(nèi)容,感知音樂(lè)的情緒,基于對(duì)內(nèi)容深度準(zhǔn)確的理解,生成視頻。

新壹視頻大模型采用了自監(jiān)督學(xué)習(xí)方案,會(huì)觀察和學(xué)習(xí)大量的視頻數(shù)據(jù),通過(guò)分析視頻的結(jié)構(gòu)、內(nèi)容、風(fēng)格等多個(gè)維度,自我理解和把握視頻制作的規(guī)則和邏輯。

新壹視頻大模型能跨場(chǎng)景進(jìn)行知識(shí)遷移與關(guān)聯(lián),選擇合適素材,調(diào)整視頻風(fēng)格,生成滿足創(chuàng)作者需求且質(zhì)量高的視頻;其可面向行業(yè)級(jí)的垂直場(chǎng)景對(duì)新壹視頻大模型做定向訓(xùn)練,以提供更加精準(zhǔn)、專業(yè)的服務(wù)。

秒創(chuàng)是基于新壹科技視頻大模型的AI內(nèi)容生成平臺(tái),該平臺(tái)提供了圖片生成、視頻生成、聲音生成、數(shù)字人生成等AIGC功能,以及千萬(wàn)級(jí)的結(jié)構(gòu)化視頻庫(kù)。通過(guò)秒創(chuàng)平臺(tái),創(chuàng)作者可以把一篇文章甚至是一個(gè)想法制作為視頻,而且從文案到視頻成品時(shí)間僅為5分鐘。

▲新壹科技CEO雷濤發(fā)布會(huì)現(xiàn)場(chǎng)對(duì)相關(guān)產(chǎn)品進(jìn)行演示講解

二、24小時(shí)完成數(shù)字人訓(xùn)練,3D數(shù)字人未來(lái)將成為人人標(biāo)配

新壹科技的數(shù)字人平臺(tái)通過(guò)多模態(tài)合成AI技術(shù),可以將真人錄制的視頻和音頻素材生成2D寫實(shí)數(shù)字人,同時(shí)該平臺(tái)在24內(nèi)小時(shí)可以完成一個(gè)數(shù)字人的訓(xùn)練。

該數(shù)字人平臺(tái)融合通用語(yǔ)言模型、音視頻生成技術(shù),能夠低成本的生成真人播報(bào)視頻和直播,有助于降低真人出鏡門檻。此外新壹數(shù)字人平臺(tái)還可以驅(qū)動(dòng)3D數(shù)字人形象。

新壹科技發(fā)布的最后一款應(yīng)用為明星數(shù)字人祝福視頻制作產(chǎn)品秒祝。秒祝通過(guò)對(duì)明星視頻進(jìn)行訓(xùn)練,將明星的形象和聲音還原出來(lái),生成對(duì)應(yīng)的明星數(shù)字人形象。最終呈現(xiàn)給客戶的是以明星數(shù)字人為主角的個(gè)性化定制祝福視頻。

結(jié)語(yǔ):20年視頻行業(yè)積累經(jīng)驗(yàn),未來(lái)AIGC業(yè)務(wù)將在垂直場(chǎng)景落地

在過(guò)去將近20年的時(shí)間里,新壹科技一直從事視頻相關(guān)領(lǐng)域,并培養(yǎng)了一支代碼技術(shù)過(guò)硬的工程師團(tuán)隊(duì)。

目前,新壹科技的AI生成能力已覆蓋文本、圖像、音視頻等內(nèi)容模態(tài),已經(jīng)實(shí)現(xiàn)從大模型到平臺(tái)服務(wù)再到產(chǎn)品服務(wù)落地的AIGC業(yè)務(wù)全鏈路打通。未來(lái),新壹科技將推出政府政務(wù)、金融保險(xiǎn)、適老養(yǎng)老、智能交互數(shù)字人以及游戲等垂直場(chǎng)景服務(wù)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港