展會信息港展會大全

AI讓趙本山、郭德綱一起飆英文:背后科技來自中國團隊,7個月收入百萬美元
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-31 13:10:50   瀏覽:7177次  

導(dǎo)讀:你能想象趙本山一口純正倫敦腔嗎? 在AI時代,一切皆有可能。 近日,不少郭德綱說英文相聲、趙本山倫敦腔接受采訪、馬保國狂飆日語化身馬大佐的視頻開始在互聯(lián)網(wǎng)風(fēng)靡,這背后的核心技術(shù)來自于一款A(yù)I視頻工具。 據(jù)悉,這一技術(shù)支持300多種聲音、40多種語言,...

你能想象趙本山一口純正倫敦腔嗎?

在AI時代,一切皆有可能。

近日,不少郭德綱說英文相聲、趙本山倫敦腔接受采訪、馬保國狂飆日語化身馬大佐的視頻開始在互聯(lián)網(wǎng)風(fēng)靡,這背后的核心技術(shù)來自于一款A(yù)I視頻工具。

據(jù)悉,這一技術(shù)支持300多種聲音、40多種語言,不僅可以準(zhǔn)確卡點,音色與講母語時候的音色類似,甚至連口型都能對上。

在來勢洶洶的AI浪潮下,這次“被失業(yè)”的又是誰?

賽博法師讓趙本山、郭德綱說英文,AI取代人類進程加速?

從上周開始,郭德綱說英文的視頻就開始在抖音、微博等平臺瘋傳,在這些視頻中郭老師不僅用英文接受采訪,還用英文說相聲。而這些的視頻并非簡單的配音或者AI變聲,而是高度貼合人物聲線和風(fēng)格、甚至連嘴型都匹配,以假亂真程度讓圍觀者大為震驚。

本周一趙本山倫敦腔接受采訪的視頻以同樣的原因在全網(wǎng)爆紅。在這兩例娛樂性極強的案例的啟發(fā)下,有網(wǎng)友認為在未來翻譯的工作極有可能被AI取代,而好萊塢罷工所擔(dān)憂的AI取代演員危機似乎也初見端倪。

藍鯨記者采訪到了其中多條爆款視頻的制作者UP主賽博法師,他告訴藍鯨記者,這些視頻的爆火在他的預(yù)期之中,“在發(fā)作品之前,還在制作過程中的時候我就知道會火。”他表示,自己本身是傳媒、新媒體行業(yè)出身,進行AI相關(guān)內(nèi)容創(chuàng)作也有半年多,認為自己的網(wǎng)感和對AI發(fā)展的情況都有一定自信,“在作品還在制作中的時候,我都在不禁感嘆,實在是太像了。我們這些AI相關(guān)的創(chuàng)作者更了解現(xiàn)在的AI發(fā)展到哪一步了, 閾值比普通人更高,連我都感嘆的東西,普通人看到也一定會贊嘆。”

除了技術(shù)本身帶給大家的震撼,這類爆款視頻的主人公也是精心選擇的結(jié)果,賽博法師表示,“主要是反差感。趙本山和郭德綱都是老派語言類表演藝術(shù)家,他們在公眾前的形象都是比較有鄉(xiāng)土氣息的,并不那么洋氣,那么設(shè)想一下,當(dāng)觀眾們看著他們兩個突然飚出一口英文會怎么樣?我就是想抓住這個反差感,讓他們第一時間吸引觀眾的耳朵和眼睛。”

不過從AI孫燕姿起,版權(quán)就像一把達摩克利斯之劍懸在創(chuàng)作者頭上,賽博法師也不免有此擔(dān)憂,他告訴藍鯨記者,自己雖然同步在B站與抖音都發(fā)布了相關(guān)視頻,但趙本山和郭德綱并沒有在抖音火起來,很大程度上是因為被限流了,“還是比較擔(dān)心版權(quán)問題的,目前這還只是翻譯了原視頻,我要是直接修改人物發(fā)言內(nèi)容,造成名譽受損、造謠等后果那就太嚴重了。”

AI郭德綱技術(shù)來自深圳創(chuàng)業(yè)公司,已實現(xiàn)盈利

據(jù)賽博法師介紹,AI郭德綱的實現(xiàn)主要基于一款A(yù)I視頻工具HeyGen,用戶只需上傳視頻,選擇語言,就能生成自動翻譯、音色調(diào)整、嘴型匹配的視頻。

而HeyGen背后則是一家在深圳創(chuàng)立的AIGC企業(yè)。

HeyGen的開發(fā)團隊為詩云科技,司如其名,公司名中的“詩云”取自劉慈欣科幻小說《詩云》,寓意人的創(chuàng)造性無法被科技取代,但創(chuàng)作的過程和效率卻可以被機器極大優(yōu)化,而現(xiàn)實中詩云科技要做的也是用AI生成內(nèi)容,讓用戶以更低成本完成內(nèi)容創(chuàng)作。

據(jù)天眼查APP,詩云科技的法定代表人為徐卓,目前公司已完成兩輪數(shù)百萬美元融資。其中2021年3月,詩云科技宣布獲得紅杉中國種子基金和真格基金的天使輪投資;同年8月30日,詩云科技宣布獲得數(shù)百萬美元Pre-A輪融資,由IDG資本領(lǐng)投、紅杉中國種子基金和真格基金跟投。

徐卓英文名Joshua,他本科畢業(yè)于同濟大學(xué)自動化專業(yè),后前往卡內(nèi)基梅隆大學(xué)攻讀計算機碩士學(xué)位。作為明星應(yīng)用Snapchat前100號員工 ,徐卓從0到1搭建了Snapchat廣告平臺、推薦算法系統(tǒng)以及機器學(xué)習(xí)平臺Barista,并負責(zé)AI camera的技術(shù)及產(chǎn)品研發(fā),經(jīng)驗十分豐富。他的創(chuàng)業(yè)合伙人梁望此前在字節(jié)跳動擔(dān)任北美設(shè)計主管,二人同屬大廠精英。

HeyGen于2022年7月正式推出,據(jù)36氪報道,HeyGen在7個月內(nèi)實現(xiàn)了100萬美元的ARR(年度經(jīng)常性收入)。

HeyGen的收入主要來自于付費,據(jù)賽博法師介紹,這款應(yīng)用分年付和月付,月付最低29美元包含15分鐘生成時間,再往上還有幾個檔次,主要是包含的生成時間不同。對于這樣的收費,賽博法師認為對于普通用戶而言并不便宜,“29美元/月的起步價對于美國人來說可能不算什么,對于國內(nèi)來說就太貴了,畢竟換算下來兩百塊出頭了。”

但同時他也肯定了HeyGen的技術(shù):“半年前的AI技術(shù),還需要20-30分鐘的人聲素材,才能訓(xùn)練出一個聲音模型,而HeyGen只需要幾十秒,而且目前沒見到同類產(chǎn)品能做到像HeyGen一樣對口型。”

從AI孫燕姿到AI郭德綱,AIGC是玩具還是工具

自從ChatGPT在國內(nèi)掀起AI浪潮后,大廠悉數(shù)投入戰(zhàn)斗,但現(xiàn)實來看,當(dāng)初對標(biāo)ChatGPT的大模型類應(yīng)用或尚未面世,或并未掀起太大水花,相反一系列具體的落地應(yīng)用反而成為了一個個小爆款。

2023年5月AI孫燕姿全網(wǎng)爆紅,背后的黑科技為“SO-VITS-SVC”。

“SO-VITS-SVC”源于2021年6月11日發(fā)布的“VITS”的開源項目。“VITS”是一種語音合成模型,可以實現(xiàn)“文生音”的效果。但“VITS”模型需要海量的訓(xùn)練數(shù)據(jù),并高度依賴于人們對語料數(shù)據(jù)的文本標(biāo)記,應(yīng)用門檻很高。2022年8月26日,一位名為“Rcell”的B站用戶在“VITS”的基礎(chǔ)上,結(jié)合了Soft-vc、VIsinger等,開發(fā)出了“SO-VITS-SVC”模型。“SO-VITS-SVC”可以理解是一個音色轉(zhuǎn)換的AI模型,僅需十幾分鐘的音頻數(shù)據(jù),便可以擬合成具備特定主體音色的工具。

2023年8月,國內(nèi)首個AIGC爆款應(yīng)用妙鴨相機引爆網(wǎng)絡(luò),這是一款以AI大模型為基座的App,是由阿里大文娛投資的一個創(chuàng)業(yè)項目。該產(chǎn)品公布后,一些高峰期排隊、個人隱私相關(guān)話題引發(fā)關(guān)注。

2023年10月,憑借AI郭德綱與趙本山,HeyGen走入大眾視野。

縱觀在國內(nèi)激起大眾輿論層面關(guān)注的幾款A(yù)IGC應(yīng)用可以發(fā)現(xiàn),“玩具屬性”似乎是走紅的基礎(chǔ),當(dāng)初對標(biāo)“第四次工業(yè)革命”的AI創(chuàng)業(yè)浪潮則并沒有在大眾層面給生產(chǎn)力環(huán)節(jié)帶來相應(yīng)的驚喜。AIGC究竟會在多大程度上真正影響我們的生活?

對此,賽博法師認為,一個技術(shù)從出現(xiàn),到被大家熟知,需要一個過程。以“玩具”的形式出現(xiàn)在大眾眼前,不一定是一件壞事,同一種技術(shù),既可以做成玩具,也可以做成工具。“比方說我之前做過攝影師,在我手里我覺得單反相機更好用,手機只是圖一樂,拍不出相機的效果。但在普通人手里,相機還真沒有手機好用,使用門檻的高低直接決定了適用人群,玩具也可,工具也可以,主要是看誰來用。”

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港