展會(huì)信息港展會(huì)大全

正式開(kāi)源!網(wǎng)易有道上線“易魔聲”語(yǔ)音合成引擎
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-10 17:37:59   瀏覽:7598次  

導(dǎo)讀:11月10日,網(wǎng)易有道正式上線易魔聲開(kāi)源語(yǔ)音合成(TTS)引擎,所有用戶可免費(fèi)在開(kāi)源社區(qū)GitHub進(jìn)行下載使用,通過(guò)其提供的web界面及批量生成結(jié)果的腳本接口,輕松實(shí)現(xiàn)音色的情感合成與應(yīng)用。 據(jù)悉,易魔聲是一款有道自研TTS引擎,目前支持中英文雙語(yǔ),包含200...

11月10日,網(wǎng)易有道正式上線“易魔聲”開(kāi)源語(yǔ)音合成(TTS)引擎,所有用戶可免費(fèi)在開(kāi)源社區(qū)GitHub進(jìn)行下載使用,通過(guò)其提供的web界面及批量生成結(jié)果的腳本接口,輕松實(shí)現(xiàn)音色的情感合成與應(yīng)用。

據(jù)悉,“易魔聲”是一款有道自研TTS引擎,目前支持中英文雙語(yǔ),包含2000多種不同的音色,更有特色的情感合成功能,支持合成包含快樂(lè)、興奮、悲傷、憤怒等廣泛情感的語(yǔ)音。

(GitHub開(kāi)源界面)

在過(guò)往的回憶里,總會(huì)有一些特別的聲音,比如:偶像的聲音激勵(lì)人心、媽媽的聲音讓我們一秒回憶起小時(shí)候……聲音,作為語(yǔ)言維度的一種,總是蘊(yùn)含著人類充沛的情感表達(dá)。而富有情感的合成語(yǔ)音,是能夠?yàn)閼?yīng)用和內(nèi)容增色的AI功能。有道“易魔聲”則為開(kāi)發(fā)者和內(nèi)容創(chuàng)作者提供了一些解決思路只需簡(jiǎn)單通過(guò)在文本中加入情感的描述提示,就可以自由合成符合自己需求的帶有情感的語(yǔ)音,比傳統(tǒng)TTS更加自然逼真。

隨著基于GAN等現(xiàn)代AI技術(shù)的語(yǔ)音能力越來(lái)越成熟,實(shí)現(xiàn)一個(gè)質(zhì)量較高的TTS系統(tǒng)的門檻越來(lái)越低。但即使如此,中英雙語(yǔ)的高質(zhì)量、現(xiàn)代TTS模塊還是不易找到,要在自己的應(yīng)用與內(nèi)容中加入高逼真度且高度可控的語(yǔ)音,特別是中英雙語(yǔ)的語(yǔ)音,也依然比較麻煩。

“目前該項(xiàng)目還處于初期階段,現(xiàn)在將這個(gè)項(xiàng)目開(kāi)源,也是希望能幫助到有需求的開(kāi)發(fā)者與內(nèi)容創(chuàng)作者,并不斷擴(kuò)大高質(zhì)量TTS的應(yīng)用范圍,讓產(chǎn)品及應(yīng)用更好地落地。也期待大家試用后給我們提供更多反饋與建議。”網(wǎng)易有道CEO周楓介紹道。

有道在 TTS 領(lǐng)域耕耘多年,始終以場(chǎng)景為導(dǎo)向,不斷推動(dòng)技術(shù)落地,為用戶帶來(lái)諸多高效便捷的應(yīng)用和產(chǎn)品。例如,推出教育領(lǐng)域首個(gè)明星語(yǔ)音功能,將王源、歐陽(yáng)娜娜、馬伯騫等明星的聲音內(nèi)置在網(wǎng)易有道詞典中,陪伴用戶共同學(xué)習(xí)英語(yǔ);提供聲音定制和聲音復(fù)刻功能,僅需 5 分鐘即可完成個(gè)性化聲音定制;近期推出的 Hi Echo 虛擬人口語(yǔ)私教,借助有道「子曰」教育大模型、語(yǔ)音和虛擬人技術(shù),幫助用戶隨時(shí)隨地輕松練習(xí)英語(yǔ)口語(yǔ)。

從2008年起,網(wǎng)易有道便開(kāi)始布局AI,多年來(lái)一直致力于基于Transformer模型進(jìn)行創(chuàng)新和應(yīng)用,并在神經(jīng)網(wǎng)絡(luò)翻譯、計(jì)算機(jī)視覺(jué)、高性能計(jì)算、智能語(yǔ)音AI技術(shù)等方面都具備了核心技術(shù),為應(yīng)用的實(shí)際落地打下了堅(jiān)實(shí)的技術(shù)基矗

此外,用戶還可通過(guò)有道智云官網(wǎng),體驗(yàn)已經(jīng)對(duì)開(kāi)發(fā)者通過(guò)API等形式開(kāi)放的文本和圖像翻譯、文字和各類圖片識(shí)別、作文批改等各類AI技術(shù)。

有道智云AI開(kāi)放平臺(tái),是網(wǎng)易有道旗下一站式人工智能服務(wù)提供商,為開(kāi)發(fā)者、企業(yè)和政府機(jī)構(gòu)等提供自然語(yǔ)言翻譯、文字識(shí)別、OCR、語(yǔ)音識(shí)別等服務(wù)以及行業(yè)解決方案,致力于提供安全、可靠和高效的云服務(wù)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港