展會信息港展會大全

微軟攜手 Project Gutenberg,利用 AI 制作 5000 本免費有聲書
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-12 13:00:36   瀏覽:10686次  

導(dǎo)讀:IT之家 9 月 12 日消息,微軟近日與免費數(shù)字圖書館計劃Project Gutenberg 合作,利用 AI 為電子書庫制作了超過 5000 本免費有聲書。 ▲ 圖源Project Gutenberg 網(wǎng)站 據(jù)悉,在這一項目中,研究人員結(jié)合了機(jī)器學(xué)習(xí)、自動文本選擇和自然語音合成等多項 AI 技術(shù)...

IT之家 9 月 12 日消息,微軟近日與“免費數(shù)字圖書館計劃”Project Gutenberg 合作,利用 AI 為電子書庫制作了超過 5000 本免費有聲書。

▲ 圖源Project Gutenberg 網(wǎng)站

據(jù)悉,在這一項目中,研究人員結(jié)合了機(jī)器學(xué)習(xí)、自動文本選擇和自然語音合成等多項 AI 技術(shù),實現(xiàn)了電子書自動轉(zhuǎn)化為語音的全流程。

IT之家經(jīng)過查詢得知,項目團(tuán)隊首先開發(fā)出一種算法,可以自動分析電子書的結(jié)構(gòu),區(qū)分正文和非關(guān)鍵部分的頁碼、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本轉(zhuǎn)語音技術(shù),生成類似真人的自然朗讀語音。此外,該團(tuán)隊還使系統(tǒng)能夠辨別書中敘述者、對話和不同角色,并相應(yīng)調(diào)整語音,實現(xiàn)故事情節(jié)的語音表達(dá)。

微軟表示,此次計劃已收集整理了超過 35000 小時的有聲書語音數(shù)據(jù),涵蓋了各類經(jīng)典文學(xué)、戲劇、傳記等作品,這些語音數(shù)據(jù)都將以開源方式免費提供。用戶也可以用自己錄制的少量語音,生成“用自己的聲音朗讀整本書”的效果,這一項目相對豐富了網(wǎng)站有聲書的內(nèi)容,同時也為視障人士提供了便利。

參考

贊助本站

人工智能實驗室

相關(guān)熱詞: 微軟 攜手 Project Gutenberg 利用 制作

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港