IT之家 11 月 6 日消息,人工智能技術(shù)的進(jìn)步,對語音合成(TTS)的自然性和表現(xiàn)力的需求越來越高。上個月,微軟發(fā)布了三種專為對話場景設(shè)計的新型逼真的人工智能語音。近日,微軟又為美國東部 / 東南亞 / 西歐地區(qū)等更多區(qū)域發(fā)布了 7 種新的逼真的人工智能語音,涵蓋了法語(加拿大)、法語(法國)、德語(德國)、意大利語(意大利)、韓語(韓國)、葡萄牙語(巴西)、西班牙語(西班牙)等語言。
這些新的語音非常適合需要生動的語音交互的應(yīng)用,包括聊天機器人、語音助手、游戲、在線學(xué)習(xí)、旅游景點等。
除了這 7 種新的語音,微軟還對現(xiàn)有的 3 種語音進(jìn)行了更新,增加了更多的表現(xiàn)力。
微軟是如何創(chuàng)建這些逼真的人工智能語音的呢?微軟稱,“我們首先為每種語音設(shè)計了一個人格,就像一個真實的人一樣,友好而樂觀,總是樂于幫助別人,分享有趣或?qū)嵱玫闹R。這種語音的說話風(fēng)格類似于與熟人喝茶時的對話,保持自然而不夸張的語氣。”
目前,微軟提供了超過 400 種神經(jīng)網(wǎng)絡(luò)語音,覆蓋了 140 多種語言和地區(qū),IT之家小伙伴在這里試聽這些新的語音。