美國流媒體巨頭Spotify近日為播客推出了一項新的人工智能語音翻譯功能,贏得了X公司老板埃隆馬斯克的贊譽(yù)。
Spotify正在測試一項新的人工智能功能,該功能名為“語音翻譯(Voice Translation)”,可以克隆播客主播的聲音,并使用相同的語氣,節(jié)奏和速度,提供西班牙語,法語和德語的無縫聽力體驗。
該工具是Spotify在OpenAI 的自動語音識別 (ASR) 系統(tǒng)Whisper的幫助下開發(fā)的,使用了語音轉(zhuǎn)文本生成AI模型來翻譯音頻文件,并使用語音復(fù)制模型來匹配原始說話者的風(fēng)格。
這項技術(shù)的早期測試已經(jīng)在一些流行的英語播客上進(jìn)行了,Spotify打算將這一功能擴(kuò)展到更多的播客,甚至嘗試為多語種主持人提供人工智能配音的內(nèi)容。
知名播客主持人和計算機(jī)科學(xué)家萊克斯弗里德曼在X平臺上發(fā)帖,表達(dá)了他對Spotify的人工智能翻譯和語音克隆能力的興奮之情。
馬斯克在他的帖子下回應(yīng)了一個表示驚嘆的“Wow”。