劃重點
01法國AI創(chuàng)企Gladia成功融資1600萬美元,推出多語言實時音頻轉錄和分析引擎。
02該引擎提供超過100種語言的高級實時轉錄功能,延遲低于300毫秒。
03目前,Gladia的API已為7萬名用戶和600家企業(yè)客戶提供服務。
04由于此輪融資,Gladia計劃推出一站式音頻AI工具包,以應對市場競爭。
以上內容由騰訊混元大模型生成,僅供參考
智東西(公眾號:zhidxcom)
編譯 | 楊蕊
編輯 |漠影
智東西10月16日消息,據(jù)VentureBeat昨日報道,法國AI轉錄和音頻智能創(chuàng)企Gladia成功融資1600萬美元,并推出了一個多語言實時音頻轉錄和分析引擎。該公司計劃利用這筆資金推進研發(fā),推出一站式音頻AI工具包。
Gladia成立于2022年,一直專注于開發(fā)端到端的音頻基礎設施。該公司推出的最新微調引擎可以提供超過100種語言的高級實時轉錄功能。
該引擎的獨特之處在于能夠實時捕捉通話中有價值的信息,包括來電者的情緒、對話中的關鍵信息和摘要。
該新產(chǎn)品克服了語言理解和實時數(shù)據(jù)處理等挑戰(zhàn),實時語音轉文本引擎的延遲低于300毫秒。
本輪融資由歐洲風投機構XAnge領投,Illuminate Financial、XTX Ventures等多家風投公司參投。
截至目前,Gladia累計融資金額已達到2030萬美元,早期種子輪投資者包括New Wave、紅杉資本(作為First Sequoia Arc計劃的一部分)、Cocoa和GFC。
一、Gladia新引擎:100多種語言實時轉錄,不到1秒生成內容
語音轉文本產(chǎn)品在克服語言理解挑戰(zhàn)方面面臨著諸多困難。
其中,語言資源的數(shù)量和質量不足是一個關鍵問題。
在Gladia公司看來,目前大多數(shù)語音識別系統(tǒng)主要依賴于英語音頻數(shù)據(jù)進行訓練,這在一定程度上限制了它們對其他語言的識別能力。
為了解決這個問題,Gladia致力于開發(fā)一個真正多語言的實時語音識別產(chǎn)品。
該公司新開發(fā)的微調引擎能夠提供100多種語言的高級實時轉錄服務。
Gladia特別增強了新引擎對各種口音的識別能力,使其能夠迅速適應不同語言環(huán)境,從而為用戶提供更加全面和高效的語音轉文字體驗。
Gladia的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Jean-Louis Quéguiner在接受VentureBeat采訪時稱,他創(chuàng)立Gladia的初衷源于個人經(jīng)歷,現(xiàn)有的音頻轉錄服務無法準確識別他的法語口音。
他說:“考慮到目前大多數(shù)語音識別模型主要在英語音頻數(shù)據(jù)上訓練,存在固有的偏見,Gladia優(yōu)先構建了第一個真正多語言的實時產(chǎn)品。”
此外,Gladia引擎的特別之處在于能夠即時從對話中提取信息,如來電者的情緒、關鍵信息和對話摘要。這意味著使用Gladia從通話或會議中生成文字記錄和見解只需不到1秒鐘的時間。
二、克服語言、數(shù)據(jù)多個挑戰(zhàn),延遲低于300毫秒不損準確性
由于上下文信息有限,實時模型在迅速生成內容、準確輸出內容上可能會遇到難題。
此外,實時模型需要更多的計算資源來支持其運行,這進一步增加了引擎開發(fā)的復雜性。
Gladia推出的新產(chǎn)品克服了語言理解和實時處理數(shù)據(jù)等上述挑戰(zhàn),并且能夠對功能進行持續(xù)優(yōu)化,以提供更準確的服務。
Gladia的實時語音轉文本引擎在延遲方面達到了行業(yè)領先水平,延遲時間低于300毫秒,且無論用戶使用的是哪種語言、位于何地或使用何種技術棧,都不會影響轉錄的準確性。
XAnge合伙人Alexis du Peloux說:“Gladia代表了我們在XAnge所推崇的品質:一支大膽的全球科技團隊,處于AI創(chuàng)新的前沿,擁有成熟的商業(yè)模式,能夠為各個行業(yè)帶來新機遇。在快節(jié)奏的AI環(huán)境中,Jean-Louis Quéguiner和他的團隊表現(xiàn)非常出色,我們很自豪能夠支持Gladia進行A輪融資。”
▲Gladia創(chuàng)始人Jonathan Soto(左)和Jean-Louis Quéguiner(右)。(圖源:VentureBeat)
三、整合AI功能,單一API已為7萬用戶600家企業(yè)服務
Gladia試圖將多種AI功能整合到其現(xiàn)有平臺中。
聯(lián)合創(chuàng)始人兼首席技術官Jonathan Soto說:“我們的單一API兼容所有現(xiàn)有的技術棧和協(xié)議,包括SIP、VoIP、FreeSwitch和Asterisk。這使我們能夠輕松將實時轉錄和分析集成到客戶的AI平臺中,讓他們專注于為終端用戶提供最佳服務。”
該公司在2023年6月推出了其第一個異步轉錄和音頻智能API。
自推出以來,Gladia的API在企業(yè)應用中受到了廣泛關注,尤其在會議記錄和筆記輔助工具方面表現(xiàn)突出。
Gladia的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Jean-Louis Quéguiner說:“Gladia的技術使垂直市場中需要尖端實時轉錄(包括銷售支持和聯(lián)絡中心平臺)的公司能夠從人工呼叫后處理無縫轉向主動、低延遲的工作流程。無論是自動進行客戶關系管理(CRM),還是采用AI為坐席提供實時指導,Gladia都旨在幫助企業(yè)更智能、更高效地運營。”
目前,該API已為全球超過7萬名用戶和600家企業(yè)客戶提供服務,包括Attention、Circleback、Method Financial、Recall、Sana和VEED。
結語:Gladia放新招!新資本助力研發(fā)一站式音頻AI工具包
Gladia將利用新資金推進其研發(fā)工作,計劃很快將一站式音頻AI工具包推向市場,并通過大語言模型和檢索增強生成擴展其產(chǎn)品范圍。
該公司在聯(lián)絡中心即服務 (CCaaS) 領域擁有多家設計合作伙伴,目前正在試行由Gladia的實時AI引擎提供支持的代理協(xié)助解決方案。
Gladia的這些新動作,加上新資本的助力,使得公司在研發(fā)一站式音頻AI工具包方面有了更多的底氣,進一步鞏固其在競爭激烈的市場中的地位。
這對Otter.ai和Fireflies.ai等競爭對手以及其他將語音對話轉錄為文本的基于AI的服務來說將會是一個新的挑戰(zhàn)。
來源:VentureBeat