展會(huì)信息港展會(huì)大全

訊飛星火首發(fā)超擬人合成語(yǔ)音功能 AI讓科技更有溫度
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-29   瀏覽:653次  

導(dǎo)讀:科大訊飛旗下訊飛星火大模型V3.5(以下簡(jiǎn)稱(chēng) 訊飛星火V3.5 )春季上新,不僅發(fā)布業(yè)界首個(gè)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音大模型,還進(jìn)一步升級(jí)星火語(yǔ)音大模型,首發(fā)多情感超擬人合成,具備情緒表達(dá)能力,并推出一句話(huà)聲音復(fù)刻功能,讓科技更有溫度。 早在今 ......

科大訊飛旗下訊飛星火大模型V3.5(以下簡(jiǎn)稱(chēng) 訊飛星火V3.5 )春季上新,不僅發(fā)布業(yè)界首個(gè)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音大模型,還進(jìn)一步升級(jí)星火語(yǔ)音大模型,首發(fā)多情感超擬人合成,具備情緒表達(dá)能力,并推出一句話(huà)聲音復(fù)刻功能,讓科技更有溫度。

早在今年 1 月,科大訊飛首發(fā)了超擬人合成語(yǔ)音功能,讓 AI 不再是冷冰冰的播音腔,同時(shí)具備超強(qiáng)的情緒感知能力,能像 知冷知熱 的朋友一樣帶入情感互動(dòng),更具人情味。這一技術(shù)的提升背后不僅得益于訊飛星火V3.5在語(yǔ)義理解、指令跟隨和多輪對(duì)話(huà)的演示中展現(xiàn)的優(yōu)異能力,還有在情緒感知和擬人合成方面的出色表現(xiàn)。

訊飛星火 V3.5 此次的更新版本中,這一功能再度加強(qiáng),首發(fā)多情感超擬人合成功能,進(jìn)一步提升了合成聲音中情緒表達(dá)感知能力,情緒可感知度達(dá)到 85%以上,可以實(shí)現(xiàn)包括高興、抱歉、安慰、撒嬌、困惑等多種情感語(yǔ)氣表達(dá)。正如劉慶峰說(shuō), 技術(shù)在不斷的進(jìn)步,我們希望在安全可控的前提下,能夠帶來(lái)這個(gè)社會(huì)更有溫度的人工智能的體驗(yàn),能夠真的幫助到那些特別需要幫助的人。今天這個(gè)世界更需要有溫度的科技。

不僅能用,還要好用、易用,這或許才是部分大模型應(yīng)用在同質(zhì)化競(jìng)爭(zhēng)中脫穎而出的關(guān)鍵因素?萍疾皇抢浔拇嬖冢珹I 時(shí)代的科技更要能力與溫度兼顧,方能收獲大眾的歡迎。

長(zhǎng)文本已經(jīng)成為國(guó)產(chǎn)大模型比拼的新方向。在經(jīng)過(guò)長(zhǎng)達(dá)一年的對(duì)標(biāo) ChatGPT-4、比拼參數(shù)大小的同質(zhì)化競(jìng)爭(zhēng)之后,中國(guó)人工智能公司們終于找出了一個(gè)更容易被普通用戶(hù)理解、也更能直觀地超越美國(guó)同行們的差異化標(biāo)的。掀起這一波競(jìng)爭(zhēng)浪潮的是國(guó)內(nèi)大模型創(chuàng)業(yè)公司月之暗面。這家公司在去年將旗下的大模型 Kimi 的上下文參數(shù)規(guī)模提升至 20 萬(wàn)字,上個(gè)月又提升至 200萬(wàn)字,迅速引爆市場(chǎng)。3月,阿里旗下的通義千問(wèn)已經(jīng)將這一數(shù)字更新到 1000萬(wàn)字,宣稱(chēng)是 全球文檔處理容量第一的 AI 應(yīng)用 。華泰證券在一份研報(bào)中指出,具有長(zhǎng)上下文的大模型通用性更強(qiáng),用戶(hù)將特定領(lǐng)域的知識(shí)通過(guò)上下文的方式輸入到模型中,模型即可通過(guò)上下文學(xué)習(xí)掌握相應(yīng)內(nèi)容,一定程度上代替模型的微調(diào)。但經(jīng)過(guò)幾個(gè)月的比拼跟進(jìn)之后,長(zhǎng)文本之于大模型似乎又成了一項(xiàng)廠家炫技的同質(zhì)化環(huán)節(jié),以至于有媒體已經(jīng)飛快地喊出了 長(zhǎng)文本降溫 的口號(hào),長(zhǎng)文本如何才能真正落地陷入瓶頸。

大模型長(zhǎng)文本功能的落地需要重點(diǎn)解決兩個(gè)問(wèn)題。一是海量文本的高效處理。面對(duì)上百萬(wàn)甚至上千萬(wàn)文字,模型后臺(tái)消耗的運(yùn)算資源也成倍增加,業(yè)界的一些大模型往往智能處理前 20% 或前 50% 的內(nèi)容,之后的處理效率就大大減慢。二是如何保證大模型在科研、醫(yī)療、法律等行業(yè)專(zhuān)業(yè)場(chǎng)景的準(zhǔn)確率,這樣才能解決大模型在剛需場(chǎng)景的應(yīng)用問(wèn)題?拼笥嶏w董事長(zhǎng)劉慶峰介紹,為了解決大模型應(yīng)用效率和準(zhǔn)確率問(wèn)題,訊飛星火 V3.5 提升了對(duì)長(zhǎng)文本的理解、學(xué)習(xí)、回答能力,并進(jìn)行了重要的模型剪枝和蒸餾,從而推出業(yè)界最優(yōu)的 130億參數(shù)的大模型。在效果損失僅 3% 以?xún)?nèi)的情況下,使得星火在文檔上傳解析處理、知識(shí)問(wèn)答的首響時(shí)間以及文字生成效率方面都獲得了極大的效率提升。在對(duì)比測(cè)試中,使用訊飛星火對(duì)比國(guó)內(nèi)可測(cè)最好的大模型,在保障長(zhǎng)文本效果的情況下,無(wú)論是10K、64K、128K token,還是更長(zhǎng)的文本上,星火大模型的性能都是業(yè)界最優(yōu)。

解決了效率和準(zhǔn)確率的問(wèn)題,長(zhǎng)文本才不至于只停留在參數(shù)比拼的噱頭上,真正落地于應(yīng)用場(chǎng)景。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞:

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港