本文來源:時(shí)代財(cái)經(jīng) 作者:申謹(jǐn)睿
科大訊飛董事長劉慶峰
大模型開啟了規(guī);瘧(yīng)用落地競(jìng)速。
10月24日,科大訊飛在全球1024開發(fā)者節(jié)上推出了訊飛星火大模型的最新版本訊飛星火4.0 Turbo,并推出了首發(fā)10項(xiàng)基于訊飛星火底座能力、覆蓋多個(gè)行業(yè)的產(chǎn)品與創(chuàng)新應(yīng)用。
從卷參數(shù)到卷價(jià)格,大模型似乎還未迎來真正的賽點(diǎn),相較于發(fā)揮實(shí)際作用,當(dāng)下的模型廠商似乎更在意“DAU”(日活躍用戶數(shù)量)。換言之,在廣泛的、實(shí)際的場(chǎng)景中,市場(chǎng)真正需要的是有能力去解決實(shí)際問題的大模型,而不只是一個(gè)看似很大、很便宜的超級(jí)應(yīng)用。
隨著大模型“卷應(yīng)用”的浪潮逐步在醫(yī)療、金融、交通、政務(wù)等領(lǐng)域落地開花,更多的從業(yè)者意識(shí)到,生成式AI的下半場(chǎng),更大的機(jī)會(huì)或許在應(yīng)用上。而中國的AI產(chǎn)業(yè),有望從應(yīng)用層實(shí)現(xiàn)彎道超車。
基于這一導(dǎo)向下,科大訊飛在內(nèi)的模型廠商開始圍繞解決實(shí)際問題去豐富模型的能力,以及推出更加細(xì)分的應(yīng)用。
一、“能文能武”的大模型
相較于此前幾個(gè)版本,訊飛星火4.0 Turbo在數(shù)學(xué)能力和代碼能力方面有所突破,針對(duì)相應(yīng)場(chǎng)景的能力維度也實(shí)現(xiàn)了拓展。
根據(jù)實(shí)用數(shù)學(xué)任務(wù)構(gòu)建測(cè)試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計(jì)算、財(cái)務(wù)、金融、度量等多個(gè)維度的任務(wù)中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評(píng)價(jià)等算法驗(yàn)證,預(yù)計(jì)今年底可實(shí)現(xiàn)類“o1”的高難度數(shù)學(xué)能力顯著提升。
根據(jù)代碼生成HumanEval測(cè)試集上的效果對(duì)比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務(wù)上和GPT-4o的差距微弱,在C++能力上超過GPT-4o。在真實(shí)應(yīng)用場(chǎng)景,基于認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室構(gòu)建的iFLYCode-Eval-2.0代碼實(shí)用場(chǎng)景測(cè)試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯(cuò)、單元測(cè)試等任務(wù)上都超過了GPT-4o。同時(shí)推出星火代碼7B版本,滿足代碼生成、代碼補(bǔ)全等極速響應(yīng)型任務(wù)。
訊飛星火4.0 Turbo“能文能武”不只升級(jí)了“理工”方面的能力,還支持“情感陪伴”功能的實(shí)現(xiàn)。
會(huì)上,超擬人數(shù)字人首次亮相,多模態(tài)的交互從超擬人的語音變成超擬人的數(shù)字人,實(shí)現(xiàn)語音、視頻、圖文的全部聯(lián)動(dòng)的多模態(tài)交互。
多模態(tài)視覺能力加持下的人機(jī)交互有多驚喜?劉聰現(xiàn)場(chǎng)給超擬人數(shù)字人打了個(gè)“視頻電話”,他不斷調(diào)整道具“孫悟空”“奧特曼”“怪獸”的擺放位置,無需拍照,超擬人數(shù)字人看圖說話,馬上回應(yīng):“奧特曼和孫悟空停止了打斗,正在聯(lián)合對(duì)抗怪獸 ”,和劉聰暢聊不同角度的所見。
“目前,訊飛星火支持用戶創(chuàng)建自己的個(gè)性化數(shù)字人,打造每個(gè)人的數(shù)字分身。”劉聰現(xiàn)場(chǎng)演示了一個(gè)自己的“數(shù)字分身”,只需在后臺(tái)進(jìn)行簡單的編輯、定義,就可快速生成自己的卡通形象,更能一句話復(fù)刻自己的聲音作為發(fā)音人,隨時(shí)隨地與自己對(duì)話。目前,已支持1300+種人設(shè)打造。
二、跳開“開源”與“閉源”,徑直走向差異化
在業(yè)內(nèi)討論AI大模型數(shù)量過多的時(shí)候,往往還會(huì)注意到另一個(gè)現(xiàn)象,即數(shù)百個(gè)大模型問世,這些大模型之間的差異性體現(xiàn)在哪?
解答上述問題的邏輯走向大多離不開“開源”與“閉源”。
支持開源的行業(yè)人士認(rèn)為,開源模型的意義,在于所有團(tuán)隊(duì)都站在一條起跑線上,拿著同樣的廚具和食材,能炒出什么樣的菜,各憑本事,是一種公平競(jìng)爭。
支持閉源的行業(yè)人士認(rèn)為,閉源模型更適合在競(jìng)爭激烈的大模型行業(yè)里聚集人才和算力,進(jìn)而實(shí)現(xiàn)商業(yè)化落地,維護(hù)模型的根本差異化。
事實(shí)上,大模型的開源,與一般意義上的軟件開源存在差異。一般軟件開源時(shí),開發(fā)者可以獲取軟件的源代碼,并據(jù)此修改或者增加新功能;而大模型內(nèi)部代碼,是大模型理解、邏輯、推理、生成等綜合能力的體現(xiàn)。
2023通信產(chǎn)業(yè)大會(huì)上發(fā)布的《大語言模型代碼能力測(cè)評(píng)分析報(bào)告》曾在測(cè)評(píng)規(guī)范下,對(duì)訊飛星火等5款最新版本大模型開展測(cè)評(píng),該《報(bào)告》顯示,訊飛星火在編寫代碼方面表現(xiàn)優(yōu)異,代碼格式規(guī)范,正確率高。
今年,科大訊飛在全球1024開發(fā)者節(jié)上又給出了打造“差異化”的新答案。
作為以智能語音技術(shù)見長的企業(yè),科大訊飛將其語音識(shí)別、語種能力的優(yōu)勢(shì)進(jìn)一步擴(kuò)大至大模型領(lǐng)。
會(huì)上,科大訊飛發(fā)布星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個(gè)語種。根據(jù)實(shí)用任務(wù)場(chǎng)景構(gòu)建測(cè)試集MMT-Eval-1.0,訊飛星火在汽車、家電、辦公、翻譯等行業(yè)的任務(wù)場(chǎng)景應(yīng)用效果超過了GPT-4o。
“訊飛作為中國唯一的認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室承建單位,我們有使命有責(zé)任要做多語言大模型”,劉慶峰表示,訊飛星火底座能力要不斷提升,對(duì)標(biāo)全球最好水平,同時(shí)還要針對(duì)真實(shí)應(yīng)用場(chǎng)景做到全球最好,不斷擴(kuò)大多語種范圍,“我們一定要代表中國給世界第二種選擇。”
多模態(tài)多語言能力升級(jí),將全面賦能汽車產(chǎn)業(yè)?拼笥嶏w還首發(fā)了汽車端側(cè)星火大模型,據(jù)悉,今年第四季度起,奇瑞、廣汽、長城等多款搭載端側(cè)大模型的車型將上市開售。
此外,科大訊飛也將新一代模型應(yīng)用至教育領(lǐng)域。會(huì)上,科大訊飛發(fā)布了基于“問題鏈”的高中數(shù)學(xué)智能教師系統(tǒng),該系統(tǒng)可以智能生成教學(xué)問題鏈,以循序漸進(jìn)的方式輔助教師啟發(fā)學(xué)生思考并逐步解決問題,同時(shí)基于精準(zhǔn)學(xué)情定位學(xué)生薄弱點(diǎn)、融合最近發(fā)展區(qū)規(guī)劃路徑、鼓勵(lì)學(xué)生基于真實(shí)世界的主動(dòng)提問、探究式學(xué)習(xí)。
同時(shí),訊飛AI學(xué)習(xí)機(jī)中首發(fā)AI作業(yè)過濾器。學(xué)習(xí)機(jī)通過OCR能力識(shí)別出紙質(zhì)練習(xí)題,根據(jù)學(xué)生歷史學(xué)習(xí)情況和本地化考情,將題目分出“必做題”“選做題”“建議不做題”三個(gè)等級(jí),實(shí)現(xiàn)“練得更少、學(xué)得更好”的目標(biāo)。
除延續(xù)深耕領(lǐng)域的優(yōu)勢(shì),科大訊飛還背靠自身技術(shù)主線不斷拓寬應(yīng)用領(lǐng)域。會(huì)上,科大訊飛發(fā)布了醫(yī)療、司法、政務(wù)、企業(yè)辦公等多領(lǐng)域的AI助手。 “用人工智能技術(shù)解決社會(huì)剛需,是科大訊飛一直以來的出發(fā)點(diǎn)之一”。 劉慶峰說道。
三、繁榮生態(tài)鑄就人工智能未來
“訊飛星火已成為央國企大模型的第一選擇。”劉慶峰曬出了大模型應(yīng)用成績單:央國企中標(biāo)第一、教育醫(yī)療市場(chǎng)第一、智能汽車市場(chǎng)第一、大模型開發(fā)者生態(tài)第一、智能硬件市場(chǎng)第一、賦能科研應(yīng)用第一、賦能工業(yè)應(yīng)用第一。
這份成績單中,多個(gè)“第一”顯示了科大訊飛作為人工智能領(lǐng)軍企業(yè)打造生態(tài)的決心。截至2024年10月,科大訊飛已與各頭部企業(yè)共建20多個(gè)行業(yè)大模型,覆蓋300+應(yīng)用場(chǎng)景。
為了幫助各行各業(yè)更好地落地大模型,科大訊飛構(gòu)建了從“建算力、理數(shù)據(jù)、訓(xùn)模型,到落場(chǎng)景、保安全、精運(yùn)營”的全套解決方案。“科大訊飛有領(lǐng)先的工具鏈,可大幅提升‘理數(shù)據(jù)、訓(xùn)模型’的效率;有覆蓋300+行業(yè)場(chǎng)景的實(shí)際應(yīng)用案例,已形成相互借鑒和復(fù)用的規(guī);(yīng);還有全國產(chǎn)化的算力平臺(tái)。”劉慶峰說。
只有生態(tài)的繁榮,才有人工智能的未來。根據(jù)IDC研究報(bào)告和市場(chǎng)公開數(shù)據(jù)顯示,科大訊飛在語音語義市占率中第一、大模型開發(fā)者規(guī)模第一,達(dá)78.1萬。據(jù)悉,科大訊飛將開放全場(chǎng)景資源,從技術(shù)能力到應(yīng)用落地,用最短路徑實(shí)現(xiàn)產(chǎn)品成功,線上線下渠道和資源共享,加速開發(fā)者邁向市場(chǎng)成功。此外,科大訊飛將牽頭成立AI基金,用5億創(chuàng)業(yè)基金推動(dòng)開發(fā)者創(chuàng)業(yè),加速前沿技術(shù)產(chǎn)業(yè)化進(jìn)程,并與地方政府聯(lián)合為AI創(chuàng)業(yè)團(tuán)隊(duì)提供產(chǎn)業(yè)落地支撐。
發(fā)布會(huì)上,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營有限公司三方聯(lián)合打造的國產(chǎn)超大規(guī)模智算平臺(tái)“飛星二號(hào)”正式啟動(dòng)。去年10月24日,首個(gè)國產(chǎn)萬卡算力集群“飛星一號(hào)”平臺(tái)上線,星火大模型持續(xù)引領(lǐng)全國產(chǎn)算力平臺(tái)發(fā)展,劉慶峰介紹一年以來攻克了很多‘疑難雜癥’,解決了500多次的基礎(chǔ)軟硬件問題和模型適配問題。
“飛星二號(hào)”將帶來新模型新算法的持續(xù)適配和智算集群規(guī)模的再次躍遷,持續(xù)探索無人區(qū)、引領(lǐng)國產(chǎn)大模型底座的發(fā)展、給世界提供第二選擇。“只有在真正自主可控的平臺(tái)上,才有真正的中國人工智能大未來。”
科大訊飛正在引領(lǐng)大模型規(guī);瘧(yīng)用時(shí)代,面向未來,劉慶峰認(rèn)為人工智能產(chǎn)業(yè)發(fā)展有五個(gè)關(guān)鍵詞:頂天立地、自主可控、通專結(jié)合、端云聯(lián)動(dòng)、軟硬一體。劉慶峰說:“堅(jiān)持這五個(gè)關(guān)鍵點(diǎn),我們的人工智能就有大未來,就能真正的解放生產(chǎn)力、釋放想象力,改變產(chǎn)業(yè)格局和競(jìng)爭格局,帶來科研范式的變化,帶來各行各業(yè)的變化。”