展會(huì)信息港展會(huì)大全

原生訓(xùn)練大模型重要性凸顯 中科聞歌競(jìng)逐AI萬億級(jí)賽道
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-20 09:56:26   瀏覽:5400次  

導(dǎo)讀:本報(bào)記者 李靜 北京報(bào)道 12月15日,中國科學(xué)院旗下人工智能企業(yè)中科聞歌推出全自主知識(shí)產(chǎn)權(quán)的雅意2.0國產(chǎn)大模型(以下簡稱雅意2.0),并發(fā)布開源技術(shù)報(bào)告。 據(jù)中科聞歌CEO羅引介紹,雅意1.0 大模型于今年6月3日推出,6 個(gè)月后推出的 2.0版本,在模型訓(xùn)練、特...

本報(bào)記者 李靜 北京報(bào)道

12月15日,中國科學(xué)院旗下人工智能企業(yè)中科聞歌推出全自主知識(shí)產(chǎn)權(quán)的雅意2.0國產(chǎn)大模型(以下簡稱“雅意2.0”),并發(fā)布開源技術(shù)報(bào)告。

據(jù)中科聞歌CEO羅引介紹,雅意1.0 大模型于今年6月3日推出,6 個(gè)月后推出的 2.0版本,在模型訓(xùn)練、特色技能、領(lǐng)域應(yīng)用、測(cè)評(píng)指標(biāo)四個(gè)方面都有很多突破。首先在模型訓(xùn)練方面,雅意 2.0 實(shí)現(xiàn)了從70億參數(shù)量邁向300億參數(shù)量的模型;在訓(xùn)練數(shù)據(jù)集方面,從200多T豐富的多元數(shù)據(jù)中萃取出10T左右,一共2.65萬億Tokens的高質(zhì)量訓(xùn)練數(shù)據(jù)集,來滿足模型訓(xùn)練。

《中國經(jīng)營報(bào)》記者了解到,雅意大模型是一個(gè)企業(yè)級(jí)通用大模型,此前已為政府、中央級(jí)媒體、研究機(jī)構(gòu)等多家單位,提供垂直領(lǐng)域?qū)I(yè)模型服務(wù)。雅意2.0發(fā)布后,基于雅意2.0中科聞歌面向安全、媒體、金融、輿情、法律、中醫(yī)等領(lǐng)域構(gòu)建了多個(gè)行業(yè)大模型應(yīng)用。

中科聞歌董事長王磊表示:“如今,在國內(nèi)大模型也是百花齊放,然而真正原生的國產(chǎn)化的AI大模型卻寥寥可數(shù),人力、人才、算力、算法、數(shù)據(jù)仍與國際先進(jìn)水平存在較大差距,國內(nèi)的AI產(chǎn)業(yè)仍處于早期的發(fā)展階段。”

從目前的大模型領(lǐng)域來看,市場(chǎng)上已經(jīng)有了ChatGPT、LLAM等大模型,但王磊認(rèn)為,國內(nèi)仍需要做自己的原生訓(xùn)練大模型,主要是三個(gè)方面的答案:第一,當(dāng)前國內(nèi)基礎(chǔ)原生的大模型極其匱乏,自主研發(fā)能力不足,而開源模型的能力又不穩(wěn)定,中文的支持是相對(duì)比較弱的,語種的支持也比較少,安全性不足,無法用于嚴(yán)格的生產(chǎn)環(huán)境。第二,很多政企的重要部門需要自主可控、安全可靠的原生模型,因?yàn)殚_源模型是一個(gè)黑盒,預(yù)訓(xùn)練階段的時(shí)候,數(shù)據(jù)的來源和質(zhì)量不可信,就會(huì)導(dǎo)致模型在出生時(shí)不安全。同時(shí)應(yīng)用到政企場(chǎng)景時(shí),二次訓(xùn)練的可操作性又不強(qiáng),制約了應(yīng)用和發(fā)展。第三,大模型是大算力、大數(shù)據(jù)、大算法的融合大工程,是一個(gè)龐大的工程,下一代的技術(shù)創(chuàng)新需要研發(fā)經(jīng)驗(yàn)的積累,從頭預(yù)訓(xùn)練可以得到第一手經(jīng)驗(yàn),通過積累,可以進(jìn)行進(jìn)一步原生創(chuàng)新。

“雅意大模型的研發(fā)其實(shí)取得了一批硬核的技術(shù)成果。首先是全國產(chǎn)化的基礎(chǔ)模型,數(shù)據(jù)模型完全是由我們團(tuán)隊(duì)工程師和青年科學(xué)家一起自主研發(fā),從頭開始預(yù)訓(xùn)練。其次非常重要的是,我們積累了兩個(gè)非常重要的AI數(shù)據(jù)集,一個(gè)是海量的高質(zhì)量預(yù)訓(xùn)練的數(shù)據(jù)集,一個(gè)是領(lǐng)域微調(diào)的指令集,我們的AI數(shù)據(jù)集也參與了智源研究院中國CCI語料數(shù)據(jù)庫的建設(shè),在核心技術(shù)的詞表壓縮、訓(xùn)練加速、意圖識(shí)別、工具調(diào)用等方面取得了一些領(lǐng)先的成果。”王磊說道,“但仍然需要看到的是,在新的一些行業(yè)應(yīng)用里面,多輪對(duì)話、長文閱讀、多模態(tài)智能交互、內(nèi)容安全可控以及智能插件的自動(dòng)調(diào)用,這些工作還亟待去做一些技術(shù)探索。”

“人工智能分為通用和專用,其中通用人工智能分三個(gè)層次低等、中等、高等,現(xiàn)在無疑是在低等的層次,但是正在這個(gè)層次上逐漸向中等發(fā)展和演化,大模型演化趨勢(shì)是非常明顯的。”南開大學(xué)經(jīng)濟(jì)研究所所長、中國新一代人工智能發(fā)展戰(zhàn)略研究院首席經(jīng)濟(jì)學(xué)家劉剛說道,從大模型在各個(gè)行業(yè)的應(yīng)用來看,落地時(shí)存在著兩個(gè)重要影響因素。第一個(gè)是容錯(cuò)率,內(nèi)部使用時(shí)容錯(cuò)率高,對(duì)外用容錯(cuò)率低,容錯(cuò)率決定了這個(gè)模型在行業(yè)應(yīng)用的情況。第二個(gè)是市場(chǎng)規(guī)模,在使用時(shí)會(huì)先解決頭部問題,然后再解決長尾問題。

北京銀行首席信息官龔偉華談到了大模型在銀行領(lǐng)域的落地情況,他表示:“當(dāng)下來看,大模型有自身的優(yōu)勢(shì)和一些缺陷。因?yàn)榇竽P椭杏泻芏鄸|西是不可解釋性的,存在模型黑盒,作為銀行來說,如果直接把大模型的能力用于服務(wù)客戶,風(fēng)險(xiǎn)還是非常大。所以短期來看,大模型直接對(duì)外服務(wù)會(huì)比較少,但是對(duì)內(nèi)我們?cè)敢庠诟鞣N場(chǎng)景進(jìn)行訓(xùn)練探索。未來相信隨著科技倫理的治理,國家對(duì)于模型應(yīng)用法律法規(guī)的逐漸成熟,大模型的應(yīng)用落地也會(huì)更加成熟。”

此外,可以清晰看到的是,人工智能這個(gè)萬億級(jí)的賽道正在從感知智能向認(rèn)知和決策智能跨越,以人臉識(shí)別等視覺識(shí)別技術(shù)的企業(yè)上市,標(biāo)志著感知智能的市場(chǎng)已成規(guī)模。“而隨著ChatGPT的發(fā)布,這兩年認(rèn)知智能市場(chǎng)進(jìn)入了加速的變現(xiàn)期,未來決策智能市場(chǎng)空間更為巨大。”王磊說。

(編輯:張靖超 校對(duì):顏京寧)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港