韩国美女伊人VIP,色网亚洲免费在线,成人午夜性影院视频

原生訓(xùn)練大模型重要性凸顯中科聞歌競(jìng)逐AI萬億級(jí)賽道

來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-20 09:56:26 瀏覽：5400次

導(dǎo)讀：本報(bào)記者李靜北京報(bào)道 12月15日，中國科學(xué)院旗下人工智能企業(yè)中科聞歌推出全自主知識(shí)產(chǎn)權(quán)的雅意2.0國產(chǎn)大模型（以下簡稱雅意2.0），并發(fā)布開源技術(shù)報(bào)告。據(jù)中科聞歌CEO羅引介紹，雅意1.0 大模型于今年6月3日推出，6 個(gè)月后推出的 2.0版本，在模型訓(xùn)練、特...

本報(bào)記者李靜北京報(bào)道

12月15日，中國科學(xué)院旗下人工智能企業(yè)中科聞歌推出全自主知識(shí)產(chǎn)權(quán)的雅意2.0國產(chǎn)大模型（以下簡稱“雅意2.0”），并發(fā)布開源技術(shù)報(bào)告。

據(jù)中科聞歌CEO羅引介紹，雅意1.0 大模型于今年6月3日推出，6 個(gè)月后推出的 2.0版本，在模型訓(xùn)練、特色技能、領(lǐng)域應(yīng)用、測(cè)評(píng)指標(biāo)四個(gè)方面都有很多突破。首先在模型訓(xùn)練方面，雅意 2.0 實(shí)現(xiàn)了從70億參數(shù)量邁向300億參數(shù)量的模型；在訓(xùn)練數(shù)據(jù)集方面，從200多T豐富的多元數(shù)據(jù)中萃取出10T左右，一共2.65萬億Tokens的高質(zhì)量訓(xùn)練數(shù)據(jù)集，來滿足模型訓(xùn)練。

《中國經(jīng)營報(bào)》記者了解到，雅意大模型是一個(gè)企業(yè)級(jí)通用大模型，此前已為政府、中央級(jí)媒體、研究機(jī)構(gòu)等多家單位，提供垂直領(lǐng)域?qū)I(yè)模型服務(wù)。雅意2.0發(fā)布后，基于雅意2.0中科聞歌面向安全、媒體、金融、輿情、法律、中醫(yī)等領(lǐng)域構(gòu)建了多個(gè)行業(yè)大模型應(yīng)用。

中科聞歌董事長王磊表示：“如今，在國內(nèi)大模型也是百花齊放，然而真正原生的國產(chǎn)化的AI大模型卻寥寥可數(shù)，人力、人才、算力、算法、數(shù)據(jù)仍與國際先進(jìn)水平存在較大差距，國內(nèi)的AI產(chǎn)業(yè)仍處于早期的發(fā)展階段。”

從目前的大模型領(lǐng)域來看，市場(chǎng)上已經(jīng)有了ChatGPT、LLAM等大模型，但王磊認(rèn)為，國內(nèi)仍需要做自己的原生訓(xùn)練大模型，主要是三個(gè)方面的答案：第一，當(dāng)前國內(nèi)基礎(chǔ)原生的大模型極其匱乏，自主研發(fā)能力不足，而開源模型的能力又不穩(wěn)定，中文的支持是相對(duì)比較弱的，語種的支持也比較少，安全性不足，無法用于嚴(yán)格的生產(chǎn)環(huán)境。第二，很多政企的重要部門需要自主可控、安全可靠的原生模型，因?yàn)殚_源模型是一個(gè)黑盒，預(yù)訓(xùn)練階段的時(shí)候，數(shù)據(jù)的來源和質(zhì)量不可信，就會(huì)導(dǎo)致模型在出生時(shí)不安全。同時(shí)應(yīng)用到政企場(chǎng)景時(shí)，二次訓(xùn)練的可操作性又不強(qiáng)，制約了應(yīng)用和發(fā)展。第三，大模型是大算力、大數(shù)據(jù)、大算法的融合大工程，是一個(gè)龐大的工程，下一代的技術(shù)創(chuàng)新需要研發(fā)經(jīng)驗(yàn)的積累，從頭預(yù)訓(xùn)練可以得到第一手經(jīng)驗(yàn)，通過積累，可以進(jìn)行進(jìn)一步原生創(chuàng)新。

“雅意大模型的研發(fā)其實(shí)取得了一批硬核的技術(shù)成果。首先是全國產(chǎn)化的基礎(chǔ)模型，數(shù)據(jù)模型完全是由我們團(tuán)隊(duì)工程師和青年科學(xué)家一起自主研發(fā)，從頭開始預(yù)訓(xùn)練。其次非常重要的是，我們積累了兩個(gè)非常重要的AI數(shù)據(jù)集，一個(gè)是海量的高質(zhì)量預(yù)訓(xùn)練的數(shù)據(jù)集，一個(gè)是領(lǐng)域微調(diào)的指令集，我們的AI數(shù)據(jù)集也參與了智源研究院中國CCI語料數(shù)據(jù)庫的建設(shè)，在核心技術(shù)的詞表壓縮、訓(xùn)練加速、意圖識(shí)別、工具調(diào)用等方面取得了一些領(lǐng)先的成果。”王磊說道，“但仍然需要看到的是，在新的一些行業(yè)應(yīng)用里面，多輪對(duì)話、長文閱讀、多模態(tài)智能交互、內(nèi)容安全可控以及智能插件的自動(dòng)調(diào)用，這些工作還亟待去做一些技術(shù)探索。”

“人工智能分為通用和專用，其中通用人工智能分三個(gè)層次低等、中等、高等，現(xiàn)在無疑是在低等的層次，但是正在這個(gè)層次上逐漸向中等發(fā)展和演化，大模型演化趨勢(shì)是非常明顯的。”南開大學(xué)經(jīng)濟(jì)研究所所長、中國新一代人工智能發(fā)展戰(zhàn)略研究院首席經(jīng)濟(jì)學(xué)家劉剛說道，從大模型在各個(gè)行業(yè)的應(yīng)用來看，落地時(shí)存在著兩個(gè)重要影響因素。第一個(gè)是容錯(cuò)率，內(nèi)部使用時(shí)容錯(cuò)率高，對(duì)外用容錯(cuò)率低，容錯(cuò)率決定了這個(gè)模型在行業(yè)應(yīng)用的情況。第二個(gè)是市場(chǎng)規(guī)模，在使用時(shí)會(huì)先解決頭部問題，然后再解決長尾問題。

北京銀行首席信息官龔偉華談到了大模型在銀行領(lǐng)域的落地情況，他表示：“當(dāng)下來看，大模型有自身的優(yōu)勢(shì)和一些缺陷。因?yàn)榇竽Ｐ椭杏泻芏鄸|西是不可解釋性的，存在模型黑盒，作為銀行來說，如果直接把大模型的能力用于服務(wù)客戶，風(fēng)險(xiǎn)還是非常大。所以短期來看，大模型直接對(duì)外服務(wù)會(huì)比較少，但是對(duì)內(nèi)我們?cè)敢庠诟鞣N場(chǎng)景進(jìn)行訓(xùn)練探索。未來相信隨著科技倫理的治理，國家對(duì)于模型應(yīng)用法律法規(guī)的逐漸成熟，大模型的應(yīng)用落地也會(huì)更加成熟。”

此外，可以清晰看到的是，人工智能這個(gè)萬億級(jí)的賽道正在從感知智能向認(rèn)知和決策智能跨越，以人臉識(shí)別等視覺識(shí)別技術(shù)的企業(yè)上市，標(biāo)志著感知智能的市場(chǎng)已成規(guī)模。“而隨著ChatGPT的發(fā)布，這兩年認(rèn)知智能市場(chǎng)進(jìn)入了加速的變現(xiàn)期，未來決策智能市場(chǎng)空間更為巨大。”王磊說。

（編輯：張靖超校對(duì)：顏京寧）

原生訓(xùn)練大模型重要性凸顯中科聞歌競(jìng)逐AI萬億級(jí)賽道
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-20 09:56:26 瀏覽：5400次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

原生訓(xùn)練大模型重要性凸顯 中科聞歌競(jìng)逐AI萬億級(jí)賽道 來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-20 09:56:26 瀏覽：5400次