展會(huì)信息港展會(huì)大全

百川智能×騰AI|百川重磅發(fā)布Baichuan2大模型!已上線思開(kāi)源社區(qū)
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-06 19:55:28   瀏覽:12774次  

導(dǎo)讀:摘要: 騰AI正式支持 baichuan2開(kāi)源大模型 【2023年9月6日,北京】今日,百川智能在北京召開(kāi)大模型發(fā)布會(huì),正式發(fā)布Baichuan2開(kāi)源大模型,騰AI基礎(chǔ)軟硬件平臺(tái)正式支持Baichuan2大模型,并在思MindSpore開(kāi)源社區(qū)大模型平臺(tái)上線Baichuan2-7B模型開(kāi)放體驗(yàn)。 發(fā)...

摘要:騰AI正式支持baichuan2開(kāi)源大模型

【2023年9月6日,北京】今日,百川智能在北京召開(kāi)大模型發(fā)布會(huì),正式發(fā)布Baichuan2開(kāi)源大模型,騰AI基礎(chǔ)軟硬件平臺(tái)正式支持Baichuan2大模型,并在思MindSpore開(kāi)源社區(qū)大模型平臺(tái)上線Baichuan2-7B模型開(kāi)放體驗(yàn)。

發(fā)布會(huì)現(xiàn)場(chǎng),百川智能宣布正式開(kāi)源微調(diào)后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其量化版本4bit,面向?qū)W術(shù)及商業(yè)市場(chǎng)提供大模型服務(wù),并且均為免費(fèi)可商用。

思MindSpore版本開(kāi)源倉(cāng)鏈接:

https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md

思MindSpore開(kāi)源社區(qū)大模型平臺(tái):

https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat

文理兼?zhèn)湫阅軆?yōu)異,全領(lǐng)先LLaMA2

Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6T質(zhì)量多語(yǔ)數(shù)據(jù)進(jìn)訓(xùn)練,在保留了上一代開(kāi)源模型良好的生成與創(chuàng)作能力,流暢的多輪對(duì)話能力以及部署檻較低等眾多特性的基礎(chǔ)上,兩個(gè)模型在數(shù)學(xué)、代碼、安全、邏輯推理、語(yǔ)義理解等能有顯著提升。其中Baichuan2-13B-Base相比上代13B模型,數(shù)學(xué)能力提升49%,代碼能提升46%,安全能力提升37%,邏輯推理能力提升25%,語(yǔ)義理解能力提升15%。

本次開(kāi)源的兩個(gè)模型在各評(píng)測(cè)榜單上的表現(xiàn)優(yōu)秀,在MMLU、CMMLU、GSM8K等幾權(quán)威評(píng)估基準(zhǔn)中,以絕對(duì)優(yōu)勢(shì)領(lǐng)先LLaMA 2,相比其他同等參數(shù)量大模型,表現(xiàn)也十分亮眼,性能大幅度優(yōu)于LLaMA 2等同尺寸模型競(jìng)品。

更值得一提的是,根據(jù)MMLU等多個(gè)權(quán)威英文評(píng)估基準(zhǔn)評(píng)分 Baichuan2-7b以70億的參數(shù)在英文主流任務(wù)上與130 億參數(shù)量的LLaMA 2基本持平。

7B參數(shù)模型的Benchmark成績(jī)

13B參數(shù)模型的Benchmark成績(jī)

Baichuan2-7B和Baichuan2-13B不僅對(duì)學(xué)術(shù)研究完全開(kāi)放,開(kāi)發(fā)者也僅需郵件申請(qǐng)獲得官方商用許可后,即可以免費(fèi)商用。

Baichuan2大模型

Baichuan2大模型是由百川智能開(kāi)發(fā)的一系列開(kāi)源可商用的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型。包含了70億、130億、530億參數(shù)的模型。百川智能成之初,就將通過(guò)開(kāi)源式助中國(guó)模型態(tài)繁榮作為公司的重要發(fā)展向。此次開(kāi)源的兩款Baichuan2模型,得到了上下游企業(yè)的積極響應(yīng),華為等眾多知名企業(yè)均參加了本次發(fā)布會(huì)并與百川智能達(dá)成了合作。

騰AI

騰 AI 是以騰 AI 基礎(chǔ)軟硬件平臺(tái)為基礎(chǔ)構(gòu)建的人工智能計(jì)算產(chǎn)業(yè)。騰AI基礎(chǔ)軟硬件平臺(tái)包括 Atlas 系列硬件及伙伴自有品牌硬件、異構(gòu)計(jì)算架構(gòu) CANN、全場(chǎng)景AI框架思 MindSpore、騰應(yīng)用使能 MindX、一站式開(kāi)發(fā)平臺(tái) ModelArts 和統(tǒng)一工具鏈MindStudio 等。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港