當(dāng)前位置：人工智能實驗室> 云計算 > 阿里云：做AI時代最開放的云，已支撐國內(nèi)一半大模型

阿里云：做AI時代最開放的云，已支撐國內(nèi)一半大模型
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-11-05 09:00:56 瀏覽：4798次

導(dǎo)讀：近一個月以來，國內(nèi)多家大模型紛紛更新?lián)Q代，百模大戰(zhàn)也隨著大模型能力的提升愈發(fā)火熱。10月31日，2023云棲大會上，阿里云旗下大模型通義千問也迎來了2.0的升級，并成為了文心一言、科大訊飛之后第三家宣布超越GPT3.5的大模型，同時，基于通義千問的大模型全...

近一個月以來，國內(nèi)多家大模型紛紛更新?lián)Q代，“百模大戰(zhàn)”也隨著大模型能力的提升愈發(fā)火熱。10月31日，2023云棲大會上，阿里云旗下大模型通義千問也迎來了2.0的升級，并成為了文心一言、科大訊飛之后第三家宣布超越GPT3.5的大模型，同時，基于通義千問的大模型“全家桶”也向公眾亮相。

不過，相比其他研發(fā)大模型的企業(yè)，阿里云不僅做到了通義千問的開源，還為全國80%的科技企業(yè)和一半的大模型公司提供了算力支持。

事實上，本屆云棲大會阿里云更強調(diào)開放與生態(tài)。除了加速自研大模型迭代，從升級AI基礎(chǔ)設(shè)施到產(chǎn)品結(jié)構(gòu)、AI開源社區(qū)的搭建都在貫徹“開放”這一主題。其中，AI開源社區(qū)魔搭集聚了280萬開發(fā)者、2300多個模型，模型下載量超過1億。

在云棲大會上，阿里云CTO周靖人發(fā)布了8個基于通義千問的行業(yè)大模型：通義靈碼智能編碼助手、通義智文AI閱讀助手、通義聽悟工作學(xué)習(xí)AI助手、通義星塵個性化角色創(chuàng)作平臺、通義點金智能投研助手、通義曉蜜智能客服、通義仁心個人專屬健康助手、通義法睿AI法律顧問。此外，周靖人還發(fā)布了一站式大模型應(yīng)用開發(fā)平臺阿里云百煉，開發(fā)者可在5分鐘內(nèi)開發(fā)一款大模型應(yīng)用，幾小時即可“煉”出一個企業(yè)專屬模型。

在大模型時代，通義千問系列大模型有什么樣的發(fā)展目標(biāo)？阿里云又將扮演何種角色呢？

更好的大模型加速應(yīng)用創(chuàng)新

在2023云棲大會現(xiàn)場，周靖人公布了阿里自研大模型的最新進展，發(fā)布千億級參數(shù)規(guī)模的通義千問2.0。通義千問2.0在10個權(quán)威測評中全面超越GPT-3.5和Llama2，加速追趕GPT-4。

具體來看，過去6個月，通義千問2.0在性能上取得巨大飛躍，相比4月發(fā)布的1.0版本，通義千問2.0在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識記憶、幻覺抵御等能力上均有顯著提升。目前，通義千問的綜合性能已經(jīng)超過GPT-3.5，加速追趕GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10個主流Benchmark測評集上，通義千問2.0的得分整體超越Meta的Llama-2-70B，相比OpenAI的Chat-3.5是九勝一負(fù)，相比GPT-4則是四勝六負(fù)，與GPT-4的差距進一步縮校

中英文理解能力是大語言模型的基本功。英語任務(wù)方面，通義千問2.0在MMLU基準(zhǔn)的得分是82.5，僅次于GPT-4，通過大幅增加參數(shù)量，通義千問2.0能更好地理解和處理復(fù)雜的語言結(jié)構(gòu)和概念；中文任務(wù)方面，通義千問2.0以明顯優(yōu)勢在C-Eval基準(zhǔn)獲得最高得分，這是由于模型在訓(xùn)練中學(xué)習(xí)了更多中文語料，進一步強化了中文理解和表達能力。

在數(shù)學(xué)推理、代碼理解等領(lǐng)域，通義千問2.0進步明顯。在推理基準(zhǔn)測試GSM8K中，通義千問排名第二，展示了強大的計算和邏輯推理能力；在HumanEval測試中，通義千問得分緊跟GPT-4和GPT-3.5，該測試主要衡量大模型理解和執(zhí)行代碼片段的能力，這一能力是大模型應(yīng)用于編程輔助、自動代碼修復(fù)等場景的基矗

據(jù)了解，阿里云在大模型方面的研究，從2018年底、2019年初就已經(jīng)開始，通義千問模型就是在之前阿里云預(yù)訓(xùn)練模型的技術(shù)體系里面發(fā)展起來的。

“我們從4月份開始對外發(fā)布以后，也進行了一系列升級，通義千問2.0是個千億級規(guī)模的大模型，我們的目標(biāo)一方面是開發(fā)產(chǎn)品本身，更重要的是我們把這個大模型以API方式開放出來，能夠讓更多人使用。至于模型能力的部分，我們也做了很多測評，我們希望在通用的測評集里比較客觀地驗證模型的能力，今天我們面對ChatGPT3.5來說有非常大的勝率，ChatGPT4.0里大家各有勝負(fù)。當(dāng)然這一方面是一個評測集，另一方面也是大家使用的體感，我相信最好的是用戶來做評價，大家可以去嘗試，給一個判斷，而且本身這個模型也在不斷地演進過程當(dāng)中，其實每個人的體感是不一樣的。即使回答同一個問題，有的人覺得模型A不錯，有的人覺得模型B不錯，其實很大程度上模型反饋質(zhì)量好壞也是個性化的體感，這個是我們接下來面對的一個技術(shù)問題，怎么能夠找到大家個性化的需求，能夠更加地幫助大家個性化地去定制相關(guān)的模型。”周靖人說。

當(dāng)前，千行百業(yè)都想借助大模型實現(xiàn)生產(chǎn)和服務(wù)方式的變革，但大模型使用的高門檻把大部分人擋在了技術(shù)浪潮之外。不論是定制專屬大模型，還是基于大模型構(gòu)建創(chuàng)新應(yīng)用，都有很高的人才、技術(shù)、資金要求。

在云棲大會現(xiàn)場，周靖人發(fā)布了一站式大模型應(yīng)用開發(fā)平臺阿里云百煉，該平臺集成了國內(nèi)外主流優(yōu)質(zhì)大模型，提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開發(fā)工具，為用戶簡化了底層算力部署、模型預(yù)訓(xùn)練、工具開發(fā)等復(fù)雜工作。開發(fā)者可在5分鐘內(nèi)開發(fā)一款大模型應(yīng)用，幾小時即可“煉”出一個企業(yè)專屬模型，開發(fā)者可把更多精力專注于應(yīng)用創(chuàng)新。

為推動大模型更易在千行百業(yè)集成落地，阿里云基于通義“打樣”了8個行業(yè)大模型，并在現(xiàn)場公布進展：個性化角色創(chuàng)作平臺通義星塵、智能投研助手通義點金、AI閱讀助手通義智文等首次亮相；智能編碼助手通義靈碼已在阿里云內(nèi)部大規(guī)模采用，廣受好評；工作學(xué)習(xí)AI助手通義聽悟每天處理5萬余個音視頻，累積用戶超100萬。

大模型正引發(fā)千行百業(yè)的新一輪創(chuàng)新，目前，央視網(wǎng)、朗新科技、亞信科技等企業(yè)已率先在阿里云百煉上開發(fā)專屬模型和應(yīng)用，朗新科技在云上訓(xùn)練出電力專屬大模型，開發(fā)“電力賬單解讀智能助手”“電力行業(yè)政策解析/數(shù)據(jù)分析助手”，為客戶接待提效50%、降低投訴70%。

全面升級AI基礎(chǔ)設(shè)施

大模型是本輪AI浪潮的核心技術(shù)，基礎(chǔ)模型的質(zhì)量很大程度決定了AI產(chǎn)業(yè)化的前景。訓(xùn)練大模型是囊括了算力底座、網(wǎng)絡(luò)、存儲、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程，只有強大的云計算體系才能訓(xùn)練出高質(zhì)量的大模型。

周靖人表示，2009年阿里云就提出“數(shù)據(jù)中心是一臺計算機”的理念，今天，AI時代更加需要這樣的技術(shù)體系。作為一臺超級計算機的云計算，可高效連接異構(gòu)計算資源，突破單一性能芯片瓶頸，協(xié)同完成大規(guī)模智能計算任務(wù)。

為了保證大模型訓(xùn)練的穩(wěn)定互聯(lián)和高效并行計算，阿里云全新升級了人工智能平臺PAI。PAI底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu)，支持高達10萬卡量級的集群可擴展規(guī)模，超大規(guī)模分布式訓(xùn)練加速比高達96%，遠(yuǎn)超業(yè)界水平；在大模型訓(xùn)練任務(wù)中，可節(jié)省超過50%算力資源，性能全球領(lǐng)先。

阿里云通義大模型系列就是基于人工智能平臺PAI訓(xùn)練而成。除了通義大模型，中國一半大模型公司跑在阿里云上，百川智能、智譜AI、零一萬物、昆侖萬維、vivo、復(fù)旦大學(xué)等大批頭部企業(yè)及機構(gòu)均在阿里云上訓(xùn)練大模型。

百川智能創(chuàng)始人兼CEO王小川表示，“百川成立僅半年便發(fā)布了7款大模型，快速迭代背后離不開云計算的支持。”百川智能和阿里云進行了深入合作，在雙方的共同努力下，百川很好地完成了千卡大模型訓(xùn)練任務(wù)，有效降低了模型推理成本，提升了模型部署效率。

客觀而言，國內(nèi)大模型的發(fā)展與“不計成本登月”的OpenAI還存在差距。王小川表示，國內(nèi)大模型的現(xiàn)狀是“理想上慢一步，落地上快三步”。雖然在技術(shù)創(chuàng)新和技術(shù)理想上美國有所領(lǐng)先，但是中國的應(yīng)用落地能力更強。百川擁有經(jīng)驗豐富的搜索團隊，過去成功打造過基于語言模型的超級應(yīng)用，且擁有經(jīng)過市場驗證的技術(shù)、產(chǎn)品、商業(yè)化能力，團隊掌握的搜索技術(shù)可以助力大模型研發(fā)，且能補齊大模型在幻覺等問題上的短板。

除了團隊、經(jīng)驗等優(yōu)勢外，百川實現(xiàn)平均每月迭代一款模型的另一重要原因是云計算的支撐。王小川介紹，模型的快速迭代和部署離不開云計算，百川智能和阿里云作為緊密的合作伙伴，在模型預(yù)訓(xùn)練和模型部署等方面進行了深入合作。在雙方的共同努力下，百川很好地完成了千卡大模型訓(xùn)練任務(wù)，有效降低了模型推理成本，提升了模型部署效率。

阿里云已成為中國大模型的公共AI算力底座。截至目前，中國眾多頭部主流大模型都已通過阿里云對外提供API服務(wù)，包括通義系列、Baichuan系列、智譜AI ChatGLM系列、姜子牙通用大模型等。

隨著AI產(chǎn)業(yè)化逐步深入，必將迎來大規(guī)模智能算力需求爆發(fā)。阿里云已在全球30個地域建設(shè)了89個云計算數(shù)據(jù)中心，提供3000余個邊緣計算節(jié)點，云計算的低延時、高彈性優(yōu)點將發(fā)揮得淋漓盡致。今年，阿里云成功支撐火爆全網(wǎng)的妙鴨相機短時間高強度的流量爆發(fā)。

周靖人說：“隨著大模型技術(shù)與云計算本身的融合，我們希望未來的云可以像車一樣也能夠自動駕駛，大幅提升開發(fā)者使用云的體驗。”

據(jù)悉，阿里云上有超過30款云產(chǎn)品接入了大模型能力，例如阿里云大數(shù)據(jù)治理平臺DataWorks新增了全新的交互形態(tài)Copilot，用戶只需用自然語言輸入即可生成SQL，并自動執(zhí)行相應(yīng)的數(shù)據(jù)ETL操作，整體開發(fā)與分析可提效30%以上，堪比“自動駕駛”。

阿里云容器、數(shù)據(jù)庫等產(chǎn)品上也提供了類似的開發(fā)體驗，可實現(xiàn)NL2SQL、SQL注釋生成/糾錯/優(yōu)化等功能，未來這些能力還將集成到阿里云其他產(chǎn)品上。

堅定開放共促生態(tài)繁榮 阿里云的定位是要服務(wù)好AI時代創(chuàng)業(yè)者

“促進中國AI生態(tài)繁榮，是阿里云的首要目標(biāo)。阿里云將堅定打造AI時代最開放的大模型平臺，我們歡迎所有大模型接入阿里云百煉，共同向開發(fā)者提供AI服務(wù)。”周靖人表示。

阿里云是國內(nèi)最早開源自研大模型的科技公司，掀起中國大模型開源浪潮。目前，阿里云已開源通義千問7B、14B版本，下載量突破百萬。在現(xiàn)場，周靖人宣布通義千問72B模型即將開源，將成為中國參數(shù)最大的開源模型。

除了與開發(fā)者共享自研新技術(shù)，阿里云還大力支持三方大模型發(fā)展。在阿里云魔搭社區(qū)上，百川智能、智譜AI、上海人工智能實驗室、IDEA研究院等業(yè)界頂級玩家，都開源首發(fā)他們的核心大模型，阿里云則為開發(fā)者們“嘗鮮”大模型提供免費GPU算力，截至目前已超3000萬小時。

周靖人透露，魔搭社區(qū)現(xiàn)已聚集2300多款A(yù)I模型，吸引280萬名AI開發(fā)者，AI模型下載量突破1億，成為中國規(guī)模最大、開發(fā)者最活躍的AI社區(qū)。

2023云棲大會上，阿里云宣布了一項重磅計劃：“云工開物計劃”，給中國所有大學(xué)生每人送一臺云服務(wù)器。此外，阿里云還將為簽約高校提供更大規(guī)模的算力資源支持，助力中國青年學(xué)者和學(xué)子攀登科研高峰。目前，清華大學(xué)、北京大學(xué)、浙江大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)、華南理工大學(xué)等高校已首批達成合作。

對于阿里云在AI時代的定位，周靖人在接受媒體采訪時表示，阿里云今天的定位是服務(wù)好各種各樣AI時代的創(chuàng)業(yè)者、開發(fā)者、企業(yè)客戶等等。也就是通過多層技術(shù)的能力，能夠讓用戶在平臺上得到最好的支持，幫助他們解決創(chuàng)業(yè)上的挑戰(zhàn)、進行創(chuàng)新上的加速、讓人工智能能夠落地。

“在各個維度上，今天阿里云所面對的客戶分很多階層。有的可能來自于模型創(chuàng)業(yè)公司，對于他們來講，更希望使用到最先進的AI基礎(chǔ)設(shè)施做大模型研究。還有一類客戶，希望能夠把已有的開源模型有效結(jié)合自己產(chǎn)品做二次創(chuàng)新。更多則希望用通義千問這種開源的模型，幫助它做自己的業(yè)務(wù)系統(tǒng)開發(fā)。”周靖人說。“今天，阿里云的要服務(wù)好所有上面講到的客戶，所有在智能時代期待利用數(shù)字創(chuàng)新，或者利用人工智能的方式做科技創(chuàng)新的客戶，并希望以完善的產(chǎn)品矩陣有效支持好他們，這就是我們當(dāng)前的定位。”

“過去十來年，阿里云服務(wù)了中國移動互聯(lián)網(wǎng)的大發(fā)展。今天，隨著大模型技術(shù)的迅速發(fā)展，智能化時代正在開啟。阿里云正在面向AI時代進行全面的技術(shù)升級和創(chuàng)新，打造AI時代一朵最開放的云。”阿里巴巴集團董事會主席蔡崇信說。