展會信息港展會大全

阿里云:做AI時代最開放的云,已支撐國內(nèi)一半大模型
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-05 09:00:56   瀏覽:4798次  

導(dǎo)讀:近一個月以來,國內(nèi)多家大模型紛紛更新?lián)Q代,百模大戰(zhàn)也隨著大模型能力的提升愈發(fā)火熱。10月31日,2023云棲大會上,阿里云旗下大模型通義千問也迎來了2.0的升級,并成為了文心一言、科大訊飛之后第三家宣布超越GPT3.5的大模型,同時,基于通義千問的大模型全...

近一個月以來,國內(nèi)多家大模型紛紛更新?lián)Q代,“百模大戰(zhàn)”也隨著大模型能力的提升愈發(fā)火熱。10月31日,2023云棲大會上,阿里云旗下大模型通義千問也迎來了2.0的升級,并成為了文心一言、科大訊飛之后第三家宣布超越GPT3.5的大模型,同時,基于通義千問的大模型“全家桶”也向公眾亮相。

不過,相比其他研發(fā)大模型的企業(yè),阿里云不僅做到了通義千問的開源,還為全國80%的科技企業(yè)和一半的大模型公司提供了算力支持。

事實上,本屆云棲大會阿里云更強調(diào)開放與生態(tài)。除了加速自研大模型迭代,從升級AI基礎(chǔ)設(shè)施到產(chǎn)品結(jié)構(gòu)、AI開源社區(qū)的搭建都在貫徹“開放”這一主題。其中,AI開源社區(qū)魔搭集聚了280萬開發(fā)者、2300多個模型,模型下載量超過1億。

在云棲大會上,阿里云CTO周靖人發(fā)布了8個基于通義千問的行業(yè)大模型:通義靈碼智能編碼助手、通義智文AI閱讀助手、通義聽悟工作學(xué)習(xí)AI助手、通義星塵個性化角色創(chuàng)作平臺、通義點金智能投研助手、通義曉蜜智能客服、通義仁心個人專屬健康助手、通義法睿AI法律顧問。此外,周靖人還發(fā)布了一站式大模型應(yīng)用開發(fā)平臺阿里云百煉,開發(fā)者可在5分鐘內(nèi)開發(fā)一款大模型應(yīng)用,幾小時即可“煉”出一個企業(yè)專屬模型。

在大模型時代,通義千問系列大模型有什么樣的發(fā)展目標(biāo)?阿里云又將扮演何種角色呢?

更好的大模型 加速應(yīng)用創(chuàng)新

在2023云棲大會現(xiàn)場,周靖人公布了阿里自研大模型的最新進展,發(fā)布千億級參數(shù)規(guī)模的通義千問2.0。通義千問2.0在10個權(quán)威測評中全面超越GPT-3.5和Llama2,加速追趕GPT-4。

具體來看,過去6個月,通義千問2.0在性能上取得巨大飛躍,相比4月發(fā)布的1.0版本,通義千問2.0在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識記憶、幻覺抵御等能力上均有顯著提升。目前,通義千問的綜合性能已經(jīng)超過GPT-3.5,加速追趕GPT-4。

在MMLU、C-Eval、GSM8K、HumanEval、MATH等10個主流Benchmark測評集上,通義千問2.0的得分整體超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九勝一負(fù),相比GPT-4則是四勝六負(fù),與GPT-4的差距進一步縮校

中英文理解能力是大語言模型的基本功。英語任務(wù)方面,通義千問2.0在MMLU基準(zhǔn)的得分是82.5,僅次于GPT-4,通過大幅增加參數(shù)量,通義千問2.0能更好地理解和處理復(fù)雜的語言結(jié)構(gòu)和概念;中文任務(wù)方面,通義千問2.0以明顯優(yōu)勢在C-Eval基準(zhǔn)獲得最高得分,這是由于模型在訓(xùn)練中學(xué)習(xí)了更多中文語料,進一步強化了中文理解和表達能力。

在數(shù)學(xué)推理、代碼理解等領(lǐng)域,通義千問2.0進步明顯。在推理基準(zhǔn)測試GSM8K中,通義千問排名第二,展示了強大的計算和邏輯推理能力;在HumanEval測試中,通義千問得分緊跟GPT-4和GPT-3.5,該測試主要衡量大模型理解和執(zhí)行代碼片段的能力,這一能力是大模型應(yīng)用于編程輔助、自動代碼修復(fù)等場景的基矗

據(jù)了解,阿里云在大模型方面的研究,從2018年底、2019年初就已經(jīng)開始,通義千問模型就是在之前阿里云預(yù)訓(xùn)練模型的技術(shù)體系里面發(fā)展起來的。

“我們從4月份開始對外發(fā)布以后,也進行了一系列升級,通義千問2.0是個千億級規(guī)模的大模型,我們的目標(biāo)一方面是開發(fā)產(chǎn)品本身,更重要的是我們把這個大模型以API方式開放出來,能夠讓更多人使用。至于模型能力的部分,我們也做了很多測評,我們希望在通用的測評集里比較客觀地驗證模型的能力,今天我們面對ChatGPT3.5來說有非常大的勝率,ChatGPT4.0里大家各有勝負(fù)。當(dāng)然這一方面是一個評測集,另一方面也是大家使用的體感,我相信最好的是用戶來做評價,大家可以去嘗試,給一個判斷,而且本身這個模型也在不斷地演進過程當(dāng)中,其實每個人的體感是不一樣的。即使回答同一個問題,有的人覺得模型A不錯,有的人覺得模型B不錯,其實很大程度上模型反饋質(zhì)量好壞也是個性化的體感,這個是我們接下來面對的一個技術(shù)問題,怎么能夠找到大家個性化的需求,能夠更加地幫助大家個性化地去定制相關(guān)的模型。”周靖人說。

當(dāng)前,千行百業(yè)都想借助大模型實現(xiàn)生產(chǎn)和服務(wù)方式的變革,但大模型使用的高門檻把大部分人擋在了技術(shù)浪潮之外。不論是定制專屬大模型,還是基于大模型構(gòu)建創(chuàng)新應(yīng)用,都有很高的人才、技術(shù)、資金要求。

在云棲大會現(xiàn)場,周靖人發(fā)布了一站式大模型應(yīng)用開發(fā)平臺阿里云百煉,該平臺集成了國內(nèi)外主流優(yōu)質(zhì)大模型,提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開發(fā)工具,為用戶簡化了底層算力部署、模型預(yù)訓(xùn)練、工具開發(fā)等復(fù)雜工作。開發(fā)者可在5分鐘內(nèi)開發(fā)一款大模型應(yīng)用,幾小時即可“煉”出一個企業(yè)專屬模型,開發(fā)者可把更多精力專注于應(yīng)用創(chuàng)新。

為推動大模型更易在千行百業(yè)集成落地,阿里云基于通義“打樣”了8個行業(yè)大模型,并在現(xiàn)場公布進展:個性化角色創(chuàng)作平臺通義星塵、智能投研助手通義點金、AI閱讀助手通義智文等首次亮相;智能編碼助手通義靈碼已在阿里云內(nèi)部大規(guī)模采用,廣受好評;工作學(xué)習(xí)AI助手通義聽悟每天處理5萬余個音視頻,累積用戶超100萬。

大模型正引發(fā)千行百業(yè)的新一輪創(chuàng)新,目前,央視網(wǎng)、朗新科技、亞信科技等企業(yè)已率先在阿里云百煉上開發(fā)專屬模型和應(yīng)用,朗新科技在云上訓(xùn)練出電力專屬大模型,開發(fā)“電力賬單解讀智能助手”“電力行業(yè)政策解析/數(shù)據(jù)分析助手”,為客戶接待提效50%、降低投訴70%。

全面升級AI基礎(chǔ)設(shè)施

大模型是本輪AI浪潮的核心技術(shù),基礎(chǔ)模型的質(zhì)量很大程度決定了AI產(chǎn)業(yè)化的前景。訓(xùn)練大模型是囊括了算力底座、網(wǎng)絡(luò)、存儲、大數(shù)據(jù)、AI框架、AI模型等復(fù)雜技術(shù)的系統(tǒng)性工程,只有強大的云計算體系才能訓(xùn)練出高質(zhì)量的大模型。

周靖人表示,2009年阿里云就提出“數(shù)據(jù)中心是一臺計算機”的理念,今天,AI時代更加需要這樣的技術(shù)體系。作為一臺超級計算機的云計算,可高效連接異構(gòu)計算資源,突破單一性能芯片瓶頸,協(xié)同完成大規(guī)模智能計算任務(wù)。

為了保證大模型訓(xùn)練的穩(wěn)定互聯(lián)和高效并行計算,阿里云全新升級了人工智能平臺PAI。PAI底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu),支持高達10萬卡量級的集群可擴展規(guī)模,超大規(guī)模分布式訓(xùn)練加速比高達96%,遠(yuǎn)超業(yè)界水平;在大模型訓(xùn)練任務(wù)中,可節(jié)省超過50%算力資源,性能全球領(lǐng)先。

阿里云通義大模型系列就是基于人工智能平臺PAI訓(xùn)練而成。除了通義大模型,中國一半大模型公司跑在阿里云上,百川智能、智譜AI、零一萬物、昆侖萬維、vivo、復(fù)旦大學(xué)等大批頭部企業(yè)及機構(gòu)均在阿里云上訓(xùn)練大模型。

百川智能創(chuàng)始人兼CEO王小川表示,“百川成立僅半年便發(fā)布了7款大模型,快速迭代背后離不開云計算的支持。”百川智能和阿里云進行了深入合作,在雙方的共同努力下,百川很好地完成了千卡大模型訓(xùn)練任務(wù),有效降低了模型推理成本,提升了模型部署效率。

客觀而言,國內(nèi)大模型的發(fā)展與“不計成本登月”的OpenAI還存在差距。王小川表示,國內(nèi)大模型的現(xiàn)狀是“理想上慢一步,落地上快三步”。雖然在技術(shù)創(chuàng)新和技術(shù)理想上美國有所領(lǐng)先,但是中國的應(yīng)用落地能力更強。百川擁有經(jīng)驗豐富的搜索團隊,過去成功打造過基于語言模型的超級應(yīng)用,且擁有經(jīng)過市場驗證的技術(shù)、產(chǎn)品、商業(yè)化能力,團隊掌握的搜索技術(shù)可以助力大模型研發(fā),且能補齊大模型在幻覺等問題上的短板。

除了團隊、經(jīng)驗等優(yōu)勢外,百川實現(xiàn)平均每月迭代一款模型的另一重要原因是云計算的支撐。王小川介紹,模型的快速迭代和部署離不開云計算,百川智能和阿里云作為緊密的合作伙伴,在模型預(yù)訓(xùn)練和模型部署等方面進行了深入合作。在雙方的共同努力下,百川很好地完成了千卡大模型訓(xùn)練任務(wù),有效降低了模型推理成本,提升了模型部署效率。

阿里云已成為中國大模型的公共AI算力底座。截至目前,中國眾多頭部主流大模型都已通過阿里云對外提供API服務(wù),包括通義系列、Baichuan系列、智譜AI ChatGLM系列、姜子牙通用大模型等。

隨著AI產(chǎn)業(yè)化逐步深入,必將迎來大規(guī)模智能算力需求爆發(fā)。阿里云已在全球30個地域建設(shè)了89個云計算數(shù)據(jù)中心,提供3000余個邊緣計算節(jié)點,云計算的低延時、高彈性優(yōu)點將發(fā)揮得淋漓盡致。今年,阿里云成功支撐火爆全網(wǎng)的妙鴨相機短時間高強度的流量爆發(fā)。

周靖人說:“隨著大模型技術(shù)與云計算本身的融合,我們希望未來的云可以像車一樣也能夠自動駕駛,大幅提升開發(fā)者使用云的體驗。”

據(jù)悉,阿里云上有超過30款云產(chǎn)品接入了大模型能力,例如阿里云大數(shù)據(jù)治理平臺DataWorks新增了全新的交互形態(tài)Copilot,用戶只需用自然語言輸入即可生成SQL,并自動執(zhí)行相應(yīng)的數(shù)據(jù)ETL操作,整體開發(fā)與分析可提效30%以上,堪比“自動駕駛”。

阿里云容器、數(shù)據(jù)庫等產(chǎn)品上也提供了類似的開發(fā)體驗,可實現(xiàn)NL2SQL、SQL注釋生成/糾錯/優(yōu)化等功能,未來這些能力還將集成到阿里云其他產(chǎn)品上。

堅定開放共促生態(tài)繁榮 阿里云的定位是要服務(wù)好AI時代創(chuàng)業(yè)者

“促進中國AI生態(tài)繁榮,是阿里云的首要目標(biāo)。阿里云將堅定打造AI時代最開放的大模型平臺,我們歡迎所有大模型接入阿里云百煉,共同向開發(fā)者提供AI服務(wù)。”周靖人表示。

阿里云是國內(nèi)最早開源自研大模型的科技公司,掀起中國大模型開源浪潮。目前,阿里云已開源通義千問7B、14B版本,下載量突破百萬。在現(xiàn)場,周靖人宣布通義千問72B模型即將開源,將成為中國參數(shù)最大的開源模型。

除了與開發(fā)者共享自研新技術(shù),阿里云還大力支持三方大模型發(fā)展。在阿里云魔搭社區(qū)上,百川智能、智譜AI、上海人工智能實驗室、IDEA研究院等業(yè)界頂級玩家,都開源首發(fā)他們的核心大模型,阿里云則為開發(fā)者們“嘗鮮”大模型提供免費GPU算力,截至目前已超3000萬小時。

周靖人透露,魔搭社區(qū)現(xiàn)已聚集2300多款A(yù)I模型,吸引280萬名AI開發(fā)者,AI模型下載量突破1億,成為中國規(guī)模最大、開發(fā)者最活躍的AI社區(qū)。

2023云棲大會上,阿里云宣布了一項重磅計劃:“云工開物計劃”,給中國所有大學(xué)生每人送一臺云服務(wù)器。此外,阿里云還將為簽約高校提供更大規(guī)模的算力資源支持,助力中國青年學(xué)者和學(xué)子攀登科研高峰。目前,清華大學(xué)、北京大學(xué)、浙江大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)、華南理工大學(xué)等高校已首批達成合作。

對于阿里云在AI時代的定位,周靖人在接受媒體采訪時表示,阿里云今天的定位是服務(wù)好各種各樣AI時代的創(chuàng)業(yè)者、開發(fā)者、企業(yè)客戶等等。也就是通過多層技術(shù)的能力,能夠讓用戶在平臺上得到最好的支持,幫助他們解決創(chuàng)業(yè)上的挑戰(zhàn)、進行創(chuàng)新上的加速、讓人工智能能夠落地。

“在各個維度上,今天阿里云所面對的客戶分很多階層。有的可能來自于模型創(chuàng)業(yè)公司,對于他們來講,更希望使用到最先進的AI基礎(chǔ)設(shè)施做大模型研究。還有一類客戶,希望能夠把已有的開源模型有效結(jié)合自己產(chǎn)品做二次創(chuàng)新。更多則希望用通義千問這種開源的模型,幫助它做自己的業(yè)務(wù)系統(tǒng)開發(fā)。”周靖人說。“今天,阿里云的要服務(wù)好所有上面講到的客戶,所有在智能時代期待利用數(shù)字創(chuàng)新,或者利用人工智能的方式做科技創(chuàng)新的客戶,并希望以完善的產(chǎn)品矩陣有效支持好他們,這就是我們當(dāng)前的定位。”

“過去十來年,阿里云服務(wù)了中國移動互聯(lián)網(wǎng)的大發(fā)展。今天,隨著大模型技術(shù)的迅速發(fā)展,智能化時代正在開啟。阿里云正在面向AI時代進行全面的技術(shù)升級和創(chuàng)新,打造AI時代一朵最開放的云。”阿里巴巴集團董事會主席蔡崇信說。

編輯 方靜怡 陳莉

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港