展會信息港展會大全

“降價”上癮!阿里云宣布通義千問主力模型降價97%
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-21 15:00:51   瀏覽:5221次  

導(dǎo)讀:IT時報記者 郝俊慧 沒有最低,只有更低!最近一周,大模型卷起價格戰(zhàn)。 5月21日,阿里云宣布降價,通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,1塊錢可以買200萬tokens,相當(dāng)于5本《新華字典...

IT時報記者 郝俊慧

沒有最低,只有更低!最近一周,大模型“卷起”價格戰(zhàn)。

5月21日,阿里云宣布降價,通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,1塊錢可以買200萬tokens,相當(dāng)于5本《新華字典》的文字量。

自5月14日OpenAI宣布正式推出新一代旗艦AI模型GPT-4o,并將API價格下降50%以來,短短一周內(nèi),國產(chǎn)大模型智譜大模型、字節(jié)跳動豆包大模型先后官宣降價,降幅都在80%~90%之間。其中,豆包將價格降到了“以厘計費”,一塊錢能買125萬Tokens,相當(dāng)于三本《三國演義》。

如今,阿里云再進一步將價格打到“骨折”。

“未來,大模型就是云”,宣布降價消息的武漢AI智領(lǐng)者峰會現(xiàn)場,阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光的這句話,或許正是諸多廠商不得不跟進的原因。

業(yè)界普遍認(rèn)為,隨著大模型性能逐漸提升,AI應(yīng)用創(chuàng)新正進入密集探索期,但推理成本過高依然是制約大模型規(guī)模化應(yīng)用的關(guān)鍵因素。大幅降低大模型推理價格的意義在于,降低AI應(yīng)用開發(fā)的門檻,鼓勵開發(fā)者加速進入賽道,加速應(yīng)用端對AI產(chǎn)品的適應(yīng)性和依賴性。

阿里云預(yù)計,未來大模型API的調(diào)用量會有成千上萬倍的增長,公共云+API將成為企業(yè)使用大模型的主流方式。

通義千問本次降價共覆蓋9款商業(yè)化及開源系列模型。

不久前,OpenAI的Sam Altman轉(zhuǎn)發(fā)了Chatbot Arena榜單來印證GPT-4o的能力,其中全球排名前20的模型中,僅有的三款中國模型都是通義千問出品,包括Qwen-Max、Qwen1.5-110B、Qwen1.5-72B,此次全部降價。

其中,不久前發(fā)布的通義千問旗艦款大模型Qwen-Max,API輸入價格降至0.04元/千tokens,降幅達67%。Qwen-Max是目前中文大模型中的“佼佼者”,在權(quán)威基準(zhǔn)OpenCompass上性能追平GPT-4-Turbo,并在大模型競技場Chatbot Arena中躋身全球前15。

Qwen-Long是通義千問的長文本增強版模型,性能對標(biāo)GPT-4,上下文長度最高達1千萬。除了輸入價格降至0.0005元/千tokens,Qwen-Long輸出價格也直降90%至0.002元/千tokens。相比之下,國內(nèi)外廠商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens輸入價格分別為0.22元、0.025元、0.022元及0.12元,均遠(yuǎn)高于Qwen-long。

在“價格戰(zhàn)”這條路上,阿里云一向是先行者。

今年2月29日,阿里云舉起“價格屠刀”,對旗下100多款云產(chǎn)品、500多個產(chǎn)品規(guī)格,平均降價幅度超過20%,最高降幅達55%,涉及覆蓋計算、存儲、數(shù)據(jù)庫等所有核心產(chǎn)品。此后,多家云商“被迫”跟進。

此次,阿里云依然是大模型降價潮的第一梯隊。相較“后來者”國產(chǎn)大模型廠商,出身“云服務(wù)商”的阿里云具有先天優(yōu)勢。

劉偉光透露,公共云的技術(shù)紅利和規(guī)模效應(yīng),帶來巨大的成本和性能優(yōu)勢。阿里云基于自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò)HPN7.0、高性能存儲CPFS、人工智能平臺PAI等核心技術(shù)和產(chǎn)品,構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng),結(jié)合百煉分布式推理加速引擎,大幅壓縮了模型推理成本,并加快模型推理速度。

從實際測試來看,即便是同樣的開源模型,在公共云上的調(diào)用價格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用Qwen-72B開源模型、每月1億tokens用量為例,在阿里云百煉上直接調(diào)用API每月僅需600元,私有化部署的成本平均每月超1萬元。

此外,云廠商天然的開放性,能為開發(fā)者提供最豐富的模型和工具鏈。阿里云百煉平臺上匯聚通義、百川、ChatGLM、Llama系列等上百款國內(nèi)外優(yōu)質(zhì)模型,內(nèi)置大模型定制與應(yīng)用開發(fā)工具鏈,開發(fā)者可以便捷地測試比較不同模型,開發(fā)專屬大模型,并輕松搭建RAG等應(yīng)用。從選模型、調(diào)模型、搭應(yīng)用到對外服務(wù),一站式搞定。

贊助本站

人工智能實驗室
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港