展會信息港展會大全

AI算力調(diào)度平臺,大模型時(shí)代云計(jì)算的新生意|甲子光年
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-08 14:00:34   瀏覽:6556次  

導(dǎo)讀:提供AI算力的另一種方式。 作者|趙健 大模型時(shí)代,云計(jì)算廠商如何賺錢? 最常見的方式是提供算力。大模型需要大算力,因此,對算力尤其是英偉達(dá)GPU的巨額投入是不可或缺的。英偉達(dá)曾透露,2023財(cái)年數(shù)據(jù)中心業(yè)務(wù)有40%的收入來自超大規(guī)模數(shù)據(jù)中心與云服務(wù)商。...

提供AI算力的另一種方式。

作者|趙健

大模型時(shí)代,云計(jì)算廠商如何賺錢?

最常見的方式是提供算力。大模型需要大算力,因此,對算力尤其是英偉達(dá)GPU的巨額投入是不可或缺的。英偉達(dá)曾透露,2023財(cái)年數(shù)據(jù)中心業(yè)務(wù)有40%的收入來自超大規(guī)模數(shù)據(jù)中心與云服務(wù)商。

但現(xiàn)在,云計(jì)算廠商又多了一門新生意。

近期,有“混合云第一股”之稱的云廠商青云科技推出了兩款新的云產(chǎn)品AI算力調(diào)度平臺與AI算力云。AI算力調(diào)度平臺是一款軟件產(chǎn)品,它介于底層的資源層與上層的模型層之間,通過整合不同來源、類型和架構(gòu)的算力資源,實(shí)現(xiàn)統(tǒng)一調(diào)度與運(yùn)營,為用戶提供按需獲取和調(diào)度的服務(wù);AI算力云,就是以青云為主來運(yùn)營的AI算力服務(wù)。

這兩款A(yù)I算力產(chǎn)品與服務(wù)針對的是算力中心的短期建設(shè)與中長期運(yùn)營的需求。青云科技總裁林源表示,今天中國云計(jì)算市場處在算力建設(shè)階段,大量的數(shù)據(jù)中心如雨后春筍般出現(xiàn),這些建設(shè)者有地方政府、國資央企、地方AI集成商等。對于建設(shè)者而言,成本與技術(shù)的挑戰(zhàn)都很大,比如一臺最新的一臺英偉達(dá)服務(wù)器高達(dá)200萬元。如此大的投資,怎么建?建成之后如何運(yùn)營,如何賺錢?這些問題都需要有人來解決。

青云科技的AI算力調(diào)度平臺已經(jīng)成功服務(wù)于國家超算濟(jì)南中心。濟(jì)南超算中心是一個(gè)多元計(jì)算中心,對外提供1000P算力、300PB存儲,算力類型包括HPC超算,主要服務(wù)于山東省的高校;以CPU為主的通用算力,主要服務(wù)于傳統(tǒng)的政務(wù)云、企業(yè)數(shù)字化應(yīng)用;以GPU為主的智算,主要服務(wù)于智慧城市,以及正在爆發(fā)的AI需求。

濟(jì)南超算中心的建設(shè)覆蓋了幾乎所有產(chǎn)業(yè)鏈上下游公司,但青云科技為其獨(dú)家提供了算力調(diào)度平臺,至今已經(jīng)運(yùn)營了3年。濟(jì)南超算中心目前已經(jīng)盈利。

對于AI算力云服務(wù),不同于大廠選擇重金投入GPU來獲取稀缺的算力資源,青云科技采用了“輕資產(chǎn)”運(yùn)營,以生態(tài)合作的方式共同運(yùn)營AI算力。

以濟(jì)南超算中心為例,建成之后不僅服務(wù)于當(dāng)?shù)仄髽I(yè),也會服務(wù)于全國其他地區(qū)的企業(yè)。當(dāng)青云科技的客戶有算力需求,青云科技可以通過直接調(diào)度濟(jì)南超算的算力向客戶提供AI算力資源。因此,青云科技既是濟(jì)南超算的供應(yīng)商,也是其渠道商。

這樣的案例不在少數(shù)。青云科技已經(jīng)與北京、寧夏、河南、湖北、四川等地區(qū)的算力中心建立起合作關(guān)系。

在2023年半年報(bào)中,青云科技披露AI算力服務(wù)的收入超2000萬元。林源表示,未來AI算力產(chǎn)品與服務(wù)將會成為青云科技營收的主力。

過去十年,中國的云計(jì)算市場一共經(jīng)歷了三次比較大的機(jī)會。第一次是數(shù)字化,移動(dòng)數(shù)字化催生了公有云,產(chǎn)業(yè)數(shù)字化催生了私有云;第二次是信創(chuàng)與國產(chǎn)替代。而當(dāng)前爆發(fā)的生成式AI,就是第三次大機(jī)會。

林源認(rèn)為,2023年由GPU驅(qū)動(dòng)的智算,正如十年前的2013年由CPU驅(qū)動(dòng)的通用云計(jì)算。而這一次的市場規(guī)模,要比過去大10倍、甚至100倍。

近期,「甲子光年」等媒體采訪了青云科技總裁林源,青云科技產(chǎn)品經(jīng)理苗慧。以下是專訪實(shí)錄,略經(jīng)刪改:

1.與大廠定位不同

問:青云的算力調(diào)度產(chǎn)品有哪些特色?

苗慧:簡單舉幾個(gè)例子。第一,青云針對上百臺機(jī)器的大集群,研發(fā)了更加優(yōu)化的調(diào)度算法。比如在調(diào)度的鏈路標(biāo)簽上,盡可能做到調(diào)度同一個(gè)交換機(jī),減少數(shù)據(jù)的損耗。第二,在應(yīng)用環(huán)境上,青云應(yīng)用了K8s和Slurm兩種調(diào)度平臺同時(shí)為客戶服務(wù),是完全集成好的。在顆粒度和運(yùn)維傳統(tǒng)機(jī)器方面,也會有更多的優(yōu)化。

圖片來源:青云科技

問:大廠、運(yùn)營商、私有云廠商也有軟件能力,為什么說青云的AI算力調(diào)度運(yùn)營是青云科技的優(yōu)勢?

林源:首先,私有云廠商想做,需要補(bǔ)齊十幾年公有云運(yùn)營的經(jīng)驗(yàn)。第二,大廠的定位一定是發(fā)展自己的云,而不是支持別人去做云,或者說支持第三方做云只是他的一個(gè)項(xiàng)目而已,主力還在自己的云產(chǎn)品與服務(wù)。

苗慧:比如對于國家超算的人員配置,根本沒有研發(fā)這個(gè)崗位,全都是運(yùn)維人員。用戶通過青云AI算力調(diào)度平臺,申請10臺機(jī)器,5分鐘內(nèi)就能得到。否則,運(yùn)維人員需要兩個(gè)人部署三天,這就是更多的投入。

問:英偉達(dá)今年發(fā)布了AI云產(chǎn)品DGX Cloud,青云的產(chǎn)品和英偉達(dá)DGX Cloud在定位上有沒有相似?

苗慧:DGX-Cloud還是基于硬件。英偉達(dá)在今年發(fā)布了24臺機(jī)器的整機(jī),巨大的機(jī)器上云一定會有優(yōu)勢。但DGX Cloud不在中國區(qū)運(yùn)營,從資源層和運(yùn)營層都是其自身的。青云的算力調(diào)度產(chǎn)品不僅自己的公有云能用,還能給到任何一家算力中心。

林源:英偉達(dá)DGX Cloud還是單一算力,肯定以GPU為主。站在英偉達(dá)的角度,他服務(wù)于大模型的訓(xùn)練、推理,定位就是面對AI的場景,以及賣GPU卡。而青云科技根據(jù)中國市場國情,需要向下兼容,不同的客戶需要的芯片算力種類不同,既有GPU,也有CPU、超算。比如我們跟英特爾9系列做適配,一個(gè)芯片2T內(nèi)存,在推理場景比英偉達(dá)還要好一些。青云的算力調(diào)度平臺,針對的是多元算力。

2.“輕資產(chǎn)”提供AI算力

問:青云自身在算力上的投入是怎樣的?

林源:GPU不太一樣,青云不會跟云大廠拼投資,而是以相對“輕資產(chǎn)”的方式與別人一起運(yùn)營AI算力云。青云是聯(lián)合運(yùn)營方,投資的是技術(shù)與產(chǎn)品,但不會花1個(gè)億買幾百張卡、幾百臺服務(wù)器。重資產(chǎn)不是青云的價(jià)值所在。

問:那誰來做算力層面的投入?

林源:目前來看,算力層面上的投資建設(shè)者主要有以下幾種:第一種是地方國企和地方央企,例如能源公司,他們有強(qiáng)烈的興趣將電力轉(zhuǎn)變成算力。第二種是地方政府,他們需要新的工具來促進(jìn)產(chǎn)業(yè)聚集,提升GDP,有些直接進(jìn)行投資,有些與央企或銀行合作。第三種是大模型公司、AI芯片公司等,他們在各地都參與建立了算力中心,但缺乏標(biāo)準(zhǔn)平臺,他們也想銷售硬件或整合解決方案,通常更愿意與獨(dú)立的供應(yīng)商合作。我們之間互為渠道伙伴,青云協(xié)助他們進(jìn)行計(jì)算資源調(diào)度,并一起提供AI計(jì)算資源云服務(wù)。

以濟(jì)南超算為例,濟(jì)南超算會基于他投資的算力直接賣給他的客戶,青云也會出售給青云的客戶,青云既是他的供應(yīng)商,也是他的渠道商。未來所有的本地?cái)?shù)據(jù)中心建設(shè)都會面臨這個(gè)問題,當(dāng)?shù)仄髽I(yè)會消費(fèi)一部分,剩余部分他會希望有人幫他消耗。AI算力云與算力調(diào)度中心是青云的同構(gòu)產(chǎn)品,可以進(jìn)行系統(tǒng)級的產(chǎn)品對接。

圖片來源:青云科技

問:除了和濟(jì)南超算有合作外,還有其他的合作方嗎?

林源:跟北京、寧夏、河南、湖北、四川等地區(qū)有合作。北京是以高校為主,寧夏是地域性的算力投資建設(shè)者,四川、湖北是能源公司,河南是地方政府。還有一些小城市,主要是一些AI合作伙伴,對接當(dāng)?shù)氐乃懔χ行暮螅们嘣频恼{(diào)度平臺做賦能。

問:青云自己提供云服務(wù)和青云給甲方提供算力調(diào)度服務(wù),會成為一種競合的關(guān)系嗎?

林源:我們先看下市場現(xiàn)狀,為什么會有那么多供應(yīng)商和地區(qū)云、國資云、地方私有云平臺呢?這是中國的市場形態(tài)決定的,每個(gè)人都有所屬的客戶和資源。AI來了之后,市場會不一樣嗎?我覺得不會那么快改變。

問:很多大模型廠商會選擇自己買卡,這類廠商對于青云科技的AI算力云還有需求嗎?

林源:大模型廠商自己的規(guī)劃中,有相對固定的部分,他會更愿意買卡,因?yàn)楝F(xiàn)金充裕,會更加可控,這部分跟青云確實(shí)沒太大關(guān)系。但在模型訓(xùn)練階段、項(xiàng)目落地階段,有很多彈性需求,比如他需要訓(xùn)練行業(yè)模型,同時(shí)希望跟一場算力云廠商合作提供MaaS的服務(wù)。大模型公司一定會買一部分,自建一部分。

問:目前市場上算力資源不夠,怎么辦?

林源:算力不夠的核心是GPU的供貨問題,不在于我們。用戶一般是簽完合同后等著我們的算力供應(yīng),所有廠商都面臨相同的問題。但是不同廠商的解法不一樣,大廠是靠錢買,青云的方式是與合作伙伴一起。青云的核心是調(diào)度平臺,但不妨礙青云一起給客戶提供AI算力云。

問:在青云開放同盟中,有哪些廠商?青云處于什么地位?

林源:可以分為技術(shù)生態(tài)和商業(yè)生態(tài)。技術(shù)生態(tài)的第一層是GPU、CPU等異構(gòu)芯片;第二層是模型生態(tài)(MaaS),包括主流的商業(yè)大模型、開源大模型。在芯片層跟模型層之間,就是算力調(diào)度層。算力調(diào)度層不僅靠青云,也有很多廠商在做模型的加速和模型的驅(qū)動(dòng)。技術(shù)生態(tài)還有一環(huán),就是行業(yè)ISV。

商業(yè)生態(tài),包括我們說的智算中心建設(shè)方,以及天然就能幫你售賣的合作伙伴。

問:在AI時(shí)代,大家合作的意愿會比以前更強(qiáng)嗎?在巨大的市場紅利面前,為什么會愿意收益共享?

林源:先談主觀看法,我認(rèn)為有必要這么做,大家就應(yīng)該各司其職、合作共贏。現(xiàn)在持這種想法的不只青云一家。哪怕是客戶,也不希望一家獨(dú)大,不希望被一家廠商綁定。他希望在每一個(gè)細(xì)分領(lǐng)域找到最優(yōu)秀的人,為他提供整體解決方案。這是一個(gè)正常的、合理的商業(yè)模式。

第二點(diǎn)是客觀。一家企業(yè)很難從底層資源到上層應(yīng)用,自己把做有事情做好,AI時(shí)代這會比過去更難,F(xiàn)在的經(jīng)濟(jì)環(huán)境,要核算投入產(chǎn)出比,需要成為所有行業(yè)的專家,才能“單打獨(dú)斗”,這是一個(gè)客觀的挑戰(zhàn)。

問:AI會給現(xiàn)有的云廠商格局帶來一些什么樣的變化?青云如何定位自己未來的位置?

林源:AI一定會對于現(xiàn)在的云廠商帶來變化。第一,對于底層技術(shù)的需求,以及對于合作的模式,都在發(fā)生變化。

第二,現(xiàn)在所有人都在同一起跑線上。我判斷會有一些新晉做AI Cloud的公司進(jìn)入市常傳統(tǒng)的IDC已經(jīng)不適合GPU運(yùn)行,因?yàn)槟芎、設(shè)計(jì)都不一樣,傳統(tǒng)IDC面臨改造升級。

第三,有些云廠商自己也做大模型,青云科技不做,而是深耕AI算力調(diào)度平臺。面對新的AI應(yīng)用需求,大家需要很多技術(shù)積累、技術(shù)迭代,這特別像2013年的云時(shí)代。

在資本側(cè),確實(shí)可以自己投資建設(shè),但現(xiàn)在AI不缺投資者與建設(shè)者,缺的是運(yùn)營平臺。資本會有影響,但不會像以前那么大。

總結(jié)來說,大廠在技術(shù)與資本層面并沒有明顯的優(yōu)勢。我們?yōu)槭裁磽肀I,因?yàn)锳I是唯一的增長市常2017年之前,大家不會考慮增量市場的問題,但之后客戶應(yīng)用在飽和,越來越多的云廠商冒出來,這時(shí)候大廠靠自己的品牌以及價(jià)格優(yōu)勢在公有云市場上來搶奪機(jī)會。現(xiàn)在大家忙的不是競爭,而是在AI時(shí)代如何為客戶更好地服務(wù),解決算力問題。

3.AI會成為未來營收主力

問:青云科技的半年報(bào)顯示,今年上半年AI算力服務(wù)的收入有2000多萬元。青云的算力產(chǎn)品與服務(wù),未來可以帶來多大的營收?有哪些期待?

林源:營收數(shù)字以公開的財(cái)報(bào)口徑為準(zhǔn)。但基本上有這樣一個(gè)趨勢:AI算力現(xiàn)在更多以訓(xùn)練為主,之后我們希望它進(jìn)入推理階段。訓(xùn)練的增速是可以期待的,2023年以GPU為主的算力云,就跟2013年以CPU為主的云一模一樣。2013-2017這幾年,所有云廠商都是100%的增長。

問:AI算力是一個(gè)很大的市場,但AI算力調(diào)度是否只是其中一小部分市場?

林源:我們看的是兩塊,第一塊AI算力調(diào)度本身,這有點(diǎn)像原來傳統(tǒng)交付模式的生意。第二塊是AI算力云,它既有產(chǎn)品的部分,也有服務(wù)的部分。這一部分未來十年的市場空間更大,我覺得是10倍、100倍的增長,而青云科技至少會比上一階段做到的規(guī)模更大。

問:青云現(xiàn)在的營收主力還是私有云,未來AI算力調(diào)度會成為營收的主力嗎?

林源:我覺得它一定會成為主要的營收,但是它需要點(diǎn)時(shí)間。過去青云最早做數(shù)字化、做信創(chuàng)業(yè)務(wù),尤其過去兩年信創(chuàng)占私有云很大一部分,這不是青云決定的,而是市場決定的。之后所有的客戶都會往AI遷移,不管是傳統(tǒng)客戶還是互聯(lián)網(wǎng)客戶,生意模式與運(yùn)營模式都會由AI驅(qū)動(dòng)。如果不做AI,真的會落后。所以,它一定會成為主營的業(yè)務(wù)。

問:在AI算力服務(wù)這一塊,客戶需求比較旺盛的主要集中在哪幾個(gè)領(lǐng)域?

苗慧:主要就是訓(xùn)練。現(xiàn)在大模型作為技術(shù)基礎(chǔ),在上層面向不同的行業(yè)。只要能標(biāo)準(zhǔn)化的,都在大規(guī)模地做模型的訓(xùn)練,然后生產(chǎn)出自己的小模型。在理解人類意圖的時(shí)候,意圖模型也隨之更新。所以,如果我要做一個(gè)行業(yè),大概要訓(xùn)練3~5個(gè)小模型,為這個(gè)行業(yè)提供服務(wù)。

問:青云算力調(diào)度平臺是一個(gè)標(biāo)準(zhǔn)化平臺嗎?在行業(yè)的應(yīng)用上有沒有差別?

林源:青云對算力調(diào)度平臺的定位就是“產(chǎn)品”,產(chǎn)品就是標(biāo)準(zhǔn)化的。在濟(jì)南超算這一客戶中,會有客制化的部分,但那是他要做的事情,不是青云要做的事情。青云的定位始終是一家軟件產(chǎn)品公司,而不是一家項(xiàng)目公司。

問:青云現(xiàn)階段更希望吸引什么樣的行業(yè),或者什么樣的行業(yè)有更大的意愿采用這一產(chǎn)品?

苗慧:青云AI算力調(diào)度平臺主要服務(wù)于超算中心、區(qū)域算力中心、區(qū)域電信、區(qū)域的一些合作伙伴,我們共同建設(shè)起那朵云,共同運(yùn)營。

第二是青云公有云的AI算力云,主要服務(wù)于大模型的開發(fā)商。因?yàn)榇竽P烷_發(fā)商也在面向客戶提供一些像金融領(lǐng)域的模型、交通領(lǐng)域的模型,它需要大規(guī)模的機(jī)器進(jìn)行訓(xùn)練,青云還是面向于這種模型提供商比較多。

第三是青云計(jì)劃今年年底或者明年,大規(guī)模的推理就會上云,因?yàn)榇笠?guī)模的訓(xùn)練研發(fā)工作會有一個(gè)階段性的成果,推理服務(wù)會是之后相對重點(diǎn)的工作。

(封面圖來源:《鋼鐵俠》)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港