劃重點
01商湯科技作為一家中國人工智能公司,經(jīng)歷了行業(yè)的爆發(fā)式增長和調(diào)整,目前已成為一家成熟的商業(yè)化公司。
02商湯科技在AI基礎(chǔ)設(shè)施方面的投入和通用大模型的路線選擇,與OpenAI等國際巨頭十分吻合。
03為此,商湯制定了“大裝置-大模型-應(yīng)用”的三位一體核心戰(zhàn)略,以降低訓(xùn)練、推理和部署成本。
04目前,商湯在傳統(tǒng)AI領(lǐng)域已有非常成熟的產(chǎn)品和解決方案,同時也在積極布局算力運營服務(wù)。
05除此之外,商湯科技在海外市場也取得了顯著的增長,占集團(tuán)總收入比例提升至18.5%。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
要堅持的和將放棄的,都基于未來想成為的樣子做考量
文 | 施然中國人工智能(AI)產(chǎn)業(yè)在過去10年歷經(jīng)多個關(guān)鍵節(jié)點。2017年谷歌AlphaGo在中國戰(zhàn)勝圍棋世界冠軍柯潔,驗證了AI在這一度被認(rèn)為人類智力巔峰的領(lǐng)域超過了人類的最高水平,從而開啟了AI產(chǎn)業(yè)的新一輪爆發(fā)式增長,AI算法快速在各個產(chǎn)業(yè)里落地并產(chǎn)生價值:從人臉識別、身份驗證,再到互聯(lián)網(wǎng)平臺的算法推薦,廣告精準(zhǔn)投放等。多輪技術(shù)周期轉(zhuǎn)換中,出現(xiàn)了一大批前期被肯定、后期被驗證的公司。商湯科技是其中一家。商湯成立于2014年,到今年已經(jīng)是第10個年頭。從最早的人臉識別算法,到今天的大模型,商湯參與并見證了中國AI產(chǎn)業(yè)的發(fā)展、挑戰(zhàn)和調(diào)整。2021年12月,商湯在港交所上市,最新市值569億港元。今年以來,商湯市值上漲超過50%。10年過去,商湯從一家快速增長的AI明星初創(chuàng)公司,變成一家成熟的商業(yè)化公司。經(jīng)歷了中國AI科技投資的狂熱期到冷靜期,經(jīng)歷了AI技術(shù)的兩次大變革,也經(jīng)歷了國際形勢變化帶來的地緣政治影響。今天,生成式AI的發(fā)展日新月異,世界距離通用人工智能的目標(biāo)越來越近,商湯作為中國人工智能行業(yè)的代表,也快速調(diào)整戰(zhàn)略目標(biāo)。和今天備受關(guān)注的創(chuàng)業(yè)新貴不同,在AI圈里摸爬滾打了十年的商湯更關(guān)注如何盈利,如何真正讓AI技術(shù)落地應(yīng)用,如何成為一家有能力穿越周期的科技公司。
圖說:商湯科技上?偛看髽
摸爬滾打的十年
商湯最早是通過計算機(jī)視覺技術(shù)(CV)進(jìn)入AI行業(yè)。商湯科技董事長兼CEO徐立回憶,當(dāng)科研突破進(jìn)入產(chǎn)業(yè)的時候,大家都在驗證一件事,就是AI技術(shù)精度究竟能不能過工業(yè)的紅線。彼時各家公司開發(fā)不同的AI模型在垂直行業(yè)中試水落地,大概經(jīng)過兩到三年的驗證后,就像AlphaGo在圍棋中的驗證一樣,以人臉識別、圖像識別為核心的一批模型過了工業(yè)應(yīng)用的紅線。2017年前后,人臉識別技術(shù)開始陸續(xù)應(yīng)用于不同垂直場景中,包括智慧城市、身份識別驗證等。接下來,行業(yè)思考的新問題是如何讓AI應(yīng)用于更多場景和行業(yè)中。在當(dāng)時更普遍的方式是造更多模型。今天回頭來看,通過投入大量研發(fā)人員造更多領(lǐng)域模型的路徑已經(jīng)基本被迭代,主流方式是造更通用的大模型,再在模型基礎(chǔ)上微調(diào)出專用模型。當(dāng)時那個節(jié)點,很少有人去想更遠(yuǎn)的未來,去探索未來的路徑,畢竟模型是否能通用尚需驗證。商湯無疑是有遠(yuǎn)見的,率先投入通用模型的研發(fā)和AI算力的發(fā)展!叭绻忝總場景都用投入研究人員訓(xùn)練不同模型,最后可能你要做成百上千個模型,完成一個復(fù)雜的任務(wù),模型的生產(chǎn)降不下來! 徐立發(fā)現(xiàn),這階段AI模型的生產(chǎn)成本主要是人。事實上,當(dāng)時的AI公司的研發(fā)成本幾乎就等價于研發(fā)人員薪酬。伴隨商業(yè)化進(jìn)程的深入,要做通用的、端到端的模型變成商湯思考的主要方向。2019年,商湯對外提出做通用視覺大模型;在自動駕駛領(lǐng)域,又率先提出了做端到端的大模型UniAD。徐立發(fā)現(xiàn),在走向通用的過程中,AI算力的重要性愈發(fā)上升。一個復(fù)雜的任務(wù)如果能分解為三個子問題,假設(shè)每個環(huán)節(jié)有10個參數(shù),訓(xùn)練3個專用模型來解決這些問題只需要30個參數(shù),而如果要用一個通用端到端模型來解決,那就變成有1000個參數(shù)(10乘10乘10),相當(dāng)于參數(shù)量增加了100倍,這意味著算力規(guī)模要呈幾何級數(shù)增加!叭绻忝總場景都用一個不同的模型去做,最后可能你要做1000個模型,這很難實現(xiàn),人手都不夠,模型的價格也降不下來!毙炝l(fā)現(xiàn),這一路徑顯然距離跨越“工業(yè)紅線”越來越遠(yuǎn)。所以,通用模型的打造成了2019年商湯的重中之重,商湯是國內(nèi)最早一批投入通用大模型研發(fā)的廠商,這也成為其構(gòu)建AI價值商業(yè)閉環(huán)的先發(fā)優(yōu)勢,而這背后的大規(guī)模AI基礎(chǔ)設(shè)施建設(shè)投入也隨之提上日程。徐立原計劃用租賃算力完成通用模型研發(fā),但當(dāng)時市場上沒有成熟的大規(guī)模算力基礎(chǔ)設(shè)施,只能自己去建不說,此前甚至都沒有前人經(jīng)驗完整搭建過一套大規(guī)模智算系統(tǒng)。商湯成了第一個吃螃蟹的人,投建了自己的算力大裝置,組建了大裝置團(tuán)隊完成超大規(guī)模的算力訓(xùn)推軟件平臺的搭建。取名算力大裝置,徐立是將其對于AI的作用類比于粒子對撞機(jī)之于高能物理學(xué)。如今商湯所持有的5.4萬塊GPU和超過20,000petaFLOPS算力,已經(jīng)成為行業(yè)公認(rèn)的稀缺資源。而在2018年2022這幾年間,資本對于AI的態(tài)度以及國際環(huán)境都發(fā)生了巨變。2018年到2021年是中國AI創(chuàng)業(yè)、融資爆發(fā)式增長的四年,以商湯為代表的AI創(chuàng)業(yè)公司們在那幾年快速獲得高額融資,走到上市節(jié)點。創(chuàng)投數(shù)據(jù)服務(wù)商IT桔子數(shù)據(jù)顯示,2018年,中國AI領(lǐng)域共融資2373億元,同比增長93%。2021年共融資3996億元,同比增長51%。但市場熱度在2022年出現(xiàn)明顯下滑,這一年AI領(lǐng)域融資額降至1579億元,同比下滑64%,2023年繼續(xù)下滑至1101億元。和融資熱度下滑同時出現(xiàn)的,還有外部水溫的變化。在此之前,AI領(lǐng)域的融資以美元投資機(jī)構(gòu)為主,他們看重前沿技術(shù),也愿意為初創(chuàng)公司早期的高額研發(fā)買單。但2021年,美國加大對中國科技公司的制裁力度,美元機(jī)構(gòu)陸續(xù)退出。商湯的融資上市過程可謂是一個縮影:商湯在2019年被美國列入實體清單,2021年上市期間又被美國列入涉軍企業(yè)清單(CMIC)。但仍頂著壓力于當(dāng)年12月30日在港交所掛牌上市,獲得了穩(wěn)定的融資渠道,提升了抗風(fēng)險能力,這為商湯繼續(xù)發(fā)展通用智能和AI智算奠定了基礎(chǔ)。和全球大部分AI公司一樣,商湯還處于虧損階段,但作為上市公司,商湯面臨商業(yè)化落地和保持技術(shù)領(lǐng)先的雙重考驗,想要扭虧,需要一邊擴(kuò)大收入,一邊降低成本。現(xiàn)在看來,商湯在AI基礎(chǔ)設(shè)施方面的投入和通用大模型的路線選擇,與OpenAI等國際巨頭十分吻合。要搞好算力基礎(chǔ)設(shè)施軟件能力,需要深入理解大模型。2023年4月,商湯在國內(nèi)率先發(fā)布了“日日新SenseNova”大模型體系,發(fā)布時,徐立提到,通用模型的能力比單純的規(guī)模更重要,商湯在過去積累了不少客戶,解決了很多行業(yè)問題,因此積累了大量真實數(shù)據(jù),能夠讓模型在通用的基礎(chǔ)上,在垂直領(lǐng)域更好用。在此后一年3個月的時間內(nèi),“日日新”迭代至5.5版本,交互效果和多項核心指標(biāo)實現(xiàn)對標(biāo)GPT-4o,也是國內(nèi)對標(biāo)GPT-4 Turbo領(lǐng)先的國產(chǎn)大模型之一。商湯技術(shù)上的領(lǐng)先也迅速體現(xiàn)在商業(yè)上。今年8月商湯發(fā)布的半年財報顯示,2024年上半年,商湯收入17.4億元,同比增長21%;毛利7.7億元,同比增長18%。商湯財報中,收入來源按業(yè)務(wù)分為三大類,生成式AI、智能汽車和傳統(tǒng)AI,其中生成式AI占比60.4%,是目前商湯收入占比最高的業(yè)務(wù)。
新的機(jī)遇和挑戰(zhàn)
把原來傳統(tǒng)AI構(gòu)建一個個場景模型的時代稱為AI1.0的話,徐立認(rèn)為,生成式AI或者AI2.0時代除了模型的通用性之外,最大的特點是成本結(jié)構(gòu)由“研發(fā)人員密集型”轉(zhuǎn)化為了“算力資源密集型”。OpenAI研發(fā)ChatGPT的時候研發(fā)人員只有87人。由一套算力基礎(chǔ)設(shè)施支持行業(yè)應(yīng)用,實現(xiàn)服務(wù)邊際成本極低,是理想的模式。但實際上,目前算力資源成本巨大,以現(xiàn)有的應(yīng)用規(guī)模來說,很難看到盈虧平衡。2024年9月,微軟與貝萊德攜手成立300億美金的AI基建基金。商湯是上一輪AI產(chǎn)業(yè)爆發(fā)中,少數(shù)成功上市的AI公司。一些業(yè)內(nèi)人士擔(dān)心,商湯在資金儲備方面不及互聯(lián)網(wǎng)大廠,可以大規(guī)模投入今天的生成式大模型;又不像初創(chuàng)公司那樣可以暫時不考慮商業(yè)回報,通過一級市場大規(guī)模融資來獲得技術(shù)投入資本。徐立卻認(rèn)為,過往十年的AI1.0時代客戶和應(yīng)用,使得商湯更了解市場需要什么樣的AI產(chǎn)品和服務(wù)。其次,也因為長期專注于AI底層基礎(chǔ)設(shè)施與模型應(yīng)用,商湯積累了可觀的算力規(guī)模和技術(shù)資源,以及高效運營這些資源的能力。“電力和通信流量都是基礎(chǔ)設(shè)施,一套基礎(chǔ)設(shè)施就能服務(wù)千行百業(yè),但是早期的成本也都居高不下,隨著技術(shù)的迭代以及使用人數(shù)的擴(kuò)大,邊際成本就忽略不計了”,現(xiàn)在AI基礎(chǔ)設(shè)施正處在這樣的重要轉(zhuǎn)折點。他總結(jié),商湯是最懂模型的算力服務(wù)商,最懂算力的模型服務(wù)商。商湯也需要將傳統(tǒng)AI客戶轉(zhuǎn)化為生成式AI客戶,隨著客戶需求和技術(shù)迭代,讓生成式AI商業(yè)應(yīng)用能夠快速進(jìn)入市場。在具體應(yīng)用行業(yè)上,商湯需要做到更聚焦。AI1.0時代的行業(yè)客戶,在通用人工智能來臨之際,已經(jīng)快速將日日新大模型部署到各領(lǐng)域,一些垂直行業(yè)場景包括金融領(lǐng)域,如商湯金融的數(shù)據(jù)先兵產(chǎn)品聚焦數(shù)字化分析;在智能辦公領(lǐng)域,比如在Copilot助手(個人AI助手)商湯 “小浣熊”產(chǎn)品個人用戶和開發(fā)者達(dá)數(shù)十萬,亦服務(wù)于金山辦公等頭部應(yīng)用。此外,在大模型擬人交互領(lǐng)域,商湯日日新大模型支持了新浪微博、閱文集團(tuán)筑夢島、愛奇藝等互聯(lián)網(wǎng)應(yīng)用,日均Tokens數(shù)達(dá)數(shù)百億,調(diào)用量在半年內(nèi)增長近22倍。商湯下一步的產(chǎn)品和業(yè)務(wù)目標(biāo)是“用得上、用得好、用得起”。用得上是指能真正為用戶創(chuàng)造價值;用得好是要進(jìn)入客戶的生產(chǎn)和流程中;用得起,則是需要大幅降低訓(xùn)練、推理和部署成本。為了實現(xiàn)這一目標(biāo),商湯決策層制定了“大裝置-大模型-應(yīng)用”的三位一體核心戰(zhàn)略。大裝置是指模型的基礎(chǔ)設(shè)施服務(wù),以算力服務(wù)為主。徐立提到,如果只有基礎(chǔ)設(shè)施,不懂大模型的話,就有競爭力。今天使用算力主要有兩類,一是訓(xùn)練模型,二是使用模型。訓(xùn)練模型時,需要優(yōu)化算力使用效率;使用模型的時候,則需要節(jié)約算力成本!敖裉烊斯ぶ悄艿纳虡I(yè)模式不管是訓(xùn)練模型,還是用模型對外服務(wù),本質(zhì)意義上都是在消耗資源,付的是資源的費用。所有的商業(yè)模式最后都和計算資源消耗畫了一個等號,就是通過‘三位一體’,把資源以最有效的方式利用起來!毙炝⒈硎。按照這樣的戰(zhàn)略布局,商湯認(rèn)為,算力和模型的深度協(xié)同,能讓大模型迅速迭代,并降低推理成本,從而獲得更多用戶和調(diào)用量增長,實現(xiàn)收入提升。例如在推理場景中,商湯以創(chuàng)新的技術(shù)架構(gòu)實現(xiàn)了相同算力及電力成本下的每秒請求數(shù)(QPS)提升4倍,并實現(xiàn)了推理服務(wù)彈性按需伸縮,優(yōu)化了大規(guī)模AI推理的整體成本。算力服務(wù)是不少科技巨頭也在重點布局的方向,徐立認(rèn)為,一些科技巨頭的重心在于自己的生態(tài),包括自研芯片和云平臺等。但當(dāng)下AI領(lǐng)域要搶占先機(jī),什么資源更快更好用就先用起來,不局限于一家的產(chǎn)品和平臺。徐立認(rèn)為,商湯提供的基礎(chǔ)服務(wù)更貼近AI發(fā)展現(xiàn)狀。
穿越技術(shù)周期的兩條腿
今天,AI領(lǐng)域最大的挑戰(zhàn)就是商業(yè)模式不清晰。算力的投入,數(shù)據(jù)的投入和人才的投入都相對確定,甚至連AI可能帶來的風(fēng)險和威脅都已經(jīng)被多次討論。但AI究竟能怎么賺錢,最終的產(chǎn)品形態(tài)如何,目前還很難有定論。商湯這樣的AI技術(shù)公司,能否成功穿越新一輪技術(shù)轉(zhuǎn)換周期,取決于兩點:其一,走得夠快;其二,走得夠遠(yuǎn)。徐立說,今天對于AI公司來說挑戰(zhàn)很大,因為“技術(shù)投入永遠(yuǎn)要比商業(yè)化前置”。如果決定要做大模型,那就需要長期的資源投入,有新的方向出現(xiàn)都要跟進(jìn)。但實際的回報可能要等很長的周期。上市后的商湯有了更清晰的規(guī)劃盈利。
徐立說,商湯目前有兩條腿,一條腿是傳統(tǒng)AI,技術(shù)成熟,不斷降低成本、拓展市場(包括海外市場),聚焦利潤貢獻(xiàn);另一條腿新一代的AI大模型,目標(biāo)是盈虧平衡,這條腿增長很快,且能看得到未來。前者保證商湯“走得夠快”,后者保證“走得夠遠(yuǎn)”。商湯在不斷探索不同的商業(yè)的模式,比如:賣一體機(jī)。一臺機(jī)器配一定數(shù)量的賬號,能夠?qū)崿F(xiàn)本地化部署,即買即用,一方面能降低客戶應(yīng)用AI的門檻,另一方面也能幫助客戶節(jié)約使用成本。這一模式相對軟件模式,毛利偏低,但商業(yè)化效率提升明顯。在海外市場,商湯也未放棄軟件模式。事實上,目前全球范圍內(nèi),中國和美國是AI領(lǐng)域的兩大高地,中國的AI技術(shù)對很多海外國家來說,都是非常領(lǐng)先的。徐立說,海外客戶對于AI軟件的購買意愿很高,且回款周期短。目前商湯在傳統(tǒng)AI領(lǐng)域已經(jīng)有非常成熟的產(chǎn)品和解決方案,只需要繼續(xù)拓展海外銷售渠道即可。據(jù)了解,商湯目前海外市場的年營收增長率約40%,高于21%的整體增長率,海外市場占集團(tuán)總收入比例提升至18.5%。目前,海外市場對于商湯來說是賺錢主力之一,且在海外能沿用軟件模式,毛利更高。海外市場營收和利潤的增長也能夠幫助商湯更好地投入到大模型業(yè)務(wù)中。接下來,考驗AI公司的是如何實現(xiàn)大模型的商業(yè)化。據(jù)媒體報道,OpenAI GPT-4的一次訓(xùn)練成本約6300萬美元,2022年的總訓(xùn)練成本約5.4億美元。OpenAI稱2024年的運營成本將超過85億美元,預(yù)計虧損約50億元美元,預(yù)計2023年至2028年的總虧損(不包括股權(quán)補償)將達(dá)到440億美元。OpenAI還提到,模型訓(xùn)練成本還將進(jìn)一步增長,預(yù)計到2026年每年將達(dá)到95億美元?梢灶A(yù)見的是,大模型依然會在通用的道路上前進(jìn),但很難在短時間內(nèi)實現(xiàn)真正的通用。此外,隨著開源模型的能力越來越強(qiáng),對于一些科技公司來說,再去“卷”參數(shù)、做預(yù)訓(xùn)練價值不大。更實際的方式是,通過針對性訓(xùn)練,去提升較小模型的專有能力,也相當(dāng)于是“降本增效”,這可能是更符合當(dāng)下市場環(huán)境的做法。從訓(xùn)練到推理,算力的資源屬性愈發(fā)顯現(xiàn)。商湯也在積極布局算力運營,希望在現(xiàn)有條件下將已投入打造的資源變現(xiàn)。現(xiàn)實情況是,目前市場上的算力資源分散且標(biāo)準(zhǔn)不統(tǒng)一,使用起來效率不高。而商湯可提供算力運營服務(wù),將不同標(biāo)準(zhǔn)的卡連接起來,適配不同需求,滿足那些需要使用算力的客戶。2024年10月18日,商湯科技十周年國際論壇上,徐立表示,當(dāng)下正處于AGI(通用AI)的轉(zhuǎn)折點,大模型快速發(fā)展很大程度是因為基礎(chǔ)設(shè)施水平有顯著提高,讓通用AI模型成為可能。徐立還提到,早在2014年商湯成立之時,商湯創(chuàng)始人湯曉鷗就強(qiáng)調(diào),要把技術(shù)帶到日常生活中,希望技術(shù)能夠融入生活的不同場景。這句話放到今天仍不過時。