當(dāng)前位置：人工智能實驗室> 企業(yè)新聞 > 商湯轉(zhuǎn)型生成式 AI 這一年：預(yù)判與聚焦

商湯轉(zhuǎn)型生成式 AI 這一年：預(yù)判與聚焦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-04-11 09:17:33 瀏覽：6062次

導(dǎo)讀：主動收縮傳統(tǒng) AI 業(yè)務(wù)，商湯錨定生成式 AI。在大模型浪潮去年席卷全球后，2014 年就成立的中國老牌 AI 公司商湯科技的最新年報變化明顯：商湯將原本的 4 個主營業(yè)務(wù)智慧城市、智慧商業(yè)、智慧生活和智能汽車，重新劃分為 3 大板塊傳統(tǒng) AI 業(yè)務(wù)（智慧商業(yè)、...

主動收縮傳統(tǒng) AI 業(yè)務(wù)，商湯錨定生成式 AI。

在大模型浪潮去年席卷全球后，2014 年就成立的中國老牌 AI 公司商湯科技的最新年報變化明顯：

商湯將原本的 4 個主營業(yè)務(wù)智慧城市、智慧商業(yè)、智慧生活和智能汽車，重新劃分為 3 大板塊“傳統(tǒng) AI” 業(yè)務(wù)（智慧商業(yè)、智慧生活、智慧城市構(gòu)成）、“智能汽車業(yè)務(wù)” 和 “生成式 AI 業(yè)務(wù)” 。

商湯對這些業(yè)務(wù)態(tài)度分明：收縮傳統(tǒng) AI 業(yè)務(wù)，集中資源投入生成式 AI 業(yè)務(wù)。

這是商湯成立以來的最大一次轉(zhuǎn)型，它已部分反映在業(yè)績上：據(jù)今年 3 月底發(fā)布的 2023 年年報，商湯生成式 AI 業(yè)務(wù)去年的總收入達(dá) 12 億元人民幣，營收占比為 35%，而過去曾占商湯收入大頭的智慧城市業(yè)務(wù)占比已降至 10% 以內(nèi)。

一位商湯管理層預(yù)測：今年或明年，商湯生成式 AI 的營收占比例將超 50%。

綜合市場信息，商湯的 12 億元營收在中國大模型和整個生成式 AI 市場處于領(lǐng)先位置。

更快的商業(yè)化進度與商湯的前幾年的非共識判斷與提前布局有關(guān)。

早在 2019 年，商湯就開始開發(fā)參數(shù)規(guī)模超出行業(yè)的視覺大模型，2020 年又開始開發(fā)大語言模型，是中國最早做大模型的公司之一。

更考驗決心的是商湯 2020 年啟動的 “大裝置”，這是商湯自建的算力基礎(chǔ)設(shè)施，需要大筆投入。當(dāng)時商湯正在籌備上市，有較大財務(wù)壓力，但仍選擇投資。

據(jù)了解，2023 年初時，商湯大裝置就已有 2.7 萬張 GPU，目前則上升至 4.5 萬張 GPU，算力較去年翻倍。

在新一輪 AI 熱潮前，商湯過去的這些嘗試尚處于早期商業(yè)化階段。

在前不久舉辦的商湯年會上，商湯科技董事長兼 CEO 徐立談到了商湯過去的沉浮，他認(rèn)為商湯有能力抓住新機會。

“借用《繁花》里的一句話，大暑之后必有大寒，大寒之后也必有大暑。” 徐立回憶，商湯成立之初，沒人相信中國公司能把人臉識別做到全球第一，而是有大量數(shù)據(jù)、人才和資源的 Google 和 Facebook 等大型科技公司更易成功。但到 2021 年，商湯的人臉識別等計算機視覺技術(shù)在全球各項比賽中拿下了 70 多個冠軍，推翻了大公司更有機會做好這項技術(shù)的主流判斷。

“這是商湯打破共識，形成反共識，再逐步塑造共識的過程。” 徐立認(rèn)為，在生成式 AI 時代，商湯也能復(fù)現(xiàn)類似的過程。至少在算力層面，商湯已先走了一步。

從計算機視覺看到的 “Scaling Laws”

“更大的模型有更好效果” 是大語言模型能力提升的關(guān)鍵指引。大多數(shù)公司都把 OpenAI 在 2020 年發(fā)布的 “Scaling Laws” 論文視作這一洞察的源頭。OpenAI 的研究者在論文中提到，算力、數(shù)據(jù)量和參數(shù)是影響模型性能的重要變量。他們也用實踐證明，用更多數(shù)據(jù)和算力訓(xùn)練參數(shù)更大的模型，效果通常更好。

一位商湯研發(fā)高管告訴《晚點 LatePost》，他們在 2017 年研發(fā)視覺大模型時也感知到了同樣的趨勢，只不過這來自計算機視覺領(lǐng)域的實踐。

商湯當(dāng)時想做更大的模型與業(yè)務(wù)需求有關(guān)。那些年，阻礙 AI 技術(shù)規(guī)�；瘧�(yīng)用的瓶頸是：用相同的模型，無法滿足客戶的多樣需求，服務(wù)不同場景時，得重新訓(xùn)練單獨的模型，耗時耗力，成本也高。

許多公司選擇提高單一模型的開發(fā)效率；而商湯的解決方法是：訓(xùn)練更大的模型，一次解決多個場景中的問題，到了部署環(huán)節(jié)，再針對特定場景精簡模型，以節(jié)省模型運行時的算力。

沿著這個思路，商湯在 2019 年發(fā)布了參數(shù)達(dá)到 10 億的視覺大模型。那時視覺模型鮮有如此大的參數(shù)，特斯拉的自動駕駛模型的參數(shù)量大概是 1 億。

與商湯自己的老模型相比，更大的新模型效果確實更好，能解決的問題更多。比如同一個模型不僅可以識別出圖像中的人，還能識別出汽車等物體，并能準(zhǔn)確勾勒圖片中不同的物體輪廓，即用同一個模型，就完成了人物、物體識別和圖像分割等多個視覺任務(wù)。

之后幾年，商湯又訓(xùn)練了參數(shù) 30 億、100 億的視覺大模型，底層架構(gòu)也過渡到了現(xiàn)在主流的 Transformer，并在 2022 年發(fā)布了參數(shù)達(dá)到 320 億的視覺大模型。

這些實踐也讓商湯也看到了語言與圖像融合的趨勢。原本訓(xùn)練計算機視覺模型，需要靠人工標(biāo)注數(shù)據(jù)。而訓(xùn)練更大模型需要的數(shù)據(jù)量達(dá)到的數(shù)億，甚至數(shù)十億，此時無法再靠人去一個個標(biāo)注數(shù)據(jù)，更高效的方法是搜集帶有文字描述的圖片，經(jīng)過清洗后訓(xùn)練模型，語言處理能力由此成了訓(xùn)練更強的視覺模型的必要條件。

OpenAI 在 2020 年發(fā)布 GPT-3，讓業(yè)界看到了大語言模型的潛力，商湯彼時也加大投入研究大語言模型，并著手積累相關(guān)訓(xùn)練數(shù)據(jù)。到 2022 年 11 月底 ChatGPT 引起關(guān)注時，商湯已有了不少儲備。

2023 年 4 月，商湯發(fā)布 “日日新大模型” 系列，是中國最早發(fā)布大語言模型的公司之一。同時，商湯還發(fā)布了一組生成式 AI 應(yīng)用，其中有大語言模型支持的聊天機器人產(chǎn)品 “商量”，多模態(tài)模型支持的文生圖應(yīng)用 “秒畫”，還有那會兒關(guān)注度沒那么高的視頻生成和文生 3D 模型的相關(guān)產(chǎn)品。

之后一年，商湯的大模型更新了 3 個版本。今年 2 月發(fā)布日日新大模型 4.0 時，商湯稱，其大語言模型的 “綜合整體評測成績水平比肩 GPT-4”。

據(jù)商湯財報，4 月下旬，商湯會發(fā)布能力達(dá)到 GPT-4 Turbo 水平的日日新大模型系列，其中的視覺等多模態(tài)能力將對標(biāo) GPT-4V。

GPT-4 Turbo 是 OpenAI 在 2023 年 3 月發(fā)布的 GPT-4 強化版，它有更強的語言處理和編程能力；GPT-4V 則是 OpenAI 在 GPT-4 基礎(chǔ)上融合視覺處理能力的多模態(tài)模型。

提升模型本身的性能之外，商湯也在通過其它工程手段優(yōu)化模型的最終表現(xiàn)，讓它更實用。

比如商湯使用了檢索增強生成（RAG）技術(shù)，來提升大模型處理數(shù)據(jù)、回答問題的能力，增加模型的金融知識儲備，降低錯誤信息生成的概率。這幫助商湯談下了中國銀行、招商銀行、中國工商銀行和上海銀行等金融客戶。

大模型已能解決越來越多問題，但是隨著技術(shù)發(fā)展，商湯認(rèn)為模型并非越大越好。為了更好適應(yīng)端側(cè)場景，商湯還訓(xùn)練了一系列不同規(guī)格的小模型，它們能在汽車、筆記本電腦和手機等移動設(shè)備上運行。商湯已與早期客戶小米、榮耀等手機品牌達(dá)成了共同探索更多端側(cè)應(yīng)用的合作。

徐立認(rèn)為，商湯過去為手機、汽車廠商提供計算機視覺模型的經(jīng)驗，也可以遷移到大模型領(lǐng)域。

在終端部署模型的難點是：手機等設(shè)備上算力有限，需要用更小的算力實現(xiàn)模型效果，這涉及一系列技術(shù)與工程化技巧。商湯之前就服務(wù)過大多數(shù)頭部安卓手機廠商，汽車客戶則有本田和廣汽埃安等，其模型已運營在超 20 億臺手機和上百萬輛汽車上。

“中國最大的商業(yè)化場景就是各個終端。” 徐立說。

商湯在財報中提到，2023 年，商湯已經(jīng)談下數(shù)十家訂單金額超過千萬人民幣的生成式 AI 客戶。

一位商湯人士稱，現(xiàn)在商湯的大模型業(yè)務(wù)還處于商業(yè)化早期階段。他認(rèn)為，大模型的商業(yè)化與模型能力息息相關(guān)，等到商湯發(fā)布能力更強的基礎(chǔ)模型后，相關(guān)收入會迅速增長。

頂著虧損建設(shè) “大裝置”

過去一年，算力成為整個 AI 行業(yè)最緊俏的資源。埃隆馬斯克（Elon Musk）感嘆英偉達(dá)先進的 GPU “比毒品還難買”。英偉達(dá)的股價一年之間漲了 3 倍多，成為市值最高的芯片公司。

從 GPU 采購量來看，商湯大裝置的算力規(guī)模跟字節(jié)跳動的火山引擎、阿里云等云計算公司有一定差距。但在算力緊缺的 2023 年，商湯靠著 “大裝置 + 大模型” 吸引了各行業(yè)的多家客戶，有金融領(lǐng)域的太平洋保險和招商銀行等；頭部互聯(lián)網(wǎng)公司如京東、小米、金山和微博等；大模型和生成式 AI 創(chuàng)業(yè)公司 HiDream.AI、瀾舟科技和 Tiamat 等；還有清華大學(xué)和人民大學(xué)等學(xué)術(shù)機構(gòu)。

徐立把 “大裝置” 視為商湯打破業(yè)內(nèi)共識、重建共識的最新案例。

2017 年訓(xùn)練出來 1000 層的視覺神經(jīng)網(wǎng)絡(luò) SenseNet 后，商湯的研究人員就開始著手建設(shè)大裝置的原型系統(tǒng)。等訓(xùn)練出 10 億參數(shù)視覺大模型后，商湯在 2020 年 7 月決定投入 56 億元建設(shè)大裝置，是商湯當(dāng)年營收的 1.6 倍。

投入大量資金建設(shè)算力中心，對當(dāng)時還在虧損的商湯來說是一個挑戰(zhàn)。2020 年下半年，商湯遞交了港股招股書，大規(guī)模的資金投入可能影響其在資本市場的表現(xiàn)。

“公司里大部分人都不理解，商湯作為 AI 公司，為什么要做重資產(chǎn)的基礎(chǔ)設(shè)施。” 徐立在年會上說，“有些大廠也認(rèn)為針對 AI 提供算力服務(wù)的市場太小，不值得投入大量研發(fā)資源。”

即使到現(xiàn)在，作為 AI 公司是否應(yīng)該自建算力設(shè)施也沒有形成共識。據(jù)了解，國內(nèi)大模型創(chuàng)業(yè)公司中，有的公司選擇全部租賃 GPU，不持有資產(chǎn)，有的則大部分倚靠自建算力，少量租用外部 GPU。

徐立自己的邏輯是，做更通用的模型需要更大的算力支持。幾年前他接受采訪時說，大裝置可以讓 AI 的商業(yè)化不再依靠密集的人力。

當(dāng)時最普遍的 AI 商業(yè)化方法是根據(jù)項目定制解決方案，如做一個手機人臉解鎖算法，需要上百人的團隊，換一個場景又得上百人進來。而有了專門為 AI 定制的、更強的算力中心，他們可以更高效地訓(xùn)練通用大模型，從而解決落地過程中不斷出現(xiàn)的細(xì)分場景。

商湯的大裝置在 2021 年底投入使用，除了少量高校等科研機構(gòu)，大裝置那時并未給商湯帶來太多外部新客戶，直到 ChatGPT 出現(xiàn)。

盡管如此，商湯 2020 年以來一直在持續(xù)購買更多 GPU，擴大大裝置算力規(guī)模。商湯大裝置的整體算力目前已達(dá)到 1.2 萬 petaFLOPS（每秒千兆億次浮點運算），是建成時的 4 倍。

據(jù)商湯介紹，他們現(xiàn)在已可以互聯(lián)超過一萬張 GPU ，保持 90% 加速率（衡量多卡互聯(lián)訓(xùn)練大模型效率的指標(biāo)，理想狀態(tài)是 100%），并持續(xù)訓(xùn)練 30 多天不中斷這是訓(xùn)練上千億參數(shù)甚至更大模型的必備能力。商湯稱，他們也在優(yōu)化大模型推理環(huán)節(jié)，一年內(nèi)把性價比提升了 3 倍。

一位商湯人士說，商湯會持續(xù)采購華為騰、寒武紀(jì)等 10 多家中國公司的 AI 芯片，以更多元的芯片擴充大裝置算力。

從傳統(tǒng) AI 到生成式 AI

商湯在去年啟動成立以來最大轉(zhuǎn)型：重點投入生成式 AI，主動收縮為商湯貢獻(xiàn)絕大部分收入的傳統(tǒng) AI 業(yè)務(wù)。

傳統(tǒng) AI 是商湯原來的智慧城市、智慧商業(yè)和智慧生活等非生成式 AI 業(yè)務(wù)，2023 年的收入占比從前一年的 82% 下降到了 54%。

商湯在財報中特意提到，智慧城市業(yè)務(wù)在收入中的占比已不到 10%：“公司對其依賴大幅降低”。

徐立稱，接下來商湯的智慧城市和智慧商業(yè)會重點聚焦有現(xiàn)金流、利潤率更高的領(lǐng)域。

商湯智能汽車業(yè)務(wù)始于 2016 年，主要是基于計算機視覺技術(shù)開發(fā)包括高級輔助駕駛和智能座艙等解決方案，客戶已有廣汽埃安、哪吒汽車等。它們把商湯的方案用到了多個車型上。過去一年，商湯智能汽車業(yè)務(wù)的收入增長 31% 到 3.8 億元。

傳統(tǒng) AI 業(yè)務(wù)收縮，生成式 AI 成為商湯當(dāng)前的最重要業(yè)務(wù)。

一位商湯人士說，雖然許多客戶會提前付款，等著用商湯的大裝置。但商湯依然會預(yù)留相當(dāng)比例的算力，用來訓(xùn)練自己的大模型。

“如果只是租賃算力，商湯可能就只能從生成式 AI 浪潮中獲得一小部分收入，而且沒有競爭力。” 一位商湯高管說，最適合商湯的業(yè)務(wù)模式是借算力優(yōu)勢，延伸業(yè)務(wù)范圍，比如提供模型訓(xùn)練和推理服務(wù)，以及用更低的成本訓(xùn)練出行業(yè)領(lǐng)先的大模型。

商湯以算力為基礎(chǔ)向生成式 AI 轉(zhuǎn)型也面臨著重要挑戰(zhàn)。比如算力中心屬于重資產(chǎn)業(yè)務(wù)，需要考慮折舊，會拉低商湯的利潤率。

商湯的轉(zhuǎn)型還在繼續(xù)。商湯在財報中寫道：2024 年，商湯會繼續(xù)調(diào)整業(yè)務(wù)，改善現(xiàn)金流、減少虧損這是它過去 10 年一直面臨的難題，也是中國 AI 企業(yè)普遍的待解之題。

題圖來源：由商湯秒畫生成。

上一篇：微軟前全球副總裁入局AGI：左手效率神器、右手AI開放世界，實測好用！

下一篇：如何參與機器人浪潮？——中國共振，機器人元年來臨

AiLab云推薦

商湯轉(zhuǎn)型生成式 AI 這一年：預(yù)判與聚焦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-04-11 09:17:33 瀏覽：6062次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

商湯轉(zhuǎn)型生成式 AI 這一年：預(yù)判與聚焦 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-04-11 09:17:33 瀏覽：6062次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

商湯轉(zhuǎn)型生成式 AI 這一年：預(yù)判與聚焦
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-04-11 09:17:33 瀏覽：6062次