當(dāng)前位置：人工智能實驗室> 企業(yè)新聞 > “商湯們”托舉AI大時代丨2023數(shù)字中國年度案例

“商湯們”托舉AI大時代丨2023數(shù)字中國年度案例
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-14 15:16:35 瀏覽：4315次

導(dǎo)讀：AI時代在2023年正式拉開了序幕。根據(jù)Markets and Markets數(shù)據(jù)，2023年全球AI市場規(guī)模為1502億美元，預(yù)計2023年至2030年復(fù)合增長率為36.8%。托舉起這個AI大時代不斷向前的，是那些腳踏實地的企業(yè)它們堅持長期主義，深深地扎根于產(chǎn)業(yè)土壤，關(guān)注生產(chǎn)力的創(chuàng)新...

AI時代在2023年正式拉開了序幕。

根據(jù)Markets and Markets數(shù)據(jù)，2023年全球AI市場規(guī)模為1502億美元，預(yù)計2023年至2030年復(fù)合增長率為36.8%。

托舉起這個AI大時代不斷向前的，是那些腳踏實地的企業(yè)它們堅持長期主義，深深地扎根于產(chǎn)業(yè)土壤，關(guān)注生產(chǎn)力的創(chuàng)新與顛覆式增長，持續(xù)探索、試錯與實踐，埋下時代變革的種子，并向陽而長。

商湯（00020.HK）正是其中最典型的一家。

2023年是商湯成立的第九年。對AI大時代的暢想與厲兵，堅實了商湯發(fā)展思路踏實打基礎(chǔ)，落地找應(yīng)用一方面，商湯通過打造新型AI基礎(chǔ)設(shè)施“商湯AI大裝置SenseCore”，打通算力、算法和平臺；另一方面，商湯建立“日日新SenseNova”大模型及研發(fā)體系，以低成本解鎖通用AI能力，推動AI創(chuàng)新和落地，打通商業(yè)價值閉環(huán)，解決長尾應(yīng)用問題。

AI時代已至

全球頂尖科技巨頭都在不遺余力地擁抱這個AI大時代。

就在11月初，馬斯克發(fā)布了他新創(chuàng)辦的AI 公司xAI 的首款產(chǎn)品Grok，這是一款對標(biāo)ChatGPT 的聊天機器人，馬斯克由此真正進入了生成式AI 這條目前最熱門的賽道，與OpenAI、谷歌、Meta 同臺競技。

蘋果據(jù)悉今明兩年將豪擲數(shù)十億美元采購AI服務(wù)器，力圖追趕微軟和谷歌的領(lǐng)先地位。此外，蘋果計劃最早在2024年年底將生成式AI技術(shù)融入iPhone和iPad，端側(cè)AI應(yīng)用落地接近轉(zhuǎn)折點。

成立48年的微軟借力OpenAI正重新成為全球最領(lǐng)先的科技公司。微軟堅信下一代AI將重塑每個軟件類別和每個業(yè)務(wù)，包括微軟自己的業(yè)務(wù)。CEO薩蒂亞納德拉在10月致公司股東的年度信中寫到，非�？春肁I，未來繼續(xù)大力押注。

國內(nèi)大廠也正在撲面而來的AI大潮中迎頭趕上。僅僅是類ChatGPT技術(shù)方面，各大科技公司年內(nèi)已推出的大模型數(shù)量超180個，還有數(shù)十個在研。賽迪顧問數(shù)據(jù)顯示，今年1-7月，中國大模型發(fā)布量占全球比重達67.4%。

除了數(shù)量的爆發(fā)式增長，大模型的參數(shù)也在增長。GPT-2的預(yù)訓(xùn)練數(shù)據(jù)量為40GB、參數(shù)量僅有15億個，GPT-3的預(yù)訓(xùn)練數(shù)據(jù)量達到45TB、參數(shù)量更是高達1750億個，GPT-4則據(jù)稱為1.8萬億參數(shù)量，13萬億訓(xùn)練數(shù)據(jù)。而目前的多模態(tài)大模型參數(shù)量普遍相對較大，多在千億級以上。

隨著企業(yè)數(shù)據(jù)的不斷積累，算力基礎(chǔ)設(shè)施不斷完善，未來大模型的商業(yè)應(yīng)用場景將越來越多，大模型賦能千行百業(yè)，中國AI市場規(guī)模也將持續(xù)擴大。賽迪顧問預(yù)計，2025年中國AI產(chǎn)業(yè)規(guī)模將超3000億元，未來三年產(chǎn)業(yè)規(guī)模年均復(fù)合增長率達到18.8%。

商湯的AI理念

身處這個正被AI深刻改變的時代，商湯有著自己的發(fā)展理念。

AI的發(fā)展，需要大算力底座，需要基礎(chǔ)設(shè)施，也需要能夠結(jié)合產(chǎn)業(yè)應(yīng)用落地。商湯堅持先打基礎(chǔ)，再找應(yīng)用。

商湯意識到，當(dāng)前業(yè)界訓(xùn)練大模型，對大算力的需求非常旺盛，而真正好用的基礎(chǔ)設(shè)施卻十分稀缺。因此，商湯打造了新型人工智能基礎(chǔ)設(shè)施商湯大裝置SenseCore，打通算力、算法和平臺。

據(jù)悉，大裝置SenseCore擁有超30000張GPU，融合了AI、超算與大數(shù)據(jù)的核心能力，通過為AI優(yōu)化的高性能計算、高性能存儲及緩存、高性能網(wǎng)絡(luò)，以存算分離、大規(guī)模彈性、容錯調(diào)度等特征，支撐大模型在數(shù)千張卡、PB級存儲上，完成萬億級參數(shù)大模型訓(xùn)練。

SenseCore AI平臺產(chǎn)品則提供了模塊化、全鏈條的數(shù)據(jù)、訓(xùn)練及推理能力，可實現(xiàn)百億級數(shù)據(jù)管理及檢索、人工標(biāo)注服務(wù)，加速AI大模型研發(fā)效率。一鍵量化、一鍵部署、一鍵應(yīng)用，提供了大模型快速上線驗證的工具，加速創(chuàng)新。

“商湯大裝置既是算力平臺，也是數(shù)據(jù)型服務(wù)平臺。未來技術(shù)發(fā)展當(dāng)中，如果沒有這樣一個基礎(chǔ)設(shè)施平臺，創(chuàng)新科技幾乎是不可能的。”商湯科技董事長兼CEO徐立表示。

目前，商湯大裝置已累計服務(wù)超50個核心客戶，其中大模型客戶10家以上，涵蓋智能駕駛、生物制藥、芯片設(shè)計、智慧商業(yè)、高校科研等前沿領(lǐng)域，已在超過20個落地場景中實現(xiàn)大模型交付。

在大裝置基礎(chǔ)上，商湯構(gòu)建了“商湯日日新SenseNova”大模型體系。

日日新SenseNova是國內(nèi)首個綜合能力超越GPT-3.5的大語言模型及文生圖大模型，已服務(wù)上千家客戶，模型相關(guān)業(yè)務(wù)規(guī)模已增長6倍。

“我們以商湯AI大裝置SenseCore打造AGI（通用人工智能）時代的基礎(chǔ)設(shè)施，并基于此將大模型體系命名為‘日日新’，寓意‘茍日新、日日新、又日新’，希望在模型迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI的更多可能。”徐立稱。

基于“商湯日日新SenseNova”大模型體系，商湯針對不同細分場景打造了系列生成式AI大模型應(yīng)用，包括大語言模型應(yīng)用商量SenseChat、圖像生成平臺秒畫SenseMirage、數(shù)字人視頻內(nèi)容創(chuàng)作平臺如影SenseAvatar、大場景3D內(nèi)容生成平臺瓊宇SenseSpace、物體重建及營銷服務(wù)平臺格物SenseThings。

“目前的人工智能就是一門實踐科學(xué)，訓(xùn)練一個大模型如同教育一個小孩，‘課程設(shè)計’是其中的關(guān)鍵。”徐立表示，商湯會專注于“課程設(shè)計”和高價值數(shù)據(jù)的構(gòu)造，結(jié)合不同領(lǐng)域的Knowhow可以快速訓(xùn)練適用于行業(yè)的專用模型，實現(xiàn)行業(yè)落地。

商湯科技已將AI商業(yè)化賦能多個行業(yè)。在“商湯日日新SenseNova”大模型體系下，商湯正積極通過大模型的多模態(tài)能力組合賦能產(chǎn)業(yè)升級，并帶來諸多引領(lǐng)行業(yè)的應(yīng)用創(chuàng)新。

商湯憑什么？

數(shù)據(jù)、算力和算法是AI最底層的三大要素，亦是決定AI發(fā)展的重要基矗支撐商湯發(fā)展戰(zhàn)略的，也是其自身在三要素領(lǐng)域獨特的優(yōu)勢。

算法類似于AI模型的大腦，目前我國在AI算法基礎(chǔ)理論研究方面與海外的差距已經(jīng)縮小，同時由于AI算法的革新頻率較快，未來在某些垂直領(lǐng)域的進展可能更為領(lǐng)先。

商湯很早開始探索計算機視覺領(lǐng)域，2017年布局決策智能，2019年開始涉足NLP（自然語言處理）領(lǐng)域，為大模型的研發(fā)和后續(xù)應(yīng)用打下了堅實的算法基矗

另一方面，算法的本質(zhì)是人才的力量。目前，商湯已組建成亞洲最大、水平最高的AI研究團隊，核心團隊具有20年的科研經(jīng)驗，不斷探索最前沿的人工智能研究。截至2022年末，商湯研發(fā)隊伍高達三千多人，占員工總數(shù)近70%，全年研發(fā)支出超40億元。

算力為AI模型提供運行動力，沒有足夠的算力，AI模型就無法順利進行訓(xùn)練、推理和應(yīng)用。面對高速增長的算力需求，GPU等高性能算力資源緊缺是目前制約人工智能發(fā)展的主要因素之一。

商湯位于上海臨港的人工智能計算中心（AIDC）2022年初正式啟動運營，目前能夠輸出超過6000 Petaflops超大規(guī)模算力，擁有行業(yè)領(lǐng)先的算力輸出能力、超大模型訓(xùn)練及大規(guī)模推理能力，是亞洲最大的智能計算平臺之一。

近期，商湯位于重慶的人工智能計算中心正式“點亮”。據(jù)悉，商湯重慶AIDC首期建設(shè)以國產(chǎn)化算力為主，中長期規(guī)劃建設(shè)算力1000 Petaflops。

數(shù)據(jù)的累積下沉和打通是一切人工智能模型運行和應(yīng)用的基礎(chǔ)，AI模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù)作支撐，大模型的價值觀和安全性也依賴于訓(xùn)練數(shù)據(jù)質(zhì)量。

商湯在AI數(shù)據(jù)方面的優(yōu)勢源于其積累的原始語料數(shù)據(jù)體量已經(jīng)非常大，而更加有壁壘的其實是提高數(shù)據(jù)的質(zhì)量。

為提高數(shù)據(jù)質(zhì)量，商湯投入了數(shù)百臺服務(wù)器，搭載了千卡級的GPU計算資源，同時靠算法結(jié)合人工標(biāo)注的方式，對原始語料數(shù)據(jù)做分門別類的精細化清洗。

“我們訓(xùn)練了大量的分類器，可以按照要求篩選出高價值的數(shù)據(jù)，也對一些特定類別數(shù)據(jù)進行了大量的人工標(biāo)注。”商湯科技告訴第一財經(jīng)，“商湯關(guān)注訓(xùn)練數(shù)據(jù)的每一個細節(jié)，確保其質(zhì)量、安全性和價值觀都符合要求。”