展會信息港展會大全

“商湯們”托舉AI大時代丨2023數(shù)字中國年度案例
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-14 15:16:35   瀏覽:4315次  

導(dǎo)讀:AI時代在2023年正式拉開了序幕。 根據(jù)Markets and Markets數(shù)據(jù),2023年全球AI市場規(guī)模為1502億美元,預(yù)計2023年至2030年復(fù)合增長率為36.8%。 托舉起這個AI大時代不斷向前的,是那些腳踏實地的企業(yè)它們堅持長期主義,深深地扎根于產(chǎn)業(yè)土壤,關(guān)注生產(chǎn)力的創(chuàng)新...

AI時代在2023年正式拉開了序幕。

根據(jù)Markets and Markets數(shù)據(jù),2023年全球AI市場規(guī)模為1502億美元,預(yù)計2023年至2030年復(fù)合增長率為36.8%。

托舉起這個AI大時代不斷向前的,是那些腳踏實地的企業(yè)它們堅持長期主義,深深地扎根于產(chǎn)業(yè)土壤,關(guān)注生產(chǎn)力的創(chuàng)新與顛覆式增長,持續(xù)探索、試錯與實踐,埋下時代變革的種子,并向陽而長。

商湯(00020.HK)正是其中最典型的一家。

2023年是商湯成立的第九年。對AI大時代的暢想與厲兵,堅實了商湯發(fā)展思路踏實打基礎(chǔ),落地找應(yīng)用一方面,商湯通過打造新型AI基礎(chǔ)設(shè)施“商湯AI大裝置SenseCore”,打通算力、算法和平臺;另一方面,商湯建立“日日新SenseNova”大模型及研發(fā)體系,以低成本解鎖通用AI能力,推動AI創(chuàng)新和落地,打通商業(yè)價值閉環(huán),解決長尾應(yīng)用問題。

AI時代已至

全球頂尖科技巨頭都在不遺余力地擁抱這個AI大時代。

就在11月初,馬斯克發(fā)布了他新創(chuàng)辦的AI 公司xAI 的首款產(chǎn)品Grok,這是一款對標(biāo)ChatGPT 的聊天機器人,馬斯克由此真正進入了生成式AI 這條目前最熱門的賽道,與OpenAI、谷歌、Meta 同臺競技。

蘋果據(jù)悉今明兩年將豪擲數(shù)十億美元采購AI服務(wù)器,力圖追趕微軟和谷歌的領(lǐng)先地位。此外,蘋果計劃最早在2024年年底將生成式AI技術(shù)融入iPhone和iPad,端側(cè)AI應(yīng)用落地接近轉(zhuǎn)折點。

成立48年的微軟借力OpenAI正重新成為全球最領(lǐng)先的科技公司。微軟堅信下一代AI將重塑每個軟件類別和每個業(yè)務(wù),包括微軟自己的業(yè)務(wù)。CEO薩蒂亞納德拉在10月致公司股東的年度信中寫到,非?春肁I,未來繼續(xù)大力押注。

國內(nèi)大廠也正在撲面而來的AI大潮中迎頭趕上。僅僅是類ChatGPT技術(shù)方面,各大科技公司年內(nèi)已推出的大模型數(shù)量超180個,還有數(shù)十個在研。賽迪顧問數(shù)據(jù)顯示,今年1-7月,中國大模型發(fā)布量占全球比重達67.4%。

除了數(shù)量的爆發(fā)式增長,大模型的參數(shù)也在增長。GPT-2的預(yù)訓(xùn)練數(shù)據(jù)量為40GB、參數(shù)量僅有15億個,GPT-3的預(yù)訓(xùn)練數(shù)據(jù)量達到45TB、參數(shù)量更是高達1750億個,GPT-4則據(jù)稱為1.8萬億參數(shù)量,13萬億訓(xùn)練數(shù)據(jù)。而目前的多模態(tài)大模型參數(shù)量普遍相對較大,多在千億級以上。

隨著企業(yè)數(shù)據(jù)的不斷積累,算力基礎(chǔ)設(shè)施不斷完善,未來大模型的商業(yè)應(yīng)用場景將越來越多,大模型賦能千行百業(yè),中國AI市場規(guī)模也將持續(xù)擴大。賽迪顧問預(yù)計,2025年中國AI產(chǎn)業(yè)規(guī)模將超3000億元,未來三年產(chǎn)業(yè)規(guī)模年均復(fù)合增長率達到18.8%。

商湯的AI理念

身處這個正被AI深刻改變的時代,商湯有著自己的發(fā)展理念。

AI的發(fā)展,需要大算力底座,需要基礎(chǔ)設(shè)施,也需要能夠結(jié)合產(chǎn)業(yè)應(yīng)用落地。商湯堅持先打基礎(chǔ),再找應(yīng)用。

商湯意識到,當(dāng)前業(yè)界訓(xùn)練大模型,對大算力的需求非常旺盛,而真正好用的基礎(chǔ)設(shè)施卻十分稀缺。因此,商湯打造了新型人工智能基礎(chǔ)設(shè)施商湯大裝置SenseCore,打通算力、算法和平臺。

據(jù)悉,大裝置SenseCore擁有超30000張GPU,融合了AI、超算與大數(shù)據(jù)的核心能力,通過為AI優(yōu)化的高性能計算、高性能存儲及緩存、高性能網(wǎng)絡(luò),以存算分離、大規(guī)模彈性、容錯調(diào)度等特征,支撐大模型在數(shù)千張卡、PB級存儲上,完成萬億級參數(shù)大模型訓(xùn)練。

SenseCore AI平臺產(chǎn)品則提供了模塊化、全鏈條的數(shù)據(jù)、訓(xùn)練及推理能力,可實現(xiàn)百億級數(shù)據(jù)管理及檢索、人工標(biāo)注服務(wù),加速AI大模型研發(fā)效率。一鍵量化、一鍵部署、一鍵應(yīng)用,提供了大模型快速上線驗證的工具,加速創(chuàng)新。

“商湯大裝置既是算力平臺,也是數(shù)據(jù)型服務(wù)平臺。未來技術(shù)發(fā)展當(dāng)中,如果沒有這樣一個基礎(chǔ)設(shè)施平臺,創(chuàng)新科技幾乎是不可能的。”商湯科技董事長兼CEO徐立表示。

目前,商湯大裝置已累計服務(wù)超50個核心客戶,其中大模型客戶10家以上,涵蓋智能駕駛、生物制藥、芯片設(shè)計、智慧商業(yè)、高校科研等前沿領(lǐng)域,已在超過20個落地場景中實現(xiàn)大模型交付。

在大裝置基礎(chǔ)上,商湯構(gòu)建了“商湯日日新SenseNova”大模型體系。

日日新SenseNova是國內(nèi)首個綜合能力超越GPT-3.5的大語言模型及文生圖大模型,已服務(wù)上千家客戶,模型相關(guān)業(yè)務(wù)規(guī)模已增長6倍。

“我們以商湯AI大裝置SenseCore打造AGI(通用人工智能)時代的基礎(chǔ)設(shè)施,并基于此將大模型體系命名為‘日日新’,寓意‘茍日新、日日新、又日新’,希望在模型迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”徐立稱。

基于“商湯日日新SenseNova”大模型體系,商湯針對不同細分場景打造了系列生成式AI大模型應(yīng)用,包括大語言模型應(yīng)用商量SenseChat、圖像生成平臺秒畫SenseMirage、數(shù)字人視頻內(nèi)容創(chuàng)作平臺如影SenseAvatar、大場景3D內(nèi)容生成平臺瓊宇SenseSpace、物體重建及營銷服務(wù)平臺格物SenseThings。

“目前的人工智能就是一門實踐科學(xué),訓(xùn)練一個大模型如同教育一個小孩,‘課程設(shè)計’是其中的關(guān)鍵。”徐立表示,商湯會專注于“課程設(shè)計”和高價值數(shù)據(jù)的構(gòu)造,結(jié)合不同領(lǐng)域的Knowhow可以快速訓(xùn)練適用于行業(yè)的專用模型,實現(xiàn)行業(yè)落地。

商湯科技已將AI商業(yè)化賦能多個行業(yè)。在“商湯日日新SenseNova”大模型體系下,商湯正積極通過大模型的多模態(tài)能力組合賦能產(chǎn)業(yè)升級,并帶來諸多引領(lǐng)行業(yè)的應(yīng)用創(chuàng)新。

商湯憑什么?

數(shù)據(jù)、算力和算法是AI最底層的三大要素,亦是決定AI發(fā)展的重要基矗支撐商湯發(fā)展戰(zhàn)略的,也是其自身在三要素領(lǐng)域獨特的優(yōu)勢。

算法類似于AI模型的大腦,目前我國在AI算法基礎(chǔ)理論研究方面與海外的差距已經(jīng)縮小,同時由于AI算法的革新頻率較快,未來在某些垂直領(lǐng)域的進展可能更為領(lǐng)先。

商湯很早開始探索計算機視覺領(lǐng)域,2017年布局決策智能,2019年開始涉足NLP(自然語言處理)領(lǐng)域,為大模型的研發(fā)和后續(xù)應(yīng)用打下了堅實的算法基矗

另一方面,算法的本質(zhì)是人才的力量。目前,商湯已組建成亞洲最大、水平最高的AI研究團隊,核心團隊具有20年的科研經(jīng)驗,不斷探索最前沿的人工智能研究。截至2022年末,商湯研發(fā)隊伍高達三千多人,占員工總數(shù)近70%,全年研發(fā)支出超40億元。

算力為AI模型提供運行動力,沒有足夠的算力,AI模型就無法順利進行訓(xùn)練、推理和應(yīng)用。面對高速增長的算力需求,GPU等高性能算力資源緊缺是目前制約人工智能發(fā)展的主要因素之一。

商湯位于上海臨港的人工智能計算中心(AIDC)2022年初正式啟動運營,目前能夠輸出超過6000 Petaflops超大規(guī)模算力,擁有行業(yè)領(lǐng)先的算力輸出能力、超大模型訓(xùn)練及大規(guī)模推理能力,是亞洲最大的智能計算平臺之一。

近期,商湯位于重慶的人工智能計算中心正式“點亮”。據(jù)悉,商湯重慶AIDC首期建設(shè)以國產(chǎn)化算力為主,中長期規(guī)劃建設(shè)算力1000 Petaflops。

數(shù)據(jù)的累積下沉和打通是一切人工智能模型運行和應(yīng)用的基礎(chǔ),AI模型訓(xùn)練需要大量高質(zhì)量數(shù)據(jù)作支撐,大模型的價值觀和安全性也依賴于訓(xùn)練數(shù)據(jù)質(zhì)量。

商湯在AI數(shù)據(jù)方面的優(yōu)勢源于其積累的原始語料數(shù)據(jù)體量已經(jīng)非常大,而更加有壁壘的其實是提高數(shù)據(jù)的質(zhì)量。

為提高數(shù)據(jù)質(zhì)量,商湯投入了數(shù)百臺服務(wù)器,搭載了千卡級的GPU計算資源,同時靠算法結(jié)合人工標(biāo)注的方式,對原始語料數(shù)據(jù)做分門別類的精細化清洗。

“我們訓(xùn)練了大量的分類器,可以按照要求篩選出高價值的數(shù)據(jù),也對一些特定類別數(shù)據(jù)進行了大量的人工標(biāo)注。”商湯科技告訴第一財經(jīng),“商湯關(guān)注訓(xùn)練數(shù)據(jù)的每一個細節(jié),確保其質(zhì)量、安全性和價值觀都符合要求。”

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港