展會信息港展會大全

商湯科技楊帆:AI將迎來更加繁榮的“大航海時代”,生產范式發(fā)生重大轉變丨GTIC 2023
來源:互聯(lián)網   發(fā)布日期:2023-06-06 06:18:31   瀏覽:4176次  

導讀:智東西(公眾號:zhidxcom) 編輯| GTIC 智東西6月5報道,在GTIC 2023中國AIGC創(chuàng)新峰會上,商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆以《AI 2.0 大模型帶來的新時代浪潮》為主題發(fā)表演講,解讀了作為小模型時代走出的創(chuàng)企的求變之路和能力圈。 AI正引領新一...

智東西(公眾號:zhidxcom)

編輯| GTIC

智東西6月5報道,在GTIC 2023中國AIGC創(chuàng)新峰會上,商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆以《AI 2.0 大模型帶來的新時代浪潮》為主題發(fā)表演講,解讀了作為“小模型時代”走出的創(chuàng)企的求變之路和能力圈。

AI正引領新一代技術革命,從AI輔助科研、生成式AI席卷到近期爆火的對話機器人ChatGPT。大(算)力出奇跡、量變引發(fā)質變。楊帆稱,AI生產范式正發(fā)生重大轉變大模型時代到來。

楊帆談道,在過去10年的AI“小模型”時代,解決單一問題的深度學習方法與工業(yè)化小模型生產工具逐步成熟;在新的大模型時代,大模型即服務(MaaS)成為新主題,誕生了圍繞大模型基礎設施降本、算力數(shù)據(jù)軍備賽、實時用戶反饋展開的AI新范式。

面向這一趨勢,扎根AI近10年的商湯沉淀出商湯SenseCore大裝置,從AI原生基礎設施、大模型生產平臺、算法模型服務、行業(yè)應用四個層面,使能極致大模型開發(fā)體驗。

楊帆說,商湯將結合多年行業(yè)經驗累積,提供高效率、低成本、規(guī);男乱淮鶤I基礎設施產品與服務,全棧加速千億級大模型生產部署,促進數(shù)據(jù)采集、標注、管理效率大幅提升,縮減模型迭代周期。同時商湯還會通過提供大模型開發(fā)支持服務,保障開發(fā)成果落地。

以下為楊帆的演講實錄:

感謝今天有這個機會來跟大家分享一下商湯最近在做的一些工作。今年ChatGPT、大模型非;穑虦鳛橐粋從事算法研發(fā)的公司,我們不叫大模型,而是講預訓練模型,這件事情我們從18年就開始在做了。

一、很多預訓練模型的技術進步,比起ChatGPT毫不遜色

在我們看來,今天ChatGPT因為能跟C端用戶無縫交互的對話式能力,使得最近兩年以大數(shù)據(jù)、暴力美學為基礎的新的預訓練模型技術火出圈,被更多人所認識和感知到。

過去兩年,我們看到的很多技術進步其實都是類似的機理和機制,我個人認為它們的意義某種程度上比起ChatGPT毫不遜色,甚至更大。

比如前年到去年很多AI for Science的突破,今天能夠快速推演所有蛋白質的結構,能夠做原子劇變的模擬,這些實際上都是一些最新AI技術通過更大的模型訓練帶來的改變。

大模型、預訓練其實是一個非常寬泛的領域,不止是自然語言,也包括視覺、多模態(tài)、決策,雖然決策模型今天的數(shù)據(jù)量級和參數(shù)量級沒有那么大,但是很多模態(tài)模型最終還是要應用到決策任務上。所以在我看來,最近兩年整個AI研究范式確實產生了非常大的改變,而且這個改變是全方位的。包括AI for Science,不僅僅是技術的進步,過去兩年相關商業(yè)化節(jié)奏也非?,很多國內外公司已經可以利用最新的科研技術,迅速形成一些生產力的轉化。

再比如說去年非;鸬奈纳鷪D,還有最新的Stable Diffusion繪畫結果,都已經是實實在在的商業(yè)嘗試。你可以在社交平臺上找到10萬粉絲的AI博主。此前,Midjourney發(fā)布V5版本,已經解決了畫手指的問題。

技術本身在非?焖俚氐,不僅僅是對話式大模型。當然對話大模型本身有無數(shù)的探討與思考,我們相信它在未來能夠形成大量新的技術應用。今天在國內外有很多從業(yè)者已經開始用這樣的技術快速地做一些應用的創(chuàng)造與更新。

二、大模型時代,AI生產范式發(fā)生重大轉變

這樣技術的創(chuàng)新與進步背后,底層支撐是什么?

今天很多嘉賓提到了大數(shù)據(jù)、大模型以及支撐它的大算力,的確如此。單個AI模型的數(shù)據(jù)參數(shù)量以及所需要的算力規(guī)模到2010、2012年之后是一個非常陡峭的曲線,呈現(xiàn)極高速的增長,它的成本也是非常高昂的。

我們做了一個簡單的測算,微軟現(xiàn)在嘗試把一部分ChatGPT接進了Bing搜索結果,假設把谷歌每秒的查詢全部AI化,為了支撐這個東西去跑,意味著300億美金的運算成本,非常高昂。

我們面前還有很長的路。一方面是技術的進步,一方面是成本的下降、資源的節(jié)約,還有很多的工作需要我們去做。從GPT-2到GPT-3到3.5再到4,特別是3.5到4,模型參數(shù)并沒有很大變化,主要來自于數(shù)據(jù)量級多了20倍,而產生很大的效果。所有這一切都指向“大力出奇跡,量變引發(fā)質變”。在我們看來,這個方向更多意味著整個AI從技術生產范式以及商業(yè)模式帶來全新的變化。

商湯2014年成立,經歷了上一輪AI的完整商業(yè)化過程。我們看到所有AI技術創(chuàng)新、算法的迭代,其實是一個鏈條很長、要不斷高頻迭代形成閉環(huán),最后才能產生應用的模式。

這樣的模式有一個問題:鏈條中牽扯到多環(huán)節(jié),而且在每個環(huán)節(jié)需要的技術能力、業(yè)務理解、場景能力都是不同的,需要在每個環(huán)節(jié)都保持專業(yè)性。同時,它要求整個迭代頻率比較快,AI所有的技術今天應用在任何一個新場景上,都是不足的,都需要通過快速迭代去改進提升。

這某種意義上帶來了高單點成本和高門檻,也是過去我們遇到的AI產業(yè)化沒有達到多數(shù)人預期的背后,很重要的原因所在。

超大規(guī)模預訓練模型出現(xiàn)之后,整個生產范式發(fā)生了完全的改變,從AI原生的基礎設施,包括硬件、計算機的體系結構、數(shù)據(jù)的組織結構、資源的組織結構,甚至包括基礎軟件。

在這之前,支撐一個可能是更高成本,但是通用泛化能力更好的基礎模型可以進行橫向閉環(huán),可以通過更低成本、更低門檻的嵌入去加速整個應用邏輯。因為今天做很多C端應用,天然數(shù)據(jù)閉環(huán)更好,形成一個更好的飛輪效應。

這中間最重要的,還不是來自于對應用場景成本的下降,而是應用場景門檻的下降。

三、被改變的不僅是互聯(lián)網應用,還有企業(yè)服務

過去做AI應用,很多時候,首先你需要一個懂行業(yè)的人,知道這個技術工具到底怎么樣解決行業(yè)的問題、去解決行業(yè)的什么問題,以及解決問題之后企業(yè)自身的發(fā)展、商業(yè)模式該怎么設計,需要你去理解所服務的行業(yè)、你所服務的客戶。同時,用好這個工具,你又需要非常專業(yè)的人才、資源、能力,幫助你做算法迭代、技術的提升。

你可能很幸運,找到懂行業(yè)的創(chuàng)始人、懂技術的合伙人,但是接下來你就會發(fā)現(xiàn),兩個人去溝通時,大家有很多底層的常識不一樣,非常難在一個人身上同時具備專業(yè)的人工智能技術能力和深厚的行業(yè)經驗和積累。

但是,今天這一切事情不太需要了。我們今天去做一個場景化的應用、場景化的服務,對AI的學習門檻做大幅下降,不再需要去學習那么復雜的完整的模型訓練,不需用讀論文,可能接入第三方的大模型服務,結合一些領域數(shù)據(jù)和領域Know-how做一些微調和人工干預,就可以快速實現(xiàn)場景應用的閉環(huán)。

這會帶來整個產業(yè)或技術革新模式的改變,技術迭代方式發(fā)生核心轉變之后,對于很多人做創(chuàng)業(yè)、做新的應用,做企業(yè)服務,在商業(yè)模式上也會帶來大量的改變。

而且因為這個過程中需要更大規(guī)模更低成本的基礎設施來提供服務,這一定是軍備競賽巨頭級的游戲。同時,在場景應用設計中會更加關注數(shù)據(jù)閉環(huán)、數(shù)據(jù)飛輪和數(shù)據(jù)積累,它會帶來整個產業(yè)和應用非常大的改變。

很多人說有了這樣一個新的技術浪潮之后,整個人工智能的所有互聯(lián)網應用會被全部重做一遍。

在我們看來,(被改變的)不僅僅是互聯(lián)網應用,還有今天的企業(yè)服務。過去在行業(yè)中,推動產業(yè)數(shù)字化之后下一步的智能化過程中,我們所遇到的一些困難,因為這樣的一些新技術突破,門檻會被極大降低,會有更多人會參與到整個過程中來,to B也會發(fā)生很大的改變。

這一切依賴的基礎,叫作人工智能的基礎設施。

四、把大算力、大模型、大數(shù)據(jù)構建成基礎服務

什么叫人工智能的基礎設施?

我們經常講智能時代的基礎設施,大算力、大模型、大數(shù)據(jù),實際上就是怎么樣把這樣一些核心的基礎性底層能力構建出更加規(guī);⒏痈咝、更加低成本的基礎供應,這中間包括物理環(huán)境設施,包括AI原生為AI設計的基礎底層軟件,包括AI的核心一整套工具體系,以及架設于之上的模型服務,用它更好地去服務支持到每個行業(yè)未來的應用迭代和發(fā)展。

這是商湯從2019年開始去迭代、去年正式對外發(fā)布的大裝置SenseCore。今天做科學研究很多時候用到科學大裝置,它的特點就是投資巨大,規(guī)模也很大,當你要突破一些科學前沿的時候,一定需要大規(guī)模的基礎設施,才能真正解決問題,這是我們對于人工智能基礎設施未來發(fā)展方向的理解。我們今天把這樣一種能力作為一個開放的服務,提供給行業(yè)中的伙伴、客戶和兄弟姐妹。

商湯AIDC是2020年上海市第一個人工智能新基建項目,是全亞洲目前為止最大的人工智能專用基礎設施、專用的人工智能計算中心之一,有將近5000P的算力。通過這樣的一個算力,我們提供完整的AI基礎設施資源的能力。

除了基礎的資源規(guī)模和量以外,商湯一直以來作為一個以算法應用為核心的企業(yè),在過去發(fā)展的十年間積累了大量AI原生的從算法框架到開源模型的能力,我們今天在做的事情是把這樣的能力整合,提供一整套AI原生從資源到硬件到軟件到體系化服務的能力,通過自動化的工具,幫助更好地訓練和使用大模型。

當我們講到大模型,很多人在關注算力。除了算力還有數(shù)據(jù),今天所有人都在講數(shù)據(jù)來源,除了把這些數(shù)據(jù)爬下來,大模型能替代標注很多數(shù)據(jù)外,數(shù)據(jù)如何做有效處理、有效管理仍是問題。只做自然語言還好一點,你可以用大的文件去存。下一步我們做多模態(tài),首先遇到一個問題圖像、視頻是海量的小文件,今天有沒有足夠好的文件管理系統(tǒng)去支持百億量級的文件,能夠在一個AI訓練任務上快速地訪問和調用,這些都是從我們去看待一個AI大規(guī)模訓練所面臨的大量原生問題。

我們不僅提供硬件、軟件,還提供一些專業(yè)的專家支持服務,這種服務涵蓋了今天做一些大模型訓練、推理、優(yōu)化。訓練一個大模型,這個大模型如果要提供一個應用服務,成本會很高昂,模型做好后有沒有辦法做快速蒸餾、快速剪枝,變成一個可以讓下游更低成本使用的商業(yè)化產品。對此商湯提供了一整套的解決方案去服務今天有志于參與到人工智能2.0新浪潮中的朋友們。今天的嘉賓里有好幾家是我們的客戶,我們現(xiàn)在正在服務他們,幫助他們去訓練自己的大模型。

最后有一些例子,很多是視覺和AI for Sicence。我們今天看到基于基模型,基于預訓練的體系,它在不同的細分領域中已經越來越多越來越快地能夠在行業(yè)中產生應用,產生實際價值。

我們相信通過這樣的一些趨勢:未來以人工智能泛化性、通用性為目標的大規(guī)模預訓練模型,把它作為一種服務,用它為算力、數(shù)據(jù)、算法在內的一體化基礎設施能力,服務到更廣闊的不管to B場景應用海量市場還是C端互聯(lián)網全部被重做一遍的用戶生態(tài),這一定是未來的核心趨勢。

而在這個過程中,商湯對自己有一個的定位,用一句話來講:“訓AI大模型,用商湯大裝置。”歡迎在這方面有興趣的朋友同仁跟我們做交流。

以上是我的分享,謝謝!

以上是楊帆演講內容的完整整理。

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港