當前位置：人工智能實驗室> 產(chǎn)業(yè)政策 > 縱覽2023世界人工智能大會：百模大戰(zhàn)4個月，中國AI產(chǎn)業(yè)怎么樣了？

縱覽2023世界人工智能大會：百模大戰(zhàn)4個月，中國AI產(chǎn)業(yè)怎么樣了？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-09 07:58:07 瀏覽：26642次

導讀：文｜劉雨琦編｜王一粟身處大模型的浪潮之中，AI的熱度一波接著一波。 7月6日，2023年世界人工智能大會在上海召開，一度沖上了微博熱搜榜。在5萬平方米的會場中，400多家企業(yè)的展臺員工都在不遺余力地講解著自家新產(chǎn)品，參會的人們不斷穿梭其中，腳都走麻了...

文｜劉雨琦

編｜王一粟

身處大模型的浪潮之中，AI的熱度一波接著一波。

7月6日，2023年世界人工智能大會在上海召開，一度沖上了微博熱搜榜。在5萬平方米的會場中，400多家企業(yè)的展臺員工都在不遺余力地講解著自家新產(chǎn)品，參會的人們不斷穿梭其中，“腳都走麻了，但心情還是很澎湃。”有觀眾說道。

在現(xiàn)場，光錐智能發(fā)現(xiàn)大會的展臺均是按行業(yè)部署，軟件、硬件、芯片“一家人整整齊齊”的排列著。阿里、百度、騰訊三連座，無異于同臺競技，而觀眾們能在5分鐘之內(nèi)縱覽全國最新大模型，邊看邊對比。

作為國內(nèi)最大的AI盛會，此次與往屆不同的是，通用人工智能的曙光似乎就在咫尺之間，群雄逐鹿的戰(zhàn)意感染了每一個見證者。

特斯拉創(chuàng)始人、CEO埃隆馬斯克連線開場，圖靈獎得主、中國科學院院士、上海期智研究院院長姚期智主持討論此次大會，不僅集齊了百度文心、阿里通義、華為盤古、訊飛星火、商湯日日新等30余個海內(nèi)外大模型，還有80余位國內(nèi)外院士，特斯拉、微軟、華為、阿里等50余位海內(nèi)外大咖，學術界與科技界正在合力推開時代厚重的大門。

最為基礎的大模型層，技術平臺迎來新的迭代升級，如何賦能千行百業(yè)，推進產(chǎn)業(yè)落地成為新階段的探討主題。

AI infra結構雖然尚不成熟，但大模型的配套設施跟了上來，適應大模型計算存儲的向量數(shù)據(jù)庫成為熱門賽道，保證大模型安全運行的AI安全監(jiān)測平臺順勢而生。

應用落地搶在了大模型成熟的前面，軟件應用滲透至各行各業(yè)場景，硬件端又催生了一批機器人新產(chǎn)品。

中國大模型跑出了中國速度，技術層、配套設施層、應用層，同時在各個環(huán)節(jié)同步崛起，而不是等著底層大模型技術成熟后才慢慢跟上。一面繼續(xù)夯實地基，一面遍地開花，整艦加速前進，衍生出更多的中國大模型模式。

大模型，兩條腿走路

從3月如雨后春筍般冒頭至今，短短4個月的時間，大模型正在從“通用型”走向“產(chǎn)業(yè)落地”。

通用大模型是一場“贏家通吃”的大逃殺，把大模型用起來，比做出來更重要。在此次世界人工智能大會上，所有大模型升級的關鍵詞都是“產(chǎn)業(yè)”。

作為大模型的提供方，螞蟻、騰訊、百度、阿里、華為、網(wǎng)易等大廠結合此前已有領域的經(jīng)驗優(yōu)勢，快速探索垂類場景應用。

阿里的通義千問大模型，就率先用在了智慧金融。通過將自然語言理解和生成能力與金融場景結合，通義千問與中金財富、杭州銀行、恒生電子等合作，通過智能問答、智能外呼、智能助手，來幫助企業(yè)識別市場風險、理解客戶需求。

以游戲和教育為主的網(wǎng)易，則將大模型率先與這兩個領域結合。在教育領域，網(wǎng)易有道自研了國內(nèi)首個教育大模型“子曰”，在此次大會還發(fā)布了最新應用成果虛擬人口語教練，可以1V1體驗類似真人的口語私教。

而在自動駕駛領域積累多年的百度，把大模型投入了汽車交通領域。在汽車制造領域，百度智能云為長安汽車提供了人工智能基礎設施平臺和數(shù)字人平臺，與吉利汽車一起打造了汽車行業(yè)大模型，構建了工廠數(shù)字化大腦，幫助降低管理運維成本。

正如華為輪值董事長胡厚提到，“人工智能的發(fā)展關鍵是走深向?qū)崳c放在讓人工智能為千行百業(yè)的生產(chǎn)活動服務，為科研創(chuàng)新服務。”

不過，這波中國大模型們產(chǎn)業(yè)落地的姿勢雖各不相同，但在優(yōu)勢領域站穩(wěn)后，都開始一致向外擴展，比拼起了行業(yè)覆蓋能力。

以騰訊為例，目前，騰訊云已經(jīng)為傳媒、文旅等10余個行業(yè)提供了超過50個大模型行業(yè)解決方案；華為的盤古大模型則主要與金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等行業(yè)相結合落地......總體而言，智慧政務、智慧金融、智慧交通成為搶手垂類賽道。

騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示，“通用大模型可以在100個場景中，解決70%-80%的問題，但未必能100%滿足企業(yè)某個場景的需求。”

為了提升行業(yè)大模型的競爭力，企業(yè)們需要深入垂類行業(yè)的具體場景，貼身肉搏真正考驗技術的細節(jié)與效果。

作為持續(xù)進化的技術，大模型光能用起來還不夠。正如每一個技術的發(fā)展，都需要兩條腿走路，一條是實用性，一條是先進性，大模型的實用性，是借由產(chǎn)業(yè)側(cè)落地逐步探索的，而先進性則體現(xiàn)在對跨模態(tài)難題的突破。

參考ChatGPT從3.5到4.0的路徑，生成式大模型的技術前進之路，是單模態(tài)到多模態(tài)的，從一開始同質(zhì)化嚴重的文生文，正在一路向文生圖、文生聲、文生視頻演進。

在通義千問之后，阿里云此次宣布推出“通義大模型”新成員AI繪畫“通義萬相”，與文心一格、商湯秒畫類似，文生圖賽道已經(jīng)擁擠起來。

而在文生圖之后，文生聲、文生視頻是接下來的賽點。

以視頻為例，作為文、聲、圖的結合體，文生視頻也是生成式大模型的終極形態(tài)。目前，文生視頻技術的難點在于連貫畫面素材的生產(chǎn)。基于數(shù)字人的已有技術，文生視頻最快在數(shù)字人場景實現(xiàn)。

例如，商湯的如影大模型，能將文本文案,一鍵生成知識分享、品牌宣傳、短視頻帶貨、培訓宣講、熱點資訊等各類數(shù)字人視頻，以及3D內(nèi)容生成平臺“瓊宇”（場景生成）、“格物”（物體生成），基于3D內(nèi)容生成技術對空間和物體復刻與交互。

以往，技術往往都是先發(fā)展，后應用。而在這一波大模型浪潮下，技術的先進性、實用性同步發(fā)展，兩條腿走路的大模型正在加速前進。

產(chǎn)業(yè)拼圖，逐個補齊

大模型狂奔了4個月，產(chǎn)業(yè)的拼圖，也在一塊一塊逐漸補齊。

以大模型為核心的MaaS服務平臺，是大模型飛機著陸的機常大模型如何落地、落地速度，都與這個機場平臺的建設成熟程度緊密相關。

目前，百度文心千帆、阿里靈駿PAI平臺、騰訊模型商店、火山引擎的火山方舟，雖然有細分的差別，但都是MaaS服務平臺，幫助企業(yè)更好的精調(diào)、部署行業(yè)大模型，將大模型應用在產(chǎn)業(yè)中。

WAIC中，MaaS平臺的升級也是一大主要看點。會上，騰訊云公開了幾大重點行業(yè)方向，包括金融風控、交互翻譯、數(shù)智人等創(chuàng)新場景，下一步將布局AI for Science，持續(xù)通過AI 大模型應用在天文探索、文化考古等領域。

在不久前，火山引擎也發(fā)布了MaaS服務平臺火山方舟，包括模型廣場和模型工具兩個重要模塊，核心目的也是通過平臺力量幫助企業(yè)更好的做應用落地。

而在發(fā)展的過程中，安全問題也逐漸暴露出來。

無論是AI詐騙還是三星的員工數(shù)據(jù)泄露，模型安全一度成為了社會焦點�，F(xiàn)階段，解決問題的前提是發(fā)現(xiàn)問題，亮起安全紅燈，才能有的放矢的解決。

為此，螞蟻推出了可信程度安全評測系統(tǒng)“蟻鑒2.0”，作為業(yè)內(nèi)首個產(chǎn)業(yè)級支持文本、圖像等全數(shù)據(jù)類型的AI安全檢測平臺，“蟻鑒2.0”新增AIGC安全性、AI可解釋評測能力，可服務于金融、教育、文化、醫(yī)療、電商等領域10多個大規(guī)模復雜業(yè)務場景。

另外，螞蟻還將發(fā)布以隱私計算技術為核心的隱語開源框架1.0版本、“隱私計算安全對戰(zhàn)”科普互動游戲，數(shù)字版權保護平臺“鵲鑿”等。

螞蟻的技術人員告訴光錐智能：“當面對多模型決策時，企業(yè)可以將大模型開放給蟻鑒平臺進行評分，將有4個不同的評分標準，就像論文的查重系統(tǒng)，檢測模型的安全指數(shù)并打分，為企業(yè)提供指導。”

不過，據(jù)光錐智能了解到，目前，蟻鑒僅能檢測問題，并不提供針對性解決數(shù)據(jù)安全問題的方案。還需要其他廠商共同完善產(chǎn)業(yè)鏈條。

另一方面，數(shù)據(jù)技術的發(fā)展也在突破大模型本身的限制。

正如前文所講，大模型正在經(jīng)歷從通用到行業(yè)的變遷，這個過程受到兩個方面的限制：一是通用大模型只有“短期記憶”，無論是國內(nèi)還是國外，OpenAI最新發(fā)布了GPT4的開源版本中也強調(diào)，有8k的Token限制；二是訓練行業(yè)專有大模型，企業(yè)需要將私有數(shù)據(jù)與通用大模型進行結合，私有數(shù)據(jù)如何安全的接入大模型？如何更高效率、低成本的處理動態(tài)變化的數(shù)據(jù)？

這也就是為什么，大模型火了之后，向量數(shù)據(jù)庫隨之火爆的原因。

星環(huán)科技創(chuàng)始人孫元浩向光錐智能解釋道：“向量數(shù)據(jù)庫就像是大模型的外腦，能夠幫助大模型擁有長期記憶，且私有數(shù)據(jù)可以通過向量化存儲在向量數(shù)據(jù)庫中，既能滿足瞬時接入和輸出，也保障企業(yè)私有數(shù)據(jù)不被泄露。”

為此，騰訊云發(fā)布了云原生向量數(shù)據(jù)庫Tencent Cloud VectorDB，支持10億級向量檢索規(guī)模，并將延遲控制在毫秒級。相比傳統(tǒng)單機插件式數(shù)據(jù)庫檢索規(guī)模提升10倍，同時具備百萬級每秒查詢（QPS）的峰值能力。

星環(huán)科技發(fā)布了分布式向量數(shù)據(jù)庫Transwarp Hippo。支持存儲、索引以及管理海量的向量式數(shù)據(jù)集，提供向量相似度檢索、高密度向量聚類等能力，有效地解決了大模型在知識時效性低、輸入能力有限、準確度低等問題。

向量數(shù)據(jù)庫火爆的背后，是大模型帶動著整個數(shù)據(jù)產(chǎn)業(yè)鏈向前發(fā)展。

在訓練大模型之前的數(shù)據(jù)準備（清洗、過濾、提純）、數(shù)據(jù)處理（選型、質(zhì)量、標注）在經(jīng)歷了數(shù)道工序后才能“喂”給大模型，而中國目前數(shù)據(jù)產(chǎn)業(yè)相對分散，導致數(shù)據(jù)在流通的過程中容易遇到安全問題，且效率不高。

比如，需要先把復雜的非結構化數(shù)據(jù)通過向量化（embedding），處理統(tǒng)一成多維空間里的坐標值，才能夠為大模型所用，但如Zilliz一類的向量數(shù)據(jù)庫，并不幫企業(yè)完成向量化的過程。

這就需要一個一站式的數(shù)據(jù)處理平臺。和數(shù)據(jù)打了十幾年交道的孫元浩，將經(jīng)驗凝結在了星環(huán)的Sophon LLMOps中，通過該平臺，用戶可以完成數(shù)據(jù)采集、知識沉淀、大模型迭代提升的完整閉環(huán)。同時將向量數(shù)據(jù)庫與圖數(shù)據(jù)庫進行結合，能夠更好的幫助大模型跨領域知識學習和調(diào)優(yōu)，讓大語言模型能更好地理解不同領域的專業(yè)術語、縮寫、常見詞匯和語法，承擔統(tǒng)一的語義理解功能，解決業(yè)務領域性問題。

產(chǎn)業(yè)鏈的陸續(xù)補齊，是大模型發(fā)展的基石，同時也將帶起諸多的產(chǎn)業(yè)鏈機會，共建一個完整的模型生態(tài)。

軟件、硬件，兩手抓

今年整個展覽館，素有“人氣王”之稱的機器人被數(shù)字人搶了風頭。

數(shù)字人展館外人頭攢動，圍了一圈又一圈。商湯搭建如影數(shù)字人生成平臺，現(xiàn)場演繹3D數(shù)字人生成過程；網(wǎng)易有道豎屏展示虛擬人口語教練，吸引了參展人上前互動；魔琺科技還原虛擬人試播間，虛擬人一上午連播三常

雖然，近期AI主播、AI數(shù)字人大規(guī)模涌入了短視頻平臺，掀起了一波討論熱度，但逛完一圈卻發(fā)現(xiàn)沒人展出2D數(shù)字人，顯然相比其實用性，酷炫、好玩、互動性強的3D數(shù)字人更能搶奪人們的目光。

走進AI繪畫平臺的場館，依然令人眼花繚亂。阿里打造巨屏展示其文生圖效果，商湯使用超大卷屏演示其秒畫功能。數(shù)字人、AI繪畫，AIGC儼然成為大眾最關心的事兒，也是大模型應用中跑得最快的方向。

AIGC熱度居高不下，成為了人們茶余飯后的談資，不過更重要的是要推進產(chǎn)業(yè)落地。

網(wǎng)易伏羲預訓練及生成式人工智能平臺負責人趙增告訴光錐智能，目前游戲是圖像生成的核心應用場景之一。“游戲場景需要創(chuàng)作大量的內(nèi)容，例如各種不同朝代的角色，世界各地的風景，通過文圖功能可快速生成手稿，激發(fā)創(chuàng)意，提升游戲制作效率。”

光錐智能逛展過程中發(fā)現(xiàn)，相比于年初，市面上內(nèi)容生成的類型變得豐富了起來。文生圖幾乎是各家的標配，除此之外，更多維度的多模態(tài)能力越來越完善。比如，騰訊利用文生音頻技術，在音樂創(chuàng)作領域推出了XMusic生成式通用作曲框架。

從最初的文生圖，到現(xiàn)在的文生音頻、圖生圖，生成內(nèi)容的類型越來越多樣化，呈現(xiàn)出從單模態(tài)走向多模態(tài)的趨勢。但這還遠遠不夠，參照國外Midjourney一類軟件的發(fā)展，文生視頻將是下一階段的方向，而國內(nèi)公司在這方面探索還處于特別早期。

“左手軟件，右手硬件”，AIGC應用落地正在表現(xiàn)出“兩手抓”的趨勢。

大會剛開幕，馬斯克在發(fā)言中就提出：“未來人類將會有更多機器人產(chǎn)品，預計地球上的機器人數(shù)量將會超過人類數(shù)量。

據(jù)了解，今年現(xiàn)場共20余款機器人共同亮相，多款為首發(fā)，包括達闥搭載大模型對話能力的雙足機器人、特斯拉人形機器人擎天柱、網(wǎng)易伏羲具身智能工程機器人、微創(chuàng)手術機器人、美團無人機V4、宇樹四足機器人、科大訊飛機器狗、云深處絕影Lite3四足機器人等。

大模型讓軟件重做了一遍，但離實際應用到機器人行業(yè)還有很長的距離。

長期以來，機器人一直面臨前端需求不足、單體成本太高、無法規(guī)�；a(chǎn)等難題。某機器人廠商市場負責人向光錐智能透露，幾年間，我們的機器人成本降低到此前的三分之一，但于行業(yè)而言，在實際應用中還有很多未知問題需要磨合。

上述負責人表示，理想狀態(tài)下，大模型能夠使機器人長出靈魂，讓它自主做決策，跟實際環(huán)境去互動。

但遺憾的是，目前還很難做到，機器人的邊緣端資源有限，已有的算力帶不動大模型部署，而部署了高昂的GPU又會繼續(xù)拉高機器人的單價。

對此，有創(chuàng)業(yè)者稱，AI技術路線尚未走通，可能五年之內(nèi)也難出現(xiàn)大規(guī)模人形機器人的產(chǎn)品形態(tài)應用。

不過，包括馬斯克在內(nèi)的多位企業(yè)家都認為，機器人是人工智能的“具身智能”落地。在更長期的未來中，機器人的成熟會將人工智能的應用從信息產(chǎn)業(yè)，帶向更深更大的實體世界中。

結語

中國大模型正處于一片欣欣向榮的態(tài)勢。

不過，行業(yè)熱鬧之中，我們也看到了大模型技術路徑、產(chǎn)業(yè)落地、配套設施搭建、應用生態(tài)仍處于早期階段。

正如阿里云周靖人所說，“大模型領域你追我趕的過程剛剛開始，大家還是要有一些耐心。”

上一篇：直擊WAIC2023｜第四范式胡時偉：大模型將提速企業(yè)數(shù)字化轉(zhuǎn)型

下一篇：亞馬遜云科技生成式AI產(chǎn)品研究院院長：不能依賴單一、萬能的大型語言模型應對各種任務

AiLab云推薦

縱覽2023世界人工智能大會：百模大戰(zhàn)4個月，中國AI產(chǎn)業(yè)怎么樣了？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-09 07:58:07 瀏覽：26642次

相關內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關于我們

版權聲明

縱覽2023世界人工智能大會：百模大戰(zhàn)4個月，中國AI產(chǎn)業(yè)怎么樣了？ 來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-09 07:58:07 瀏覽：26642次

相關內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關于我們

版權聲明

縱覽2023世界人工智能大會：百模大戰(zhàn)4個月，中國AI產(chǎn)業(yè)怎么樣了？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-09 07:58:07 瀏覽：26642次