7月6日至8日,2023世界人工智能大會在上海舉辦。鄭瑩瑩攝
中新網(wǎng)上海7月8日電 題:當大模型如“雨后春筍” 業(yè)界改變了什么?
中新網(wǎng)記者 鄭瑩瑩
在2023年的世界人工智能大會(WAIC)上,大模型“扎堆”。根據(jù)大會主辦方此前發(fā)布的內(nèi)容,這次大會上有30多個海內(nèi)外大模型登場,開發(fā)團隊或是分享大模型路徑,或是展示大模型賦能各行各業(yè)的多元生態(tài),都爭相在大模型發(fā)展上有所行動或謀得先機。
如“雨后春筍”般出現(xiàn)的大模型,究竟改變了什么?
它讓“專業(yè)門檻”變低
一個初學者如果學畫畫,可能需要練個幾年,才能畫出一幅足夠?qū)I(yè)的畫。
人工智能改變了這一情況。它讓畫畫的“專業(yè)門檻”變低,僅僅輸入一些文字,一幅美輪美奐的作品便在短時間里生成了。
在大會的一場論壇上,商湯科技董事長兼CEO徐立在生成式大模型“商湯秒畫SenseMirage3.0”上輸入一些提示詞:中國龍、藍色擺件、珠寶風格。
看似簡單,但徐立說,該大模型可以根據(jù)大眾認知,自動“補齊”提示詞,讓生成的圖片細節(jié)更豐富。
在“補齊”提示詞后,該大模型呈現(xiàn)的是:一張中國龍3D渲染圖,具有精細的圖案。龍站在一片藍色“瑪瑙海”上,增添了深度和神秘感……
7月6日至8日,2023世界人工智能大會在上海舉辦。鄭瑩瑩 攝
它讓“數(shù)據(jù)家族”發(fā)生改變
因為數(shù)據(jù)安全問題,很多企業(yè)不敢讓數(shù)據(jù)“流通”起來。
大模型下,“數(shù)據(jù)家族”悄然發(fā)生變化。
星環(huán)科技創(chuàng)始人、CEO孫元浩認為,運用大模型對數(shù)據(jù)進行分類分級,可能是個新嘗試。
他認為,大模型用的數(shù)據(jù)可以分為四類:第一類是感知類數(shù)據(jù),如視覺數(shù)據(jù)、語音數(shù)據(jù)等。第二類是事實類數(shù)據(jù),過去很多行業(yè)已經(jīng)能將這類數(shù)據(jù)結(jié)構(gòu)化,但需要借助大模型將其變化歷史找出來,組成完整語義;第三類是知識類數(shù)據(jù),過去很多這類數(shù)據(jù)并沒有被有效利用,大模型出現(xiàn)以后有望助力改變這一情況;第四類數(shù)據(jù)是方法論類數(shù)據(jù)。
孫元浩說,從感知類、事實類、知識類到方法論類,所有的數(shù)據(jù)向大模型輸入時都需要轉(zhuǎn)化為大模型能理解的語言,因此“大模型時代”,數(shù)據(jù)產(chǎn)業(yè)鏈需要各種工具以及各種類型的數(shù)據(jù)庫,這樣才能真正把大模型用起來。
它讓產(chǎn)業(yè)變“活”
大模型改變了什么?這對致力于搭“數(shù)據(jù)樂高”的數(shù)庫科技創(chuàng)始人兼CEO劉彥來說,并不難回答。
他的團隊把SAM(Segment Analysis& Mapping)產(chǎn)業(yè)鏈數(shù)據(jù)體系升級為UPG(Universal Product Graph)產(chǎn)業(yè)鏈數(shù)據(jù)體系,“UPG不但有SAM的框架,同時它可以疊加工藝、生產(chǎn)環(huán)節(jié)、材質(zhì)、設(shè)備等各種類型的關(guān)系。”
換句話說,大模型的出現(xiàn),讓該企業(yè)搭“數(shù)字樂高”的能力更強了。
劉彥說,原來要“提煉”這些關(guān)系很難,大語言模型可以跑海量數(shù)據(jù)、快速生成這些關(guān)系,大大提高了效率。
螳螂捕蟬,黃雀在后。當大模型“運動員”越來越多的時候,大模型“考官”出現(xiàn)了。
今年的世界人工智能大會上,作為“鎮(zhèn)館之寶”之一,“蟻鑒AI安全檢測平臺2.0”(簡稱:蟻鑒2.0)受到關(guān)注。螞蟻集團大安全事業(yè)群技術(shù)部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術(shù),‘蟻鑒2.0’很像一個24小時不眠不休的‘安全黑客’,致力于找出大模型存在的弱點和安全問題。這種AI對AI的評測,好比‘生成式考官’考核‘生成式運動員’,也是教學相長。”
7月6日至8日,2023世界人工智能大會在上海舉辦。湯彥俊 攝
它讓“智能未來”更具挑戰(zhàn)
大模型有了,大模型下的“智能世界2.0”就能來了嗎?
還沒有。生成式大模型,以概率的方式生成內(nèi)容,會生成似是而非的內(nèi)容,這也被稱為“幻覺問題”。
如何讓語料更精準、讓大模型減少“幻覺問題”,業(yè)界在努力。
上海數(shù)據(jù)交易所總經(jīng)理湯奇峰在大會上稱,大模型建設(shè)中,語料庫是一個非常重要的方面。上海數(shù)據(jù)交易所致力于建設(shè)高質(zhì)量的語料庫,推動人工智能大模型產(chǎn)業(yè)的發(fā)展。
在今年的世界人工智能大會上,中國電信發(fā)布行業(yè)大模型Telechat。據(jù)中國電信數(shù)字智能科技分公司副總經(jīng)理何忠江介紹,Telechat依托中國電信云網(wǎng)融合優(yōu)勢,利用自研技術(shù)增強大模型的預(yù)訓練和推理能力,減少大模型“幻覺現(xiàn)象”;同時,Telechat大模型正在與千行百業(yè)的信息化解決方案進行融合,以滿足多樣場景需求。(完)