展會信息港展會大全

人工智能≠機器“人”:激活基礎(chǔ)模型在產(chǎn)業(yè)中的巨大應(yīng)用潛力和商業(yè)價值
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-12 17:20:13   瀏覽:5533次  

導(dǎo)讀:一些企業(yè)和機構(gòu)對于人工智能大模型的應(yīng)用方式,還局限在智能客服、對話機器人,或者文字、圖片生成等方面。事實上,基礎(chǔ)模型擁有強大的推理、生成和泛化能力,適用于產(chǎn)業(yè)界中最具商業(yè)價值的任務(wù),如精準(zhǔn)預(yù)測和控制、高效優(yōu)化決策,以及智能化、可交互的工業(yè)...

“一些企業(yè)和機構(gòu)對于人工智能大模型的應(yīng)用方式,還局限在智能客服、對話機器人,或者文字、圖片生成等方面。事實上,基礎(chǔ)模型擁有強大的推理、生成和泛化能力,適用于產(chǎn)業(yè)界中最具商業(yè)價值的任務(wù),如精準(zhǔn)預(yù)測和控制、高效優(yōu)化決策,以及智能化、可交互的工業(yè)模擬。”

微軟亞洲研究院資深首席研究員邊江。

隨著人工智能大模型(基礎(chǔ)模型,F(xiàn)oundation Models)的發(fā)展,很多企業(yè)和機構(gòu)都對其在生產(chǎn)力場景中的應(yīng)用表現(xiàn)出極大的熱情。不過,我們也觀察到這樣一個現(xiàn)象:很多產(chǎn)業(yè)從業(yè)者似乎更關(guān)注人工智能接近“人”的一面像人類一樣對話、寫作、創(chuàng)作,以及擁有近似于人類的感知能力。比如,很多企業(yè)在引入人工智能大模型時,首選場景都傾向于智能客服,對話機器人等“類人”崗位。毫無疑問,這種傾向存在著對大模型理解和應(yīng)用上的局限,并不能讓它在產(chǎn)業(yè)界發(fā)揮出應(yīng)有的潛力。

然而,這些局限有其必然性。因為基礎(chǔ)模型與生產(chǎn)場景的融合還缺乏成熟且普遍的先例。如果把人工智能看作一種“生產(chǎn)工具”,那么它的應(yīng)用就類似于“先有工具再發(fā)掘用途”,而且人類歷史上可能從未有過這種不針對特定需求,而是有著廣泛用途但又存在不確定性的工具。

此外,由于不同產(chǎn)業(yè)存在更加豐富、復(fù)雜的場景,適用于產(chǎn)業(yè)界相應(yīng)場景的基礎(chǔ)模型,與通常意義上的基礎(chǔ)模型也不盡相同。這就需要對產(chǎn)業(yè)大模型進(jìn)行同步創(chuàng)新,在更多產(chǎn)業(yè)場景中充分發(fā)揮基礎(chǔ)模型的能力,實現(xiàn)人工智能與應(yīng)用場景的匹配。對于各個產(chǎn)業(yè)來說,我們不妨從擺脫思維局限開始,不要將人工智能等同于機器“人”。然后,重新審視和改變現(xiàn)有的業(yè)務(wù)流程和業(yè)務(wù)架構(gòu),梳理出適應(yīng)人工智能時代的人與基礎(chǔ)模型的合作模式。

基礎(chǔ)模型在產(chǎn)業(yè)界潛力無限

基礎(chǔ)模型是具有通用的數(shù)據(jù)表示能力、知識理解能力和推理能力的人工智能模型,可以在不同的領(lǐng)域和場景中自然遷移,并快速適應(yīng)新的環(huán)境。與此同時,產(chǎn)業(yè)界的數(shù)字化平臺在經(jīng)過多年的發(fā)展后,已經(jīng)積累了大量的行業(yè)數(shù)據(jù),為基礎(chǔ)模型提供了更豐富和更適用于特定場景的知識和信息這讓基礎(chǔ)模型有了融入產(chǎn)業(yè)場景的基矗

在應(yīng)用價值方面,基礎(chǔ)模型強大的推理能力,能夠幫助使用者更好地理解數(shù)據(jù),從海量的數(shù)據(jù)中提取有價值的信息,發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)和規(guī)律,從而提供更深刻的洞察和更有效的建議。這一優(yōu)勢可以在產(chǎn)業(yè)領(lǐng)域的預(yù)測、決策、模擬等場景中發(fā)揮關(guān)鍵作用。

基礎(chǔ)模型的另一個優(yōu)勢是泛化能力。在基礎(chǔ)模型出現(xiàn)之前,每個行業(yè)場景都需要使用特定數(shù)據(jù)來訓(xùn)練一個專屬人工智能模型,這難以大規(guī)模復(fù)用,限制了人工智能的商業(yè)價值,而基于全世界通用知識訓(xùn)練的基礎(chǔ)模型,極大地提升了模型的泛化能力,讓產(chǎn)業(yè)界不再需要像傳統(tǒng)人工智能解決方案那樣,為每個場景訓(xùn)練專屬模型。

基礎(chǔ)模型還可以和生成式人工智能結(jié)合,提升工業(yè)仿真和智能模擬的準(zhǔn)確性、真實性與可交互性,促進(jìn)數(shù)字孿生的實現(xiàn)。工業(yè)仿真和模擬都是對真實世界的還原和測試,涉及眾多復(fù)雜的角色和環(huán)境。傳統(tǒng)人工智能模型難以支撐大規(guī)模仿真,模擬時往往會簡化真實情況,或忽略重要的極端事件,影響了模擬和仿真的質(zhì)量和真實性。生成式人工智能大模型能夠支持更廣泛的場景,在深入學(xué)習(xí)特定領(lǐng)域?qū)I(yè)知識的基礎(chǔ)上,建立特定數(shù)據(jù)維度分布與真實事件的映射,實現(xiàn)接近現(xiàn)實世界的模擬,更好地輔助工業(yè)預(yù)測與決策任務(wù),達(dá)到工業(yè)應(yīng)用標(biāo)準(zhǔn)。

基礎(chǔ)模型在產(chǎn)業(yè)界落地需要克服四個難題

在產(chǎn)業(yè)界,最重要也最有商業(yè)價值的任務(wù)包括精準(zhǔn)預(yù)測和控制,高效優(yōu)化決策,以及智能化、可交互的工業(yè)模擬等復(fù)雜任務(wù)。這些領(lǐng)域也是傳統(tǒng)行業(yè)企業(yè)應(yīng)該重點關(guān)注的應(yīng)用方向。然而,通過對現(xiàn)有的GPT等基礎(chǔ)模型的評測,并結(jié)合產(chǎn)業(yè)領(lǐng)域的實際情況,我們發(fā)現(xiàn)基礎(chǔ)模型與真實產(chǎn)業(yè)需求之間還存在明顯差距,需要克服若干難題,才能使其在產(chǎn)業(yè)界發(fā)揮更大的作用。

首先,我們?nèi)狈σ粋能夠從紛繁的領(lǐng)域數(shù)據(jù)中理解復(fù)雜領(lǐng)域知識,且可以基于領(lǐng)域知識來構(gòu)建智能體的通用框架。不同的領(lǐng)域具有各自豐富且復(fù)雜的數(shù)據(jù),例如物流企業(yè)中的海關(guān)信息、跨國政策等相關(guān)信息;醫(yī)藥行業(yè)中FDA(食品藥品監(jiān)督管理局)藥物審查文檔;法律行業(yè)中的各類法規(guī)文檔等。構(gòu)建基于領(lǐng)域知識的智能體需要更通用的框架,從這些數(shù)據(jù)中提煉出重要的領(lǐng)域知識,發(fā)現(xiàn)數(shù)據(jù)和知識之間的隱含關(guān)聯(lián),并對它們進(jìn)行有效的組織和管理。

其次,在文本數(shù)據(jù)之外,基礎(chǔ)模型對結(jié)構(gòu)化數(shù)據(jù)的處理和理解能力較弱。目前的基礎(chǔ)模型最擅長的還是純文本內(nèi)容的生成和創(chuàng)作,部分模型也能處理圖像、語音等數(shù)據(jù)。但是,工業(yè)場景中的數(shù)據(jù)往往是數(shù)值型、結(jié)構(gòu)化的,如健康監(jiān)測指標(biāo)、電池充放電信號、金融信用行為等時序數(shù)據(jù)或表格數(shù)據(jù),F(xiàn)有的大模型還沒有針對這類數(shù)據(jù)進(jìn)行特定的設(shè)計和優(yōu)化,不能充分理解并處理這些數(shù)據(jù),因此很難精準(zhǔn)的完成基于這類數(shù)據(jù)的預(yù)測和分類任務(wù)。

第三,從應(yīng)用層面來看,基礎(chǔ)模型的決策能力不夠穩(wěn)定和可靠。能源、物流、金融、健康等關(guān)鍵產(chǎn)業(yè)場景中最重要的往往是決策類任務(wù),包括物流路徑優(yōu)化、能耗設(shè)備控制、投資策略制定、醫(yī)療資源調(diào)度等,這些任務(wù)往往涉及多個變量和多個約束,特別是當(dāng)面對動態(tài)變化的環(huán)境時,基礎(chǔ)模型還沒有完全適應(yīng)這些復(fù)雜的任務(wù),無法直接在產(chǎn)業(yè)領(lǐng)域應(yīng)用。

最后,我們還缺乏對一些特定領(lǐng)域的基礎(chǔ)數(shù)據(jù)的洞察,以及構(gòu)建特定領(lǐng)域基礎(chǔ)模型的方法和經(jīng)驗。很多特定領(lǐng)域的核心信息并不是單純的文本,因此他們的基礎(chǔ)數(shù)據(jù)也不再是文本中的字和詞,而是包含獨特的語義結(jié)構(gòu)和關(guān)系的新型基礎(chǔ)數(shù)據(jù),例如金融投資行業(yè)中的交易訂單信息;生物醫(yī)藥行業(yè)中的分子結(jié)構(gòu)信息等,相關(guān)領(lǐng)域的核心知識往往隱含在這一類基礎(chǔ)數(shù)據(jù)中,需要更深入和更細(xì)致的分析。只有在此基礎(chǔ)上構(gòu)建特定領(lǐng)域的基礎(chǔ)模型,才能更有效地挖掘和釋放數(shù)據(jù)的潛力。

構(gòu)建產(chǎn)業(yè)基礎(chǔ)模型:融合通用知識與領(lǐng)域?qū)I(yè)知識

為了推動基礎(chǔ)模型在產(chǎn)業(yè)界更快地落地和應(yīng)用,我們可以著重從以下幾個方面入手:

首先,我們可以利用豐富和復(fù)雜的產(chǎn)業(yè)領(lǐng)域數(shù)據(jù),構(gòu)建更通用、高效和實用的檢索增強生成(RAG)框架,可以適配各個垂直領(lǐng)域,幫助提煉出重要的領(lǐng)域知識,發(fā)現(xiàn)數(shù)據(jù)和知識之間的隱含關(guān)聯(lián),并對它們進(jìn)行有效的組織和管理。

基于基礎(chǔ)模型的更通用、高效和實用的檢索增強生成(RAG)框架。

其次,基于工業(yè)場景中重要的數(shù)值數(shù)據(jù)和相應(yīng)的結(jié)構(gòu)化依賴,構(gòu)建適合產(chǎn)業(yè)化的基礎(chǔ)模型,通過有效融合通用知識和時序數(shù)據(jù)或表格數(shù)據(jù)中的領(lǐng)域知識,更有效地解決產(chǎn)業(yè)中的預(yù)測、分類等任務(wù)。

從傳統(tǒng)人工智能的產(chǎn)業(yè)解決方案到融合通用與領(lǐng)域知識的產(chǎn)業(yè)基礎(chǔ)模型。

另一個我們目前正在著重探索的方向:利用基礎(chǔ)模型已具備的強大的生成、泛化和遷移能力,提高產(chǎn)業(yè)決策的質(zhì)量和效率。在這方面,我們在探索兩種路徑,一是將基礎(chǔ)模型作為一個智能體,二是讓基礎(chǔ)模型輔助強化學(xué)習(xí)智能體。

將基礎(chǔ)模型作為一個智能體:我們可以利用基礎(chǔ)模型的先驗知識,結(jié)合離線強化學(xué)習(xí)(Offline Reinforcement Learning),通過持續(xù)收集新的領(lǐng)域知識并不斷微調(diào),促進(jìn)智能體的進(jìn)化,提高作為智能體的基礎(chǔ)模型的優(yōu)化決策能力,使其能更專注于處理產(chǎn)業(yè)領(lǐng)域內(nèi)的任務(wù)。

協(xié)同基礎(chǔ)模型與離線強化學(xué)習(xí)構(gòu)建決策智能體。

經(jīng)過優(yōu)化的基礎(chǔ)模型可以在多種產(chǎn)業(yè)場景中發(fā)揮作用。例如,在方程式賽車中,該基礎(chǔ)模型能夠優(yōu)化賽車的輪胎維修策略,根據(jù)賽車輪胎的損耗和維修成本,找到最佳的進(jìn)站維修時間,以縮短賽程、提高賽車排名;在化工企業(yè)的產(chǎn)品調(diào)度中,利用這一基礎(chǔ)模型可以大幅提高產(chǎn)品存儲與生產(chǎn)過程中管線協(xié)同的效率,從而提升生產(chǎn)執(zhí)行效率;另外,基于基礎(chǔ)模型的泛化能力與魯棒性,還可以將其快速遷移至空調(diào)控制優(yōu)化的場景中,在保證舒適溫度的同時實現(xiàn)能耗最小化。

使用基礎(chǔ)模型輔助強化學(xué)習(xí)智能體:我們可以讓模型學(xué)習(xí)通用表示,在不同的環(huán)境和任務(wù)中快速適應(yīng),從而提升泛化能力。在這一方法中,我們引入了預(yù)訓(xùn)練世界模型(Pretrained World Model),它可以模擬人類的學(xué)習(xí)和決策過程,增強產(chǎn)業(yè)決策的效果。通過利用具有廣泛知識的預(yù)訓(xùn)練世界模型,并采用兩階段預(yù)訓(xùn)練框架,開發(fā)者能夠更全面和靈活地訓(xùn)練基礎(chǔ)模型進(jìn)行產(chǎn)業(yè)決策,并將其擴展到任何特定的決策場景。

我們與微軟Xbox團(tuán)隊合作,在游戲測試的場景中驗證了這個框架的有效性。我們利用該框架針對游戲地圖預(yù)訓(xùn)練了世界模型,解決了在新游戲場景中利用地標(biāo)觀察進(jìn)行長期空間推理或?qū)Ш降膯栴}。該預(yù)訓(xùn)練模型明顯優(yōu)于沒有世界模型或使用傳統(tǒng)學(xué)習(xí)方法的模型,極大地提高了游戲探索的效率。

此外,我們還可以使用領(lǐng)域內(nèi)專有的基礎(chǔ)數(shù)據(jù)和所蘊含的特定語義信息,打造領(lǐng)域內(nèi)的基礎(chǔ)模型,為智能可交互的決策和模擬開拓新的可能性。比如,我們可以基于金融市場交易訂單數(shù)據(jù)構(gòu)建金融投資基礎(chǔ)模型,這些基礎(chǔ)數(shù)據(jù)是包含豐富語義結(jié)構(gòu)和信息的交易訂單,而不是純文本字符;谶@一金融基礎(chǔ)模型,我們可以實現(xiàn)針對不同市場風(fēng)格的訂單流生成,模擬不同市場環(huán)境下的大規(guī)模訂單交易,實現(xiàn)對金融投資市場的可控模擬,從而更好地理解市場變化的規(guī)律,探索應(yīng)對極端場景的策略。

基于金融基礎(chǔ)模型實現(xiàn)針對不同市場風(fēng)格的訂單流生成,從而模擬多樣的市場環(huán)境。

基礎(chǔ)模型引領(lǐng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的下一波浪潮

很早之前,微軟亞洲研究院就已經(jīng)意識到人工智能在產(chǎn)業(yè)界的廣泛應(yīng)用需要新的技術(shù)探索、嘗試和突破,通過跟來自不同產(chǎn)業(yè)的合作伙伴合作,我們陸續(xù)研發(fā)出Qlib人工智能量化投資平臺、MARO多智能體資源優(yōu)化平臺、FOST時空預(yù)測工具、BatteryML電池性能分析與預(yù)測平臺等開源模型。這些面向產(chǎn)業(yè)的人工智能平臺、工具和模型,不僅在工業(yè)界發(fā)揮了重要作用,也為目前基礎(chǔ)模型的產(chǎn)業(yè)落地提供了重要的數(shù)據(jù)和工具基矗

借鑒成功的人工智能產(chǎn)業(yè)化經(jīng)驗,我們已經(jīng)開始從前文介紹的幾個維度深入探索面向工業(yè)領(lǐng)域的人工智能基礎(chǔ)模型及其應(yīng)用。我們發(fā)現(xiàn),在這些突破傳統(tǒng)大模型認(rèn)知的維度上,基礎(chǔ)模型擁有巨大潛力,能夠深刻促進(jìn)產(chǎn)業(yè)變革。

可以想象,未來基礎(chǔ)模型將能夠幫助產(chǎn)業(yè)界實現(xiàn)行業(yè)內(nèi)的知識自動管理、自動提娶自動迭代。在此之外,我們也在探索基礎(chǔ)模型幫助企業(yè)實現(xiàn)自動研發(fā),包括研發(fā)方向的自動發(fā)掘、算法研究方案的自動生成、研發(fā)過程和科學(xué)實驗的自動生成和執(zhí)行,以及研究思路的自動迭代。換言之,人工智能將能夠自主進(jìn)行數(shù)據(jù)驅(qū)動的產(chǎn)業(yè)化研發(fā),這將深刻改變產(chǎn)業(yè)界的運作模式。

研發(fā)智能體:自動演進(jìn)以工業(yè)數(shù)據(jù)為中心的研發(fā)周期。

基礎(chǔ)模型將是繼互聯(lián)網(wǎng)和云計算之后,加速產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的新動力,并將帶來新一波的產(chǎn)業(yè)創(chuàng)新爆發(fā)。我們期待與更多產(chǎn)業(yè)界的合作伙伴一起,深入真實場景,探索基礎(chǔ)模型在產(chǎn)業(yè)領(lǐng)域應(yīng)用的更多可能性,充分釋放基礎(chǔ)模型的商業(yè)價值。

相關(guān)模型開源鏈接:

Qlib:https://www.msra.cn/zh-cn/news/features/qlib-2

MARO:https://github.com/microsoft/maro

FOST:https://github.com/microsoft/FOST

BatteryML:https://github.com/microsoft/BatteryML

2023年是微軟亞洲研究院建院25周年。借此機會,該院特別策劃了“智啟未來”系列文章,邀請到微軟亞洲研究院不同研究領(lǐng)域的領(lǐng)軍人物,以署名文章的形式分享他們對人工智能、計算機及其交叉學(xué)科領(lǐng)域的觀點洞察及前沿展望。本文為該院授權(quán)澎湃科技獨家首發(fā)。作者邊江,現(xiàn)任微軟亞洲研究院資深首席研究員、微軟亞洲研究院機器學(xué)習(xí)組和產(chǎn)業(yè)創(chuàng)新中心負(fù)責(zé)人。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港