當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > 人工智能≠機器“人”：激活基礎(chǔ)模型在產(chǎn)業(yè)中的巨大應(yīng)用潛力和商業(yè)價值

人工智能≠機器“人”：激活基礎(chǔ)模型在產(chǎn)業(yè)中的巨大應(yīng)用潛力和商業(yè)價值
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-01-12 17:20:13 瀏覽：5533次

導(dǎo)讀：一些企業(yè)和機構(gòu)對于人工智能大模型的應(yīng)用方式，還局限在智能客服、對話機器人，或者文字、圖片生成等方面。事實上，基礎(chǔ)模型擁有強大的推理、生成和泛化能力，適用于產(chǎn)業(yè)界中最具商業(yè)價值的任務(wù)，如精準(zhǔn)預(yù)測和控制、高效優(yōu)化決策，以及智能化、可交互的工業(yè)...

“一些企業(yè)和機構(gòu)對于人工智能大模型的應(yīng)用方式，還局限在智能客服、對話機器人，或者文字、圖片生成等方面。事實上，基礎(chǔ)模型擁有強大的推理、生成和泛化能力，適用于產(chǎn)業(yè)界中最具商業(yè)價值的任務(wù)，如精準(zhǔn)預(yù)測和控制、高效優(yōu)化決策，以及智能化、可交互的工業(yè)模擬。”

微軟亞洲研究院資深首席研究員邊江。

隨著人工智能大模型（基礎(chǔ)模型，F(xiàn)oundation Models）的發(fā)展，很多企業(yè)和機構(gòu)都對其在生產(chǎn)力場景中的應(yīng)用表現(xiàn)出極大的熱情。不過，我們也觀察到這樣一個現(xiàn)象：很多產(chǎn)業(yè)從業(yè)者似乎更關(guān)注人工智能接近“人”的一面像人類一樣對話、寫作、創(chuàng)作，以及擁有近似于人類的感知能力。比如，很多企業(yè)在引入人工智能大模型時，首選場景都傾向于智能客服，對話機器人等“類人”崗位。毫無疑問，這種傾向存在著對大模型理解和應(yīng)用上的局限，并不能讓它在產(chǎn)業(yè)界發(fā)揮出應(yīng)有的潛力。

然而，這些局限有其必然性。因為基礎(chǔ)模型與生產(chǎn)場景的融合還缺乏成熟且普遍的先例。如果把人工智能看作一種“生產(chǎn)工具”，那么它的應(yīng)用就類似于“先有工具再發(fā)掘用途”，而且人類歷史上可能從未有過這種不針對特定需求，而是有著廣泛用途但又存在不確定性的工具。

此外，由于不同產(chǎn)業(yè)存在更加豐富、復(fù)雜的場景，適用于產(chǎn)業(yè)界相應(yīng)場景的基礎(chǔ)模型，與通常意義上的基礎(chǔ)模型也不盡相同。這就需要對產(chǎn)業(yè)大模型進(jìn)行同步創(chuàng)新，在更多產(chǎn)業(yè)場景中充分發(fā)揮基礎(chǔ)模型的能力，實現(xiàn)人工智能與應(yīng)用場景的匹配。對于各個產(chǎn)業(yè)來說，我們不妨從擺脫思維局限開始，不要將人工智能等同于機器“人”。然后，重新審視和改變現(xiàn)有的業(yè)務(wù)流程和業(yè)務(wù)架構(gòu)，梳理出適應(yīng)人工智能時代的人與基礎(chǔ)模型的合作模式。

基礎(chǔ)模型在產(chǎn)業(yè)界潛力無限

基礎(chǔ)模型是具有通用的數(shù)據(jù)表示能力、知識理解能力和推理能力的人工智能模型，可以在不同的領(lǐng)域和場景中自然遷移，并快速適應(yīng)新的環(huán)境。與此同時，產(chǎn)業(yè)界的數(shù)字化平臺在經(jīng)過多年的發(fā)展后，已經(jīng)積累了大量的行業(yè)數(shù)據(jù)，為基礎(chǔ)模型提供了更豐富和更適用于特定場景的知識和信息這讓基礎(chǔ)模型有了融入產(chǎn)業(yè)場景的基矗

在應(yīng)用價值方面，基礎(chǔ)模型強大的推理能力，能夠幫助使用者更好地理解數(shù)據(jù)，從海量的數(shù)據(jù)中提取有價值的信息，發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)和規(guī)律，從而提供更深刻的洞察和更有效的建議。這一優(yōu)勢可以在產(chǎn)業(yè)領(lǐng)域的預(yù)測、決策、模擬等場景中發(fā)揮關(guān)鍵作用。

基礎(chǔ)模型的另一個優(yōu)勢是泛化能力。在基礎(chǔ)模型出現(xiàn)之前，每個行業(yè)場景都需要使用特定數(shù)據(jù)來訓(xùn)練一個專屬人工智能模型，這難以大規(guī)模復(fù)用，限制了人工智能的商業(yè)價值，而基于全世界通用知識訓(xùn)練的基礎(chǔ)模型，極大地提升了模型的泛化能力，讓產(chǎn)業(yè)界不再需要像傳統(tǒng)人工智能解決方案那樣，為每個場景訓(xùn)練專屬模型。

基礎(chǔ)模型還可以和生成式人工智能結(jié)合，提升工業(yè)仿真和智能模擬的準(zhǔn)確性、真實性與可交互性，促進(jìn)數(shù)字孿生的實現(xiàn)。工業(yè)仿真和模擬都是對真實世界的還原和測試，涉及眾多復(fù)雜的角色和環(huán)境。傳統(tǒng)人工智能模型難以支撐大規(guī)模仿真，模擬時往往會簡化真實情況，或忽略重要的極端事件，影響了模擬和仿真的質(zhì)量和真實性。生成式人工智能大模型能夠支持更廣泛的場景，在深入學(xué)習(xí)特定領(lǐng)域?qū)I(yè)知識的基礎(chǔ)上，建立特定數(shù)據(jù)維度分布與真實事件的映射，實現(xiàn)接近現(xiàn)實世界的模擬，更好地輔助工業(yè)預(yù)測與決策任務(wù)，達(dá)到工業(yè)應(yīng)用標(biāo)準(zhǔn)。

基礎(chǔ)模型在產(chǎn)業(yè)界落地需要克服四個難題

在產(chǎn)業(yè)界，最重要也最有商業(yè)價值的任務(wù)包括精準(zhǔn)預(yù)測和控制，高效優(yōu)化決策，以及智能化、可交互的工業(yè)模擬等復(fù)雜任務(wù)。這些領(lǐng)域也是傳統(tǒng)行業(yè)企業(yè)應(yīng)該重點關(guān)注的應(yīng)用方向。然而，通過對現(xiàn)有的GPT等基礎(chǔ)模型的評測，并結(jié)合產(chǎn)業(yè)領(lǐng)域的實際情況，我們發(fā)現(xiàn)基礎(chǔ)模型與真實產(chǎn)業(yè)需求之間還存在明顯差距，需要克服若干難題，才能使其在產(chǎn)業(yè)界發(fā)揮更大的作用。

首先，我們?nèi)狈σ粋€能夠從紛繁的領(lǐng)域數(shù)據(jù)中理解復(fù)雜領(lǐng)域知識，且可以基于領(lǐng)域知識來構(gòu)建智能體的通用框架。不同的領(lǐng)域具有各自豐富且復(fù)雜的數(shù)據(jù)，例如物流企業(yè)中的海關(guān)信息、跨國政策等相關(guān)信息；醫(yī)藥行業(yè)中FDA（食品藥品監(jiān)督管理局）藥物審查文檔；法律行業(yè)中的各類法規(guī)文檔等。構(gòu)建基于領(lǐng)域知識的智能體需要更通用的框架，從這些數(shù)據(jù)中提煉出重要的領(lǐng)域知識，發(fā)現(xiàn)數(shù)據(jù)和知識之間的隱含關(guān)聯(lián)，并對它們進(jìn)行有效的組織和管理。

其次，在文本數(shù)據(jù)之外，基礎(chǔ)模型對結(jié)構(gòu)化數(shù)據(jù)的處理和理解能力較弱。目前的基礎(chǔ)模型最擅長的還是純文本內(nèi)容的生成和創(chuàng)作，部分模型也能處理圖像、語音等數(shù)據(jù)。但是，工業(yè)場景中的數(shù)據(jù)往往是數(shù)值型、結(jié)構(gòu)化的，如健康監(jiān)測指標(biāo)、電池充放電信號、金融信用行為等時序數(shù)據(jù)或表格數(shù)據(jù)�，F(xiàn)有的大模型還沒有針對這類數(shù)據(jù)進(jìn)行特定的設(shè)計和優(yōu)化，不能充分理解并處理這些數(shù)據(jù)，因此很難精準(zhǔn)的完成基于這類數(shù)據(jù)的預(yù)測和分類任務(wù)。

第三，從應(yīng)用層面來看，基礎(chǔ)模型的決策能力不夠穩(wěn)定和可靠。能源、物流、金融、健康等關(guān)鍵產(chǎn)業(yè)場景中最重要的往往是決策類任務(wù)，包括物流路徑優(yōu)化、能耗設(shè)備控制、投資策略制定、醫(yī)療資源調(diào)度等，這些任務(wù)往往涉及多個變量和多個約束，特別是當(dāng)面對動態(tài)變化的環(huán)境時，基礎(chǔ)模型還沒有完全適應(yīng)這些復(fù)雜的任務(wù)，無法直接在產(chǎn)業(yè)領(lǐng)域應(yīng)用。

最后，我們還缺乏對一些特定領(lǐng)域的基礎(chǔ)數(shù)據(jù)的洞察，以及構(gòu)建特定領(lǐng)域基礎(chǔ)模型的方法和經(jīng)驗。很多特定領(lǐng)域的核心信息并不是單純的文本，因此他們的基礎(chǔ)數(shù)據(jù)也不再是文本中的字和詞，而是包含獨特的語義結(jié)構(gòu)和關(guān)系的新型基礎(chǔ)數(shù)據(jù)，例如金融投資行業(yè)中的交易訂單信息；生物醫(yī)藥行業(yè)中的分子結(jié)構(gòu)信息等，相關(guān)領(lǐng)域的核心知識往往隱含在這一類基礎(chǔ)數(shù)據(jù)中，需要更深入和更細(xì)致的分析。只有在此基礎(chǔ)上構(gòu)建特定領(lǐng)域的基礎(chǔ)模型，才能更有效地挖掘和釋放數(shù)據(jù)的潛力。

構(gòu)建產(chǎn)業(yè)基礎(chǔ)模型：融合通用知識與領(lǐng)域?qū)I(yè)知識

為了推動基礎(chǔ)模型在產(chǎn)業(yè)界更快地落地和應(yīng)用，我們可以著重從以下幾個方面入手：

首先，我們可以利用豐富和復(fù)雜的產(chǎn)業(yè)領(lǐng)域數(shù)據(jù)，構(gòu)建更通用、高效和實用的檢索增強生成（RAG）框架，可以適配各個垂直領(lǐng)域，幫助提煉出重要的領(lǐng)域知識，發(fā)現(xiàn)數(shù)據(jù)和知識之間的隱含關(guān)聯(lián)，并對它們進(jìn)行有效的組織和管理。

基于基礎(chǔ)模型的更通用、高效和實用的檢索增強生成（RAG）框架。

其次，基于工業(yè)場景中重要的數(shù)值數(shù)據(jù)和相應(yīng)的結(jié)構(gòu)化依賴，構(gòu)建適合產(chǎn)業(yè)化的基礎(chǔ)模型，通過有效融合通用知識和時序數(shù)據(jù)或表格數(shù)據(jù)中的領(lǐng)域知識，更有效地解決產(chǎn)業(yè)中的預(yù)測、分類等任務(wù)。

從傳統(tǒng)人工智能的產(chǎn)業(yè)解決方案到融合通用與領(lǐng)域知識的產(chǎn)業(yè)基礎(chǔ)模型。

另一個我們目前正在著重探索的方向：利用基礎(chǔ)模型已具備的強大的生成、泛化和遷移能力，提高產(chǎn)業(yè)決策的質(zhì)量和效率。在這方面，我們在探索兩種路徑，一是將基礎(chǔ)模型作為一個智能體，二是讓基礎(chǔ)模型輔助強化學(xué)習(xí)智能體。

將基礎(chǔ)模型作為一個智能體：我們可以利用基礎(chǔ)模型的先驗知識，結(jié)合離線強化學(xué)習(xí)（Offline Reinforcement Learning），通過持續(xù)收集新的領(lǐng)域知識并不斷微調(diào)，促進(jìn)智能體的進(jìn)化，提高作為智能體的基礎(chǔ)模型的優(yōu)化決策能力，使其能更專注于處理產(chǎn)業(yè)領(lǐng)域內(nèi)的任務(wù)。

協(xié)同基礎(chǔ)模型與離線強化學(xué)習(xí)構(gòu)建決策智能體。

經(jīng)過優(yōu)化的基礎(chǔ)模型可以在多種產(chǎn)業(yè)場景中發(fā)揮作用。例如，在方程式賽車中，該基礎(chǔ)模型能夠優(yōu)化賽車的輪胎維修策略，根據(jù)賽車輪胎的損耗和維修成本，找到最佳的進(jìn)站維修時間，以縮短賽程、提高賽車排名；在化工企業(yè)的產(chǎn)品調(diào)度中，利用這一基礎(chǔ)模型可以大幅提高產(chǎn)品存儲與生產(chǎn)過程中管線協(xié)同的效率，從而提升生產(chǎn)執(zhí)行效率；另外，基于基礎(chǔ)模型的泛化能力與魯棒性，還可以將其快速遷移至空調(diào)控制優(yōu)化的場景中，在保證舒適溫度的同時實現(xiàn)能耗最小化。

使用基礎(chǔ)模型輔助強化學(xué)習(xí)智能體：我們可以讓模型學(xué)習(xí)通用表示，在不同的環(huán)境和任務(wù)中快速適應(yīng)，從而提升泛化能力。在這一方法中，我們引入了預(yù)訓(xùn)練世界模型（Pretrained World Model），它可以模擬人類的學(xué)習(xí)和決策過程，增強產(chǎn)業(yè)決策的效果。通過利用具有廣泛知識的預(yù)訓(xùn)練世界模型，并采用兩階段預(yù)訓(xùn)練框架，開發(fā)者能夠更全面和靈活地訓(xùn)練基礎(chǔ)模型進(jìn)行產(chǎn)業(yè)決策，并將其擴展到任何特定的決策場景。

我們與微軟Xbox團(tuán)隊合作，在游戲測試的場景中驗證了這個框架的有效性。我們利用該框架針對游戲地圖預(yù)訓(xùn)練了世界模型，解決了在新游戲場景中利用地標(biāo)觀察進(jìn)行長期空間推理或?qū)Ш降膯栴}。該預(yù)訓(xùn)練模型明顯優(yōu)于沒有世界模型或使用傳統(tǒng)學(xué)習(xí)方法的模型，極大地提高了游戲探索的效率。

此外，我們還可以使用領(lǐng)域內(nèi)專有的基礎(chǔ)數(shù)據(jù)和所蘊含的特定語義信息，打造領(lǐng)域內(nèi)的基礎(chǔ)模型，為智能可交互的決策和模擬開拓新的可能性。比如，我們可以基于金融市場交易訂單數(shù)據(jù)構(gòu)建金融投資基礎(chǔ)模型，這些基礎(chǔ)數(shù)據(jù)是包含豐富語義結(jié)構(gòu)和信息的交易訂單，而不是純文本字符�；谶@一金融基礎(chǔ)模型，我們可以實現(xiàn)針對不同市場風(fēng)格的訂單流生成，模擬不同市場環(huán)境下的大規(guī)模訂單交易，實現(xiàn)對金融投資市場的可控模擬，從而更好地理解市場變化的規(guī)律，探索應(yīng)對極端場景的策略。

基于金融基礎(chǔ)模型實現(xiàn)針對不同市場風(fēng)格的訂單流生成，從而模擬多樣的市場環(huán)境。

基礎(chǔ)模型引領(lǐng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的下一波浪潮

很早之前，微軟亞洲研究院就已經(jīng)意識到人工智能在產(chǎn)業(yè)界的廣泛應(yīng)用需要新的技術(shù)探索、嘗試和突破，通過跟來自不同產(chǎn)業(yè)的合作伙伴合作，我們陸續(xù)研發(fā)出Qlib人工智能量化投資平臺、MARO多智能體資源優(yōu)化平臺、FOST時空預(yù)測工具、BatteryML電池性能分析與預(yù)測平臺等開源模型。這些面向產(chǎn)業(yè)的人工智能平臺、工具和模型，不僅在工業(yè)界發(fā)揮了重要作用，也為目前基礎(chǔ)模型的產(chǎn)業(yè)落地提供了重要的數(shù)據(jù)和工具基矗

借鑒成功的人工智能產(chǎn)業(yè)化經(jīng)驗，我們已經(jīng)開始從前文介紹的幾個維度深入探索面向工業(yè)領(lǐng)域的人工智能基礎(chǔ)模型及其應(yīng)用。我們發(fā)現(xiàn)，在這些突破傳統(tǒng)大模型認(rèn)知的維度上，基礎(chǔ)模型擁有巨大潛力，能夠深刻促進(jìn)產(chǎn)業(yè)變革。

可以想象，未來基礎(chǔ)模型將能夠幫助產(chǎn)業(yè)界實現(xiàn)行業(yè)內(nèi)的知識自動管理、自動提娶自動迭代。在此之外，我們也在探索基礎(chǔ)模型幫助企業(yè)實現(xiàn)自動研發(fā)，包括研發(fā)方向的自動發(fā)掘、算法研究方案的自動生成、研發(fā)過程和科學(xué)實驗的自動生成和執(zhí)行，以及研究思路的自動迭代。換言之，人工智能將能夠自主進(jìn)行數(shù)據(jù)驅(qū)動的產(chǎn)業(yè)化研發(fā)，這將深刻改變產(chǎn)業(yè)界的運作模式。

研發(fā)智能體：自動演進(jìn)以工業(yè)數(shù)據(jù)為中心的研發(fā)周期。

基礎(chǔ)模型將是繼互聯(lián)網(wǎng)和云計算之后，加速產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的新動力，并將帶來新一波的產(chǎn)業(yè)創(chuàng)新爆發(fā)。我們期待與更多產(chǎn)業(yè)界的合作伙伴一起，深入真實場景，探索基礎(chǔ)模型在產(chǎn)業(yè)領(lǐng)域應(yīng)用的更多可能性，充分釋放基礎(chǔ)模型的商業(yè)價值。

相關(guān)模型開源鏈接：

Qlib：https://www.msra.cn/zh-cn/news/features/qlib-2

MARO：https://github.com/microsoft/maro

FOST：https://github.com/microsoft/FOST

BatteryML：https://github.com/microsoft/BatteryML

2023年是微軟亞洲研究院建院25周年。借此機會，該院特別策劃了“智啟未來”系列文章，邀請到微軟亞洲研究院不同研究領(lǐng)域的領(lǐng)軍人物，以署名文章的形式分享他們對人工智能、計算機及其交叉學(xué)科領(lǐng)域的觀點洞察及前沿展望。本文為該院授權(quán)澎湃科技獨家首發(fā)。作者邊江，現(xiàn)任微軟亞洲研究院資深首席研究員、微軟亞洲研究院機器學(xué)習(xí)組和產(chǎn)業(yè)創(chuàng)新中心負(fù)責(zé)人。