展會(huì)信息港展會(huì)大全

審視AI Agent:追捧、落地,和2024年的To B破局點(diǎn)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-27 09:12:46   瀏覽:11168次  

導(dǎo)讀:圖片來源@視覺中國 文 | 產(chǎn)業(yè)家,作者 | 斗斗 ,編輯 | 皮爺 今年4月份,斯坦福和谷歌的研究者共同創(chuàng)建了一個(gè)西部世界小鎮(zhèn)(Westworldsimulation),在這個(gè)小鎮(zhèn)里,25個(gè)智能體可執(zhí)行類似人類的日常行為,比如起床后做早餐然后去上班,藝術(shù)家作畫,作家寫作。...

圖片來源@視覺中國

文 | 產(chǎn)業(yè)家,作者 | 斗斗 ,編輯 | 皮爺

今年4月份,斯坦福和谷歌的研究者共同創(chuàng)建了一個(gè)“西部世界小鎮(zhèn)(Westworldsimulation)”,在這個(gè)小鎮(zhèn)里,25個(gè)智能體可執(zhí)行類似人類的日常行為,比如起床后做早餐然后去上班,藝術(shù)家作畫,作家寫作。

這些就是如今人們共同談?wù)摰?ldquo;AI Agent實(shí)驗(yàn)”。而在國內(nèi)的今年下半年,大模型市場的玩家們,似乎正齊刷刷地轉(zhuǎn)向AI Agent這個(gè)清晰可見的AGI終局產(chǎn)品。

一組數(shù)據(jù)顯示,截止11月中旬,AI Agent賽道發(fā)生融資事件13起,總?cè)谫Y金額約735億人民幣,公司融資均值為56.54億人民幣。

而在國外,這一領(lǐng)域亦是火爆。“至少有100個(gè)項(xiàng)目正致力于將AI代理商業(yè)化,近10萬名開發(fā)人員正在構(gòu)建自主Agent。”外媒MattSchlicht曾表示。

AI Agent為何如此火爆?

關(guān)于AI Agent的想象力,一個(gè)高贊回答是:“大語言模型只能編個(gè)貪吃蛇,而AI Agent可以整出一個(gè)王者榮耀。”

成熟的AI Agent可以使軟件生產(chǎn)大幅降低成本。未來Coding工作流中會(huì)很多Agent臨時(shí)寫成的軟件和測試方案,不追求長期的可復(fù)用性,可以隨用隨拋。目前一家軟件行業(yè)巨頭動(dòng)輒上萬甚至十萬人,有了AI Agent之后研發(fā)、交付需要耗費(fèi)的人力和資金將大幅降低。而且使得軟件可以靈活地解決更多長尾需求。

此外,AI Agent或?qū)長LM搭建一套框架來進(jìn)行深度思考和分析,從而做出更復(fù)雜和可靠的決策。

總之,就像微軟創(chuàng)始人比爾蓋茨所說的那樣:“誰能主宰個(gè)人助理Agent,那才是大事。因?yàn)槟銓⒂肋h(yuǎn)不去搜索網(wǎng)站,不去生產(chǎn)力網(wǎng)站,不去亞馬遜。”

值得注意的是,在這種巨大的技術(shù)變革下,目前我們?nèi)詻]有切身體會(huì)到AI Agent所帶來的紅利和變化。很明顯,AI Agent的發(fā)展仍面臨一些難題。

一些值得探討的問題是,國內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何?AI Agent落地的關(guān)鍵點(diǎn)是什么?以及AI Agent未來是怎樣的?

AI Agent現(xiàn)狀,海外VS本土

目前,國內(nèi)一些科技公司已經(jīng)產(chǎn)出了數(shù)個(gè)知名大模型,因此孕育而生的Agent智能體應(yīng)用也開始逐漸進(jìn)入大眾視野。

例如百度將文心大模型應(yīng)用到智能搜索、自動(dòng)駕駛;阿里將通義千問模型應(yīng)用到高德地圖、優(yōu)酷,盒馬等產(chǎn)品。華為將其盤古模型應(yīng)用到智能氣象、語音識別等。

一家叫面壁智能的創(chuàng)業(yè)也公司推出了他們的AI Agent產(chǎn)品ChatDev,可以在短時(shí)間內(nèi)完成一個(gè)軟件或者一個(gè)小游戲的開發(fā),用戶所需要做的,只是提供給它一個(gè)要求。

值得注意的是,協(xié)同辦公領(lǐng)域似乎是巨頭們做AI Agent的“必經(jīng)之地”。

例如釘釘魔法棒套件中,從聊天AI、文檔AI、會(huì)議AI、宜搭A(yù)I、TeambitionAI等都匯集了釘釘AI產(chǎn)品能力;騰訊會(huì)議中的“會(huì)議助理”功能提供了一些智能化的支持,如自動(dòng)總結(jié)會(huì)議紀(jì)要、轉(zhuǎn)錄和翻譯;百度推出的智能工作平臺(tái)如流搭載了文心大模型,可以實(shí)現(xiàn)智能創(chuàng)作、智能推薦等功能;字節(jié)跳動(dòng)旗下的辦公軟件飛書宣布推出智能AI助手“MyAI”,旨在提升團(tuán)隊(duì)協(xié)作效率。

曾有投資人對媒體調(diào)侃:“十個(gè)AI應(yīng)用里面,五個(gè)辦公Agent,三個(gè)AIGC,還有兩成是回春的數(shù)字人。”這不僅是國內(nèi)AI Agent發(fā)展的現(xiàn)狀,其實(shí)從國外一些諸如谷歌、微軟等企業(yè)也在將AI Agent落于協(xié)同辦公場景。

其實(shí)在海外,AI Agent概念從出現(xiàn)到爆發(fā),已經(jīng)邁過多個(gè)階段。

單一Agent階段,主要是針對不同領(lǐng)域和場景的特定任務(wù),開發(fā)和部署專門的智能體。以GPTengineer為例,給它一個(gè)需求,其就可以把代碼寫個(gè)大概。

而多Agent合作階段,是由不同角色的Agent自動(dòng)合作完成復(fù)雜的任務(wù)。例如在MetaGPT上,如果讓其做一個(gè)股票分析的工具,它會(huì)把這個(gè)任務(wù)分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理等5個(gè)角色,模擬整個(gè)的軟件開發(fā)中所有決策工作流。

不過,隨著微軟全新工具AutoGen的發(fā)布,AI Agent很快翻開了新的篇章。

AutoGen允許多個(gè)LLM智能體通過聊天來解決任務(wù)。LLM智能體可以扮演各種角色,如程序員、設(shè)計(jì)師,或者是各種角色的組合,對話過程就把任務(wù)解決了。這與MetaGPT不同,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發(fā)者自己定義Agent,還可以讓他們相互對話。

這是一個(gè)新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個(gè)星期內(nèi),星標(biāo)量從390狂增到10K,并在Discord上吸引了5000多名成員。

微軟在AI Agent的布局較早。2023年3月Microsoft365Copilot發(fā)布,在當(dāng)時(shí)便提示了一種基于LLM的應(yīng)用開發(fā)范式,即Agent。目前,微軟CopilotStudio已經(jīng)支持自定義ChatGPT助手無縫集成在CRM、ERP、OA等日常辦公系統(tǒng)中。

可以發(fā)現(xiàn)微軟的AI Agent能力主要是從其本身業(yè)務(wù)衍生出來的,AutoGen更像是一種自身基于業(yè)務(wù)所打造的能力的外放,這與OpenAI并不相同。

OpenAI開發(fā)的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,使得每個(gè)人都可以打造自己的大模型應(yīng)用。諸多業(yè)內(nèi)人士認(rèn)為,超低的創(chuàng)建門檻和APP Store一樣的商業(yè)模型,會(huì)讓OpenAI快速構(gòu)建GPTs生態(tài)。

OpenAI提供的是基礎(chǔ)Agent的構(gòu)建能力,如工具調(diào)用、基于知識庫文件記憶能力等。這項(xiàng)產(chǎn)品的發(fā)布,使得AI Agent進(jìn)入了另外一個(gè)新階段,即為人人都可以打造自己的Agent提供了一種可能性。

值得注意的是,目前海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務(wù)、人力資源、金融、制造業(yè)等多個(gè)領(lǐng)域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品。

例如零售領(lǐng)域的亞馬遜Alexa、Aktify、Regie.ai等;房地產(chǎn)領(lǐng)域的Epique、propertypen、Listingcopy等;客戶服務(wù)領(lǐng)域的Agent4、Ebi.Ai、JasonAI、Aide等;人力資源領(lǐng)域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。

總體來看,在AI Agent在底層技術(shù)、架構(gòu)以及具體產(chǎn)品應(yīng)用等方面都較為完善。像OpenAI、微軟、谷歌這類科技巨頭,有著先發(fā)優(yōu)勢。另一個(gè)可以看到的現(xiàn)象是,國內(nèi)AI Agent的深度與廣度仍有所差距。

一個(gè)值得思考的問題是,Agent落地的關(guān)鍵是什么?

Agent落地的關(guān)鍵:模型?行業(yè)經(jīng)驗(yàn)?還是載體?

當(dāng)前市場上的大多數(shù)Agent,包括OpenAI推出的GPTs,其實(shí)只是構(gòu)建了一個(gè)基于特定知識庫或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進(jìn)行問答交互,如獲取行業(yè)資訊、報(bào)告等。

然而,在程序聯(lián)動(dòng)和操作方面還有很大的提升空間。目前,我們還無法直接使用GPTs來操作SAP或金蝶等ERP系統(tǒng),因?yàn)檫@涉及到API的應(yīng)用、授權(quán)、維護(hù)以及無API管理軟件的連接問題。

對于企業(yè)而言,如果GPTs等AI智能體僅用于知識問答,那么其作用將非常有限,就像一個(gè)玩具一樣,因?yàn)樗壳斑無法深入到企業(yè)的業(yè)務(wù)流程中。

這背后的原因有很多,包括模型能力、行業(yè)經(jīng)驗(yàn)、場景貼合度等,都會(huì)影響Agent的能力體現(xiàn)。

AI Agent需要具備感知環(huán)境、做出決策并執(zhí)行適當(dāng)行動(dòng)的能力。在這些關(guān)鍵步驟中,最重要的是理解輸入給Agent的內(nèi)容、進(jìn)行推理、規(guī)劃、做出準(zhǔn)確決策,并將其轉(zhuǎn)化為可執(zhí)行的原子動(dòng)作序列,以實(shí)現(xiàn)最終目標(biāo)。

目前,許多研究利用LLM作為AI Agent的認(rèn)知核心,這些模型的發(fā)展為完成這一步驟提供了質(zhì)量保證。因此,基于GPT-4的Agent表現(xiàn)得更加智能。

但就目前而言,包括GPT-4在內(nèi)的所有大模型,能力仍需提升。

“底座模型問題都還很大,AI Agent真正落地還要等更優(yōu)秀的模型。”某位身處大模型技術(shù)一線的業(yè)內(nèi)人士對產(chǎn)業(yè)家說。

不過針對模型能力不足這一問題,智譜AI&清華KEG提出了一種對齊Agent能力的微調(diào)方法AgentTuning,該方法使用少量數(shù)據(jù)微調(diào)已有模型,顯著激發(fā)了模型的Agent能力,同時(shí)可以保持模型原有的通用能力。

AI Agent的行業(yè)經(jīng)驗(yàn)對于其落地也至關(guān)重要。

“如果一篇論文提出了某種不同的訓(xùn)練方法,OpenAI內(nèi)部的Slack上會(huì)嗤之以鼻,因?yàn)檫@些都是我們玩剩下的。但是當(dāng)新的AI Agents論文出來的時(shí)候,我們才會(huì)認(rèn)真興奮的討論。”這是OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy最近發(fā)表的一段講話。

簡而言之,我們基于大模型能做出什么樣的東西,說到底還是要靠行業(yè)經(jīng)驗(yàn),而這恰是OpenAI等一眾大模型巨頭們所欠缺的。

要知道,企業(yè)要引入AI Agent進(jìn)行流程優(yōu)化,必須經(jīng)過成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評估。這就要求技術(shù)供應(yīng)商提供的必須是平臺(tái)級解決方案,而不是只針對單一、個(gè)別場景需求來提供的AI Agent自動(dòng)化解決方案。

大型企業(yè)引入新的AI技術(shù)不允許任何試錯(cuò)成本,因此技術(shù)供應(yīng)商給出的解決方案必須是開箱即用、具備行業(yè)Know-How術(shù)語和業(yè)務(wù)規(guī)則的真實(shí)智能體數(shù)字員工。也只有這樣的標(biāo)準(zhǔn)化AI Agent,才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。

例如,一個(gè)醫(yī)療行業(yè)的AI Agent需要具備醫(yī)學(xué)知識,并能夠理解和處理醫(yī)療數(shù)據(jù)。一個(gè)金融行業(yè)的AI Agent需要具備金融知識,并能夠理解和處理金融數(shù)據(jù)。

AI Agent的落地效果也受限于應(yīng)用場景。在如出行預(yù)訂中,得益于豐富的API等問題,AI Agent表現(xiàn)出色。而在如法律助手場景中,由于新知識的頻繁出現(xiàn)和API的不完善,實(shí)際應(yīng)用面臨更多挑戰(zhàn)。

這一點(diǎn),從國內(nèi)AI Agent紛紛生長于協(xié)同辦公平臺(tái)就可見一斑。

事實(shí)上,協(xié)同辦公平臺(tái)本身具備良好的API接口和插件體系,這使得將大模型集成到現(xiàn)有工具中變得更加容易。

此外,許多企業(yè)和組織都在使用協(xié)同辦公軟件,這意味著大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎(chǔ)可以加速大模型的迭代和優(yōu)化過程,使其更好地滿足用戶需求。

還有大量的數(shù)據(jù)資源助于提高模型的性能,豐富的場景也可以推動(dòng)大模型技術(shù)持續(xù)改進(jìn)。

釘釘、飛書和企業(yè)微信在作為Agent載體時(shí),也各自具有不同的優(yōu)勢。釘釘提供了完善的組織架構(gòu)管理功能,可以方便地創(chuàng)建、管理和調(diào)整團(tuán)隊(duì)架構(gòu),使得企業(yè)能夠快速搭建適應(yīng)其需求的組織結(jié)構(gòu)。

飛書強(qiáng)調(diào)實(shí)時(shí)協(xié)作和溝通,支持多人在線編輯文檔、共同討論等功能,有助于團(tuán)隊(duì)高效地完成協(xié)作任務(wù)。其特有的一體化,使得整個(gè)辦公流程更加標(biāo)準(zhǔn)化。

企業(yè)微信與微信互通,這使得其AI Agent有可能借助微信龐大的用戶數(shù)據(jù)和應(yīng)用場景,提供更加個(gè)性化和場景化的服務(wù)。

站在這個(gè)角度來看,國內(nèi)AI Agent扎堆協(xié)同辦公領(lǐng)域,則變得理所當(dāng)然。而找到一個(gè)適合AI Agent落地的場景或者說載體更為重要。

不過,除了協(xié)同辦公,還有許多其他載體可能更適合AI Agent的落地應(yīng)用。

例如智能客服、智能助手、RPA、CRM等。具體來看,在智能客服方面,AI Agent可以自動(dòng)回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的Siri、谷歌公司的GoogleAssistant和亞馬遜公司的Alexa都是智能助手的代表。

在智能流程自動(dòng)化方面,許多企業(yè)采用智能流程自動(dòng)化工具,如UiPath、BluePrism等,來自動(dòng)完成某些特定的業(yè)務(wù)流程。

在智能營銷方面,許多營銷平臺(tái)都集成了AI Agent,如HubSpot、Salesforce等。這些平臺(tái)的AI Agent可以通過數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),提供精準(zhǔn)的營銷建議和預(yù)測,幫助企業(yè)更好地了解客戶需求,提高銷售業(yè)績。

總而言之,模型能力是核心,行業(yè)經(jīng)驗(yàn)是關(guān)鍵,載體是保障。無論是模型能力還是行業(yè)經(jīng)驗(yàn)抑或是載體都是AI Agent落地的關(guān)鍵。值得注意的是,國內(nèi)的軟件業(yè)態(tài),倒逼國內(nèi)廠商造就了一身定制化、個(gè)性化能力,這種能力側(cè)面驗(yàn)證了國內(nèi)企業(yè)在技術(shù)落地上的潛力,這將會(huì)進(jìn)一步推動(dòng)Agent的落地。

AI Agent的終局是什么?

在文章開篇的“西部世界小鎮(zhèn)(Westworldsimulation)”里,這些智能體可以與別人和環(huán)境交流(互相注意到彼此舉動(dòng)、發(fā)起對話或者問候)、反思這些觀察結(jié)果(形成獨(dú)特的個(gè)人觀點(diǎn))、制定每天的計(jì)劃。他們擁有自己記憶和目標(biāo),會(huì)產(chǎn)生可信的個(gè)人和涌現(xiàn)的社交行為,而不是通過預(yù)先設(shè)計(jì)實(shí)現(xiàn)。

例如從用戶指定的單一任務(wù)開始,即一個(gè)AI Agent想要舉辦情人節(jié)聚會(huì),AI Agent們在接下來的時(shí)間里會(huì)自發(fā)的傳播邀請、認(rèn)識新朋友、互相約出參加聚會(huì)的日期,并協(xié)調(diào)在正確的時(shí)間一起出現(xiàn)在聚會(huì)上。

這是Agent項(xiàng)目里具有代表性的應(yīng)用。人們之所以為這個(gè)項(xiàng)目感到驚訝,是因?yàn)锳gent的交互出現(xiàn)了人類意料之外的現(xiàn)象。AI Agent爆發(fā)的一段時(shí)間,人們普遍認(rèn)為補(bǔ)齊了大模型短板的AI Agent更具備實(shí)用性,將是大模型重要落地方向。

隨著Agent的構(gòu)建越發(fā)簡單,Agent生態(tài)的成熟會(huì)讓C端Agent出現(xiàn)百花齊放的局面,面對用戶,Agent將會(huì)更加接地氣,引起新一輪的爆發(fā)。

但就目前而言,這一路徑的商業(yè)化存在諸多問題。拿游戲場景而言,目前收費(fèi)主要來源于出售游戲裝備、皮膚等方式。而AI Agent的價(jià)值無法體現(xiàn)在這些固有的變現(xiàn)途徑上。并且就目前Agent落地效果來看,未出現(xiàn)顛覆性的能力,C端用戶是否會(huì)為其買單無法得知。

更值得注意的是,隨著讓C端Agent百花齊放,其應(yīng)用價(jià)值方面也隨邊際效應(yīng)而無限趨向于更小量級。換言之,AI Agent能否成為AI大模型從C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向,還需時(shí)間驗(yàn)證。且即使未來會(huì)成為C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向,但其“壽命”并不長。

一個(gè)事實(shí)是,AI Agent最終的落腳點(diǎn)或?qū)⒃贐端。

比爾蓋茨認(rèn)為,智能體作為下一個(gè)平臺(tái),將會(huì)影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息并為用戶總結(jié)信息,能夠會(huì)為用戶找到最優(yōu)惠的價(jià)格,將取代搜索網(wǎng)站及電商網(wǎng)站,也將取代文字處理器、電子表格和其它生產(chǎn)力應(yīng)用程序。并且,現(xiàn)在各自獨(dú)立的搜索廣告、廣告社交網(wǎng)絡(luò)、購物、生產(chǎn)力軟件等,都將變成智能體這一項(xiàng)業(yè)務(wù)。Agent會(huì)徹底改變應(yīng)用軟件的打開方式。

這些變革來臨之前,相對于 Agent本身帶來的影響,如何構(gòu)建一個(gè)Agent,是一個(gè)更值得關(guān)注的問題。

Agent構(gòu)建平臺(tái)上,企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺(tái)構(gòu)建軟件為企業(yè)提供服務(wù)。

對于身處或準(zhǔn)備進(jìn)入AI Agent領(lǐng)域的玩家而言,找到切入點(diǎn)以及好的商業(yè)模式至關(guān)重要。

未來AI Agent的發(fā)展將不僅僅局限于單體智能,而是會(huì)擴(kuò)展到物的智能和機(jī)器人的聯(lián)動(dòng)。

從群體智能的角度來看,ToC可能會(huì)形成更大的社區(qū)化虛擬組織,每個(gè)人的Agent都能通過虛擬數(shù)據(jù)連接在一起;而ToB則可能形成虛擬的組織和企業(yè),不同的企業(yè)和員工都能通過智能體納入到網(wǎng)絡(luò)當(dāng)中。

最終,整個(gè)社會(huì)將變成一個(gè)巨大的虛實(shí)結(jié)合的網(wǎng)絡(luò),形成“智聯(lián)網(wǎng)”。在這個(gè)網(wǎng)絡(luò)中,不同的智能體將提供更強(qiáng)的生產(chǎn)力,重新塑造整個(gè)生產(chǎn)關(guān)系,從而提升整個(gè)社會(huì)的產(chǎn)能。

因此,AI Agent的發(fā)展前景非常廣闊,它們將不斷擴(kuò)展其應(yīng)用范圍和影響力,為未來的社會(huì)發(fā)展帶來巨大的變革和機(jī)遇。

時(shí)至今日,AI Agent雖然帶來了諸多想象力,卻仍舊存在諸多質(zhì)疑。技術(shù)發(fā)展之路本就充滿質(zhì)疑與批判,科技變革對于任何一個(gè)企業(yè)與個(gè)體都是一場機(jī)遇,關(guān)鍵在于如何把握它。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: 審視 Agent 追捧 落地 2024年 破局 圖片 來源

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港