當(dāng)前位置：人工智能實驗室> 人物報道 > 吳恩達(dá)最新演講：AI智能代理工作流的趨勢（觀點解讀與演講全文）

吳恩達(dá)最新演講：AI智能代理工作流的趨勢（觀點解讀與演講全文）
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-04-10 14:28:08 瀏覽：6434次

導(dǎo)讀：在紅杉資本AI峰會第三期，吳恩達(dá)教授分享了對智能體工作流的看法。在本次演講中，他談到了AI agentic workflow，也就是智能體工作流的迭代模式，以及基于人工評估基準(zhǔn)測試的效果分析，還談到了自己對于AI智能體設(shè)計模式的四種分類，包括反思、工具使用、規(guī)劃...

在紅杉資本AI峰會第三期，吳恩達(dá)教授分享了對智能體工作流的看法。在本次演講中，他談到了AI agentic workflow，也就是智能體工作流的迭代模式，以及基于人工評估基準(zhǔn)測試的效果分析，還談到了自己對于AI智能體設(shè)計模式的四種分類，包括反思、工具使用、規(guī)劃、多智能體協(xié)作。與此同時，吳恩達(dá)還分享了它對AI智能體的未來發(fā)展?jié)摿Φ恼雇?/p>

吳恩達(dá)指出，隨著AI技術(shù)的發(fā)展，AI代理被視為一個能顯著提升軟件開發(fā)效率和質(zhì)量的工具。

他通過展示AI代理如何在主動型工作流中超越單獨(dú)模型的局限，以及多代理系統(tǒng)如何通過協(xié)作來解決復(fù)雜問題，強(qiáng)化了這一觀點。

他認(rèn)為，在未來，我們將看到AI代理在各種工作流程中發(fā)揮更大的作用，并且這些代理的性能和應(yīng)用范圍將不斷擴(kuò)大。

對此，人們需要學(xué)會重新設(shè)定與AI合作的期望，并充分利用AI代理快速迭代的優(yōu)勢。

吳恩達(dá)還預(yù)測了AI工作流程的擴(kuò)展，并討論了人類需要適應(yīng)與AI代理交互的新方式。

吳恩達(dá)介紹了 AI 智能代理工作流的四種設(shè)計模式：

反思（Reflection）：LLM 檢查自己的工作，以提出改進(jìn)方法。工具使用（Tool use）：LLM 擁有網(wǎng)絡(luò)搜索、代碼執(zhí)行或任何其他功能來幫助其收集信息、采取行動或處理數(shù)據(jù)。規(guī)劃（Planning）：LLM 提出并執(zhí)行一個多步驟計劃來實現(xiàn)目標(biāo)（例如，撰寫論文大綱、進(jìn)行在線研究，然后撰寫草稿……）。多智能體協(xié)作（Multi-agent collaboration）：多個 AI 智能代理一起工作，分配任務(wù)并討論和辯論想法，以提出比單個智能體更好的解決方案。

關(guān)鍵結(jié)論及其論據(jù)支撐：

結(jié)論 1: 主動型工作流中的AI代理可以產(chǎn)生比傳統(tǒng)工作流更好的結(jié)果。

論據(jù):

吳恩達(dá)個人實際操作時觀察到的效果出人意料。

GPT-3.5在主動型工作流中表現(xiàn)得甚至比GPT-4還好，盡管GPT-4在零次提示下有更高的成功率。

結(jié)論 2: 多代理協(xié)作是提高AI性能的有效策略。

論據(jù):

設(shè)計模式包括代碼代理和批判代理的合作，這種模式易于實施且通用。

實驗顯示多代理通過協(xié)作編寫代碼、測試和迭代可以生成復(fù)雜的程序。

結(jié)論 3: AI代理的運(yùn)用將擴(kuò)大人工智能可執(zhí)行任務(wù)的范圍。

論據(jù):

吳恩達(dá)期待由于代理工作流程的存在，今年AI能完成的任務(wù)集會大幅拓展。

已經(jīng)存在的不同設(shè)計模式（反思、工具使用、規(guī)劃和多代理協(xié)作）表明，AI代理的應(yīng)用正變得越來越精細(xì)和廣泛。

結(jié)論 4: 快速迭代在AI代理的使用中是關(guān)鍵，甚至可能比慢速迭代的更高質(zhì)量模型結(jié)果更好。

論據(jù):

LLM快速生成Token對于多代理工作流程至關(guān)重要，因為需要不斷迭代。

即使是質(zhì)量較低的LLM，只要迭代速度足夠快，也可能產(chǎn)生比慢速生成Token的更高質(zhì)量模型更好的結(jié)果。

結(jié)論 5: 人們需要適應(yīng)耐心等待AI代理完成任務(wù)的方式。

論據(jù):

目前人們習(xí)慣于搜索引擎式的即時回應(yīng)，但與AI代理的合作需要時間來產(chǎn)生最佳結(jié)果。

這種適應(yīng)是提高與AI代理合作效率的必要步驟。

下面是演講全文：

《Agentic Reasoning》

我很期待與大家分享我對AI代理的看法，這是一個我認(rèn)為所有從事AI開發(fā)的人都應(yīng)該關(guān)注的令人興奮的趨勢，同時我也對其他的內(nèi)容感到興奮。

接下來的演示會是怎樣呢？現(xiàn)在我們大多數(shù)人使用AI代理的方式就像一個小企業(yè)那樣，帶著一種非主動性的工作流程，你輸入一個問題它就生成答案。這有點像你讓一個人寫一篇論文，然后說“請坐到鍵盤前，從頭到尾打出這篇論文，而且不許用退格鍵”。

盡管這很難，但LLM實際上做得相當(dāng)好。相比之下，在主動型工作流中，情況可能是這樣的：AI會說，“寫一個論文提綱。你自己需要做進(jìn)一步的調(diào)研嗎？那我們開始吧。然后寫第一稿，再讀你自己的第一稿，考慮哪些部分需要修改，然后修改你的草稿，如此反復(fù)。”

這種工作流程更加迭代，你可能需要AI做一些思考，然后修改文章，再做一些思考，這個過程重復(fù)多次。而許多人沒有意識到的是，這實際上能得到顯著更好的結(jié)果。

我自己實際操作這些主動型工作流時，也非常驚訝它們的效果。

除非你想要一個案例研究，我的團(tuán)隊使用一種名為“人類智能基準(zhǔn)測試”的代碼標(biāo)準(zhǔn)來分析數(shù)據(jù)，這個標(biāo)準(zhǔn)是由OpenAI幾年前發(fā)布的。

這里面包含了編碼問題，比如“給定一個非空整數(shù)列表，返回所有奇數(shù)元素或未偶數(shù)位置上的元素的總和”。結(jié)果是你的代碼片段就像這樣。

今天我們很多人會使用零次提示，意思是我們告訴AI“寫代碼”并讓它在第一部分運(yùn)行，比如誰調(diào)用了代碼，我知道人類不會那樣寫代碼，我們應(yīng)該把代碼打出來。也許你可以做到，但我做不到。事實證明，如果你使用GPT-3.5零次提示，它的成功率是48%，而GPT-4的表現(xiàn)則好得多，成功率達(dá)到67.7%。

但如果你采用一個主動型工作流環(huán)繞GPT-3.5，實際上它甚至比GPT-4做得還好。如果你將這種類型的工作流環(huán)繞在GPT-4周圍，它也表現(xiàn)得很好。

你會注意到，在主動型工作流中GPT-3.5實際上比GPT-4的表現(xiàn)更好。我認(rèn)為這意味著非常重要的后果，我認(rèn)為這將改變我們所有人構(gòu)建應(yīng)用程序的方法。所以“代理”這個術(shù)語被廣泛地討論，許多咨詢報告都在談?wù)揂I的未來等等。

我想更具體地與大家分享我觀察到的廣泛設(shè)計模式和代理。這是一個非�；靵y、無序的領(lǐng)域，有大量的研究和開源項目。有很多事情正在發(fā)生，但我試圖將其歸類得更具體一些。經(jīng)歷了代理反思這個工具，我認(rèn)為我們中的許多人都在使用它，它確實有效。我認(rèn)為這是公認(rèn)的技術(shù)。當(dāng)我使用它們的時候，我?guī)缀蹩偰茏屗鼈冋９ぷ鳌?/p>

計劃和多代理協(xié)作，我認(rèn)為這些更是新興的內(nèi)容。當(dāng)我使用它們時，有時我會對它們的效果感到震驚。但至少在目前，我感覺我不能總是可靠地讓它們工作。

所以讓我通過幾張幻燈片來介紹這四種設(shè)計模式。如果你們中的一些人回去讓你們的工程師使用它們，我認(rèn)為你們很快就會獲得生產(chǎn)力的提升。

所以關(guān)于反思，這里有一個例子。假設(shè)我要求一個系統(tǒng)，請為我編寫一個特定任務(wù)的代碼。然后我們有一個代碼代理，只是一個你提示編寫代碼的LLM，比如定義一個任務(wù)函數(shù)。

自我反思的一個例子是，如果你隨后用類似的提示向LLM提問，例如這里有一段代碼是為一個任務(wù)準(zhǔn)備的，然后將剛剛生成的完全相同的代碼反饋給它，并仔細(xì)檢查代碼的正確性和效率。

對他們來說，這是一個很好的建設(shè)性反潰結(jié)果表明，同一個LLM在你提示它編寫代碼后，可能會發(fā)現(xiàn)第五行的問題并修復(fù)它。如果你現(xiàn)在拿它自己的反饋提示它，它可能會生成一個第二版的代碼，可能比第一版的代碼工作得更好，雖然不能保證，但這足夠經(jīng)常發(fā)生，值得在很多應(yīng)用程序中嘗試。