展會信息港展會大全

吳恩達(dá)最新演講:AI智能代理工作流的趨勢(觀點解讀與演講全文)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-04-10 14:28:08   瀏覽:6434次  

導(dǎo)讀:在紅杉資本AI峰會第三期,吳恩達(dá)教授分享了對智能體工作流的看法。在本次演講中,他談到了AI agentic workflow,也就是智能體工作流的迭代模式,以及基于人工評估基準(zhǔn)測試的效果分析,還談到了自己對于AI智能體設(shè)計模式的四種分類,包括反思、工具使用、規(guī)劃...

在紅杉資本AI峰會第三期,吳恩達(dá)教授分享了對智能體工作流的看法。在本次演講中,他談到了AI agentic workflow,也就是智能體工作流的迭代模式,以及基于人工評估基準(zhǔn)測試的效果分析,還談到了自己對于AI智能體設(shè)計模式的四種分類,包括反思、工具使用、規(guī)劃、多智能體協(xié)作。與此同時,吳恩達(dá)還分享了它對AI智能體的未來發(fā)展?jié)摿Φ恼雇?/p>

吳恩達(dá)指出,隨著AI技術(shù)的發(fā)展,AI代理被視為一個能顯著提升軟件開發(fā)效率和質(zhì)量的工具。

他通過展示AI代理如何在主動型工作流中超越單獨(dú)模型的局限,以及多代理系統(tǒng)如何通過協(xié)作來解決復(fù)雜問題,強(qiáng)化了這一觀點。

他認(rèn)為,在未來,我們將看到AI代理在各種工作流程中發(fā)揮更大的作用,并且這些代理的性能和應(yīng)用范圍將不斷擴(kuò)大。

對此,人們需要學(xué)會重新設(shè)定與AI合作的期望,并充分利用AI代理快速迭代的優(yōu)勢。

吳恩達(dá)還預(yù)測了AI工作流程的擴(kuò)展,并討論了人類需要適應(yīng)與AI代理交互的新方式。

吳恩達(dá)介紹了 AI 智能代理工作流的四種設(shè)計模式:

反思(Reflection):LLM 檢查自己的工作,以提出改進(jìn)方法。工具使用(Tool use):LLM 擁有網(wǎng)絡(luò)搜索、代碼執(zhí)行或任何其他功能來幫助其收集信息、采取行動或處理數(shù)據(jù)。規(guī)劃(Planning):LLM 提出并執(zhí)行一個多步驟計劃來實現(xiàn)目標(biāo)(例如,撰寫論文大綱、進(jìn)行在線研究,然后撰寫草稿……)。多智能體協(xié)作(Multi-agent collaboration):多個 AI 智能代理一起工作,分配任務(wù)并討論和辯論想法,以提出比單個智能體更好的解決方案。

關(guān)鍵結(jié)論及其論據(jù)支撐:

結(jié)論 1: 主動型工作流中的AI代理可以產(chǎn)生比傳統(tǒng)工作流更好的結(jié)果。

論據(jù):

吳恩達(dá)個人實際操作時觀察到的效果出人意料。

GPT-3.5在主動型工作流中表現(xiàn)得甚至比GPT-4還好,盡管GPT-4在零次提示下有更高的成功率。

結(jié)論 2: 多代理協(xié)作是提高AI性能的有效策略。

論據(jù):

設(shè)計模式包括代碼代理和批判代理的合作,這種模式易于實施且通用。

實驗顯示多代理通過協(xié)作編寫代碼、測試和迭代可以生成復(fù)雜的程序。

結(jié)論 3: AI代理的運(yùn)用將擴(kuò)大人工智能可執(zhí)行任務(wù)的范圍。

論據(jù):

吳恩達(dá)期待由于代理工作流程的存在,今年AI能完成的任務(wù)集會大幅拓展。

已經(jīng)存在的不同設(shè)計模式(反思、工具使用、規(guī)劃和多代理協(xié)作)表明,AI代理的應(yīng)用正變得越來越精細(xì)和廣泛。

結(jié)論 4: 快速迭代在AI代理的使用中是關(guān)鍵,甚至可能比慢速迭代的更高質(zhì)量模型結(jié)果更好。

論據(jù):

LLM快速生成Token對于多代理工作流程至關(guān)重要,因為需要不斷迭代。

即使是質(zhì)量較低的LLM,只要迭代速度足夠快,也可能產(chǎn)生比慢速生成Token的更高質(zhì)量模型更好的結(jié)果。

結(jié)論 5: 人們需要適應(yīng)耐心等待AI代理完成任務(wù)的方式。

論據(jù):

目前人們習(xí)慣于搜索引擎式的即時回應(yīng),但與AI代理的合作需要時間來產(chǎn)生最佳結(jié)果。

這種適應(yīng)是提高與AI代理合作效率的必要步驟。

下面是演講全文:

《Agentic Reasoning》

我很期待與大家分享我對AI代理的看法,這是一個我認(rèn)為所有從事AI開發(fā)的人都應(yīng)該關(guān)注的令人興奮的趨勢,同時我也對其他的內(nèi)容感到興奮。

接下來的演示會是怎樣呢?現(xiàn)在我們大多數(shù)人使用AI代理的方式就像一個小企業(yè)那樣,帶著一種非主動性的工作流程,你輸入一個問題它就生成答案。這有點像你讓一個人寫一篇論文,然后說“請坐到鍵盤前,從頭到尾打出這篇論文,而且不許用退格鍵”。

盡管這很難,但LLM實際上做得相當(dāng)好。相比之下,在主動型工作流中,情況可能是這樣的:AI會說,“寫一個論文提綱。你自己需要做進(jìn)一步的調(diào)研嗎?那我們開始吧。然后寫第一稿,再讀你自己的第一稿,考慮哪些部分需要修改,然后修改你的草稿,如此反復(fù)。”

這種工作流程更加迭代,你可能需要AI做一些思考,然后修改文章,再做一些思考,這個過程重復(fù)多次。而許多人沒有意識到的是,這實際上能得到顯著更好的結(jié)果。

我自己實際操作這些主動型工作流時,也非常驚訝它們的效果。

除非你想要一個案例研究,我的團(tuán)隊使用一種名為“人類智能基準(zhǔn)測試”的代碼標(biāo)準(zhǔn)來分析數(shù)據(jù),這個標(biāo)準(zhǔn)是由OpenAI幾年前發(fā)布的。

這里面包含了編碼問題,比如“給定一個非空整數(shù)列表,返回所有奇數(shù)元素或未偶數(shù)位置上的元素的總和”。結(jié)果是你的代碼片段就像這樣。

今天我們很多人會使用零次提示,意思是我們告訴AI“寫代碼”并讓它在第一部分運(yùn)行,比如誰調(diào)用了代碼,我知道人類不會那樣寫代碼,我們應(yīng)該把代碼打出來。也許你可以做到,但我做不到。事實證明,如果你使用GPT-3.5零次提示,它的成功率是48%,而GPT-4的表現(xiàn)則好得多,成功率達(dá)到67.7%。

但如果你采用一個主動型工作流環(huán)繞GPT-3.5,實際上它甚至比GPT-4做得還好。如果你將這種類型的工作流環(huán)繞在GPT-4周圍,它也表現(xiàn)得很好。

你會注意到,在主動型工作流中GPT-3.5實際上比GPT-4的表現(xiàn)更好。我認(rèn)為這意味著非常重要的后果,我認(rèn)為這將改變我們所有人構(gòu)建應(yīng)用程序的方法。所以“代理”這個術(shù)語被廣泛地討論,許多咨詢報告都在談?wù)揂I的未來等等。

我想更具體地與大家分享我觀察到的廣泛設(shè)計模式和代理。這是一個非;靵y、無序的領(lǐng)域,有大量的研究和開源項目。有很多事情正在發(fā)生,但我試圖將其歸類得更具體一些。經(jīng)歷了代理反思這個工具,我認(rèn)為我們中的許多人都在使用它,它確實有效。我認(rèn)為這是公認(rèn)的技術(shù)。當(dāng)我使用它們的時候,我?guī)缀蹩偰茏屗鼈冋9ぷ鳌?/p>

計劃和多代理協(xié)作,我認(rèn)為這些更是新興的內(nèi)容。當(dāng)我使用它們時,有時我會對它們的效果感到震驚。但至少在目前,我感覺我不能總是可靠地讓它們工作。

所以讓我通過幾張幻燈片來介紹這四種設(shè)計模式。如果你們中的一些人回去讓你們的工程師使用它們,我認(rèn)為你們很快就會獲得生產(chǎn)力的提升。

所以關(guān)于反思,這里有一個例子。假設(shè)我要求一個系統(tǒng),請為我編寫一個特定任務(wù)的代碼。然后我們有一個代碼代理,只是一個你提示編寫代碼的LLM,比如定義一個任務(wù)函數(shù)。

自我反思的一個例子是,如果你隨后用類似的提示向LLM提問,例如這里有一段代碼是為一個任務(wù)準(zhǔn)備的,然后將剛剛生成的完全相同的代碼反饋給它,并仔細(xì)檢查代碼的正確性和效率。

對他們來說,這是一個很好的建設(shè)性反潰結(jié)果表明,同一個LLM在你提示它編寫代碼后,可能會發(fā)現(xiàn)第五行的問題并修復(fù)它。如果你現(xiàn)在拿它自己的反饋提示它,它可能會生成一個第二版的代碼,可能比第一版的代碼工作得更好,雖然不能保證,但這足夠經(jīng)常發(fā)生,值得在很多應(yīng)用程序中嘗試。

為了預(yù)示即將使用的內(nèi)容。如果你讓它運(yùn)行單元測試,如果它沒通過單元測試,那你就問它為什么沒通過單元測試?

進(jìn)行這樣的對話。我們將找出為什么沒通過單元測試,所以嘗試改變一些東西,最終提出解決方案。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港