展會信息港展會大全

哈工大聯(lián)合快手提出CogGPT:大模型也需要認知迭代
來源:互聯(lián)網   發(fā)布日期:2024-01-29 16:05:00   瀏覽:3580次  

導讀:機器之心專欄 機器之心編輯部 在認知科學領域,人類通過持續(xù)學習改變認知的過程被稱為認知迭代(Cognitive Dynamics)。形象地說,認知迭代就像是我們大腦的「軟件更新」過程,手機應用通過不斷的更新來修復 bug 和增加新功能,我們的大腦也通過不斷學習新知...

機器之心專欄

機器之心編輯部

在認知科學領域,人類通過持續(xù)學習改變認知的過程被稱為認知迭代(Cognitive Dynamics)。形象地說,認知迭代就像是我們大腦的「軟件更新」過程,手機應用通過不斷的更新來修復 bug 和增加新功能,我們的大腦也通過不斷學習新知識、經驗,來改善和優(yōu)化思考方式。

從我們判斷感冒吃什么藥效果好,到一代代數(shù)學家如何證明費馬大定理,無論是個人的心智發(fā)展還是人類文明的進步,認知迭代都扮演了不可或缺的角色。

如今,像 GPT-4 等大型語言模型(Large Language Models,LLMs)為通用人工智能(Artificial General Intelligence,AGI)的發(fā)展帶來希望的同時,也暴露出一個顯著的問題 認知固化。比如,對于經典問題「宇宙的中心在哪里」,不同時代的人會基于當時的信息給出不同的回答,但對于大模型,它們的參數(shù)在訓練完成后就固定下來了,這時候的大模型就像是一個不能升級的老舊軟件,不能再學習新的信息。

雖然我們可以通過 in-context learning 的方式,通過為大模型設定特定的認知背景來模擬相應回答,但這種認知迭代不是自驅的,也不能適應的未知信息環(huán)境。這就引出了一個問題:怎么才能讓大模型和人類一樣,根據(jù)不斷變化的信息實現(xiàn)自驅的認知迭代呢?

值得慶幸的是,這個問題已經有了初步的答案,哈爾濱工業(yè)大學與快手科技的研究團隊率先提出了大型語言模型的認知迭代(the cognitive dynamics of LLMs)的概念。不僅如此,為了系統(tǒng)建模這個概念,他們給出了形式化的任務定義和相關基準 CogBench,并提出了 CogGPT,一個顯式建模大型語言模型的認知迭代的 LLM-driven Agent。這就意味著,基于這個研究,以后的大型語言模型將不再是簡單的信息處理工具,而可以進一步模擬人類的思考方式,實現(xiàn)終身學習。

論文鏈接:https://arxiv.org/abs/2401.08438

項目主頁:https://github.com/KwaiKEG/CogGPT

從論文中可以看到,這個任務仿照心理學領域中的縱向研究,對大模型進行持續(xù)性的「心理測試」。具體來說,這個任務首先通過動態(tài)信息流建立了持續(xù)變化的信息環(huán)境,然后為大模型設定了初始人設,通過定期要求它們填寫相同的認知問卷,觀察這些模型在持續(xù)接收信息過程中,它們的認知是如何發(fā)生變化的。

基于這個任務,研究團隊還提出了基準 CogBench,根據(jù)信息流的類型,可以分為基于長文章的 CogBench_a 和基于短視頻的 CogBench_v,同時設立了真實性(Authenticity)和合理性(Rationality)兩個關鍵評估指標,分別用于衡量模型與人類評分的一致性,以及評分理由的合理性,進而豐富了大型語言模型的認知迭代分析方法。

由于現(xiàn)有大模型無法實現(xiàn)參數(shù)的實時更新,研究團隊設計了 CogGPT,一個具有迭代認知機制的 LLM-driven agent。該機制包括一個記憶保持系統(tǒng)(Memory Retention System),用于蒸餾、存儲和檢索信息,以及一個協(xié)作優(yōu)化框架(Collaborative Refinement Framework),用于自驅地完成自我認知迭代。

比如下面這個例子,CogGPT 扮演的是一個喜歡手工的人,她一開始對紋身并不了解,因此對「紋身是對美的追求」這一觀點保持代表中立的 3 分,在「看過」紋身會對身體造成傷害」和「自制香水紋身貼教程」的一系列短視頻后,她認為紋身對身體有傷害,而且不應該是美的唯一標準,將自己對這一觀點的看法從中立的 3 分改變?yōu)椴煌獾?2 分,同時也對自制紋身貼產生了興趣,從而展現(xiàn)出了像人一樣的認知迭代能力。

研究團隊還對 CogGPT 和一些通用基線在 CogBench 上做了充分實驗。實驗結果表明,在 CogBench_a 和 CogBench_v 兩個基準上,CogGPT 在真實性(Authenticity)和合理性(Rationality)這兩個核心評估指標上的表現(xiàn)都遠超現(xiàn)有方法,這也進一步證明了 CogGPT 可以有效地模仿特定人設的認知迭代過程。

如果智能系統(tǒng)可以像人類一樣持續(xù)學習,將會給我們的生活帶來革命性的變化,到時候,私人助理將能夠提供更高效的定制化服務,網上沖浪也可能不再是人類獨有的樂趣。盡管這項研究還處于起步階段,但它已經向我們揭示了一個充滿可能性的未來。

值得注意的是,該團隊不久前還開源了 KwaiAgents 系統(tǒng),提升了 7B/13B 大語言模型的 Agents 相關能力,自從發(fā)布以來已經在 Github 上獲得了 800+star(https://github.com/KwaiKEG/KwaiAgents)。

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港