當(dāng)前位置：人工智能實(shí)驗(yàn)室> 機(jī)器人 > 歷史與AI的距離：聊天機(jī)器人在歷史學(xué)科科研中的應(yīng)用

歷史與AI的距離：聊天機(jī)器人在歷史學(xué)科科研中的應(yīng)用
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-12 15:50:22 瀏覽：10065次

導(dǎo)讀：2022年11月30日，OpenAI公司的聊天機(jī)器人ChatGPT上線。半個(gè)月之后，就有在美國大學(xué)教書的友人說起ChatGPT引發(fā)了自己對(duì)工作的焦慮。2023年9月，《美國歷史評(píng)論》專門探討21世紀(jì)歷史研究新實(shí)踐的欄目的歷史實(shí)驗(yàn)室（History Lab）發(fā)表了一組題為《人工智能和歷...

2022年11月30日，OpenAI公司的聊天機(jī)器人ChatGPT上線。半個(gè)月之后，就有在美國大學(xué)教書的友人說起ChatGPT引發(fā)了自己對(duì)工作的焦慮。2023年9月，《美國歷史評(píng)論》專門探討21世紀(jì)歷史研究新實(shí)踐的欄目的“歷史實(shí)驗(yàn)室”（History Lab）發(fā)表了一組題為《人工智能和歷史實(shí)踐》的圓桌論文，及時(shí)回應(yīng)了美國同行對(duì)人工智能是什么以及能如何與歷史學(xué)進(jìn)行互動(dòng)的疑問。七篇文章關(guān)聯(lián)到了對(duì)歷史學(xué)研究者來說相對(duì)更熟悉的議題，比如“數(shù)字史學(xué)”，更多的則是一些相對(duì)新的名詞，比如“深度學(xué)習(xí)”“噪聲效應(yīng)”等等。

中文媒體對(duì)人工智能的興趣在2023年達(dá)到一個(gè)新高度。高等院校同樣如此。例如，2023年12月28日，美國羅文大學(xué)杰出教授王晴佳受復(fù)旦大學(xué)西方史學(xué)史團(tuán)隊(duì)邀請(qǐng)作了題為《數(shù)字化、人工智能和歷史學(xué)的未來》的講座，全面而深入地講述了人工智能對(duì)歷史研究的影響，讓筆者深受啟發(fā)。

在剛剛過去的龍年春節(jié)期間，OpenAI發(fā)布的文本到視頻轉(zhuǎn)換模型Sora展現(xiàn)的樣片又引發(fā)了一輪激烈的討論。無論用戶的要求是刻畫當(dāng)代時(shí)尚女性行走在東京商業(yè)區(qū)的情景，還是模擬淘金熱期間的加利福尼亞州的樣貌，Sora都能較為準(zhǔn)確乃至栩栩如生地實(shí)現(xiàn)。OpenAI甚至聲稱Sora能夠理解用戶輸入的內(nèi)容在物理世界中的存在方式，這使得以往的AI視頻生成工具相形見絀。

與此同時(shí)，谷歌在大模型信息處理能力的賽道持續(xù)發(fā)力，推出了Gemini 1.5 Pro。據(jù)稱它可以處理高達(dá)100萬個(gè)tokens的上下文窗口，差不多對(duì)應(yīng)一小時(shí)的視頻、11小時(shí)的音頻、超過30,000行代碼的代碼庫或超過700,000字的文本（約等于《伊利亞特》和《奧德賽》的文本量相加再翻一倍）。這些革新體現(xiàn)出人工智能（Artificial Intelligence）的計(jì)算能力在不斷以驚人的速度提升�！督�(jīng)濟(jì)學(xué)人》雜志在2023年2月初刊載了《人工智能的繁榮：歷史的經(jīng)驗(yàn)》一文，將GPT的出現(xiàn)和亨利福特的企業(yè)開始使用流水線生產(chǎn)汽車相提并論。易言之，人工智能的繁榮將不僅僅是信息技術(shù)領(lǐng)域快速發(fā)展的標(biāo)志。由此而生的新技術(shù)、新產(chǎn)品和新服務(wù)很快會(huì)滲透到人類生活的許多角落，進(jìn)而催生人類社會(huì)的變化。

你與AI的距離：很近又很遠(yuǎn)

對(duì)于身處高校的學(xué)者和學(xué)生而言，AI大模型及相關(guān)產(chǎn)品快速迭代帶來了許多視覺和心理上的沖擊。在應(yīng)用層面上，對(duì)于數(shù)據(jù)科學(xué)（Data Science）的研究者和依賴電腦進(jìn)行大數(shù)據(jù)分析的研究者（包括數(shù)字人文的研究者）來說，早已熟稔ChatGPT，大模型、機(jī)器學(xué)習(xí)之類的概念，各種分析工具和代碼工具已融入自己核心的工作流，創(chuàng)造出擁有極佳視覺效果的學(xué)術(shù)成果。不過，更多的師生是利用聊天機(jī)器人來處理郵件措辭、文章改寫、日常報(bào)告生成等重復(fù)性強(qiáng)的瑣事。“藝高人膽大”的“新科技愛好者”則可能在過去一年里體會(huì)到了大語言模型的“致幻術(shù)”，如從機(jī)器人那里獲得了“西南聯(lián)大的重要?jiǎng)?chuàng)始人之一楊開慧成功參加了位于蘇黎世的第七屆國際數(shù)學(xué)家大會(huì)并獲得了惟一的一枚銅牌”這樣的“新知”，著實(shí)為痛苦的期末周送來了富有新意的笑料，強(qiáng)化了人工智能聊天機(jī)器人仍是“人工智障”的刻板印象。

從學(xué)術(shù)研究的角度來看，有鑒于中文歷史學(xué)期刊的論文發(fā)表周期動(dòng)輒以年計(jì)算，且仍有許多刊物無法給文章配圖，要針對(duì)正在迅速發(fā)展的、媒體形式極為多樣的人工智能展開討論存在相當(dāng)大的困難。英文的歷史學(xué)期刊則在ChatGPT面世后不久，便開始傳遞不同領(lǐng)域?qū)W者的洞見。例如，《歷史與理論》雜志在2022年12月出版了《數(shù)字歷史和理論》�？�。其中收錄的10篇專論針對(duì)人工智能時(shí)代下的歷史學(xué)與歷史敘事等宏觀主題展開辯論，關(guān)注焦點(diǎn)則是史學(xué)理論層面的思考。

其中馬尼休斯-沃林頓（Marnie Hughes-Warrington）在有關(guān)數(shù)字歷史和理論的�？习l(fā)表的《走向?qū)θ斯v史創(chuàng)造者的認(rèn)可》已經(jīng)提到了AI在歷史編纂學(xué)中的潛力。他認(rèn)為，人工智能的歷史學(xué)應(yīng)用不僅局限于模仿人類的歷史敘事，而是通過結(jié)合推理和普遍接受的觀點(diǎn)，形成了一種新的歷史敘事方式。沃爾夫坎斯泰納（Wulf Kansteiner）則在《歷史學(xué)家的數(shù)字興奮劑：歷史、記憶和歷史理論能否人工智能化？》一文中指出，雖然GPT生成的文本無法保證結(jié)構(gòu)上的真實(shí)，但史學(xué)理論家可以讓定制的大型語言模型編寫一系列關(guān)于相同事件的描述性、敘事性和論證性歷史，從而探究描述、敘述和論證在歷史寫作中的精確關(guān)系。

上述學(xué)者的討論固然在理論層面頗有建樹，但鮮少涉及大型語言模型產(chǎn)品的具體使用方法和技巧。為數(shù)不多的例外是美國林登伍德大學(xué)（Lindenwood University）的學(xué)者團(tuán)隊(duì)在2023年年底在《元宇宙》（Metaverse）上發(fā)表的論文《數(shù)字歷史人物復(fù)活：以瑪麗西布莉?yàn)槔亩ㄖ艭hatGPT案例研究》。該文以林登伍德大學(xué)的創(chuàng)始人瑪麗西布莉（Mary Sibley）為實(shí)驗(yàn)對(duì)象，將她的海量日記內(nèi)容作為Claude 2.0的訓(xùn)練數(shù)據(jù)，開發(fā)出一個(gè)能夠復(fù)現(xiàn)西布莉獨(dú)特語調(diào)和觀點(diǎn)的聊天機(jī)器人，類似于2019年熱播日劇《輪到你了》第二季中的AI女主角。這一成果展現(xiàn)了一種新穎的歷史研究和互動(dòng)學(xué)習(xí)方式，也為學(xué)界如何利用數(shù)字技術(shù)復(fù)現(xiàn)擁有海量史料的歷史人物提供了啟發(fā)。

實(shí)際上，當(dāng)下大語言模型產(chǎn)品的能力已經(jīng)足夠成為高校師生日常課程學(xué)習(xí)和科研工作的助手，在信息檢索、文獻(xiàn)閱讀、筆記管理乃至科研創(chuàng)新等事務(wù)中發(fā)揮關(guān)鍵作用。尤其對(duì)于全球史的研究者來說，常常需要處理大量涵蓋了不同地區(qū)、國家和文明間的相互聯(lián)系與比較的材料和文獻(xiàn)。運(yùn)用AI產(chǎn)品來提高信息檢索效率和處理能力，有助于更深入地探索和分析這些復(fù)雜的歷史關(guān)系，來提高研究的深度和質(zhì)量。然而問題在于，如何將AI產(chǎn)品整合到自己的學(xué)習(xí)或工作流程之中，優(yōu)化或定制自己的專屬機(jī)器人，為其增添功能，提升自己的輸入和輸出效率，也就是利用人工智能來自我賦能，從而更高效地處理龐雜的信息。

絕知此事要躬行：管窺國內(nèi)大模型產(chǎn)品工具箱

目前大部分人使用大語言模型產(chǎn)品的方式是直接以自然語言輸入自己的問題到對(duì)話框，并等待AI的回復(fù)，仿佛在與一位真人助手交談。這簡單的過程中其實(shí)蘊(yùn)含著很多值得學(xué)習(xí)的工具性知識(shí)。在互動(dòng)中，AI回復(fù)的質(zhì)量與大模型自身能力密切相關(guān)，也受到用戶發(fā)出的提示詞（Prompt）內(nèi)容的重要影響。固然，目前網(wǎng)絡(luò)上已經(jīng)存在許多詳細(xì)的提示詞指南，但一份理想的提示詞是需要用戶自己在反復(fù)實(shí)踐的互動(dòng)中不斷地錘煉出來的，這就要求用戶所處的網(wǎng)絡(luò)社區(qū)中有AI產(chǎn)品滿足以下需求：易獲得、模型性能好，且有充足社區(qū)資源提供指導(dǎo)。

除了前文提到的ChatGPT和Gemini Pro這兩個(gè)大模型領(lǐng)域的“當(dāng)紅流量小花”，國內(nèi)也有不少相當(dāng)優(yōu)秀的同類產(chǎn)品可供使用。比如月之暗面科技推出的智能聊天機(jī)器人（Chat bot）Kimi Chat就有驚艷的長文本處理能力，能夠支持長達(dá)20萬漢字的輸入。又如清華系創(chuàng)業(yè)公司的智譜AI。用戶可以在智譜清言的客戶端體驗(yàn)GLM-4支持的“長文檔解讀”“高級(jí)聯(lián)網(wǎng)”“數(shù)據(jù)分析”“AI畫圖”等多樣化功能。尤其，這一開放平臺(tái)目前向?qū)嵜J(rèn)證的新用戶免費(fèi)贈(zèng)送數(shù)百萬tokens，對(duì)想要進(jìn)一步探索AI世界的新手十分友好。字節(jié)跳動(dòng)推出的智能體創(chuàng)建平臺(tái)“扣子”（Coze）同樣頗受好評(píng)，原因在于能讓缺乏編程經(jīng)驗(yàn)的“小白”快速上手制作自己專屬的聊天機(jī)器人，并利用知識(shí)庫（Knowledge），插件（Plug-in），工作流（Workflow）等功能增強(qiáng)機(jī)器人的性能。

當(dāng)然，選擇哪款大語言模型產(chǎn)品最終取決于個(gè)人的需求或偏好。用戶如何通過持續(xù)的使用和探索，找到能夠融入自身現(xiàn)有工作流的工具，從而有效提升學(xué)習(xí)和工作效率才是關(guān)鍵。接下來我將以學(xué)習(xí)第一次世界大戰(zhàn)的歷史為應(yīng)用情境，利用Kimi Chat、智譜AI開放平臺(tái)、“扣子”來簡單展示如何使用提示詞優(yōu)化（Prompt Optimization）、知識(shí)庫、插件來提升模型的回答質(zhì)量，使之成為歷史學(xué)的學(xué)習(xí)與科研助手。

四兩撥千斤：人工智能助手的快速優(yōu)化策略

聊天機(jī)器人的回答質(zhì)量受到模型的數(shù)據(jù)集和參數(shù)影響，目前，許多從事垂直領(lǐng)域大模型開發(fā)的研究者積極應(yīng)用微調(diào)（fine-tuning）技術(shù)來訓(xùn)練大語言模型，使之在特定領(lǐng)域有更好的表現(xiàn)。但大部分非計(jì)算機(jī)專業(yè)的師生并不具備微調(diào)所需的算力資源和專業(yè)知識(shí)，掌握這一技術(shù)的時(shí)間成本也足以令人望而卻步。但是，在不改變模型的前提下，從用戶開始琢磨自己想問什么，到聊天機(jī)器人最終給出回復(fù)，中間有許多步驟提供了可優(yōu)化的空間（如下面的流程圖所示的A和D），來盡可能地使機(jī)器人的回復(fù)貼合用戶所期待的答案。換言之，在人機(jī)互動(dòng)中，大語言模型聊天機(jī)器人通過其預(yù)訓(xùn)練能力理解用戶輸入，并可能結(jié)合實(shí)時(shí)檢索來響應(yīng)查詢。用戶可以做的，則是向機(jī)器人更明確表述自己的需求，“教”機(jī)器人如何提取某些信息，這往往可以通過系統(tǒng)的“提示詞工程”（Prompt Engineering）來實(shí)現(xiàn)。而提供知識(shí)庫或插件，則是為機(jī)器人在最終生成回復(fù)之前提供額外的信息支持，市面上大部分大語言模型產(chǎn)品已為缺乏編程和機(jī)器學(xué)習(xí)基礎(chǔ)的用戶提供了此類服務(wù)，相信大家可以花費(fèi)較短的學(xué)習(xí)時(shí)間來掌握相關(guān)應(yīng)用。

以下是三個(gè)與第一次世界大戰(zhàn)史有關(guān)的研究情境中如何使用Chat bot的簡單視頻介紹，筆者在這里拋磚引玉，希望能夠激發(fā)大家的好奇心，去大膽使用這些產(chǎn)品，將自己的聰明才智和人工智能技術(shù)結(jié)合，探索出學(xué)習(xí)的新方法，攀登上學(xué)術(shù)的新高峰。

情境1: 有關(guān)第一次世界大戰(zhàn)研究的文獻(xiàn)管理(04:01)

情境2: 對(duì)這些文獻(xiàn)進(jìn)行檢索和調(diào)用，為學(xué)術(shù)寫作服務(wù)(03:23)

情境3: 利用插件來增強(qiáng)信息檢索的體驗(yàn)(02:25)

積跬步以至千里：擁抱更具核心競爭力的自己

可以預(yù)見的是，在2024年剩余的9個(gè)多月里，科技巨頭和新秀們將會(huì)推出功能更強(qiáng)大的模型和服務(wù)更完善的產(chǎn)品，AI行業(yè)的發(fā)展也將引發(fā)持續(xù)關(guān)注。近日，Anthropic就發(fā)布了Claude 3系列大模型，其中功能最強(qiáng)大的模型Opus在各種基準(zhǔn)測試中有著優(yōu)于GPT-4和Gemini 1.0 Ultra的表現(xiàn)，為人工智能領(lǐng)域的火熱競爭添上一把新柴。

一方面，公眾對(duì)科技的迅猛發(fā)展感到驚喜，但另一方面，網(wǎng)絡(luò)社區(qū)對(duì)“通用人工智能（Artificial General Intelligence）掌控世界”“傳統(tǒng)行業(yè)迅速消亡”和“落后的人類被機(jī)器取代”等假想情景表達(dá)了擔(dān)憂。這份焦慮甚至被用作AI課程銷售的噱頭，在短期內(nèi)造就了“模型未動(dòng)、賣課先行”的奇觀。

事實(shí)上，目前通用人工智能仍然只是一個(gè)哲學(xué)概念，我們離一個(gè)完全具備人類般復(fù)雜認(rèn)知架構(gòu)的AI系統(tǒng)的誕生還有相當(dāng)遠(yuǎn)的距離。哪怕是引發(fā)街頭巷尾熱議的文生視頻大模型Sora，也并非很多自媒體所吹捧的“大世界模型”，或是“物理規(guī)律的掌握者”。其核心工作原理是結(jié)合了擴(kuò)散模型和Transformer架構(gòu)：擴(kuò)散模型從初始的噪聲出發(fā)，逐步細(xì)化成所需的視頻內(nèi)容；而Transformer架構(gòu)則負(fù)責(zé)連續(xù)視頻幀的處理，確保視頻中動(dòng)作的流暢度和自然性。AGI的最終實(shí)現(xiàn)，也即是讓機(jī)器模擬人類的認(rèn)知過程、理解復(fù)雜的概念和環(huán)境，并具備自我學(xué)習(xí)和自適應(yīng)的能力，仍是需要多學(xué)科領(lǐng)域深度合作解決的難題。

在時(shí)代的洪流中，與其每天刷手機(jī)閱讀媒體關(guān)于人工智能的“爆炸式”報(bào)道，默默做一個(gè)技術(shù)革命的旁觀者，不如積極動(dòng)手，探索如何利用現(xiàn)有的人工智能產(chǎn)品和服務(wù)來增強(qiáng)我們的認(rèn)知能力，而“聊天”機(jī)器人則是我們實(shí)現(xiàn)這種“智能放大”（Intelligence Amplification）的重要交互平臺(tái)。通過上面的簡單介紹其實(shí)已可以看出，它能做到不僅僅是陪人類聊天和進(jìn)行簡單的信息搜索。通過改進(jìn)提問方式，以及給機(jī)器人增加知識(shí)庫這一類的“小配件”等方法，我們可以用這些智能體來輔助學(xué)習(xí)，定制學(xué)習(xí)材料，甚至讓它們擔(dān)任研究助理，承擔(dān)簡單的數(shù)據(jù)分析和可視化等工作。

通過運(yùn)用這種人機(jī)協(xié)同工作模式，我們能夠把重復(fù)性較高的事務(wù)交由人工智能機(jī)器人去自動(dòng)化處理，從而提升個(gè)人知識(shí)的吸收與輸出效率，專注于自身更具創(chuàng)新性的工作。機(jī)器人的輔助能夠使我們能夠深入整合專業(yè)知識(shí)，擴(kuò)展研究視野，進(jìn)而激發(fā)創(chuàng)新思維。此外，與聊天機(jī)器人的互動(dòng)也是對(duì)我們通用能力的一種鍛煉，它幫助我們學(xué)會(huì)如何更加清晰地“思考”“提問”和“反思”；如何高效整合信息渠道，提高接收信息的質(zhì)量；以及如何為自己設(shè)計(jì)并優(yōu)化一個(gè)高效的自動(dòng)化工作流程。雖然這些能力在傳統(tǒng)的標(biāo)準(zhǔn)化考試中并不是明確的考點(diǎn)，但在學(xué)術(shù)研究和職場工作中，自主學(xué)習(xí)探究，提出有效問題，并尋找創(chuàng)新突破能力是具有價(jià)值的。綜上所述，借助人工智能，我們不僅能夠提升專業(yè)研究能力，還能鍛煉通用技能，從而構(gòu)筑起自身的核心競爭力，以求有效迎接技術(shù)革命的挑戰(zhàn)與機(jī)遇。