展會(huì)信息港展會(huì)大全

歷史與AI的距離:聊天機(jī)器人在歷史學(xué)科科研中的應(yīng)用
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-12 15:50:22   瀏覽:10065次  

導(dǎo)讀:2022年11月30日,OpenAI公司的聊天機(jī)器人ChatGPT上線。半個(gè)月之后,就有在美國大學(xué)教書的友人說起ChatGPT引發(fā)了自己對(duì)工作的焦慮。2023年9月,《美國歷史評(píng)論》專門探討21世紀(jì)歷史研究新實(shí)踐的欄目的歷史實(shí)驗(yàn)室(History Lab)發(fā)表了一組題為《人工智能和歷...

2022年11月30日,OpenAI公司的聊天機(jī)器人ChatGPT上線。半個(gè)月之后,就有在美國大學(xué)教書的友人說起ChatGPT引發(fā)了自己對(duì)工作的焦慮。2023年9月,《美國歷史評(píng)論》專門探討21世紀(jì)歷史研究新實(shí)踐的欄目的“歷史實(shí)驗(yàn)室”(History Lab)發(fā)表了一組題為《人工智能和歷史實(shí)踐》的圓桌論文,及時(shí)回應(yīng)了美國同行對(duì)人工智能是什么以及能如何與歷史學(xué)進(jìn)行互動(dòng)的疑問。七篇文章關(guān)聯(lián)到了對(duì)歷史學(xué)研究者來說相對(duì)更熟悉的議題,比如“數(shù)字史學(xué)”,更多的則是一些相對(duì)新的名詞,比如“深度學(xué)習(xí)”“噪聲效應(yīng)”等等。

中文媒體對(duì)人工智能的興趣在2023年達(dá)到一個(gè)新高度。高等院校同樣如此。例如,2023年12月28日,美國羅文大學(xué)杰出教授王晴佳受復(fù)旦大學(xué)西方史學(xué)史團(tuán)隊(duì)邀請(qǐng)作了題為《數(shù)字化、人工智能和歷史學(xué)的未來》的講座,全面而深入地講述了人工智能對(duì)歷史研究的影響,讓筆者深受啟發(fā)。

在剛剛過去的龍年春節(jié)期間,OpenAI發(fā)布的文本到視頻轉(zhuǎn)換模型Sora展現(xiàn)的樣片又引發(fā)了一輪激烈的討論。無論用戶的要求是刻畫當(dāng)代時(shí)尚女性行走在東京商業(yè)區(qū)的情景,還是模擬淘金熱期間的加利福尼亞州的樣貌,Sora都能較為準(zhǔn)確乃至栩栩如生地實(shí)現(xiàn)。OpenAI甚至聲稱Sora能夠理解用戶輸入的內(nèi)容在物理世界中的存在方式,這使得以往的AI視頻生成工具相形見絀。

與此同時(shí),谷歌在大模型信息處理能力的賽道持續(xù)發(fā)力,推出了Gemini 1.5 Pro。據(jù)稱它可以處理高達(dá)100萬個(gè)tokens的上下文窗口,差不多對(duì)應(yīng)一小時(shí)的視頻、11小時(shí)的音頻、超過30,000行代碼的代碼庫或超過700,000字的文本(約等于《伊利亞特》和《奧德賽》的文本量相加再翻一倍)。這些革新體現(xiàn)出人工智能(Artificial Intelligence)的計(jì)算能力在不斷以驚人的速度提升!督(jīng)濟(jì)學(xué)人》雜志在2023年2月初刊載了《人工智能的繁榮:歷史的經(jīng)驗(yàn)》一文,將GPT的出現(xiàn)和亨利福特的企業(yè)開始使用流水線生產(chǎn)汽車相提并論。易言之,人工智能的繁榮將不僅僅是信息技術(shù)領(lǐng)域快速發(fā)展的標(biāo)志。由此而生的新技術(shù)、新產(chǎn)品和新服務(wù)很快會(huì)滲透到人類生活的許多角落,進(jìn)而催生人類社會(huì)的變化。

你與AI的距離:很近又很遠(yuǎn)

對(duì)于身處高校的學(xué)者和學(xué)生而言,AI大模型及相關(guān)產(chǎn)品快速迭代帶來了許多視覺和心理上的沖擊。在應(yīng)用層面上,對(duì)于數(shù)據(jù)科學(xué)(Data Science)的研究者和依賴電腦進(jìn)行大數(shù)據(jù)分析的研究者(包括數(shù)字人文的研究者)來說,早已熟稔ChatGPT,大模型、機(jī)器學(xué)習(xí)之類的概念,各種分析工具和代碼工具已融入自己核心的工作流,創(chuàng)造出擁有極佳視覺效果的學(xué)術(shù)成果。不過,更多的師生是利用聊天機(jī)器人來處理郵件措辭、文章改寫、日常報(bào)告生成等重復(fù)性強(qiáng)的瑣事。“藝高人膽大”的“新科技愛好者”則可能在過去一年里體會(huì)到了大語言模型的“致幻術(shù)”,如從機(jī)器人那里獲得了“西南聯(lián)大的重要?jiǎng)?chuàng)始人之一楊開慧成功參加了位于蘇黎世的第七屆國際數(shù)學(xué)家大會(huì)并獲得了惟一的一枚銅牌”這樣的“新知”,著實(shí)為痛苦的期末周送來了富有新意的笑料,強(qiáng)化了人工智能聊天機(jī)器人仍是“人工智障”的刻板印象。

從學(xué)術(shù)研究的角度來看,有鑒于中文歷史學(xué)期刊的論文發(fā)表周期動(dòng)輒以年計(jì)算,且仍有許多刊物無法給文章配圖,要針對(duì)正在迅速發(fā)展的、媒體形式極為多樣的人工智能展開討論存在相當(dāng)大的困難。英文的歷史學(xué)期刊則在ChatGPT面世后不久,便開始傳遞不同領(lǐng)域?qū)W者的洞見。例如,《歷史與理論》雜志在2022年12月出版了《數(shù)字歷史和理論》?。其中收錄的10篇專論針對(duì)人工智能時(shí)代下的歷史學(xué)與歷史敘事等宏觀主題展開辯論,關(guān)注焦點(diǎn)則是史學(xué)理論層面的思考。

其中馬尼休斯-沃林頓(Marnie Hughes-Warrington)在有關(guān)數(shù)字歷史和理論的?习l(fā)表的《走向?qū)θ斯v史創(chuàng)造者的認(rèn)可》已經(jīng)提到了AI在歷史編纂學(xué)中的潛力。他認(rèn)為,人工智能的歷史學(xué)應(yīng)用不僅局限于模仿人類的歷史敘事,而是通過結(jié)合推理和普遍接受的觀點(diǎn),形成了一種新的歷史敘事方式。沃爾夫坎斯泰納(Wulf Kansteiner)則在《歷史學(xué)家的數(shù)字興奮劑:歷史、記憶和歷史理論能否人工智能化?》一文中指出,雖然GPT生成的文本無法保證結(jié)構(gòu)上的真實(shí),但史學(xué)理論家可以讓定制的大型語言模型編寫一系列關(guān)于相同事件的描述性、敘事性和論證性歷史,從而探究描述、敘述和論證在歷史寫作中的精確關(guān)系。

上述學(xué)者的討論固然在理論層面頗有建樹,但鮮少涉及大型語言模型產(chǎn)品的具體使用方法和技巧。為數(shù)不多的例外是美國林登伍德大學(xué)(Lindenwood University)的學(xué)者團(tuán)隊(duì)在2023年年底在《元宇宙》(Metaverse)上發(fā)表的論文《數(shù)字歷史人物復(fù)活:以瑪麗西布莉?yàn)槔亩ㄖ艭hatGPT案例研究》。該文以林登伍德大學(xué)的創(chuàng)始人瑪麗西布莉(Mary Sibley)為實(shí)驗(yàn)對(duì)象,將她的海量日記內(nèi)容作為Claude 2.0的訓(xùn)練數(shù)據(jù),開發(fā)出一個(gè)能夠復(fù)現(xiàn)西布莉獨(dú)特語調(diào)和觀點(diǎn)的聊天機(jī)器人,類似于2019年熱播日劇《輪到你了》第二季中的AI女主角。這一成果展現(xiàn)了一種新穎的歷史研究和互動(dòng)學(xué)習(xí)方式,也為學(xué)界如何利用數(shù)字技術(shù)復(fù)現(xiàn)擁有海量史料的歷史人物提供了啟發(fā)。

實(shí)際上,當(dāng)下大語言模型產(chǎn)品的能力已經(jīng)足夠成為高校師生日常課程學(xué)習(xí)和科研工作的助手,在信息檢索、文獻(xiàn)閱讀、筆記管理乃至科研創(chuàng)新等事務(wù)中發(fā)揮關(guān)鍵作用。尤其對(duì)于全球史的研究者來說,常常需要處理大量涵蓋了不同地區(qū)、國家和文明間的相互聯(lián)系與比較的材料和文獻(xiàn)。運(yùn)用AI產(chǎn)品來提高信息檢索效率和處理能力,有助于更深入地探索和分析這些復(fù)雜的歷史關(guān)系,來提高研究的深度和質(zhì)量。然而問題在于,如何將AI產(chǎn)品整合到自己的學(xué)習(xí)或工作流程之中,優(yōu)化或定制自己的專屬機(jī)器人,為其增添功能,提升自己的輸入和輸出效率,也就是利用人工智能來自我賦能,從而更高效地處理龐雜的信息。

絕知此事要躬行:管窺國內(nèi)大模型產(chǎn)品工具箱

目前大部分人使用大語言模型產(chǎn)品的方式是直接以自然語言輸入自己的問題到對(duì)話框,并等待AI的回復(fù),仿佛在與一位真人助手交談。這簡單的過程中其實(shí)蘊(yùn)含著很多值得學(xué)習(xí)的工具性知識(shí)。在互動(dòng)中,AI回復(fù)的質(zhì)量與大模型自身能力密切相關(guān),也受到用戶發(fā)出的提示詞(Prompt)內(nèi)容的重要影響。固然,目前網(wǎng)絡(luò)上已經(jīng)存在許多詳細(xì)的提示詞指南,但一份理想的提示詞是需要用戶自己在反復(fù)實(shí)踐的互動(dòng)中不斷地錘煉出來的,這就要求用戶所處的網(wǎng)絡(luò)社區(qū)中有AI產(chǎn)品滿足以下需求:易獲得、模型性能好,且有充足社區(qū)資源提供指導(dǎo)。

除了前文提到的ChatGPT和Gemini Pro這兩個(gè)大模型領(lǐng)域的“當(dāng)紅流量小花”,國內(nèi)也有不少相當(dāng)優(yōu)秀的同類產(chǎn)品可供使用。比如月之暗面科技推出的智能聊天機(jī)器人(Chat bot)Kimi Chat就有驚艷的長文本處理能力,能夠支持長達(dá)20萬漢字的輸入。又如清華系創(chuàng)業(yè)公司的智譜AI。用戶可以在智譜清言的客戶端體驗(yàn)GLM-4支持的“長文檔解讀”“高級(jí)聯(lián)網(wǎng)”“數(shù)據(jù)分析”“AI畫圖”等多樣化功能。尤其,這一開放平臺(tái)目前向?qū)嵜J(rèn)證的新用戶免費(fèi)贈(zèng)送數(shù)百萬tokens,對(duì)想要進(jìn)一步探索AI世界的新手十分友好。字節(jié)跳動(dòng)推出的智能體創(chuàng)建平臺(tái)“扣子”(Coze)同樣頗受好評(píng),原因在于能讓缺乏編程經(jīng)驗(yàn)的“小白”快速上手制作自己專屬的聊天機(jī)器人,并利用知識(shí)庫(Knowledge),插件(Plug-in),工作流(Workflow)等功能增強(qiáng)機(jī)器人的性能。

當(dāng)然,選擇哪款大語言模型產(chǎn)品最終取決于個(gè)人的需求或偏好。用戶如何通過持續(xù)的使用和探索,找到能夠融入自身現(xiàn)有工作流的工具,從而有效提升學(xué)習(xí)和工作效率才是關(guān)鍵。接下來我將以學(xué)習(xí)第一次世界大戰(zhàn)的歷史為應(yīng)用情境,利用Kimi Chat、智譜AI開放平臺(tái)、“扣子”來簡單展示如何使用提示詞優(yōu)化(Prompt Optimization)、知識(shí)庫、插件來提升模型的回答質(zhì)量,使之成為歷史學(xué)的學(xué)習(xí)與科研助手。

四兩撥千斤:人工智能助手的快速優(yōu)化策略

聊天機(jī)器人的回答質(zhì)量受到模型的數(shù)據(jù)集和參數(shù)影響,目前,許多從事垂直領(lǐng)域大模型開發(fā)的研究者積極應(yīng)用微調(diào)(fine-tuning)技術(shù)來訓(xùn)練大語言模型,使之在特定領(lǐng)域有更好的表現(xiàn)。但大部分非計(jì)算機(jī)專業(yè)的師生并不具備微調(diào)所需的算力資源和專業(yè)知識(shí),掌握這一技術(shù)的時(shí)間成本也足以令人望而卻步。但是,在不改變模型的前提下,從用戶開始琢磨自己想問什么,到聊天機(jī)器人最終給出回復(fù),中間有許多步驟提供了可優(yōu)化的空間(如下面的流程圖所示的A和D),來盡可能地使機(jī)器人的回復(fù)貼合用戶所期待的答案。換言之,在人機(jī)互動(dòng)中,大語言模型聊天機(jī)器人通過其預(yù)訓(xùn)練能力理解用戶輸入,并可能結(jié)合實(shí)時(shí)檢索來響應(yīng)查詢。用戶可以做的,則是向機(jī)器人更明確表述自己的需求,“教”機(jī)器人如何提取某些信息,這往往可以通過系統(tǒng)的“提示詞工程”(Prompt Engineering)來實(shí)現(xiàn)。而提供知識(shí)庫或插件,則是為機(jī)器人在最終生成回復(fù)之前提供額外的信息支持,市面上大部分大語言模型產(chǎn)品已為缺乏編程和機(jī)器學(xué)習(xí)基礎(chǔ)的用戶提供了此類服務(wù),相信大家可以花費(fèi)較短的學(xué)習(xí)時(shí)間來掌握相關(guān)應(yīng)用。

以下是三個(gè)與第一次世界大戰(zhàn)史有關(guān)的研究情境中如何使用Chat bot的簡單視頻介紹,筆者在這里拋磚引玉,希望能夠激發(fā)大家的好奇心,去大膽使用這些產(chǎn)品,將自己的聰明才智和人工智能技術(shù)結(jié)合,探索出學(xué)習(xí)的新方法,攀登上學(xué)術(shù)的新高峰。

情境1: 有關(guān)第一次世界大戰(zhàn)研究的文獻(xiàn)管理(04:01)

情境2: 對(duì)這些文獻(xiàn)進(jìn)行檢索和調(diào)用,為學(xué)術(shù)寫作服務(wù)(03:23)

情境3: 利用插件來增強(qiáng)信息檢索的體驗(yàn)(02:25)

積跬步以至千里:擁抱更具核心競爭力的自己

可以預(yù)見的是,在2024年剩余的9個(gè)多月里,科技巨頭和新秀們將會(huì)推出功能更強(qiáng)大的模型和服務(wù)更完善的產(chǎn)品,AI行業(yè)的發(fā)展也將引發(fā)持續(xù)關(guān)注。近日,Anthropic就發(fā)布了Claude 3系列大模型,其中功能最強(qiáng)大的模型Opus在各種基準(zhǔn)測試中有著優(yōu)于GPT-4和Gemini 1.0 Ultra的表現(xiàn),為人工智能領(lǐng)域的火熱競爭添上一把新柴。

一方面,公眾對(duì)科技的迅猛發(fā)展感到驚喜,但另一方面,網(wǎng)絡(luò)社區(qū)對(duì)“通用人工智能(Artificial General Intelligence)掌控世界”“傳統(tǒng)行業(yè)迅速消亡”和“落后的人類被機(jī)器取代”等假想情景表達(dá)了擔(dān)憂。這份焦慮甚至被用作AI課程銷售的噱頭,在短期內(nèi)造就了“模型未動(dòng)、賣課先行”的奇觀。

事實(shí)上,目前通用人工智能仍然只是一個(gè)哲學(xué)概念,我們離一個(gè)完全具備人類般復(fù)雜認(rèn)知架構(gòu)的AI系統(tǒng)的誕生還有相當(dāng)遠(yuǎn)的距離。哪怕是引發(fā)街頭巷尾熱議的文生視頻大模型Sora,也并非很多自媒體所吹捧的“大世界模型”,或是“物理規(guī)律的掌握者”。其核心工作原理是結(jié)合了擴(kuò)散模型和Transformer架構(gòu):擴(kuò)散模型從初始的噪聲出發(fā),逐步細(xì)化成所需的視頻內(nèi)容;而Transformer架構(gòu)則負(fù)責(zé)連續(xù)視頻幀的處理,確保視頻中動(dòng)作的流暢度和自然性。AGI的最終實(shí)現(xiàn),也即是讓機(jī)器模擬人類的認(rèn)知過程、理解復(fù)雜的概念和環(huán)境,并具備自我學(xué)習(xí)和自適應(yīng)的能力,仍是需要多學(xué)科領(lǐng)域深度合作解決的難題。

在時(shí)代的洪流中,與其每天刷手機(jī)閱讀媒體關(guān)于人工智能的“爆炸式”報(bào)道,默默做一個(gè)技術(shù)革命的旁觀者,不如積極動(dòng)手,探索如何利用現(xiàn)有的人工智能產(chǎn)品和服務(wù)來增強(qiáng)我們的認(rèn)知能力,而“聊天”機(jī)器人則是我們實(shí)現(xiàn)這種“智能放大”(Intelligence Amplification)的重要交互平臺(tái)。通過上面的簡單介紹其實(shí)已可以看出,它能做到不僅僅是陪人類聊天和進(jìn)行簡單的信息搜索。通過改進(jìn)提問方式,以及給機(jī)器人增加知識(shí)庫這一類的“小配件”等方法,我們可以用這些智能體來輔助學(xué)習(xí),定制學(xué)習(xí)材料,甚至讓它們擔(dān)任研究助理,承擔(dān)簡單的數(shù)據(jù)分析和可視化等工作。

通過運(yùn)用這種人機(jī)協(xié)同工作模式,我們能夠把重復(fù)性較高的事務(wù)交由人工智能機(jī)器人去自動(dòng)化處理,從而提升個(gè)人知識(shí)的吸收與輸出效率,專注于自身更具創(chuàng)新性的工作。機(jī)器人的輔助能夠使我們能夠深入整合專業(yè)知識(shí),擴(kuò)展研究視野,進(jìn)而激發(fā)創(chuàng)新思維。此外,與聊天機(jī)器人的互動(dòng)也是對(duì)我們通用能力的一種鍛煉,它幫助我們學(xué)會(huì)如何更加清晰地“思考”“提問”和“反思”;如何高效整合信息渠道,提高接收信息的質(zhì)量;以及如何為自己設(shè)計(jì)并優(yōu)化一個(gè)高效的自動(dòng)化工作流程。雖然這些能力在傳統(tǒng)的標(biāo)準(zhǔn)化考試中并不是明確的考點(diǎn),但在學(xué)術(shù)研究和職場工作中,自主學(xué)習(xí)探究,提出有效問題,并尋找創(chuàng)新突破能力是具有價(jià)值的。綜上所述,借助人工智能,我們不僅能夠提升專業(yè)研究能力,還能鍛煉通用技能,從而構(gòu)筑起自身的核心競爭力,以求有效迎接技術(shù)革命的挑戰(zhàn)與機(jī)遇。

(本文作者李思系paideia.ai提示詞工程師,朱聯(lián)壁系復(fù)旦大學(xué)歷史學(xué)系副教授。)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港