展會(huì)信息港展會(huì)大全

人工智能往事:大模型的理論基礎(chǔ),曾一度被判死刑
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-07-23 10:02:22   瀏覽:7010次  

導(dǎo)讀:【編者按:人工智能技術(shù)的飛速發(fā)展,在短短一兩年內(nèi)徹底改變了人類(lèi)對(duì)于未來(lái)的想象。例如,近期蘿卜快跑刷屏,讓不少人驚呼無(wú)人駕駛已經(jīng)近在眼前,并擔(dān)憂AI給社會(huì)造成的沖擊。大語(yǔ)言模型也仿佛在一夜之間就產(chǎn)生了神奇的涌現(xiàn)。甚至在2023年初,有人認(rèn)為歷史已...

【編者按:人工智能技術(shù)的飛速發(fā)展,在短短一兩年內(nèi)徹底改變了人類(lèi)對(duì)于未來(lái)的想象。例如,近期蘿卜快跑刷屏,讓不少人驚呼無(wú)人駕駛已經(jīng)近在眼前,并擔(dān)憂AI給社會(huì)造成的沖擊。大語(yǔ)言模型也仿佛在一夜之間就產(chǎn)生了神奇的涌現(xiàn)。甚至在2023年初,有人認(rèn)為“歷史已經(jīng)終結(jié)”,OpenAI在大模型領(lǐng)域已經(jīng)不可動(dòng)遙然而,在很多從業(yè)者看來(lái),大模型從來(lái)不是突然出現(xiàn)的,AI的發(fā)展也經(jīng)歷了漫長(zhǎng)的起起伏伏。不久前,各大模型分不清9.11和9.9哪個(gè)大的新聞,證明目前的大模型能力尚有巨大缺陷。OpenAI也被曝出,正在開(kāi)發(fā)不同于ChatGPT的、更側(cè)重推理能力的新模型。事實(shí)上,人類(lèi)期待的通用人工智能(AGI)目前還遠(yuǎn)遠(yuǎn)沒(méi)有出現(xiàn),甚至大模型是不是通向AGI的正確道路,在學(xué)術(shù)界都充滿了爭(zhēng)議?v觀人工智能發(fā)展史,作為大模型理論基礎(chǔ)的“聯(lián)結(jié)主義”學(xué)派,曾經(jīng)還一度被判死刑,被譏諷為“煉金術(shù)”。如今,聯(lián)結(jié)主義開(kāi)始占據(jù)絕對(duì)話語(yǔ)權(quán),但誰(shuí)又能保證,未來(lái)不會(huì)再次反轉(zhuǎn)?我們可以對(duì)AI技術(shù)的未來(lái)心懷樂(lè)觀,但以史為鑒,也無(wú)需過(guò)早地認(rèn)為,人類(lèi)已經(jīng)找到了人工智能的終極答案!

回顧人工智能的發(fā)展歷史,有三個(gè)主要的人工智能學(xué)派,分別是機(jī)器模擬人類(lèi)心智(mind)的符號(hào)主義、機(jī)器模擬人類(lèi)大腦(brain)的聯(lián)結(jié)主義以及機(jī)器模擬人類(lèi)行動(dòng)(action)的行為主義(見(jiàn)表 1-1)。由于行為主義的研究主要和機(jī)器人學(xué)高度相關(guān),往往被視為相對(duì)獨(dú)立的分支,且其主要觀點(diǎn)已經(jīng)融入聯(lián)結(jié)主義的方法論,因此本書(shū)主要介紹符號(hào)主義與聯(lián)結(jié)主義這兩個(gè)觀點(diǎn)相對(duì)的人工智能學(xué)派。

表 1-1人工智能學(xué)派主要思想和典型應(yīng)用

稱(chēng)霸早期人工智能的符號(hào)主義

從 1956 年達(dá)特茅斯會(huì)議第一次提出“人工智能”一詞到 20 世紀(jì) 90 年代末,符號(hào)主義統(tǒng)治了早期的人工智能。如果用一句話來(lái)描述符號(hào)主義的思想,那就是將現(xiàn)實(shí)世界抽象為可被機(jī)器識(shí)別和計(jì)算的符號(hào),利用運(yùn)算模仿人腦思考,通過(guò)邏輯推理來(lái)認(rèn)知世界。簡(jiǎn)言之,符號(hào)主義認(rèn)為智能就是計(jì)算。由于邏輯和計(jì)算是人類(lèi)典型的心智活動(dòng),因此符號(hào)主義也常常被稱(chēng)為心智派。

追根溯源,符號(hào)主義直接脫胎于艾倫 麥席森 圖靈的思想。圖靈定義了什么是人工智能,以及人工智能應(yīng)該具備什么樣的能力。20 世紀(jì) 40 年代,二戰(zhàn)帶來(lái)的計(jì)算科學(xué)和半導(dǎo)體技術(shù)的大爆發(fā),讓人們?cè)絹?lái)越多地在現(xiàn)實(shí)層面討論機(jī)器智能的可能。但在那個(gè)約翰 馮 諾依曼還沒(méi)提出計(jì)算機(jī)架構(gòu)的年代,學(xué)術(shù)界根本無(wú)法對(duì)人工智能的定義達(dá)成一致,更不用說(shuō)形成一門(mén)嚴(yán)謹(jǐn)?shù)膶W(xué)科了。

此時(shí)圖靈的天才盡顯無(wú)遺,他另辟蹊徑,先假定機(jī)器可以具有類(lèi)似人類(lèi)的智能,然后給出一個(gè)判斷方法:人與一臺(tái)機(jī)器和另一人進(jìn)行對(duì)話,通過(guò)提問(wèn)與回答,分辨與之對(duì)話的是機(jī)器還是人類(lèi)。如果人無(wú)法區(qū)分機(jī)器和人類(lèi),則代表機(jī)器通過(guò)了測(cè)試,是具備智能的。

這就是大名鼎鼎的“圖靈測(cè)試”,起初它只是在論文中的一個(gè)思維實(shí)驗(yàn)。圖靈沒(méi)有想到的是,圖靈測(cè)試會(huì)成為判斷人工智能水平的重要標(biāo)準(zhǔn)。到 2024 年的今天,每隔幾年就會(huì)有研究團(tuán)隊(duì)帶著自己的人工智能向圖靈測(cè)試發(fā)起挑戰(zhàn),但還沒(méi)有一個(gè)可以成功,即便是今天最強(qiáng)大的生成式 AI 模型也沒(méi)有完成圖靈的愿景。

1950 年,圖靈發(fā)表了題為《計(jì)算機(jī)器與智能》的重要論文,探討“機(jī)器能否思考”這一問(wèn)題。圖靈的明智之處,是他沒(méi)有糾結(jié)于機(jī)器如何思考的問(wèn)題,而是開(kāi)創(chuàng)性地提出用計(jì)算和推理達(dá)到智能的效果,并提出了用圖靈機(jī)的計(jì)算架構(gòu)去實(shí)現(xiàn)這種智能,以及用圖靈測(cè)試來(lái)驗(yàn)證智能效果?梢哉f(shuō)他一個(gè)人定義了什么是人工智能(計(jì)算)、如何實(shí)現(xiàn)智能(圖靈機(jī))以及人工智能的標(biāo)準(zhǔn)(圖靈測(cè)試),因此被公認(rèn)為“人工智能之父”。

回看歷史,如果我們承認(rèn)圖靈是人工智能的奠基人,那我們可以說(shuō)早期的人工智能就是符號(hào)主義的。顧名思義,符號(hào)主義得名于符號(hào),其思想主要繼承于圖靈,認(rèn)為智能等同于計(jì)算。為了實(shí)現(xiàn)智能,就要用各種方法將現(xiàn)實(shí)世界的各種物體抽象成符號(hào),然后利用邏輯和計(jì)算替代人類(lèi)大腦的思考。

在圖靈、馬文 明斯基和赫伯特 西蒙等代表人物的引領(lǐng)下,符號(hào)主義學(xué)說(shuō)在人工智能領(lǐng)域的統(tǒng)治地位維持了半個(gè)多世紀(jì),直到杰弗里 辛頓等學(xué)者引領(lǐng)的機(jī)器學(xué)習(xí)潮流出現(xiàn)。然而由于時(shí)代和相關(guān)技術(shù)的局限性,符號(hào)主義 AI 取得的兩大主要成就是符號(hào)表達(dá)和專(zhuān)家系統(tǒng)。

將知識(shí)符號(hào)化的過(guò)程又被稱(chēng)為符號(hào)表達(dá),也是實(shí)現(xiàn)符號(hào)主義 AI 的基礎(chǔ)步驟,其中應(yīng)用最廣的一個(gè)系統(tǒng)就是語(yǔ)義網(wǎng)絡(luò)。語(yǔ)義網(wǎng)絡(luò)可以直觀地呈現(xiàn)信息,并且能進(jìn)行復(fù)雜的語(yǔ)義推理。進(jìn)入互聯(lián)網(wǎng)時(shí)代,谷歌在 2012 年提出了知識(shí)圖譜的概念,語(yǔ)義網(wǎng)絡(luò)的相關(guān)研究和應(yīng)用又迎來(lái)了一個(gè)小高潮。在知識(shí)圖譜的幫助下,搜索引擎能夠確定 Apple(品牌)和 apple (水果)之間的區(qū)別。語(yǔ)義網(wǎng)絡(luò)在自然語(yǔ)言處理(NLP)和知識(shí)圖譜等領(lǐng)域至今仍廣泛應(yīng)用,是符號(hào)主義在今天仍然在發(fā)揮作用的為數(shù)不多的重要遺產(chǎn)。

符號(hào)主義的另一個(gè)主要成就是專(zhuān)家系統(tǒng)。顧名思義,專(zhuān)家系統(tǒng)是一套回答人們特定問(wèn)題的計(jì)算機(jī)系統(tǒng)。20 世紀(jì) 70 年代,計(jì)算機(jī)的硬件發(fā)展讓大規(guī)模的知識(shí)存儲(chǔ)成為可能,專(zhuān)家系統(tǒng)應(yīng)運(yùn)而生,這些系統(tǒng)基于特定行業(yè)的知識(shí)收集存儲(chǔ),并利用編程規(guī)則解決特定的專(zhuān)業(yè)問(wèn)題,如醫(yī)療診斷、金融分析等。專(zhuān)家系統(tǒng)的概念,第一次讓社會(huì)看到了人工智能在商業(yè)應(yīng)用中的前景。

人們對(duì)人工智能首次在商業(yè)世界中的大規(guī)模應(yīng)用充滿期待。然而后來(lái)的歷史證明,符號(hào)主義正在走入一條沒(méi)有出路的死胡同。符號(hào)主義相信,邏輯是認(rèn)知世界的唯一途徑,因?yàn)檫@是人類(lèi)認(rèn)知世界的方式,因此他們不辭辛勞地為計(jì)算機(jī)所做的每一個(gè)決定進(jìn)行編程。然而問(wèn)題是,現(xiàn)實(shí)世界往往充滿了定義不清和難以描述規(guī)則的事件,一個(gè)由工程師精心打造、像鐘表一樣精密的專(zhuān)家系統(tǒng)根本無(wú)法應(yīng)對(duì)這樣的情況。

專(zhuān)家系統(tǒng)未能達(dá)到預(yù)期,讓人們對(duì)人工智能產(chǎn)業(yè)再次失望,直接引發(fā)了人工智能第二個(gè)冬天的到來(lái)(見(jiàn)圖 1-1)。盡管深藍(lán)計(jì)算機(jī)應(yīng)用最新的統(tǒng)計(jì)學(xué)方法戰(zhàn)勝了人類(lèi),但這種勝利也展現(xiàn)了符號(hào)主義的局限性 IBM 花費(fèi)了多年時(shí)間和數(shù)百萬(wàn)美元開(kāi)發(fā)一臺(tái)能下國(guó)際象棋的計(jì)算機(jī),但僅此而已,深藍(lán)在其他領(lǐng)域毫無(wú)建樹(shù)。

到此為止,符號(hào)主義 AI 看似已經(jīng)進(jìn)入瓶頸,無(wú)法解決通用性和隨機(jī)性問(wèn)題的弊端讓 AI 難以實(shí)現(xiàn)可觀的商業(yè)價(jià)值。由于發(fā)展沒(méi)有達(dá)到外界預(yù)期,符號(hào)主義 AI 兩次陷入低谷,外部投資、政府支持和相關(guān)學(xué)術(shù)研究大量減少,史稱(chēng) AI 寒冬。浙江大學(xué)人工智能研究所所長(zhǎng)吳飛認(rèn)為:“將人類(lèi)所有知識(shí)收集起來(lái)且形式化的任務(wù)根本無(wú)法完成。人工智能需要模擬大腦而非追求嚴(yán)密的推導(dǎo)功能,即對(duì)推理的嚴(yán)格約束進(jìn)行松綁。”看來(lái)人工智能要實(shí)現(xiàn)破局,需要我們擁有一種完全不同的思維方式。

命途多舛的聯(lián)結(jié)主義

如果說(shuō)符號(hào)主義試圖模擬人類(lèi)的心智,那么聯(lián)結(jié)主義則試圖模擬人類(lèi)的大腦。與稱(chēng)霸主流的符號(hào)主義相比,聯(lián)結(jié)主義的發(fā)展更加一波三折,甚至有點(diǎn)像武俠小說(shuō)的情節(jié)主人公遭遇重大打擊卻矢志不渝,后來(lái)的一番奇遇讓他修得神功,最終一統(tǒng)江湖。聯(lián)結(jié)主義的主要思想模擬人腦的神經(jīng)網(wǎng)絡(luò)理論,在人工智能發(fā)展早期就已經(jīng)出現(xiàn),和符號(hào)主義分庭抗禮,但卻因?yàn)榉N種限制長(zhǎng)期被壓制,并沒(méi)有得到長(zhǎng)足發(fā)展。神經(jīng)網(wǎng)絡(luò)的創(chuàng)始人沃爾特 皮茨(Walter Pitts)英年早逝,第一個(gè)將神經(jīng)網(wǎng)絡(luò)投入應(yīng)用的學(xué)者弗蘭克 羅森布拉特(Frank Rosenblatt)甚至被很多人認(rèn)為是間接死于學(xué)派理論之爭(zhēng),直到辛頓攜深度學(xué)習(xí)出世,神經(jīng)網(wǎng)絡(luò)才成為人工智能研究的主流。

符號(hào)主義稱(chēng)霸了早期人工智能領(lǐng)域,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的聯(lián)結(jié)主義則統(tǒng)治了今天的人工智能領(lǐng)域。1943 年,神經(jīng)學(xué)家沃倫 麥卡洛克(Warren McCulloch)和數(shù)學(xué)家皮茨提出了首個(gè)人工神經(jīng)網(wǎng)絡(luò)模型,從而開(kāi)創(chuàng)了人工神經(jīng)網(wǎng)絡(luò)模擬人類(lèi)大腦研究的時(shí)代,這就是聯(lián)結(jié)主義的起源。后來(lái)人們根據(jù)麥卡洛克和皮茨的名字將神經(jīng)元模型命名為“M-P 神經(jīng)元模型”。神經(jīng)元模型的發(fā)布并沒(méi)有造成太大的影響力,因?yàn)樗鼘?shí)在太簡(jiǎn)單,人們不知道它能做什么。直到 1957 年,羅森布拉特在一臺(tái) IBM 704 計(jì)算機(jī)上模擬實(shí)現(xiàn)了一個(gè)叫作“感知機(jī)”(perceptron)的神經(jīng)網(wǎng)絡(luò)模型“Mark Ⅰ”(見(jiàn)圖 1-2),號(hào)稱(chēng)可以對(duì)手寫(xiě)數(shù)字進(jìn)行視覺(jué)識(shí)別和分類(lèi)。

簡(jiǎn)單來(lái)說(shuō),最初的神經(jīng)網(wǎng)絡(luò)就像一個(gè)超級(jí)大的參數(shù)方程,每個(gè)參數(shù)對(duì)應(yīng)手寫(xiě)數(shù)字的一個(gè)像素。通過(guò)研究大量的手寫(xiě)體數(shù)字,研究人員就可以設(shè)定每個(gè)參數(shù)的賦值在今天的大語(yǔ)言模型中稱(chēng)之為權(quán)重,神經(jīng)網(wǎng)絡(luò)就可以分辨數(shù)字了。

圖片來(lái)源:https://transbordeur.ch/en/2019/conversations/圖 1-2羅森布拉特和他的感知機(jī)“Mark Ⅰ”

盡管感知機(jī)的功能簡(jiǎn)單,卻有著重大意義。這是人類(lèi)第一次只需要通過(guò)預(yù)先的參數(shù)調(diào)整,不依靠編程,僅靠機(jī)器學(xué)習(xí)以完成某項(xiàng)智能任務(wù),這就展現(xiàn)了一條獨(dú)立于圖靈機(jī)和符號(hào)主義的實(shí)現(xiàn)人工智能的全新道路。至今所有以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的人工智能模型在最基本的工作原理上都與感知機(jī)并無(wú)二致。

更重要的是,它和主流的符號(hào)主義思想完全背道而馳,形成了一種學(xué)術(shù)路線之爭(zhēng),自然會(huì)引發(fā)學(xué)術(shù)同行的質(zhì)疑和論戰(zhàn)。聯(lián)結(jié)主義的代表馬文 明斯基和西摩爾 派普特(Seymour Papert)在 1969 年出版的《感知機(jī)》這本書(shū)中指出了感知機(jī)神經(jīng)網(wǎng)絡(luò)的一個(gè)致命問(wèn)題:神經(jīng)網(wǎng)絡(luò)可以很好地完成“與”“或”“非”的邏輯運(yùn)算,卻無(wú)法完成異或(exclusive-OR, 縮寫(xiě)成 XOR)這一人類(lèi)可以簡(jiǎn)單處理的邏輯運(yùn)算,這是由于像感知機(jī)這樣單層的神經(jīng)網(wǎng)絡(luò)(只有一層輸入層和一層輸出層)無(wú)法解決非線性分割問(wèn)題。

要解決這一問(wèn)題,只能通過(guò)多層神經(jīng)網(wǎng)絡(luò),也就是深度學(xué)習(xí)的方法,但由于當(dāng)時(shí)計(jì)算能力有限,根本無(wú)法解決多層神經(jīng)網(wǎng)絡(luò)造成計(jì)算量激增的問(wèn)題。

作為人工智能的先驅(qū),明斯基的著作在該領(lǐng)域有巨大的影響力,且他對(duì)單層神經(jīng)網(wǎng)絡(luò)缺點(diǎn)的論證幾乎無(wú)懈可擊,這在當(dāng)時(shí)人們的頭腦中烙下思想鋼印:“神經(jīng)網(wǎng)絡(luò)連最基本的邏輯運(yùn)算都無(wú)法完成,更不可能具有智能。” 從此之后,研究者對(duì)神經(jīng)網(wǎng)絡(luò)研究的熱情大減,甚至視之為人工智能研究的“異端”。由于在學(xué)術(shù)論戰(zhàn)中落敗,羅森布拉特從此一蹶不振,并在《感知機(jī)》出版不久后的 1971 年,不幸在自己 43 歲生日當(dāng)天溺水身亡。而在該書(shū)出版的同一年,年僅 46 歲的皮茨在收容所孤獨(dú)死去。4 個(gè)月之后,麥卡洛克也在醫(yī)院過(guò)世。

短短兩年間,幾位領(lǐng)軍人物相繼離世,這對(duì)整個(gè)聯(lián)結(jié)主義學(xué)派乃至人工智能領(lǐng)域來(lái)說(shuō)都是沉重的打擊,有關(guān)神經(jīng)網(wǎng)絡(luò)的研究進(jìn)入了一個(gè)長(zhǎng)達(dá)幾十年的低潮期,直到辛頓引領(lǐng)的深度學(xué)習(xí)潮流出現(xiàn),才上演了王者歸來(lái)的大戲。

可以看到,符號(hào)主義和聯(lián)結(jié)主義思潮在 20 世紀(jì) 60 年代相繼出現(xiàn),但各自都遭遇了挑戰(zhàn)和挫折。盡管符號(hào)主義是當(dāng)時(shí)的“顯學(xué)”,但也遇到了研究的瓶頸,無(wú)法滿足人們對(duì)人工智能不切實(shí)際的預(yù)期。而聯(lián)結(jié)主義則在路線斗爭(zhēng)中落于下風(fēng),被譏諷為“煉金術(shù)”,難以獲得資金和人才的支持。當(dāng)然,受限于時(shí)代,計(jì)算技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)的發(fā)展都剛剛萌芽,人工智能的研究者們很難將他們的設(shè)想化為現(xiàn)實(shí),這也是人工智能屢屢遭遇寒冬的客觀原因。

(本文節(jié)選自《云上的中國(guó)3》 作者:吳曉波 / 安健 / 劉斌)

本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港