劃重點(diǎn)
01人工智能研究公司OpenAI發(fā)布了最新版本的o1模型預(yù)覽,但未能延續(xù)ChatGPT-4和Sora的矚目。
02OpenAI的著名法則“算”力出奇跡的Scaling Law是否已走到極限,引發(fā)質(zhì)疑。
03然而,AlphaGo的成功經(jīng)驗表明,人工智能技術(shù)及其應(yīng)用的突破往往是在沉寂與質(zhì)疑中醞釀并最終爆發(fā)的。
04未來人工智能技術(shù)的發(fā)展需要克服技術(shù)、應(yīng)用場景、商業(yè)模式等多重挑戰(zhàn)。
05中國的人工智能技術(shù)面臨如何從高?蒲小⑵髽I(yè)合作和政府支持的雙重模式,尋求多樣的技術(shù)可能性的問題。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
經(jīng)濟(jì)觀察報 楊蔚/文 2024年9月13日,人工智能研究公司OpenAI發(fā)布了最新版本的o1模型預(yù)覽。令人意外的是,這個號稱能夠解決大模型在數(shù)理邏輯方面缺陷和幻覺問題的重大更新,卻并沒能延續(xù)ChatGPT-4和Sora(人工智能文生視頻大模型)的矚目,公眾的關(guān)注中多了一份謹(jǐn)慎和審視。
為什么不是GPT-5?性能是否真的達(dá)到了宣傳中的效果?OpenAI的著名法則,“算”力出奇跡的Scaling Law(縮放定律)是否已走到極限?相比ChatGPT推出伊始的勢如破竹,一次次OpenAI新品發(fā)布不斷發(fā)酵的卻是逐步積累的質(zhì)疑和猜想。經(jīng)歷最初的驚艷和狂熱后,公眾對于大模型技術(shù)和應(yīng)用的潛力和未來了更多不同的聲音。
與其他技術(shù)創(chuàng)新相比,人工智能技術(shù)似乎展現(xiàn)出更為明顯的周期性,常常在公眾和資本熱度過后引發(fā)爭議,甚至陷入沉寂。然而,歷史證明,社會輿論和投資者預(yù)期的劇烈波動并不能真實反映人工智能技術(shù)的發(fā)展軌跡和內(nèi)在價值。人工智能技術(shù)及其應(yīng)用的突破,往往是在沉寂與質(zhì)疑中醞釀并最終爆發(fā)的。
AlphaGo的前塵往事
時間回到2010年。當(dāng)時的人工智能技術(shù)發(fā)展可以說正處于黎明前最后的黑暗時刻。彼時還是助理教授的李飛飛剛剛發(fā)布了Imagenet世界首個大型的非結(jié)構(gòu)化圖片數(shù)據(jù)庫。
直到兩年后,當(dāng)今人工智能的主流技術(shù)卷積神經(jīng)網(wǎng)絡(luò),才在基于這個數(shù)據(jù)庫的視覺識別比賽中,超越其他技術(shù)路徑異軍突起。而人工智能對于高度模糊、變動性不確定性極大的語言文本分析處理能力,更是無從談起基于卷積神經(jīng)網(wǎng)絡(luò)的注意力機(jī)制改進(jìn),也就是我們現(xiàn)在大語言模型的基礎(chǔ),更是直到2017年才初具雛形。
在這樣的技術(shù)混沌期,一個名不見經(jīng)傳的人工智能初創(chuàng)企業(yè)悄然在英國倫敦誕生了;仡欉@家企業(yè)當(dāng)時網(wǎng)站上簡略模糊的信息,我們很難想象它會在日后成長為巨大影響力的獨(dú)角獸,并在人工智能發(fā)展中引起軒然大波。企業(yè)由一個沒有任何人工智能經(jīng)驗的神經(jīng)外科博士和他的同事創(chuàng)辦,沒有產(chǎn)品,沒有技術(shù)專利,也沒有收入。網(wǎng)站上僅有的信息,顯示這家公司是在探索和游戲、機(jī)器學(xué)習(xí)、電子商務(wù)算法相關(guān)的人工智能。
令人意外的是,這家大西洋彼岸的初創(chuàng)企業(yè)DeepMind引起了馬斯克的注意。在特斯拉業(yè)務(wù)初見起色的2011年,他以天使投資人的身份參與到了DeepMind的發(fā)展中。
有趣的是,馬斯后來說起對Deep-Mind的投資,是出于對電影《終結(jié)者》的恐懼,這與5年后他成立OpenAI的初衷如出一轍。值得注意的是,馬斯克早期的經(jīng)營重點(diǎn)更多還是放在了特斯拉上,對于外部初創(chuàng)企業(yè)的投資,其實并不頻繁。但這兩家有著馬斯克身影的初創(chuàng)型組織,雖然沒有像馬斯克希望的那樣去真正解決人工智能的倫理和風(fēng)險問題,卻兩度成為推動這一技術(shù)從低谷走向高峰的最重要力量。
DeepMind的真正轉(zhuǎn)機(jī)出現(xiàn)在馬斯克投資之后,即谷歌的收購要約。谷歌在2014年以6.6億美元的超高溢價,打敗了同為硅谷巨頭的競爭對手臉書,收購了DeepMind及其團(tuán)隊。至此,這家一直尋覓技術(shù)路徑和應(yīng)用場景的初創(chuàng)企業(yè),似乎找到了別具一格的探索方向研究用人工智能下圍棋。
對計算機(jī)對弈算法的研究其實并不鮮見,最早可以追述至人工智能誕生伊始。IBM的深藍(lán)在1997年就在國際象棋的競技中打敗了人類選手。但圍棋的難度是空前巨大的,圍棋棋盤中兩子對奕所衍生出來的棋路可能性,甚至超過整個宇宙中原子的數(shù)量總和。圍棋戰(zhàn)略對抗中高度的復(fù)雜性,意味著優(yōu)秀的圍棋選手不僅依靠大強(qiáng)度的訓(xùn)練,更是在經(jīng)驗積累中不斷強(qiáng)化的天賦和直覺。傳統(tǒng)的計算機(jī)程序依靠窮舉或暴力演算搜尋,顯然無法復(fù)制頂尖棋手對弈決策中罕見的天賦型能力,超越更是無從談起。在DeepMind之前的數(shù)十年,計算機(jī)的圍棋水平僅能勉強(qiáng)對戰(zhàn)業(yè)余選手。
當(dāng)DeepMind宣布要用其開發(fā)的人工智能圍棋程序AlphaGo挑戰(zhàn)世界頂尖的九段圍棋高手、已經(jīng)拿下18個冠軍頭銜的李世石時,無論是計算機(jī)科學(xué)家還是圍棋界都普遍都認(rèn)為人類的勝利在這樣的挑戰(zhàn)中幾乎毫無懸念。李世石本人在賽前曾預(yù)測,“5盤棋不應(yīng)該是3/2,也許是4/1或5/0,但我一定會贏”。
這場發(fā)生在2016年3月的結(jié)果卻出乎所有人意料,AlphaGo以4:1的成績戰(zhàn)勝了李世石,震驚世界。當(dāng)代人工智能技術(shù)通過圍棋,這一古老且家喻戶曉且具有社會驗證屬性的策略競技方式,空前直白地展現(xiàn)出驚人潛力。AlphaGo勝利所帶來的軒然大波與7年后ChatGPT的火爆如出一轍,都深刻地塑造了其后人工智能技術(shù)的發(fā)展。
AlphaGo的影響首先出現(xiàn)在相關(guān)的開發(fā)者社區(qū)當(dāng)中。我和美國杜蘭大學(xué)的張雨辰教授2022年發(fā)表于《戰(zhàn)略管理期刊》(StrategicManagementJour-nal)的研究中,通過分析開發(fā)者問答社區(qū)Stackoverflow和世界上最大的開源代碼平臺GitHub的開發(fā)者行為數(shù)據(jù)發(fā)現(xiàn),AlphaGo使得開發(fā)者在人工智能創(chuàng)新中,能夠更好的運(yùn)用平移、類比等思維認(rèn)知模式提出更為復(fù)雜的問題。而復(fù)雜問題的求解,是新興技術(shù)突破后進(jìn)一步創(chuàng)新的關(guān)鍵。
AlphaGo通過圍棋挑戰(zhàn)所得到的社會范圍的關(guān)注、認(rèn)可和性能驗證,不僅進(jìn)一步確定了其選擇的深度學(xué)習(xí)的技術(shù)潛力,更激勵和影響了人工智能領(lǐng)域的投資活動和人才儲備。正是這些微觀基礎(chǔ)層面的悄然變革奠定了日后整體人工智能技術(shù)發(fā)展的基矗
技術(shù)成功之后
AlphaGo出人意料的成功,背后離不開母公司谷歌的支持。早在2004年上市時,谷歌就擁有硅谷最大的服務(wù)器集群之一,更是在2015年就推出了自己的專有算力芯片TPU,其計算能力甚至超過了當(dāng)時的主流運(yùn)算芯片英偉達(dá)。強(qiáng)大的算力是深度學(xué)習(xí)人工智能算法發(fā)展不可或缺的配套資產(chǎn)。
值得注意的是,DeepMind在被收購后,不再需要直接應(yīng)對大部分營收壓力。作為谷歌子公司,DeepMind在人工智能上取得的科研成果,更多是面向谷歌內(nèi)部的轉(zhuǎn)化,被應(yīng)用到其搜索、視頻推薦和數(shù)據(jù)中心能源系統(tǒng)管理等業(yè)務(wù),這使得DeepMind在很大程度上可以不計成本地專注研發(fā),不斷推進(jìn)技術(shù)本身的性能潛力。
新興技術(shù)的突破,往往是初創(chuàng)企業(yè)與技術(shù)巨頭通力合作的結(jié)果,這樣的互動還會進(jìn)一步塑造技術(shù)的發(fā)展。
初創(chuàng)企業(yè)通常被視作顛覆性技術(shù)的來源,具有極大的創(chuàng)造力和探索精神,但商業(yè)化過程中,卻面臨缺乏市場經(jīng)驗、客戶資源和配套資產(chǎn)的挑戰(zhàn)。巨頭和成熟企業(yè)往往具備很強(qiáng)的商業(yè)化能力以及相關(guān)資源,但因路徑依賴和長期發(fā)展積累的組織惰性,往往在研發(fā)過程中只能基于現(xiàn)有的成功產(chǎn)品進(jìn)行漸進(jìn)式創(chuàng)新搜尋。
因此,初創(chuàng)企業(yè)和巨頭通過并購、戰(zhàn)略投資等合作,不僅能推動初創(chuàng)企業(yè)的技術(shù)創(chuàng)新,也成為技術(shù)巨頭獲取新技術(shù)的重要窗口和通道。
我在與美國得克薩斯大學(xué)奧斯汀分校 McCombs商學(xué)院的 FranciscoPolidoro教授的合作研究中發(fā)現(xiàn),生物制藥領(lǐng)域的重大創(chuàng)新同樣離不開大型藥廠戰(zhàn)略投資的參與,這樣的戰(zhàn)略投資和并購也會影響新興技術(shù)其后的發(fā)展。為了更好的利用巨頭的配套資產(chǎn),初創(chuàng)企業(yè)的技術(shù)路徑會向巨頭逐漸靠攏。
在人工智能領(lǐng)域,AlphaGo對于谷歌人工智能算法和服務(wù)器的利用,同樣展現(xiàn)出這樣的特點(diǎn),并直接影響技術(shù)性能的發(fā)展,進(jìn)而決定AlphaGo與李世石對決中的勝利。
然而,AlphaGo所引發(fā)的熱潮并未能一直持續(xù)。圍棋的復(fù)雜性、競技性和對抗性與典型可變現(xiàn)的商業(yè)化應(yīng)用場景具有很大的區(qū)別。熱度散去后,深度學(xué)習(xí)的商業(yè)前景開始受到質(zhì)疑。DeepMind選擇蛋白質(zhì)解析這個在生物學(xué)中看似極為專業(yè)聚焦的領(lǐng)域作為商業(yè)化的第一個嘗試,似乎也驗證了公眾對于深度學(xué)習(xí)商業(yè)化潛力的質(zhì)疑。
在AlphaGo基礎(chǔ)上的AlphaFold展示出同樣驚人的性能潛力,通過預(yù)測蛋白質(zhì)內(nèi)極大的數(shù)量的氨基酸形態(tài)解析蛋白質(zhì)結(jié)構(gòu),2年內(nèi)完成了超過15萬個人類蛋白質(zhì)解析,超過生物學(xué)家過去50年通過傳統(tǒng)方法完成工作量的3倍。然而,社會卻因為這一基礎(chǔ)領(lǐng)域探索在應(yīng)用廣度上的局限,對技術(shù)整體的商業(yè)化前景產(chǎn)生了質(zhì)疑,寄予深度學(xué)習(xí)的關(guān)注和期望在這個期間逐漸降溫,風(fēng)險投資的增長也逐步趨緩。
但實際上,深度學(xué)習(xí)技術(shù)真正蛻變成具有更為廣闊應(yīng)用潛力的通用性技術(shù),卻是在這樣的社會驗證引發(fā)的關(guān)注高潮過后、在公眾熱情退卻的冷靜期悄然實現(xiàn)的。
2020年,AlphaFold2推出,在其后的2年內(nèi)完成超過100萬個物種2.14億中蛋白質(zhì)結(jié)構(gòu)的預(yù)測解析,幾乎涵蓋了世界上全部的“蛋白質(zhì)宇宙”。這一成果在很大程度上解決了傳統(tǒng)蛋白質(zhì)解析面臨的因人力資源和儀器資金高投入所面臨的效率問題,為下游相關(guān)的生物制藥和醫(yī)療應(yīng)用領(lǐng)域研發(fā)打開了新的大門。蛋白質(zhì)解析領(lǐng)域的領(lǐng)軍人物施一公曾經(jīng)評價到,“AlphaFold蛋白質(zhì)解析是本世紀(jì)最重要的科學(xué)突破之一”。
2024年5月,AlphaFold3推出,在原有的卷積神經(jīng)網(wǎng)絡(luò)和增強(qiáng)學(xué)習(xí)技術(shù)上,AlphaFold3運(yùn)用了大模型中廣泛運(yùn)用的注意力機(jī)制加擴(kuò)散算法。在不斷的迭代發(fā)展中,AlphaFold3已經(jīng)可以蛋白質(zhì)以外的幾乎所有的生物分子結(jié)構(gòu)。
這意味著,這一技術(shù)可以更為廣泛地應(yīng)用在生物學(xué)、高科技甚至是部分傳統(tǒng)的生產(chǎn)制造領(lǐng)域。從分子結(jié)構(gòu)層面對于材料、配方和生產(chǎn)流程的進(jìn)一步理解,能夠極大拓寬這些領(lǐng)域的技術(shù)以及應(yīng)用機(jī)會,而對于這樣技術(shù)的應(yīng)用所帶來的知識變革,也將會對這些行業(yè)的競爭藍(lán)圖產(chǎn)生深刻甚至是顛覆性的影響。
未來之路
縱觀從AlphaGo到AlphaFold3的發(fā)展過程,我們看到的是過去9年間,從技術(shù)爆發(fā)到應(yīng)用的迷茫,再到特定領(lǐng)域聚焦的探索,最后在不斷向外擴(kuò)展的應(yīng)用邊界中呈現(xiàn)出更為確定的通用潛力。這個歷程無疑驗證了比爾蓋茨的名言,“我們總是高估未來兩年內(nèi)發(fā)生的變化,低估未來十年內(nèi)發(fā)生的變化”。
面對ChatGPT和更為新興的大模型技術(shù),也許在不遠(yuǎn)的未來,我們?nèi)詴吹紸lphaGo所經(jīng)歷過的風(fēng)口沉寂。盡管性能驚人,大模型的真正應(yīng)用還要攻克技術(shù)、應(yīng)用場景、商業(yè)模式等眾多挑戰(zhàn)。
首先,創(chuàng)新的商業(yè)化應(yīng)用是高性能技術(shù)的成功組合,而不是單一技術(shù)的延展。目前,大模型基于表征關(guān)聯(lián)產(chǎn)生的幻覺問題,也許需要輔助技術(shù)的加持,而不是單一在技術(shù)內(nèi)尋求性能突破。如何通過技術(shù)的疊加和組合,讓大模型能夠更為有效地在預(yù)訓(xùn)練的基礎(chǔ)上學(xué)習(xí)和理解世界,也許成為未來技術(shù)突破和從技術(shù)上競爭優(yōu)勢的關(guān)鍵之一。
第二,大模型本身性能的提升和商業(yè)化,也有賴于人工智能技術(shù)之外多維度的創(chuàng)新突破。技術(shù)的成功商業(yè)化離不開與技術(shù)相匹配的配套資產(chǎn)的發(fā)展。尤其是大模型的Scaling Law,指數(shù)級極大參數(shù)疊加才能帶來語義理解性能的倍數(shù)提升,這使得當(dāng)前人工智能的訓(xùn)練和推理從本質(zhì)上就無法避免極大的算力消耗。如何能夠提高大模型的效率降低能耗,從算法上用更小的參數(shù)實現(xiàn)相同的性能,從數(shù)據(jù)上提高訓(xùn)練效率。這些都是大模型進(jìn)一步發(fā)展亟待解決的問題。
第三,大模型的不確定性還來自于人工智能基礎(chǔ)科研層面面臨的挑戰(zhàn)。縱觀美國信息技術(shù)以及其他高新技術(shù)的發(fā)展史,由政府資助、高校主導(dǎo)的基礎(chǔ)科研一直發(fā)揮著至關(guān)重要的基礎(chǔ)知識生產(chǎn)、篩選和初步轉(zhuǎn)化的的職責(zé)。包括互聯(lián)網(wǎng)等當(dāng)代至關(guān)重要的技術(shù)發(fā)明,最初都誕生于高?蒲。但大模型的超高的算力需求以及相應(yīng)的資本投入,已經(jīng)超出了目前美國學(xué)校的經(jīng)費(fèi)承受能力,這使得人工智能領(lǐng)域的基礎(chǔ)科研向企業(yè)轉(zhuǎn)移李飛飛和前谷歌首席科學(xué)家辛頓在2023年10月的一次對話訪談中如是說。
在很大程度上,任何以單一應(yīng)用導(dǎo)向的基礎(chǔ)研究都具有很高的風(fēng)險。在新興技術(shù)發(fā)展的早期,實現(xiàn)盡可能大的技術(shù)多樣性,才能夠保證最優(yōu)的創(chuàng)新組合在充分的技術(shù)競爭中得以留存,最終成為主導(dǎo)。企業(yè)以商業(yè)應(yīng)用和利潤為導(dǎo)向的本質(zhì),有可能會導(dǎo)致其基礎(chǔ)科研過早偏于保守和單一,錯過更為激進(jìn)但有效的遠(yuǎn)程技術(shù)機(jī)會。
中國的人工智能技術(shù)同樣面臨這樣的風(fēng)險。如何從高?蒲、通過企業(yè)合作和政府支持的雙重模式,尋求多樣的技術(shù)可能性,或許能在一定程度上縮短AlphaGo由企業(yè)主導(dǎo)的技術(shù)探索期,成為未來人工智能技術(shù)更為快速破局的關(guān)鍵。
在應(yīng)用層面,AlphaGo的發(fā)展歷程,對于我們理解人工智能的未來,也具有啟示意義。新技術(shù)應(yīng)用層面的成功商業(yè)化,起始于與技術(shù)特點(diǎn)和路徑最為適配的相關(guān)領(lǐng)域,隨著應(yīng)用的逐漸成熟,才會在這些領(lǐng)域的臨近區(qū)域?qū)で笱诱箼C(jī)會,最后在更為廣闊的層面延展泛化。
在人工智能的發(fā)展中,公眾熱情和投資所呈現(xiàn)的周期性,也源于技術(shù)早期的真實適用范圍與外界預(yù)期的錯配。而過早投資在應(yīng)用領(lǐng)域,在新興技術(shù)性能無法適配的情況下強(qiáng)行尋求應(yīng)用甚至人為制造風(fēng)口,并不能真正加速技術(shù)的成熟,反而會導(dǎo)致稀缺資源的浪費(fèi)和錯配。
喧囂過后,對于挑戰(zhàn)的直面和努力,對于風(fēng)險下的契機(jī)識別和把握,對于制度的不斷完善和資源配置的悉心規(guī)劃,也許是當(dāng)下實現(xiàn)從ChatGPT到通用人工智能蛻變的基礎(chǔ)和關(guān)鍵,讓這一備受關(guān)注的技術(shù),在更長遠(yuǎn)的未來真正賦能各個應(yīng)用領(lǐng)域的產(chǎn)業(yè)升級和變革。
(作者系中歐國際工商學(xué)院管理學(xué)副教授)