展會信息港展會大全

智譜AI CEO張鵬展望2024:大模型技術演進速度不會下降
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-18 10:22:15   瀏覽:6038次  

導讀:在經(jīng)歷了一段時間的野蠻生長后,業(yè)內人士普遍認為,2024年,國內大模型市場將逐漸回歸理性。誰將從百模大戰(zhàn)中脫穎而出成為業(yè)界最關注的話題。這其中,被稱作最像OpenAI的中國公司的智譜AI,吸引到了不少關注。 1月16日,智譜AI發(fā)布新一代基座大模型GLM-4,性...

在經(jīng)歷了一段時間的“野蠻生長”后,業(yè)內人士普遍認為,2024年,國內大模型市場將逐漸回歸理性。誰將從百模大戰(zhàn)中脫穎而出成為業(yè)界最關注的話題。這其中,被稱作“最像OpenAI的中國公司”的智譜AI,吸引到了不少關注。

1月16日,智譜AI發(fā)布新一代基座大模型GLM-4,性能相比上一代全面提升,綜合能力逼近 GPT-4。智譜AI CEO張鵬在接受《中國電子報》記者采訪時表示,大模型技術往前演進的空間很大,向上探索的天花板還遠遠沒到。

要“學習”但不是“成為”OpenAI

作為一家成立于2019年的創(chuàng)業(yè)公司,智譜AI是由清華大學計算機系知識工程實驗室的技術成果轉化而來,在人工智能領域擁有十多年的研究積淀。早在2020年,OpenAI推出GPT-3大模型,而國內大模型市場還沒“熱”起來的時候,智譜AI便把OpenAI當作對標對象,啟動自己的大模型項目,可以說是第一批“吃螃蟹”的人。

與其他商業(yè)化公司不同,智譜AI更像是一群學術研究者共同打造的一個“理想島”。“我們當時的想法是要發(fā)掘科技創(chuàng)新的源動力,希望通過提前掌握一些技術發(fā)展規(guī)律去指導科研、應用的方向,甚至指導產(chǎn)業(yè)的發(fā)展。大模型就是在這樣一個時間點、這樣一個環(huán)境下,我們找到的一個階段性的重要源動力。”張鵬坦言。

很多人喜歡把智譜AI和OpenAI放在一起做對比,對此,張鵬解讀說:“智譜AI和OpenAI最重要的一個相似之處是我們的目標相同,都希望能夠實現(xiàn)AGI,而且我們都認為大模型是實現(xiàn)AGI的必經(jīng)之路。由于目標相同、訴求一致,所以大家才會看到我們的發(fā)展路徑有相似性。”

但智譜AI也并不是完全按照OpenAI的路徑發(fā)展。不同于比較主流的 GPT,智譜AI采用的是全自研的GLM(通用語言模型)預訓練框架。“中國沒有自己的預訓練模型框架。無論是GPT、BERT,還是T5,都是西方的科學家提出的底層技術,我們希望打破壟斷,所以沒有完全復刻OpenAI的路徑。”張鵬說道。

他表示,從2020年開始,國外的一些頂尖的公司不再選擇開源路線,學術界關于大模型的研究和技術上的細節(jié)也不再公開,國內研發(fā)團隊相當于走進了“無人區(qū)”,前方?jīng)]有可供參照的道路。而一個千億參數(shù)規(guī)模的大模型研發(fā)成本動輒上千萬,試錯成本巨大。

“現(xiàn)在回過頭去看,當初選擇做大模型雖然有點‘孤注一擲’,但我們對自己是有信心的。”張鵬說道。官方信息顯示,智譜AI2023年已累計獲得超25億人民幣融資,主要參與方不乏美團、螞蟻、阿里、騰訊、小米等明星企業(yè)的身影。

要認識“差距”更要看清方向

在談及國內外大模型發(fā)展差距時,張鵬坦言:“從技術發(fā)展方面來看,國內外已經(jīng)沒有太大差距了,但在對于通用人工智能的認知,國際頂尖團隊的認知水平更高,創(chuàng)新氛圍更活躍,這讓其思考問題的層次更深入,眼光也更長遠。”

中國科學院院士、清華大學計算機系教授、清華大學人工智能研究院名譽院長張鈸曾分享過這樣一個觀點:通用人工智能的三要素(數(shù)據(jù)、算力和算法),應該升級為四個要素,第四個要素是知識。正是由于我們從大量的數(shù)據(jù)中獲取了知識,建立起了可解釋魯棒的人工智能理論,這才掀起了第三代人工智能浪潮。

張鵬對此觀點表示贊同。他指出,國內外社會發(fā)展階段不同、文化氛圍不同、技術發(fā)展水平不同,人工智能的投資決策邏輯、發(fā)展路徑也存在很大差異,因此不能完全照搬國外人工智能的發(fā)展經(jīng)驗。“可以借鑒是他們對通用人工智能的深刻認知以及活躍的創(chuàng)新思想和氛圍,但我們必須要承認差距的存在,也要保持‘不服輸’的心態(tài),虛心學習、奮力趕超。”張鵬說道。

智譜AI發(fā)布新一代基座大模型GLM-4現(xiàn)場

大模型的發(fā)展方向是“越來越像人”。張鵬表示:“以前我們解決的是簡單的自然語言交互的問題,以后要解決的是‘大腦’的問題,要讓它擁有人的大腦,能感知、能理解、能推理、能交互,還能自我學習。這種能力的拓展不應該是簡單的線性疊加,而應該是一種幾何關系,甚至是指數(shù)關系,將會產(chǎn)生爆炸式的增長。”

在他看來,未來大模型的泛用性將進一步提升。隨著技術的進步和資源的投入,未來的大模型將具有更高的精度、更強的理解能力和更廣泛的適用性。這不僅意味著它們能夠更好地理解自然語言,還能夠進行更多的復雜任務,如翻譯、推理、創(chuàng)作等。

多模態(tài)也是一個重要發(fā)展方向。除了傳統(tǒng)的文本處理之外,大模型將在語音識別、圖像生成、視頻理解和推薦系統(tǒng)等領域發(fā)揮更大的作用。此外,未來大模型還將更加定制化,這將使用戶能夠更加靈活地利用大模型來解決自己的問題。

要注重“模型能力”更要尋求應用落地

商業(yè)化落地是驗證一項新技術價值的最直接的方式,F(xiàn)階段來看,國內大模型百花齊放,但大部分仍處于講技術、講發(fā)展的階段。對于商業(yè)化落地,基本上處于探索階段。

“當模型能力提升到一定的水平線以上之后,模型的應用或者說在產(chǎn)業(yè)上的落地才能變得順理成章。”張鵬坦言,“現(xiàn)在大家感覺模型沒那么‘好用’,歸根究底還是在于模型的能力有限,在走向實際應用場景的過程中還需要攻克許多難題。”

比如“模型幻覺”,現(xiàn)在普遍的認知是不能把所有工作交給人工智能來做,尤其在一些關鍵性的、安全性要求高的場景中,幻覺問題不僅影響了模型的準確性和穩(wěn)定性,還制約了大模型在真實場景中的廣泛應用的可靠性。不過,可以采用人機協(xié)同的方式來避免模型幻覺帶來的一些問題。

從行業(yè)應用角度來看,大模型在工業(yè)制造領域的應用存在巨大的想象空間。“坦白地講,傳統(tǒng)工業(yè)企業(yè)大多還是以人力為主,相對互聯(lián)網(wǎng)行業(yè)、金融行業(yè)等來說,數(shù)字化基礎相對比較薄弱,在大模型應用過程中需要花費更多力氣。”張鵬說道。

據(jù)他分析,高技術需求、數(shù)據(jù)密集型場景將會成為大模型率先實現(xiàn)規(guī)模化落地的領域。“大模型實際上就是在模擬人的大腦,它更適合用在具有高技術需求,且需要根據(jù)大量數(shù)據(jù)和知識去做出判斷決策的場景中,而不是那些一線的、操作需求強的場景。”

以操作流程優(yōu)化這個場景為例,標準化的操作流程是工業(yè)企業(yè)提升良品率和工作效率的重要基矗原本需要幾十人組成的專家團隊,花費一個月時間針對某一種新型設備人工編寫的操作流程,在引入大模型技術后,編寫時間可以縮短一半,優(yōu)化效果提升30%。在降本增效的同時,操作流程涉及的工業(yè)數(shù)據(jù)將演變成企業(yè)內部可沉淀的標準化知識,減少對人的依賴。

“IT基礎設施成熟度、人才基儲技術基儲資金基礎等,這些條件共同決定了哪些行業(yè)能夠實現(xiàn)大模型率先落地。實際上,很多工業(yè)企業(yè)已經(jīng)在探索大模型應用了。”張鵬對《中國電子報》記者表示。比如在安全生產(chǎn)方面,上一代人工智能技術主要是通過布設大量的攝像頭來進行圖像識別,以此實現(xiàn)安全生產(chǎn)。然而,由于樣本數(shù)據(jù)標注周期長,照片、視頻等數(shù)據(jù)的識別與處理需要耗費大量人力和物力,這樣做的效率其實并不高。

如果引入一個學習過大量圖像數(shù)據(jù)的通用大模型,其本身已在若干任務上達到了基準水平,只需在上面稍做微調,增加一些定制化的需求能力,就能輕松實現(xiàn)原本需要花費大量人力物力才能達到的監(jiān)測效果。張鵬向記者透露:“我們已經(jīng)在和一些廠家在工業(yè)領域做大模型應用的前期測試。一些原本技術能力就不錯的工業(yè)企業(yè),也在開源版本的大模型上做了一些應用端的嘗試,效果非常不錯。”

在他看來,只有一定規(guī)模的通用大模型,才能實現(xiàn)類人的認知能力涌現(xiàn)。訓練一個通用大模型的成本很高,但在通用大模型基座上做微調可以大大降低整體成本,這對企業(yè)而言具有很大吸引力。未來,隨著技術進一步演進,使用者越來越多,大模型的進化將會越來越快。

“從全局視角來看,沒必要重復‘造輪子’,我們真正要做的事情是集中力量投入在最好的幾個通用大模型上,持續(xù)推動它的技術演進,加快智能涌現(xiàn)的到來。”張鵬坦言。至于未來什么樣的模型值得被留下,他表示應該回歸市場,用實踐和應用檢驗。

“2024年,大模型市場將從野蠻生長回歸冷靜,對于大模型的投資與炒作將會告一段落,行業(yè)焦點也將從模型本身轉向尋找應用。”張鵬表示,“不過這并不代表大模型的技術演進速度會下降,向上探索的天花板還遠遠沒到。”

贊助本站

人工智能實驗室
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港