每經(jīng)記者:張蕊每經(jīng)編輯:陳旭
5月25日,2023中關(guān)村論壇在北京開幕,論壇將持續(xù)到5月30日。
人工智能大模型發(fā)展論壇現(xiàn)場 每經(jīng)記者 張蕊 攝
在本次論壇的“人工智能大模型發(fā)展”平行論壇上,百度首席技術(shù)官王海峰以《文心一言,讀書破萬億》為題發(fā)表了主旨演講,并通過演講展示了百度全新一代知識增強大語言模型文心一言在知識問答、寫文稿、作詩、生成視頻、推理計算以及工作場景中智能總結(jié)等多方面的能力。
王海峰表示,得益于百度在人工智能技術(shù)領(lǐng)域的全面布局和技術(shù)積累,尤其是飛槳深度學習平臺和文心大模型的聯(lián)合優(yōu)化,文心一言在一個多月時間推理性能提升了近10倍,效率更高,效果更好。目前,飛槳深度學習平臺已凝聚了535萬開發(fā)者,服務(wù)20萬家企事業(yè)單位,基于飛槳創(chuàng)建了67萬個模型,位居中國深度學習平臺市場綜合份額第一。
對于大模型產(chǎn)業(yè)化面臨的挑戰(zhàn),王海峰認為,當前出現(xiàn)了類似芯片代工廠的模式,一些具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)可以將模型生產(chǎn)的復雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。
論壇上,王海峰回答了《每日經(jīng)濟新聞》記者關(guān)于影響AI模型效果的因素有哪些、大模型的核心競爭壁壘是什么、是否每個企業(yè)都需要構(gòu)建自己的大模型的提問。
百度首席技術(shù)官王海峰 圖片來源:主辦方
王海峰告訴《每日經(jīng)濟新聞》記者,一個大模型要得到更好的效果,通常人工智能的算法、算力、數(shù)據(jù)方面都會起很大作用。“簡單地說,算法有更好的算法,數(shù)據(jù)有更多的數(shù)據(jù),或者有更多算力,但這還不夠,更重要的是三者其實是在聯(lián)合優(yōu)化的。”
“就算力而言,剛才我說到4層架構(gòu),算力是基礎(chǔ),而算力很大程度上實際上是在跟框架平臺這一層打交道。”王海峰說,比如像飛槳這樣一個深度學習框架平臺,它跟幾乎所有國際或國內(nèi)的主流芯片都有適配。“而算法當然是很核心的,很多進步最終還是靠算法。”他說,算法的進步效率更高,一個算法的改進可能就是多少倍甚至是成數(shù)量級的提升。
而數(shù)據(jù)意味著什么?在王海峰看來,數(shù)據(jù)很大程度上其實是意味著應用場景等。建構(gòu)一個基礎(chǔ)的預訓練大模型時數(shù)據(jù)會特別多,這就意味著它有一個基本的通識知識了,但應用于各種場景時,每一個場景都會帶來自己的數(shù)據(jù),當一個場景要用這種大模型時,往往是針對這個場景的需求標注很好的數(shù)據(jù),就會得到事半功倍的效果。
“所以我們?nèi)绻f日常工作,其實這幾方面都在優(yōu)化,而且是在聯(lián)合優(yōu)化,不斷地相互影響、互相迭代。”王海峰說。
每日經(jīng)濟新聞