展會信息港展會大全

ChatGPT引領(lǐng)的大模型時代,小模型還有機(jī)會嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-20 13:21:01   瀏覽:4059次  

導(dǎo)讀:每經(jīng)記者:蘭素英每經(jīng)編輯:高涵 圖片來源:主辦方供圖 隨著ChatGPT的問世,人工智能(AI)行業(yè)進(jìn)入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。 據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)?臻g至少達(dá)100...

每經(jīng)記者:蘭素英每經(jīng)編輯:高涵

圖片來源:主辦方供圖

隨著ChatGPT的問世,人工智能(AI)行業(yè)進(jìn)入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來越多的頭部廠商和創(chuàng)業(yè)者投入其中。

據(jù)花旗最新報告,保守估計生成式AI未來發(fā)展規(guī)模空間至少達(dá)100億美元,算上對云計算的加成和推動,市場增長潛力將進(jìn)一步打開。

有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達(dá)到10%。這場狂歡背后,實(shí)際上是AI發(fā)展的一次重大飛躍,將帶來一場生產(chǎn)力的革命。

為何ChatGPT能成為AI發(fā)展的拐點(diǎn)?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢?在大模型時代,中小模型將如何?

在5月17日成都舉行的“‘科技+資本’雙輪驅(qū)動的ChatGPT&LLM”閉門大咖會上,稀奇資本合伙人雷強(qiáng)生告訴《每日經(jīng)濟(jì)新聞》記者,從目前來看,大模型的賽道已經(jīng)擁擠不堪,機(jī)遇更傾向于頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,而對于更多的新入局者來說,應(yīng)該在小模型和子模型層面尋找機(jī)會。

每個行業(yè)都需要大模型嗎?

以ChatGPT為代表的AI技術(shù)被視為未來十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動了。一時間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢。據(jù)統(tǒng)計,目前國內(nèi)已有百度、阿里巴巴、華為等超過40家企業(yè)和機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。

為什么ChatGPT會觸發(fā)AI的拐點(diǎn)?

亞馬遜云科技資深解決方案架構(gòu)師賀楊在會議上表示,計算能力增長、數(shù)據(jù)增長、模型復(fù)雜性是AI處于拐點(diǎn)的關(guān)鍵驅(qū)動因素。他解釋稱,“我們可以將ChatGPT理解為AI 2.0,與AI 1.0最本質(zhì)的區(qū)別是用模型驅(qū)動任務(wù),將海量的數(shù)據(jù)壓縮存儲到模型里面,用非監(jiān)督的數(shù)據(jù)進(jìn)行訓(xùn)練。這樣的大模型可以支持很多重要任務(wù),包括文本生成、歸納、提娶問答。

毫無疑問,從GPT-3所需的參數(shù)量來看,訓(xùn)練大模型需要極大的代價。單是計算和資本的投入對大多數(shù)企業(yè)來說都是難以承受之重。以O(shè)penAI舉例來說,訓(xùn)練ChatGPT除了上萬張GPU芯片的投入以外,一個月的用電量也相當(dāng)于17萬家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時,大概花了半年時間。

在這樣的背景下,是不是所有企業(yè)或者每個細(xì)分領(lǐng)域都需要大模型呢?

昆侖萬維CEO方漢認(rèn)為,“所有行業(yè)現(xiàn)在都要干這個事兒,這是不得不干的,行業(yè)大模型的價值其實(shí)不在于做這個模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應(yīng)該重復(fù)這個過程。”

昆侖萬維CEO方漢 圖片來源:主辦方供圖

多模態(tài)發(fā)展是共識,但不會帶來人類智慧的躍升

目前,AI正在從文本、語音、視覺等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展。“基于多模態(tài)的預(yù)訓(xùn)練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點(diǎn)已成為業(yè)內(nèi)共識。建立統(tǒng)一的、跨場景、多任務(wù)的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個關(guān)鍵課題。

總部位于硅谷的向量數(shù)據(jù)庫公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個語言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個框架,它精確描述所有意圖、所有知識,把所有模態(tài)跨模態(tài)串聯(lián)起來。他估計未來兩到三年所有的模塊都會打通。

阿里巴巴達(dá)摩院的一份報告提到,多模態(tài)預(yù)訓(xùn)練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來積極影響。對個人而言,類似CLIP(對比語言-圖像預(yù)訓(xùn)練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達(dá)自己的創(chuàng)造力,無需再借助工具和編程專業(yè)能力。

對于這點(diǎn),成都普朗克科技創(chuàng)始人于芳表示無比贊同。她指出,對于喜歡畫畫和創(chuàng)造,而同時又屬于“手殘星人”的使用者來說,“多模態(tài)會賦予有創(chuàng)意、有想法的人‘手’和‘眼’,為其帶來無限的創(chuàng)作體驗(yàn),讓以前的不可能變?yōu)榭赡,這將是多模態(tài)給予這個時代的可能性。”

而對于企業(yè)來說,多模態(tài)預(yù)訓(xùn)練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開發(fā)能力的科技企業(yè),將會成為模型服務(wù)的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來,實(shí)現(xiàn)效率和成本最優(yōu)。

雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬維CEO方漢在會上提到一個有趣的觀點(diǎn),即大模型并不會帶來人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語料幾乎用完了。”不過,從工程角度來說,他認(rèn)為,圖片跟視頻這種多模態(tài)大模型應(yīng)用上就特別有價值。

大小模型未來幾年將“齊步走”

實(shí)際上,在2015年之前,小模型被認(rèn)為是理解語言的“最先進(jìn)的技術(shù)”。這些小模型擅長分析型任務(wù),被用于從“預(yù)測送達(dá)時間”到“欺詐信息分類”等各類任務(wù)中。

在大模型攪動全球之后,小模型是不是就走到“末路”了?

圖片來源:主辦方供圖

星爵認(rèn)為,大模型跟中小模型在未來幾年會并存。從技術(shù)層面來看,他以計算機(jī)為例來解釋,ChatGPT的通用大模型是超級計算機(jī),而我們每個人攜帶的筆記本、手機(jī)等智能模型,是更小的模型,不需要很強(qiáng)的算力就能獲得很好的效果。而從業(yè)務(wù)層面分析,一定會出現(xiàn)資源配置更加高效的小模型,尤其細(xì)分領(lǐng)域的專用模型。

谷歌近日在一年一度的開發(fā)者大會上推出最新大模型PaLM 2。這款大模型有四種參數(shù),從小到大分別為“壁虎” (Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨(dú)角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange's AI主理人Leo此前也對《每日經(jīng)濟(jì)新聞》記者表示,這種模式非常靈活,最小模型的速度非?,可以在手機(jī)本地運(yùn)行,而GPT-4則是單一大模型,速度較慢。

站在投資人的角度,稀奇資本合伙人雷強(qiáng)生認(rèn)為,更多的機(jī)會集中在小模型和子模型方面。

他在論壇后接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,“大模型賽道的主要玩家就是頭部廠商以及有號召力的互聯(lián)網(wǎng)大佬,例如前美團(tuán)聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)。”

在他看來,生成式AI的定位更多是一個工具,賦能其他行業(yè)降本增效,這正是小模型的機(jī)會。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實(shí)力更強(qiáng)的企業(yè),但除了高速公路,社會還需要國道、省道等。

對于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個方面:一是針對垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型。”

當(dāng)被問及如何選擇投資標(biāo)的時,他告訴每經(jīng)記者,主要分為兩類:聚焦場景化應(yīng)用的老玩家以及初創(chuàng)企業(yè)。“老玩家擁有大量高質(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會創(chuàng)造更豐富的應(yīng)用場景以及更完善的客戶體驗(yàn),市場空間更大。”他同時強(qiáng)調(diào)了選擇優(yōu)勢產(chǎn)業(yè)的重要性,“只有優(yōu)勢的產(chǎn)業(yè)才能長出創(chuàng)新的機(jī)會。”

每日經(jīng)濟(jì)新聞

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港