《科創(chuàng)板日?qǐng)?bào)》7月8日訊(記者 黃心怡)在WAIC2023期間,阿里云推出了國內(nèi)首款大模型調(diào)用工具魔搭GPT(ModelScopeGPT),它能接收用戶指令,通過“中樞模型”一鍵調(diào)用魔搭社區(qū)其他的AI模型,大小模型協(xié)同完成復(fù)雜任務(wù)。目前,魔搭GPT已能夠調(diào)用魔搭社區(qū)十多個(gè)核心AI模型的API。
“目前,大語言模型在文本創(chuàng)作、內(nèi)容生成等方面,都有驚艷表現(xiàn)。但作為一個(gè)大模型,如果本身只有文本生成能力的話,其實(shí)并不足夠的。我們提出了魔搭GPT,主要理念是以大模型為中樞,調(diào)動(dòng)各種各樣的小模型API,來彌補(bǔ)大模型在圖片生成、語言視頻、視頻生成等能力上的不足。” 阿里巴巴達(dá)摩院高級(jí)算法工程師李晨亮對(duì)《科創(chuàng)板日?qǐng)?bào)》記者表示。
當(dāng)前,如何把通用大模型做小做精,讓行業(yè)更快用起來,是一大探索方向。在這方面,李晨亮向《科創(chuàng)板日?qǐng)?bào)》記者介紹,“為了讓各行各業(yè)的這種開發(fā)者能夠把大模型用在真實(shí)的業(yè)務(wù)場(chǎng)景上,我們對(duì)大模型做了很多的一些優(yōu)化,包括利用蒸餾壓縮的方法,來提供更多的小模型;通過模型量化,來壓縮得到小模型等。后續(xù)也會(huì)開放更多和大模型周邊相關(guān)的工具,來幫助模型的落地應(yīng)用。”
構(gòu)建和訓(xùn)練一個(gè)大模型需要大量的計(jì)算資源和數(shù)據(jù),這對(duì)于個(gè)人研究者或者小團(tuán)隊(duì)來說非常具有挑戰(zhàn)性。在這樣的背景下,開源開放的生態(tài)系統(tǒng)成為了推進(jìn)大模型技術(shù)發(fā)展的重要力量。
目前,阿里云魔搭社區(qū)是國內(nèi)最大的AI模型社區(qū),集聚了180多萬AI開發(fā)者和900多個(gè)AI模型。模型貢獻(xiàn)者包括百川智能、嗶哩嗶哩、IDEA研究院、蘭丁股份、瀾舟科技、openBMB社區(qū)、啟智社區(qū)、清華TSAIL、RWKV、深勢(shì)科技、WeNet社區(qū)、元語智能、浙江大學(xué)、智譜AI等,貢獻(xiàn)了30多個(gè)10億以上參數(shù)規(guī)模大模型。
“開源生態(tài)肯定是有助于大模型的繁榮。”李晨亮強(qiáng)調(diào),“2018年谷歌提出了BERT大模型,并開源了模型的代碼,這帶來了整個(gè)預(yù)訓(xùn)練大模型領(lǐng)域的繁榮。如果沒有BERT的開源,那可能就沒有如今大模型的繁榮現(xiàn)狀,整個(gè)業(yè)界發(fā)展得會(huì)比較慢。”
以數(shù)據(jù)層面為例,大模型非常依賴于數(shù)據(jù)的質(zhì)量。“”現(xiàn)在不管是大廠還是創(chuàng)業(yè)公司,自身都有大量的數(shù)據(jù)積累。如果大家能夠把一些數(shù)據(jù)貢獻(xiàn)出來,構(gòu)建高質(zhì)量、更大規(guī)模的開源數(shù)據(jù)集,那么不管是從自身模型的迭代,還是國內(nèi)大模型發(fā)展速度,都能帶來很大的提升。” 李晨亮呼吁。
(財(cái)聯(lián)社記者 黃心怡)