展會(huì)信息港展會(huì)大全

追一科技 CEO 吳悅:大模型落地,場(chǎng)景、成本及效果,缺一不可
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-28   瀏覽:912次  

導(dǎo)讀:“下一個(gè)發(fā)展趨勢(shì)應(yīng)該是NLP對(duì)話!2016年吳悅從騰訊離開(kāi)時(shí)如是說(shuō),而這也成為了他離職后創(chuàng)業(yè)的首選方向。 2006年,從中科大碩士畢業(yè)后的吳悅便加入了騰訊。2006年到2011年,在騰訊主要做存儲(chǔ)系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。 對(duì)于為 ......

追一科技 CEO 吳悅:大模型落地,場(chǎng)景、成本及效果,缺一不可

“下一個(gè)發(fā)展趨勢(shì)應(yīng)該是NLP對(duì)話!2016年吳悅從騰訊離開(kāi)時(shí)如是說(shuō),而這也成為了他離職后創(chuàng)業(yè)的首選方向。

2006年,從中科大碩士畢業(yè)后的吳悅便加入了騰訊。2006年到2011年,在騰訊主要做存儲(chǔ)系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。

對(duì)于為何一開(kāi)始聚焦在NLP領(lǐng)域進(jìn)行創(chuàng)業(yè)。追一科技創(chuàng)始人兼CEO吳悅解釋道:“在騰訊既做過(guò)基礎(chǔ)架構(gòu),又做過(guò)搜索推薦,當(dāng)時(shí)我們就覺(jué)得NLP技術(shù)的商業(yè)價(jià)值非常大。搜索方面,孵化出了Google、百度等大公司,其實(shí)這些公司都屬于 NLP 時(shí)代比較典型的搜索應(yīng)用。推薦方面,孵化出了頭條等,在這個(gè)基礎(chǔ)上,我們判定下一個(gè)方向應(yīng)該是NLP對(duì)話!

就這樣,創(chuàng)辦追一科技之后,吳悅便主攻NLP和深度學(xué)習(xí)方向,并相繼推出對(duì)話與分析AI應(yīng)用平臺(tái)及AIForce數(shù)字員工產(chǎn)品族。其中,AIForce數(shù)字員工產(chǎn)品族就是處理營(yíng)銷(xiāo)、服務(wù)、運(yùn)營(yíng)等場(chǎng)景任務(wù)的智能機(jī)器人,也是追一的主要產(chǎn)品矩陣,其包括智能在線機(jī)器人Bot、智能語(yǔ)音機(jī)器人Call、智能助理機(jī)器人Pal、多模態(tài)數(shù)字人Face等。

在當(dāng)時(shí)來(lái)看,這一系列產(chǎn)品的研發(fā)并非一件易事。所以自成立之初,追一就特別注重新技術(shù)的應(yīng)用,對(duì)此,吳悅也特別強(qiáng)調(diào)道,2017年 Transformer 架構(gòu),以及2018年提出的Bert架構(gòu),我們都做了相關(guān)研究。比如圍繞 Transformer 提出了 RoPE旋轉(zhuǎn)位置編碼技術(shù)。被Google、Meta、阿里、百川智能等國(guó)內(nèi)外大模型廠商廣泛采用。

當(dāng)談到2022年底爆火的生成式大模型時(shí),吳悅深刻地感知到了原有的技術(shù)架構(gòu)已不能順應(yīng)市場(chǎng)的變化,以及客戶的需求,所以在今年年初,追一科技便嘗試在大模型技術(shù)的基礎(chǔ)上做研究,推出了博文領(lǐng)域大模型,并基于大模型的能力,對(duì)現(xiàn)有的軟件產(chǎn)品進(jìn)行重塑。

在大模型熱潮中,追一沒(méi)有選擇通用大模型賽道,而是選擇了領(lǐng)域大模型。究其原因,吳悅告訴AI科技評(píng)論,大模型的演進(jìn)方向主要有兩個(gè)分支:

一是沿著通用大模型的方向發(fā)展,需要不斷打開(kāi)大模型能力的天花板。比如 OpenAI 或者國(guó)內(nèi)的一些大模型廠商是沿著這個(gè)方向發(fā)展的。

另一個(gè)分支是,圍繞企業(yè)具體的業(yè)務(wù)場(chǎng)景的需求,定制化一個(gè)企業(yè)大模型。追一科技在今年年初推出的博文領(lǐng)域大模型屬于第二個(gè)分支,就是面向企業(yè)的具體業(yè)務(wù),比如營(yíng)銷(xiāo)、客服等場(chǎng)景,為企業(yè)定制一個(gè)專有大模型。

但是從目前來(lái)看,無(wú)論是通用模型還是領(lǐng)域模型,其挑戰(zhàn)都非常大。通用大模型的難度主要是規(guī)模化的難度,包括參數(shù)量上規(guī)模、數(shù)據(jù)上規(guī)模和算力上規(guī)模帶來(lái)的難度。而領(lǐng)域模型考驗(yàn)的則是直擊客戶業(yè)務(wù)痛點(diǎn)以及洞察客戶需求的能力,但是由于業(yè)務(wù)整個(gè)鏈條比較長(zhǎng),所以這是一個(gè)非常大的挑戰(zhàn)。

對(duì)此,吳悅表示認(rèn)同,同時(shí)他也表示,大模型競(jìng)賽比拼的是綜合實(shí)力,從客戶的角度出發(fā),他們?cè)陉P(guān)注技術(shù)變化的同時(shí),也會(huì)關(guān)注安全合規(guī)、成本等因素。而企業(yè)想要在這場(chǎng)科技革命中殺出重圍,則需要具備核心技術(shù)能力,產(chǎn)品化的能力,專業(yè)服務(wù)的能力,各種業(yè)務(wù)咨詢的能力。

“從技術(shù)角度看,大模型確實(shí)是一個(gè)比較重要的變量,但它不是唯一的變量。”吳悅補(bǔ)充道。

以下是AI科技評(píng)論和吳悅的對(duì)話:

混沌之時(shí),GPT掀起AI新范式

AI科技評(píng)論:為什么選擇從騰訊出來(lái),自己創(chuàng)業(yè)?

吳悅:2006年,從中科大碩士畢業(yè)后就進(jìn)入了騰訊。2006年到2011年,在騰訊主要做存儲(chǔ)系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。

2016年選擇出來(lái)創(chuàng)業(yè),主要因?yàn)榧茸鲞^(guò)基礎(chǔ)架構(gòu),又做過(guò)搜索推薦等,當(dāng)時(shí)我們就覺(jué)得NLP技術(shù)的商業(yè)價(jià)值非常大。搜索的話孵化出了Google、百度這樣的大公司,其實(shí)這些公司都屬于 NLP 時(shí)代比較典型的搜索應(yīng)用。推薦的話,孵化出了頭條等,在這個(gè)基礎(chǔ)上,我們就判定下一個(gè)方向應(yīng)該是對(duì)話,所以2016年出來(lái)創(chuàng)業(yè)時(shí)就做了對(duì)話機(jī)器人,主攻NLP方向。

AI科技評(píng)論:從NLP到深度學(xué)習(xí)再到大模型,您怎么看待三者的關(guān)系?

吳悅:有些概念需要重新厘定一下,NLP 屬于自然語(yǔ)言處理,它是人工智能三大方向之一,也是最難的方向。深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò),屬于人工智能的一個(gè)方法論。人工智能最早解決的是視覺(jué)、語(yǔ)音和 NLP 的問(wèn)題。

大模型是沿著神經(jīng)網(wǎng)絡(luò)這個(gè)方向不斷發(fā)展的,2012年2013年是深度學(xué)習(xí)的一個(gè)突破,2016 年 AlphaGo 出來(lái),是強(qiáng)化學(xué)習(xí)的突破,2022 年底到2023 年,包括 ChatGPT 其實(shí)屬于生成式大模型的突破,這些其實(shí)都屬于神經(jīng)網(wǎng)絡(luò)的一個(gè)技術(shù)分支的不斷發(fā)展的過(guò)程。

AI科技評(píng)論:在不同的技術(shù)節(jié)點(diǎn),追一都做了什么?

吳悅:從公司成立到今天,有三個(gè)比較重要的時(shí)間節(jié)點(diǎn)。

第一個(gè)時(shí)間節(jié)點(diǎn):2016 年創(chuàng)業(yè)時(shí),我們把深度學(xué)習(xí)技術(shù)應(yīng)用到對(duì)話機(jī)器人。因?yàn)橹暗膶?duì)話機(jī)器人大多是通過(guò)搜索或者一些規(guī)則的方式實(shí)現(xiàn)。當(dāng)時(shí)我們就是先于其他公司,率先把深度學(xué)習(xí)技術(shù)應(yīng)用到對(duì)話機(jī)器人中。這是第一個(gè)里程碑。

第二個(gè)時(shí)間節(jié)點(diǎn):2017年提出的transformer架構(gòu),2018年提出的Bert架構(gòu),這些都屬于大模型技術(shù)爆發(fā)前夜的階段,當(dāng)時(shí)我們就圍繞transformer、Bert的架構(gòu),做了相關(guān)研究。比如圍繞transformer 提出了 RoPE旋轉(zhuǎn)位置編碼技術(shù)。當(dāng)時(shí)被Google、Meta、阿里、百川智能等國(guó)內(nèi)外大模型廠商廣泛采用。這是我們?cè)瓌?chuàng)式的創(chuàng)新,也是作為一家AI創(chuàng)業(yè)公司為生成式大模型做得一個(gè)小貢獻(xiàn)。當(dāng)然在這個(gè)階段,圍繞Bert我們也研發(fā)出了ZOne大模型。

第三個(gè)時(shí)間節(jié)點(diǎn):2022年年底GPT爆發(fā)后,我們推出了博文領(lǐng)域大模型,專注服務(wù)和營(yíng)銷(xiāo)領(lǐng)域。我們圍繞四個(gè)理念打造博文領(lǐng)域大模型:貼合業(yè)務(wù)、合規(guī)可控、更具溫度、普惠實(shí)用。

追一科技 CEO 吳悅:大模型落地,場(chǎng)景、成本及效果,缺一不可

AI科技評(píng)論:ZOne模型和現(xiàn)在的模型概念有什么不同?

吳悅:ZOne主要是基于Bert路徑,其屬于表征式大模型的分支。其實(shí)大模型本質(zhì)上是模型參數(shù)很大,基本上都是 10 億起步,沿著這個(gè)方向衍生出了兩個(gè)方向,一個(gè)是表征式大模型,典型的就是Bert。另一個(gè)就是生成式大模型,典型的就是Open AI的GPT路徑。

AI科技評(píng)論:從早期的技術(shù),到現(xiàn)在的GPT,中間在技術(shù)的選擇上有什么挑戰(zhàn)嗎?

吳悅:2018年,這個(gè)時(shí)間節(jié)點(diǎn)其實(shí)是有點(diǎn)混沌的,當(dāng)時(shí)就面臨著到底是沿著表征式的方向走,還是生成式的方向走?其實(shí)都是不明確的,當(dāng)時(shí)大家也都在探索階段。直到2022年年底,2023年年初ChatGPT出來(lái)之后,大家感知到可能生成式更具有發(fā)展?jié)摿,所以這個(gè)階段大家都選擇全面擁抱生成式大模型。當(dāng)然表征式大模型在真正商業(yè)化落地過(guò)程中還是非常有作用的,所以這個(gè)方向我們也在延續(xù)做。

開(kāi)源&閉源之爭(zhēng),開(kāi)放式服務(wù)越來(lái)越多

AI科技評(píng)論:追一很早就開(kāi)始做大模型研究了,當(dāng)時(shí)主要是怎么考慮的?

吳悅:我們?cè)诖_定做之前,背后是有一個(gè)邏輯支撐的。大模型出現(xiàn)后,它的應(yīng)用方向或者它的發(fā)展方向,是有兩個(gè)分支的。一是沿著通用大模型的方向發(fā)展,面向的是一些通用型的需求,比如終端用戶的需求,這個(gè)過(guò)程需要不斷打開(kāi)大模型能力的天花板。典型的比如 OpenAI 或者國(guó)內(nèi)的一些大模型廠商是沿著這個(gè)方向發(fā)展的。

另一個(gè)分支是,我們認(rèn)為是圍繞企業(yè)的需求,或者圍繞著企業(yè)業(yè)務(wù)的具體場(chǎng)景的需求,定制化一個(gè)企業(yè)大模型。所以我們?cè)诮衲昴瓿跬瞥龅牟┪念I(lǐng)域大模型屬于第二個(gè)分支,也就是我們選擇面向企業(yè)的具體業(yè)務(wù),比如客服、營(yíng)銷(xiāo)等場(chǎng)景,為企業(yè)定制一個(gè)垂直領(lǐng)域大模型。

AI科技評(píng)論:所以可以理解為追一走的領(lǐng)域模型的路徑,自研還是基于開(kāi)源做微調(diào)?

吳悅:博文領(lǐng)域大模型的研發(fā)也是階段性的。我們現(xiàn)在的方向是兩條路并行走,因?yàn)槲覀兊某霭l(fā)點(diǎn)是構(gòu)建一個(gè)一體化的可落地的大模型。

從落地的角度來(lái)看,有兩個(gè)選擇,一是圍繞著開(kāi)源模型,在上面做知識(shí)注入,能力增強(qiáng)等。另外一個(gè)邏輯就是從底層向上構(gòu)建一個(gè)一體化的大模型。

從當(dāng)前階段來(lái)看,第一個(gè)階段落地會(huì)更快一些,第二個(gè)階段要慢一些,因?yàn)橥耆匝,?huì)涉及到投入,風(fēng)險(xiǎn)等問(wèn)題,所以我們還是比較謹(jǐn)慎地看待這件事兒。(更多關(guān)于大模型行業(yè)的相關(guān)話題,歡迎添加微信 ericahss1224,互相交流,互通有無(wú))

AI科技評(píng)論:在選擇開(kāi)源模型時(shí),是并行都在用還是選一家?

吳悅:我們是并行都在用,重點(diǎn)在于知識(shí)注入層面,能力強(qiáng)化層面,需要做比較多專業(yè)性的工作。這樣才能夠把大模型的能力充分挖掘出來(lái)。

AI科技評(píng)論:您認(rèn)為開(kāi)源會(huì)不會(huì)成為主流模式?或者大部分企業(yè)其實(shí)更期待更多開(kāi)源大模型的出現(xiàn)?

吳悅:我覺(jué)得沿著企業(yè)級(jí)方向,可能會(huì)越來(lái)越開(kāi)放,沿著通用人工方向,可能還是會(huì)堅(jiān)持閉源。

現(xiàn)在大家都在說(shuō)開(kāi)源模型,我覺(jué)得下一步的方向不僅僅是開(kāi)源模型越來(lái)越多,可能會(huì)有更多開(kāi)放式的服務(wù)出現(xiàn),比如數(shù)據(jù)開(kāi)源、算法開(kāi)源、甚至很多基層框架都是可以開(kāi)源的。

AI科技評(píng)論:通過(guò)半年多的實(shí)踐,您認(rèn)為做大模型的難點(diǎn)是什么?

吳悅:從客戶的角度出發(fā),以我們自身為例,我們服務(wù)的是中大型客戶,這類企業(yè)往往會(huì)有兩方面的考量:一是技術(shù)層面,二是業(yè)務(wù)層面。

從技術(shù)層面來(lái)看,中大型企業(yè)對(duì)大模型技術(shù)和產(chǎn)品的要求往往是非常嚴(yán)格的。比如安全方面,他們希望整體的數(shù)據(jù)是安全的,整體的對(duì)外提供的服務(wù)是合規(guī)的,另外還要保證大模型的輸入輸出是完全可控的。

從業(yè)務(wù)層面來(lái)看,真正要把大模型技術(shù)在客戶的業(yè)務(wù)場(chǎng)景中做落地的話,其實(shí)是需要構(gòu)建一個(gè)閉環(huán)的,他們要求的不僅是技術(shù)的能力,還包括如何把技術(shù)產(chǎn)品化,產(chǎn)品化完之后還需要做實(shí)施交付,這也會(huì)涉及到后續(xù)持續(xù)維護(hù)等專業(yè)服務(wù),最重要的是,還要足夠了解業(yè)務(wù)的需求,以及需求的洞察能力,這些能力其實(shí)都是非常重要的。(更多關(guān)于大模型行業(yè)的相關(guān)話題,歡迎添加微信 ericahss1224,互相交流,互通有無(wú))

大模型落地,場(chǎng)景、成本及效果,缺一不可

AI科技評(píng)論:基于大模型的能力,追一的產(chǎn)品已經(jīng)實(shí)現(xiàn)重塑了嗎?

吳悅:正在逐步完成重塑中,要想全面落地到客戶業(yè)務(wù)場(chǎng)景中去使用,明年年初能實(shí)現(xiàn)。我們現(xiàn)有的6款機(jī)器人產(chǎn)品已經(jīng)是非常成熟的商業(yè)化產(chǎn)品,從2016年到現(xiàn)在已經(jīng)服務(wù)了幾百家頭部客戶,現(xiàn)在我們?cè)趪L試把大模型的能力融入到這6款產(chǎn)品中,貼合客戶業(yè)務(wù)去做產(chǎn)品重塑,或者通過(guò)洞察客戶業(yè)務(wù)的方式,通過(guò)大模型解決過(guò)去的產(chǎn)品沒(méi)有解決的問(wèn)題。

追一科技 CEO 吳悅:大模型落地,場(chǎng)景、成本及效果,缺一不可

AI科技評(píng)論:從今年年初就開(kāi)始做,為什么明年才能全面落地?

吳悅:要給客戶做逐步推進(jìn),因?yàn)榘汛竽P偷哪芰舆M(jìn)來(lái),大模型本身是有幻覺(jué)、黑盒或者一些其他不可控的表現(xiàn),那就需要我們通過(guò)訓(xùn)練,自己做一個(gè)領(lǐng)域的強(qiáng)模型,幫客戶避免這樣的問(wèn)題。

對(duì)于客戶來(lái)說(shuō),過(guò)去的產(chǎn)品已經(jīng)和他們的業(yè)務(wù)系統(tǒng),做了比較深的綁定,一個(gè)大客戶,每天的訪問(wèn)量能達(dá)到幾百萬(wàn)甚至上千萬(wàn),在大模型這個(gè)大的技術(shù)變革面前,他們是非常謹(jǐn)慎的。對(duì)于他們來(lái)說(shuō),業(yè)務(wù)的穩(wěn)定是第一位的。所以還需要一個(gè)逐步灰度引入或者遷移的過(guò)程。

對(duì)于我們來(lái)說(shuō),首先我們要把頂層設(shè)計(jì)考慮清楚。就是到底應(yīng)該怎么植入大模型,短、中、長(zhǎng)期的規(guī)劃是什么樣的?時(shí)間計(jì)劃是什么樣的?規(guī)劃性的工作其實(shí)我們已經(jīng)做了大半年,基本做完了,接下來(lái)就是落地到客戶業(yè)務(wù)場(chǎng)景中開(kāi)展使用的工作。

AI科技評(píng)論:雖然落地難,但說(shuō)服客戶的成本是不是比以前低了?畢竟大家都知道大模型是能解決一些問(wèn)題的。

吳悅:在這個(gè)過(guò)程中,我們說(shuō)服客戶是要分幾個(gè)階段的。第一個(gè)階段,是讓感興趣的人愿意跟你聊這個(gè)話題。ChatGPT爆火,經(jīng)過(guò)一些科普,我覺(jué)得只要是有大模型想法的客戶,他就愿意跟你聊。所以第一階段算是破冰了。

但是跟客戶進(jìn)一步聊的時(shí)候,他會(huì)問(wèn)你的這套產(chǎn)品到底能給我?guī)?lái)什么?結(jié)合我的業(yè)務(wù),到底能夠幫我解決什么問(wèn)題?和我現(xiàn)有的 AI 系統(tǒng)相比,到底能夠帶來(lái)多大收益?需要增加多少成本?這個(gè)問(wèn)題我覺(jué)得是比較核心和關(guān)鍵的,所以這也是我們剛剛講的點(diǎn),就我們要去做調(diào)研,要做技術(shù)邊界的定義,要做合理的計(jì)劃,現(xiàn)在大多是在這個(gè)階段。

AI科技評(píng)論:您怎么理解重塑?重塑是不是意味著要替換掉原來(lái)的底層架構(gòu)?

吳悅:大模型是一項(xiàng)新技術(shù),確實(shí)能夠解決一些之前的技術(shù)所不能解決的問(wèn)題。比如一句話多意圖的問(wèn)題,但是我們要進(jìn)行大模型落地的話,其實(shí)也會(huì)引入一些新的問(wèn)題,比如幻覺(jué)問(wèn)題,可控生成問(wèn)題,成本問(wèn)題等,這些都是我們需要重點(diǎn)考慮的。好比電動(dòng)車(chē)的技術(shù)雖然好,但大家都還會(huì)有里程的焦慮。

對(duì)于生成式大模型來(lái)說(shuō),我們覺(jué)得有兩個(gè)焦慮,一是幻覺(jué)的焦慮,二是算力(成本)的焦慮。在這個(gè)技術(shù)體系里面,其實(shí)我們需要根據(jù)對(duì)客戶需求的理解,以及對(duì)整個(gè)技術(shù)的設(shè)計(jì)選擇合適的路徑,看哪些問(wèn)題適合用傳統(tǒng)系統(tǒng)解決。哪一些適合用生成式大模型解決。

我們針對(duì)客戶普遍關(guān)注的大模型的成本問(wèn)題,提出了“增程”技術(shù)理念,具體來(lái)說(shuō),就是通過(guò)大小模型協(xié)同,共同支持客戶需求,通過(guò)一個(gè)“增程器”組件,根據(jù)用戶或者實(shí)際處理任務(wù)的不同,來(lái)做動(dòng)態(tài)配置和組合,讓大模型出現(xiàn)在最應(yīng)該出現(xiàn)的地方,提升模型效果的同時(shí),實(shí)現(xiàn)了性價(jià)比最大化。

追一科技 CEO 吳悅:大模型落地,場(chǎng)景、成本及效果,缺一不可

AI科技評(píng)論:那對(duì)于客戶關(guān)心的問(wèn)題,怎么解決?畢竟還是逃不掉快速落地的問(wèn)題?

吳悅:第一,比較重要的是要解決本地化部署的問(wèn)題,所以博文領(lǐng)域大模型是要做本地化部署的,類似公有云和私有云的區(qū)別。

第二,解決成本的問(wèn)題,因?yàn)槲覀冮_(kāi)發(fā)的產(chǎn)品,在一些中大型企業(yè)中已經(jīng)有了比較廣泛和深入的應(yīng)用。就像前面所說(shuō),如果全面換成大模型的訪問(wèn),規(guī)?赡軙(huì)從之前的上百萬(wàn)到上千萬(wàn),成本是非常高的。

第三,到底能給客戶帶來(lái)多大的收益?這就需要對(duì)企業(yè)的業(yè)務(wù)有比較深入的洞察,能挖掘到業(yè)務(wù)的痛點(diǎn),然后再提出一個(gè)既可以本地化部署,又成本可控的解決方案。這是我們發(fā)現(xiàn)或者所看到的一些點(diǎn)。

AI科技評(píng)論:在落地過(guò)程中,有沒(méi)有自己的一套方法論?

吳悅:首先,之前的產(chǎn)品其實(shí)是廣泛解決客戶的問(wèn)題,但在落地過(guò)程中,我們也發(fā)現(xiàn)這些產(chǎn)品和技術(shù)是存在一些短板。這些問(wèn)題是不是就可以通過(guò)大模型解決?這是我們做大模型落地的一個(gè)重要抓手,因?yàn)槲覀冎来竽P偷哪芰吔纭?/p>

然后,我們已經(jīng)有了這樣的產(chǎn)品落地,所以跟客戶,特別是頭部客戶形成了一個(gè)很好的聯(lián)動(dòng)。在這個(gè)過(guò)程中,結(jié)合追一對(duì)大模型的理解和認(rèn)知,加上和頭部客戶共同挖掘,哪些是之前我們沒(méi)做到過(guò)的,沒(méi)有提供過(guò)的服務(wù),這時(shí),我們會(huì)重點(diǎn)看能不能通過(guò)大模型能不能延展到一些新的場(chǎng)景,這是目前我們做大模型落地的方法。

跨越大模型發(fā)展平緩期,靠的是深入業(yè)務(wù)

AI科技評(píng)論:現(xiàn)在大模型進(jìn)入到平緩期,您怎么看?

吳悅:大模型現(xiàn)在有兩個(gè)發(fā)展方向,一是通用大模型,沿著通用的需求,沿著通用 AI 的方向發(fā)展;二是圍繞著具體的應(yīng)用場(chǎng)景出發(fā),比如圍繞企業(yè)某個(gè)場(chǎng)景做AI應(yīng)用落地。目前,大模型技術(shù)確實(shí)已經(jīng)到了應(yīng)用階段。所以大家都在關(guān)注怎么把這個(gè)技術(shù)去做落地了。

AI科技評(píng)論:現(xiàn)在國(guó)內(nèi)做大模型的企業(yè)有三類:通用模型,領(lǐng)域模型,AI創(chuàng)新應(yīng)用,您認(rèn)為三者的難度分別體現(xiàn)在哪些方面?

吳悅:首先,三者難度是不一樣的。通用大模型是規(guī)模化上的難度,包括參數(shù)量上規(guī)模、數(shù)據(jù)上規(guī)模和算力上規(guī)模帶來(lái)的難度。

應(yīng)用層,如果是簡(jiǎn)單的AI創(chuàng)新應(yīng)用,那么應(yīng)用層相對(duì)獨(dú)立,基于通用大模型,也足以滿足。如果是復(fù)雜的AI創(chuàng)新應(yīng)用,例如追一在做的服務(wù)和營(yíng)銷(xiāo)領(lǐng)域的軟件產(chǎn)品,那么領(lǐng)域模型和應(yīng)用層是很難分割的,他們之間是捆綁的迭代節(jié)奏,難度在于深入到客戶的具體業(yè)務(wù),深入了解具體場(chǎng)景和需求點(diǎn),反推出大模型的能力需求,大模型的能力項(xiàng)和應(yīng)用層產(chǎn)品功能一一對(duì)應(yīng)。大模型的迭代帶來(lái)產(chǎn)品的功能的不斷豐富。

AI科技評(píng)論:如何提高競(jìng)爭(zhēng)力,保持優(yōu)勢(shì)?

吳悅:競(jìng)爭(zhēng)是一個(gè)綜合方面的考量。從客戶的角度看,其實(shí)客戶關(guān)注的是技術(shù)如何落地,以及他們考慮的安全、合規(guī)、可控等等,當(dāng)然也包括成本因素,有些客戶可能也會(huì)關(guān)注,你能不能做好產(chǎn)品化的落地,提供相應(yīng)的專業(yè)服務(wù),然后和他們做業(yè)務(wù)的共創(chuàng),所以客戶是全面的考量。

從企業(yè)的角度看,我們認(rèn)為做好一個(gè)企業(yè),需要具備核心技術(shù)能力,產(chǎn)品化的能力,專業(yè)服務(wù)的能力,各種業(yè)務(wù)咨詢的能力。目前,從技術(shù)角度看,大模型確實(shí)是一個(gè)比較重要的變量,但它不是唯一的變量。

(本站(公眾號(hào):本站)本站本站)

本站原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞:

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港