展會(huì)信息港展會(huì)大全

行業(yè)數(shù)據(jù)+場景:AI風(fēng)口下,率先利好的是這樣的公司
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-19 05:30:32   瀏覽:4683次  

導(dǎo)讀:01引言 2023創(chuàng)投圈熱度最高的話題非AI賽道莫屬。從國外OpenAI、Google等推出AI殺手級(jí)應(yīng)用,到百度等大廠追趕ChatGPT,推出屬于中國的通用大模型,就連美團(tuán)聯(lián)合創(chuàng)始人王慧文、搜狗公司前CEO王小川等行業(yè)大咖也躬身入局,資深NLP專家也紛紛下...

01引言

2023創(chuàng)投圈熱度最高的話題非AI賽道莫屬。從國外OpenAI、Google等推出AI殺手級(jí)應(yīng)用,到百度等大廠追趕ChatGPT,推出屬于中國的通用大模型,就連美團(tuán)聯(lián)合創(chuàng)始人王慧文、搜狗公司前CEO王小川等行業(yè)大咖也躬身入局,資深NLP專家也紛紛下常截至5月16日,已有255家AI企業(yè)/產(chǎn)品被收錄在“生成式AI圈子”小程序,還有更多基于大語言模型(LLM)為創(chuàng)業(yè)起點(diǎn)的企業(yè)正在涌入市常熱鬧之下,新一代AI行業(yè)的機(jī)會(huì)究竟在何處?

非凡產(chǎn)研經(jīng)過數(shù)月以來不斷跟行業(yè)內(nèi)創(chuàng)業(yè)者、專家以及AI方向投資人進(jìn)行深入交流,觀察到中國當(dāng)前AI競爭中首先獲得參賽資格的是具有前瞻性視野、擁有模型自訓(xùn)練技術(shù)和工程能力,深入運(yùn)用模型應(yīng)用到垂直場景,形成商業(yè)解決方案的企業(yè)。

我們還深度采訪了四家自訓(xùn)練模型并且應(yīng)用到垂直場景,快速實(shí)現(xiàn)商業(yè)化的企業(yè)。分別是必優(yōu)科技的創(chuàng)始人周澤安、瀾舟科技創(chuàng)始人周明、秘塔科技COO王益為和睿企科技董事長于偉,深度剖析為什么這類企業(yè)能夠在AI創(chuàng)業(yè)浪潮中率先把握機(jī)會(huì)以及為什么行業(yè)模型是中國產(chǎn)業(yè)數(shù)智化的關(guān)鍵。

必優(yōu)科技

必優(yōu)科技是一家專注于人工智能領(lǐng)域的智能可控內(nèi)容生成技術(shù)(AICGC,AI-ControlGenerateContent)的科技型公司,致力于向企業(yè)提供30+垂直行業(yè)內(nèi)容的智能創(chuàng)作SaaS服務(wù),驅(qū)動(dòng)內(nèi)容創(chuàng)作效率革新,同時(shí)為企業(yè)提供一站式垂類行業(yè)模型應(yīng)用構(gòu)建(AIGC模型訓(xùn)練,API接口與低代碼web應(yīng)用)的SaaS平臺(tái)解決方案。

瀾舟科技

瀾舟科技是一家業(yè)界領(lǐng)先的認(rèn)知智能公司,致力于以自然語言處理(NLP)技術(shù)為基礎(chǔ),為全球企業(yè)提供新一代認(rèn)知智能平臺(tái),助力企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)。其主要產(chǎn)品是基于“孟子預(yù)訓(xùn)練模型”打造的一系列功能引擎(包括搜索、生成、翻譯、對話等)和垂直場景應(yīng)用。

秘塔科技

秘塔科技是是人工智能領(lǐng)域的一家新銳科技公司,致力于將重復(fù)腦力勞動(dòng)AI化,以AI為杠桿撬動(dòng)專業(yè)場景的百倍生產(chǎn)力提升。目前,秘塔科技已經(jīng)擁有近千萬用戶,成立北京和成都兩大研發(fā)中心,在文本AIGC、文檔輔助創(chuàng)作、法律專業(yè)場景等方向上開展研發(fā)與產(chǎn)品落地。

睿企科技

睿企科技是一家深耕垂直領(lǐng)域大模型的人工智能公司,致力于通過領(lǐng)先的多模態(tài)大模型和認(rèn)知決策大腦讓每一個(gè)組織和個(gè)人都能擁有專屬自己的個(gè)性化AI大腦。公司已經(jīng)在政務(wù)、法務(wù)、金融、教育、營銷等多個(gè)行業(yè)落地,產(chǎn)品包括法務(wù)合規(guī)審核機(jī)器人、案件研判機(jī)器人、個(gè)性化助理機(jī)器人等一系列AI產(chǎn)品。

02為什么要做自訓(xùn)練模型?

如何定義自訓(xùn)練模型?

自訓(xùn)練模型是指基于Transformer架構(gòu)*,使用了大量的預(yù)訓(xùn)練數(shù)據(jù)和自監(jiān)督學(xué)習(xí)方法,可以完成各種自然語言處理任務(wù)。

Transformer架構(gòu)*:最早是由Google于2017年在「Attentionisallyouneed」一文中提出,在論文中該模型主要是被用于克服機(jī)器翻譯任務(wù)中傳統(tǒng)網(wǎng)絡(luò)訓(xùn)練時(shí)間過長,難以較好實(shí)現(xiàn)并行計(jì)算的問題。

相當(dāng)于從零搭建、訓(xùn)練語言模型,如BERT、GPT、T5等模型都是基于類似的架構(gòu)訓(xùn)練;谛袠I(yè)數(shù)據(jù)所搭建的自訓(xùn)練模型,往往具備可私有化,開源的特點(diǎn)。

本文受訪的必優(yōu)科技、瀾舟科技、秘塔科技和睿企科技,均為具有自訓(xùn)練模型并且已率先應(yīng)用到行業(yè)場景,快速實(shí)現(xiàn)商業(yè)化的企業(yè)。

自訓(xùn)練與利用API應(yīng)用開發(fā)有什么不同?

如果從構(gòu)建商業(yè)模式壁壘來說,隨著通用模型以超乎人類想象的速度優(yōu)化延伸其基礎(chǔ)能力,越是靠近基礎(chǔ)功能的應(yīng)用越危險(xiǎn)。

JasperAI近期的局面就說明了該問題。

JasperAI是美國一家2021年成立的專注營銷領(lǐng)域內(nèi)容創(chuàng)作的公司,JasperAI是GPT生態(tài)早期的最大贏家之一。在ChatGPT發(fā)布前,用戶難以直接使用LLM的語言理解與生成能力,由此Jasper基于GPT-3模型的API,通過模型的微調(diào)(fine-tune)*打造了營銷內(nèi)容生成平臺(tái),用戶量超過10萬,成立短短18個(gè)月的時(shí)間估值快速增長到15億美元。然而ChatGPT的問世,取代了Jasper提供的部分基礎(chǔ)功能,免費(fèi)的同時(shí)兼具極佳的易用性,大部分中小客戶的需求可以直接通過ChatGPT滿足。這給Jasper的定價(jià)帶來極大壓力,Jasper的優(yōu)勢大大減弱。有消息稱,其上輪投資方在ChatGPT成為C端現(xiàn)象級(jí)應(yīng)用時(shí)就已經(jīng)考慮出售其股份了。

模型的微調(diào)(fine-tune)*指在一個(gè)已經(jīng)訓(xùn)練好的模型的基礎(chǔ)上,使用新的數(shù)據(jù)集或者任務(wù)對模型進(jìn)行進(jìn)一步的訓(xùn)練,以適應(yīng)特定的任務(wù)或者數(shù)據(jù)。通常情況下,fine-tune會(huì)調(diào)整模型的參數(shù),使得模型可以更好地?cái)M合新的數(shù)據(jù)集或者完成新的任務(wù)。

如果從開發(fā)到商用的難度及成本的角度來說,無疑API應(yīng)用開發(fā)是最快最便捷的,自訓(xùn)練模型的搭建包括了多個(gè)復(fù)雜環(huán)節(jié),包括模型的復(fù)雜度、數(shù)據(jù)的質(zhì)量和數(shù)量、算法的選擇和實(shí)現(xiàn)、計(jì)算資源的可用性、團(tuán)隊(duì)的經(jīng)驗(yàn)和技能等等。在一般情況下,自訓(xùn)練模型從開發(fā)到商用的時(shí)間可能需要數(shù)月或數(shù)年的時(shí)間不等。

例如必優(yōu)科技所訓(xùn)練的垂直行業(yè)語言模型(SLLM)模型耗時(shí)14個(gè)月,該模型為專注于NLP下的細(xì)分CTG(ControlTextGenerate)方向的行業(yè)模型。

在創(chuàng)業(yè)公司的生存壓力下,形成商業(yè)解決方案并成功服務(wù)客戶才是最重要的事情,在此情形下,煉丹和投喂都變得十分講究性價(jià)比。

瀾舟科技創(chuàng)始人周明博士把當(dāng)前不同的AI商業(yè)解決方案技術(shù)路線類比自動(dòng)駕駛發(fā)展階段,也將AI技術(shù)路線的演進(jìn)比喻成三個(gè)發(fā)展階段。

L1(Level1)是自研/自訓(xùn)練通用大模型,例如ChatGPT所使用的GPT-4模型;L2是在LLM基礎(chǔ)上利用行業(yè)大數(shù)據(jù),建立行業(yè)大模型,深度參與到行業(yè)使用場景當(dāng)中;L3是基于各個(gè)場景需求,在行業(yè)模型/LLM的基礎(chǔ)上,根據(jù)具體任務(wù),要么做fine-tune,要么做prompt工程等,來滿足場景的需要。

很多大模型的創(chuàng)業(yè)團(tuán)隊(duì)剛起步,大多數(shù)處在L1階段,少數(shù)團(tuán)隊(duì)選擇L2階段創(chuàng)業(yè)。

瀾舟科技從2021年就開始了自研大模型之路,并獲得了創(chuàng)新工嘗斯道資本等機(jī)構(gòu)的多輪融資支持。據(jù)周明博士介紹,瀾舟科技推出的“孟子”模型,其技術(shù)底座均為瀾舟自訓(xùn)練,已經(jīng)率先形成了商業(yè)閉環(huán)。而瀾舟科技剛成立時(shí)就堅(jiān)持選擇自訓(xùn)練模型路徑,貫穿L1到L3,并率先形成商業(yè)化解決方案。此舉從今天看來頗具先見之明。

以金融行業(yè)為例,現(xiàn)有的LLM無法深入到金融行業(yè)的業(yè)務(wù)場景之中,即使使用大廠的LLM模型,也不會(huì)給客戶做定制化的fine-tune。所以瀾舟科技選擇了在自研LLM的基礎(chǔ)上,自訓(xùn)練行業(yè)模型,服務(wù)于金融行業(yè)的客戶,可私有化部署,可基于客戶數(shù)據(jù)訓(xùn)練,深度參與到行業(yè)業(yè)務(wù)場景之中。

必優(yōu)科技的創(chuàng)始人周澤安認(rèn)為,模型的生成可控性非常重要,自訓(xùn)練可以完全掌控生成的質(zhì)量。

“通用大模型可以迅速達(dá)到60分,而必優(yōu)科技的自訓(xùn)練模型能夠做到在核心場景里面從60分到90分。”

模型的可控生成可以滿足可信、可控的要求。而如果僅使用通用模型的基礎(chǔ)微調(diào),其提供給下游場景模型的可控fine-tune優(yōu)化空間有限。

睿企科技董事長于偉博士提出,盡管基礎(chǔ)通用大模型已經(jīng)達(dá)到優(yōu)秀高中畢業(yè)生甚至未來達(dá)到優(yōu)秀本科畢業(yè)生的水平,但是在實(shí)際落地應(yīng)用中所需要的模型能力更多是專業(yè)的能力,需要專業(yè)的知識(shí)和數(shù)據(jù)進(jìn)行訓(xùn)練,而這類知識(shí)和數(shù)據(jù)大多是私有數(shù)據(jù),不能對外開放。因此,睿企科技自2018年成立之初就致力于基于Transformer的行業(yè)垂直大模型的訓(xùn)練,為行業(yè)提供具備專業(yè)能力的NLU(自然語言處理解)和NLG(自然語言生成)大模型。

03行業(yè)大模型,是中國當(dāng)前最容易看清楚的屬于創(chuàng)業(yè)公司的好機(jī)會(huì)

行業(yè)模型是指,依托特定行業(yè)自有數(shù)據(jù),結(jié)合行業(yè)場景,通過自訓(xùn)練或基于開源通用模型的API做應(yīng)用開發(fā)的模型。

通用大模型入局成本過高,行業(yè)模型有更多創(chuàng)業(yè)機(jī)會(huì)

通用大模型的創(chuàng)業(yè)成本極其高昂,例如在算力成本方面,1750億參數(shù)的GPT-3用到了上萬塊A100芯片,機(jī)時(shí)費(fèi)用是460萬美元,資金花費(fèi)就高達(dá)1200萬美元。

瀾舟科技創(chuàng)始人周明博士指出,假設(shè)組建10到20人的團(tuán)隊(duì),購買500塊到1000塊GPU,每年最便宜大概也要投入5000萬人民幣作為研發(fā)費(fèi)用,能夠訓(xùn)練出一個(gè)百億數(shù)據(jù)級(jí)別的模型,如果訓(xùn)練千億級(jí)模型就在需要大概再投入7-10倍的資金,相當(dāng)于兩億到三億人民幣左右。

睿企科技董事長于偉博士指出,隨著用戶對模型能力的期望和要求不斷變高,模型參數(shù)和訓(xùn)練數(shù)據(jù)也需要不斷增加,受限于訓(xùn)練成本,未來只有像微軟和谷歌這類既有技術(shù)又有應(yīng)用場景、還具備超級(jí)財(cái)力的互聯(lián)網(wǎng)高科技公司才有可能在通用大模型訓(xùn)練進(jìn)行持續(xù)的投入。

當(dāng)前國內(nèi)研發(fā)LLM的團(tuán)隊(duì)至少30家,如百度、MiniMax和智譜AI等,均為資金,人才,資源、經(jīng)驗(yàn)密集的大公司及知名創(chuàng)業(yè)者領(lǐng)銜。屬于大多數(shù)創(chuàng)業(yè)者的機(jī)會(huì)并不在通用大模型領(lǐng)域。

相比LLM,行業(yè)模型的創(chuàng)業(yè)并不需要自己訓(xùn)練通用大模型,可以直接基于最先進(jìn)的開源模型或API進(jìn)行二次訓(xùn)練,模型訓(xùn)練成本大幅降低。

不需要一開始就對標(biāo)GPT3.5做千億級(jí)參數(shù)的大模型,減少模型參數(shù)量反而使得訓(xùn)練的算力成本下降、復(fù)雜度降低,在小樣本學(xué)習(xí)下進(jìn)行多次有效的訓(xùn)練,從而迅速獲得know-how和產(chǎn)品反潰

減少模型參數(shù)之后,訓(xùn)練一次的成本甚至能夠從幾百萬美元減小到幾十萬美元。那么就得以在特定領(lǐng)域?qū)δP瓦M(jìn)行多次訓(xùn)練,此時(shí)與通用大模型就形成了差異化優(yōu)勢。并且相對低的成本會(huì)帶來客戶可承受的定價(jià),尤其是在結(jié)合客戶數(shù)據(jù)的二次訓(xùn)練階段和使用階段的成本要低很多。

秘塔科技COO王益為提出創(chuàng)業(yè)公司難以兼顧的三個(gè)難點(diǎn),即“不可能三角”:投入的成本、模型的多樣性和模型的可信度。除非有無窮無盡的資金、資源可以投入,大多數(shù)模型只能做到其中一點(diǎn)或者兼顧兩點(diǎn),即使OpenAI也達(dá)不到三者兼顧的程度。

周明博士提出,瀾舟科技目前并沒有做千億級(jí)的大模型,除了成本考量,一個(gè)重要原因就是客戶目前沒有那么強(qiáng)的需求,必須做一個(gè)千億級(jí)大模型。在很多場景,客戶需要低成本且適用的模型。

必優(yōu)科技周澤安認(rèn)為,通用大模型的基礎(chǔ)底座很重要,給各行各業(yè)整體帶來了在泛化生成能力上的提升,但在如何利用通用模型打造出滿足業(yè)務(wù)場景的下游模型更為關(guān)鍵,雖然大模型目前已經(jīng)顯現(xiàn)出在特定場景的具象處理能力,但其在實(shí)際應(yīng)用的可控生成能力(可控輸入/輸出、可信可塑內(nèi)容)卻要弱于場景模型。針對在特定場景和特定用途的數(shù)據(jù)集上訓(xùn)練更精細(xì)的模型,所以必優(yōu)科技依托于自研RFKL智能算法范式迅速嘗試了90多個(gè)場景模型(伯樂、商賈、圖芴三大系列),并基于精準(zhǔn)的高價(jià)值用戶反饋數(shù)據(jù),可實(shí)現(xiàn)模型自我優(yōu)化。

睿企科技于偉博士提出,睿企科技的產(chǎn)品即是從模型的專業(yè)性和實(shí)戰(zhàn)價(jià)值出發(fā),不盲目追求模型參數(shù)規(guī)模,而是專注與針對行業(yè)中需要的專業(yè)能力,訓(xùn)練能滿足要求的性價(jià)比最高的模型,解決邏輯應(yīng)用過程中遇到的算力不足的問題。

行業(yè)模型的壁壘在于場景和數(shù)據(jù)

GPT為代表的通用大模型涌現(xiàn)出驚人的理解和生成能力以及強(qiáng)大的知識(shí)儲(chǔ)備。但是通用大模型可以全方位碾壓行業(yè)模型嗎?周明博士指出,“通用大模型是萬能的,這只是一個(gè)幻覺。”

在處理海量數(shù)據(jù)、重復(fù)性流程和追求個(gè)性化的C端場景,通用大模型會(huì)更有優(yōu)勢;而在非常專業(yè)的ToB場景,例如金融、法律和醫(yī)療等一些對輸出內(nèi)容的精準(zhǔn)度以及質(zhì)量要求比較高的行業(yè),需要在通用模型的基礎(chǔ)上加入私密且專業(yè)的高價(jià)值數(shù)據(jù)集進(jìn)行模型訓(xùn)練和工作流程優(yōu)化,才能滿足專業(yè)場景的需求。

如果能夠掌握充足且獨(dú)特的數(shù)據(jù)量,不單純依賴第三方API,選擇垂直化方式(自訓(xùn)練模型應(yīng)用于面向用戶的應(yīng)用),垂直整合場景中復(fù)雜度足夠深的任務(wù),快速迭代,尋找真實(shí)的閉環(huán)場景和用戶反饋,從而建立競爭壁壘。

此外,由于通用模型和行業(yè)模型的用戶群體差異較大,因此反饋數(shù)據(jù)有較大差異,使得由垂直行業(yè)模型生成的內(nèi)容更能符合特定垂直場景的需求,生成質(zhì)量和深度也會(huì)更高。用于RLHF(ReinforcementLearningfromHumanFeedback,基于人類反饋的強(qiáng)化學(xué)習(xí))的高質(zhì)量用戶反饋也起到非常關(guān)鍵的作用,有助于不斷推動(dòng)模型產(chǎn)出的內(nèi)容質(zhì)量進(jìn)一步提升。

這也說明了行業(yè)模型,數(shù)據(jù)為先,場景為王。

睿企科技于偉博士以公檢法行業(yè)為例,提到執(zhí)法辦案工作人員的工作量大、涉及的各種文書種類很多、流程繁瑣、對合規(guī)要求相當(dāng)高,而文書材料也是執(zhí)法辦案過程中的關(guān)鍵部分,不能有一點(diǎn)瑕疵。公檢法行業(yè)有極大的剛性需求、每年也有大量的預(yù)算投入,并且擁有很多高質(zhì)量數(shù)據(jù)。睿企科技結(jié)合公檢法部門的業(yè)務(wù)需求,基于通用大模型,把專屬數(shù)據(jù)和業(yè)務(wù)知識(shí)放在定制化的多模態(tài)垂直大模型里面,幫助公檢法部門訓(xùn)練專屬AI大腦,推出一系列基于大模型的簡單易用的AI產(chǎn)品,包括執(zhí)法辦案智能合規(guī)審核機(jī)器人、智能接處警機(jī)器人等,解決工作痛點(diǎn)提升效率。

秘塔科技COO王益為表示,法律咨詢場景的核心問題在于不能直接使用通用模型,因?yàn)長LM的目前存在Hallucination(機(jī)器幻覺,指事實(shí)性錯(cuò)誤),阻礙了B端的法律場景深度應(yīng)用。通過一個(gè)字去預(yù)測下一句,這種技術(shù)方式在法律咨詢的領(lǐng)域里行不通。所以對于創(chuàng)業(yè)公司來說,首先資源是非常有限的,那么一定要選擇具有特色的一些場景,比如行業(yè)付費(fèi)意愿強(qiáng),并且對于可信度要求極高的領(lǐng)域。

必優(yōu)科技基于Transformer架構(gòu),引入了自研WCCG(WernickeControlContentGenerate)模型,并在中間加了一層融合,通過可控的方式去生成模型,并且擁有獨(dú)創(chuàng)的RFKL智能算法范式。通用模型本身有很強(qiáng)的知識(shí)性,但是精確度方面,通用模型只能解決的是6、7成的問題。必優(yōu)科技則通過場景倒推模型的機(jī)制,基于精準(zhǔn)的高價(jià)值用戶反饋數(shù)據(jù),通過數(shù)據(jù)飛輪強(qiáng)化對場景模型的內(nèi)容生成方向進(jìn)行引導(dǎo),實(shí)現(xiàn)模型自我優(yōu)化,在特定場景中需要專門優(yōu)化模型來提升生成質(zhì)量,重塑以數(shù)據(jù)為驅(qū)動(dòng)的內(nèi)容創(chuàng)作新模式。必優(yōu)科技在用模型嘗試了近百種行業(yè)場景后,依據(jù)反饋聚焦在了人力招聘、辦公office場景。

“自訓(xùn)練特定的場景模型不僅是單純的在技術(shù)層面實(shí)現(xiàn),還要配合對數(shù)據(jù)的理解,實(shí)打?qū)嵉娜ピ搅私膺@個(gè)行業(yè)的本質(zhì),或者內(nèi)容到底輸出是給誰用?這樣才能反向定義數(shù)據(jù)去訓(xùn)練。”

瀾舟科技創(chuàng)始人周明博士認(rèn)為兩年后沒有人再會(huì)談?wù)摯竽P,因(yàn)樗呀?jīng)成為基礎(chǔ)設(shè)施了,行業(yè)競爭格局將會(huì)穩(wěn)定,通用大模型領(lǐng)域不再會(huì)出現(xiàn)新的創(chuàng)業(yè)機(jī)會(huì)。那就意味著將會(huì)就有很多公司倒閉或者轉(zhuǎn)型,這些團(tuán)隊(duì)的從業(yè)人員在市場上面將會(huì)形成很強(qiáng)的技術(shù)外溢效應(yīng),或者將在非大模型行業(yè)內(nèi)滲透。同時(shí)意味著即使是通用大模型做的很好的企業(yè)也不能僅僅依賴模型業(yè)務(wù),也應(yīng)該更多去發(fā)展各自的生態(tài)或者在這基礎(chǔ)上做一些新的運(yùn)營。

行業(yè)模型可以與通用模型LLM并存

目前行業(yè)內(nèi)共識(shí)是中國一定要有自己的大模型,大廠一定會(huì)專注在全力迅速地建立通用大模型能力。這給創(chuàng)業(yè)公司留出了生存空間。

在C端,由于大廠的流量、規(guī)模效應(yīng)和千億大模型的通用性,創(chuàng)業(yè)公司的機(jī)會(huì)將被大量擠兌,需要在夾縫中尋找機(jī)會(huì),做大廠沒有形成共識(shí)的方向;在B端,大型客戶大概率不會(huì)使用大廠的產(chǎn)品,而傾向于選擇可定制的私有化部署解決方案。

行業(yè)模型創(chuàng)業(yè)公司需要具備特定領(lǐng)域的獨(dú)有關(guān)鍵數(shù)據(jù),在具體場景上又快又好的解決問題,兼具私有化部署能力,就可以與通用模型LLM并存,在行業(yè)中找到生態(tài)位。

秘塔科技COO王益為提出只要選取自己真正懂的場景,即使巨頭都已經(jīng)布局,秘塔科技仍然在細(xì)分領(lǐng)域里面有機(jī)會(huì)和提升的空間。而在法律行業(yè),對于生成文本的多樣性要求并不是特別高,但是對于法律服務(wù)的嚴(yán)謹(jǐn)度和可信度要求特別高。秘塔科技在選擇技術(shù)路線和產(chǎn)品路線上有一些思考,秘塔科技的模型本身就是為了文生文的任務(wù)去做的單一任務(wù)訓(xùn)練,相應(yīng)去精心準(zhǔn)備數(shù)據(jù)庫,在專項(xiàng)文本上進(jìn)行強(qiáng)化和訓(xùn)練,形成正式文件的文風(fēng),這就是秘塔科技競爭的優(yōu)勢。

在直接向C端提供文本AIGC服務(wù)的產(chǎn)品中,秘塔科技擁有最多的用戶(近千萬);在法律行業(yè)中,秘塔科技的現(xiàn)有用戶覆蓋數(shù)千家律師事務(wù)所和公司法務(wù)部。

睿企科技于偉博士指出,盡管行業(yè)模型創(chuàng)業(yè)不需要從頭訓(xùn)練通用大模型,但是挑戰(zhàn)同樣存在。行業(yè)模型創(chuàng)業(yè)需要業(yè)務(wù)、數(shù)據(jù)、模型的有機(jī)融合,因?yàn)橛脩糁粫?huì)采購能滿足他們需求的性價(jià)比最高的服務(wù)和產(chǎn)品。如何找到一個(gè)巨大的市場并把產(chǎn)品和服務(wù)做到極致,成為行業(yè)頭羊,是每個(gè)垂直行業(yè)模型創(chuàng)業(yè)公司必須面對的挑戰(zhàn)。

行業(yè)模型很有可能是中國產(chǎn)業(yè)數(shù)智化的最后一公里

這一波AI被稱為第四次工業(yè)革命,將徹底改變每一個(gè)行業(yè)。阿里董事會(huì)主席張勇提出“所有行業(yè)都值得用大模型重做一遍”。

即便中國在通用模型技術(shù)上是跟隨者,但并不代表著中國市場會(huì)參照美國市場而發(fā)展。

美國的AI賽道創(chuàng)業(yè)環(huán)境,以O(shè)penAI為例,活躍開放的資本市嘗充足的算力資源和人才更適合“大力出奇跡”路線;中國的創(chuàng)業(yè)環(huán)境更加看重技術(shù)應(yīng)用的深度,中國創(chuàng)業(yè)者擅長在產(chǎn)業(yè)應(yīng)用里創(chuàng)新。陸奇博士在奇績創(chuàng)壇的演講中表示,中國的重要優(yōu)勢在于政府在AI領(lǐng)域的投入、支持和重視程度高于其他國家。

睿企科技于偉博士提到,十三五期間中國政府在公檢法領(lǐng)域投入數(shù)萬億,催生了一大批人工智能企業(yè)的高速發(fā)展和上市,加速了人工智能技術(shù)的發(fā)展。十四五期間,中國政府在大模型上的持續(xù)投入也會(huì)縮小和美國的差距,并在很多領(lǐng)域超過美國。

美國從上世紀(jì)90年代就開始了數(shù)字化浪潮,相比于美國而言,中國企業(yè)尚處于數(shù)字化轉(zhuǎn)型初期,中國有大量亟待數(shù)字化轉(zhuǎn)型升級(jí)的傳統(tǒng)產(chǎn)業(yè),有太多需要依賴人工智能實(shí)現(xiàn)效率提高的業(yè)務(wù)場景。

在中國30年的產(chǎn)業(yè)數(shù)智化浪潮之中,一直延續(xù)著的信息化-數(shù)字化-智能化的演進(jìn)路線,隨著通用模型及行業(yè)模型加入到產(chǎn)業(yè)數(shù)智化浪潮之中,很有可能在部分關(guān)鍵場景率先利用AI模型達(dá)到智能化,從而倒逼產(chǎn)業(yè)其他工作流及場景快速形成數(shù)據(jù)沉淀,這將大大加快中國整個(gè)產(chǎn)業(yè)數(shù)智化的進(jìn)程。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港