當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > 行業(yè)數(shù)據(jù)＋場景：AI風(fēng)口下，率先利好的是這樣的公司

行業(yè)數(shù)據(jù)＋場景：AI風(fēng)口下，率先利好的是這樣的公司
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-05-19 05:30:32 瀏覽：4683次

導(dǎo)讀：01引言 2023創(chuàng)投圈熱度最高的話題非AI賽道莫屬。從國外OpenAI、Google等推出AI殺手級(jí)應(yīng)用，到百度等大廠追趕ChatGPT，推出屬于中國的通用大模型，就連美團(tuán)聯(lián)合創(chuàng)始人王慧文、搜狗公司前CEO王小川等行業(yè)大咖也躬身入局，資深NLP專家也紛紛下...

01引言

2023創(chuàng)投圈熱度最高的話題非AI賽道莫屬。從國外OpenAI、Google等推出AI殺手級(jí)應(yīng)用，到百度等大廠追趕ChatGPT，推出屬于中國的通用大模型，就連美團(tuán)聯(lián)合創(chuàng)始人王慧文、搜狗公司前CEO王小川等行業(yè)大咖也躬身入局，資深NLP專家也紛紛下常截至5月16日，已有255家AI企業(yè)/產(chǎn)品被收錄在“生成式AI圈子”小程序，還有更多基于大語言模型(LLM)為創(chuàng)業(yè)起點(diǎn)的企業(yè)正在涌入市常熱鬧之下，新一代AI行業(yè)的機(jī)會(huì)究竟在何處？

非凡產(chǎn)研經(jīng)過數(shù)月以來不斷跟行業(yè)內(nèi)創(chuàng)業(yè)者、專家以及AI方向投資人進(jìn)行深入交流，觀察到中國當(dāng)前AI競爭中首先獲得參賽資格的是具有前瞻性視野、擁有模型自訓(xùn)練技術(shù)和工程能力，深入運(yùn)用模型應(yīng)用到垂直場景，形成商業(yè)解決方案的企業(yè)。

我們還深度采訪了四家自訓(xùn)練模型并且應(yīng)用到垂直場景，快速實(shí)現(xiàn)商業(yè)化的企業(yè)。分別是必優(yōu)科技的創(chuàng)始人周澤安、瀾舟科技創(chuàng)始人周明、秘塔科技COO王益為和睿企科技董事長于偉，深度剖析為什么這類企業(yè)能夠在AI創(chuàng)業(yè)浪潮中率先把握機(jī)會(huì)以及為什么行業(yè)模型是中國產(chǎn)業(yè)數(shù)智化的關(guān)鍵。

必優(yōu)科技

必優(yōu)科技是一家專注于人工智能領(lǐng)域的智能可控內(nèi)容生成技術(shù)（AICGC，AI-ControlGenerateContent）的科技型公司，致力于向企業(yè)提供30+垂直行業(yè)內(nèi)容的智能創(chuàng)作SaaS服務(wù)，驅(qū)動(dòng)內(nèi)容創(chuàng)作效率革新，同時(shí)為企業(yè)提供一站式垂類行業(yè)模型應(yīng)用構(gòu)建（AIGC模型訓(xùn)練，API接口與低代碼web應(yīng)用）的SaaS平臺(tái)解決方案。

瀾舟科技

瀾舟科技是一家業(yè)界領(lǐng)先的認(rèn)知智能公司，致力于以自然語言處理（NLP）技術(shù)為基礎(chǔ)，為全球企業(yè)提供新一代認(rèn)知智能平臺(tái)，助力企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)。其主要產(chǎn)品是基于“孟子預(yù)訓(xùn)練模型”打造的一系列功能引擎（包括搜索、生成、翻譯、對話等）和垂直場景應(yīng)用。

秘塔科技

秘塔科技是是人工智能領(lǐng)域的一家新銳科技公司，致力于將重復(fù)腦力勞動(dòng)AI化，以AI為杠桿撬動(dòng)專業(yè)場景的百倍生產(chǎn)力提升。目前，秘塔科技已經(jīng)擁有近千萬用戶，成立北京和成都兩大研發(fā)中心，在文本AIGC、文檔輔助創(chuàng)作、法律專業(yè)場景等方向上開展研發(fā)與產(chǎn)品落地。

睿企科技

睿企科技是一家深耕垂直領(lǐng)域大模型的人工智能公司，致力于通過領(lǐng)先的多模態(tài)大模型和認(rèn)知決策大腦讓每一個(gè)組織和個(gè)人都能擁有專屬自己的個(gè)性化AI大腦。公司已經(jīng)在政務(wù)、法務(wù)、金融、教育、營銷等多個(gè)行業(yè)落地，產(chǎn)品包括法務(wù)合規(guī)審核機(jī)器人、案件研判機(jī)器人、個(gè)性化助理機(jī)器人等一系列AI產(chǎn)品。

02為什么要做自訓(xùn)練模型？

如何定義自訓(xùn)練模型？

自訓(xùn)練模型是指基于Transformer架構(gòu)*，使用了大量的預(yù)訓(xùn)練數(shù)據(jù)和自監(jiān)督學(xué)習(xí)方法，可以完成各種自然語言處理任務(wù)。

Transformer架構(gòu)*：最早是由Google于2017年在「Attentionisallyouneed」一文中提出，在論文中該模型主要是被用于克服機(jī)器翻譯任務(wù)中傳統(tǒng)網(wǎng)絡(luò)訓(xùn)練時(shí)間過長，難以較好實(shí)現(xiàn)并行計(jì)算的問題。

相當(dāng)于從零搭建、訓(xùn)練語言模型，如BERT、GPT、T5等模型都是基于類似的架構(gòu)訓(xùn)練�；谛袠I(yè)數(shù)據(jù)所搭建的自訓(xùn)練模型，往往具備可私有化，開源的特點(diǎn)。

本文受訪的必優(yōu)科技、瀾舟科技、秘塔科技和睿企科技，均為具有自訓(xùn)練模型并且已率先應(yīng)用到行業(yè)場景，快速實(shí)現(xiàn)商業(yè)化的企業(yè)。

自訓(xùn)練與利用API應(yīng)用開發(fā)有什么不同？

如果從構(gòu)建商業(yè)模式壁壘來說，隨著通用模型以超乎人類想象的速度優(yōu)化延伸其基礎(chǔ)能力，越是靠近基礎(chǔ)功能的應(yīng)用越危險(xiǎn)。

JasperAI近期的局面就說明了該問題。

JasperAI是美國一家2021年成立的專注營銷領(lǐng)域內(nèi)容創(chuàng)作的公司，JasperAI是GPT生態(tài)早期的最大贏家之一。在ChatGPT發(fā)布前，用戶難以直接使用LLM的語言理解與生成能力，由此Jasper基于GPT-3模型的API，通過模型的微調(diào)（fine-tune）*打造了營銷內(nèi)容生成平臺(tái)，用戶量超過10萬，成立短短18個(gè)月的時(shí)間估值快速增長到15億美元。然而ChatGPT的問世，取代了Jasper提供的部分基礎(chǔ)功能，免費(fèi)的同時(shí)兼具極佳的易用性，大部分中小客戶的需求可以直接通過ChatGPT滿足。這給Jasper的定價(jià)帶來極大壓力，Jasper的優(yōu)勢大大減弱。有消息稱，其上輪投資方在ChatGPT成為C端現(xiàn)象級(jí)應(yīng)用時(shí)就已經(jīng)考慮出售其股份了。

模型的微調(diào)（fine-tune）*指在一個(gè)已經(jīng)訓(xùn)練好的模型的基礎(chǔ)上，使用新的數(shù)據(jù)集或者任務(wù)對模型進(jìn)行進(jìn)一步的訓(xùn)練，以適應(yīng)特定的任務(wù)或者數(shù)據(jù)。通常情況下，fine-tune會(huì)調(diào)整模型的參數(shù)，使得模型可以更好地?cái)M合新的數(shù)據(jù)集或者完成新的任務(wù)。

如果從開發(fā)到商用的難度及成本的角度來說，無疑API應(yīng)用開發(fā)是最快最便捷的，自訓(xùn)練模型的搭建包括了多個(gè)復(fù)雜環(huán)節(jié)，包括模型的復(fù)雜度、數(shù)據(jù)的質(zhì)量和數(shù)量、算法的選擇和實(shí)現(xiàn)、計(jì)算資源的可用性、團(tuán)隊(duì)的經(jīng)驗(yàn)和技能等等。在一般情況下，自訓(xùn)練模型從開發(fā)到商用的時(shí)間可能需要數(shù)月或數(shù)年的時(shí)間不等。

例如必優(yōu)科技所訓(xùn)練的垂直行業(yè)語言模型（SLLM）模型耗時(shí)14個(gè)月，該模型為專注于NLP下的細(xì)分CTG（ControlTextGenerate）方向的行業(yè)模型。

在創(chuàng)業(yè)公司的生存壓力下，形成商業(yè)解決方案并成功服務(wù)客戶才是最重要的事情，在此情形下，煉丹和投喂都變得十分講究性價(jià)比。

瀾舟科技創(chuàng)始人周明博士把當(dāng)前不同的AI商業(yè)解決方案技術(shù)路線類比自動(dòng)駕駛發(fā)展階段，也將AI技術(shù)路線的演進(jìn)比喻成三個(gè)發(fā)展階段。

L1（Level1）是自研/自訓(xùn)練通用大模型，例如ChatGPT所使用的GPT-4模型；L2是在LLM基礎(chǔ)上利用行業(yè)大數(shù)據(jù)，建立行業(yè)大模型，深度參與到行業(yè)使用場景當(dāng)中；L3是基于各個(gè)場景需求，在行業(yè)模型/LLM的基礎(chǔ)上，根據(jù)具體任務(wù)，要么做fine-tune，要么做prompt工程等，來滿足場景的需要。

很多大模型的創(chuàng)業(yè)團(tuán)隊(duì)剛起步，大多數(shù)處在L1階段，少數(shù)團(tuán)隊(duì)選擇L2階段創(chuàng)業(yè)。

瀾舟科技從2021年就開始了自研大模型之路，并獲得了創(chuàng)新工嘗斯道資本等機(jī)構(gòu)的多輪融資支持。據(jù)周明博士介紹，瀾舟科技推出的“孟子”模型，其技術(shù)底座均為瀾舟自訓(xùn)練，已經(jīng)率先形成了商業(yè)閉環(huán)。而瀾舟科技剛成立時(shí)就堅(jiān)持選擇自訓(xùn)練模型路徑，貫穿L1到L3，并率先形成商業(yè)化解決方案。此舉從今天看來頗具先見之明。

以金融行業(yè)為例，現(xiàn)有的LLM無法深入到金融行業(yè)的業(yè)務(wù)場景之中，即使使用大廠的LLM模型，也不會(huì)給客戶做定制化的fine-tune。所以瀾舟科技選擇了在自研LLM的基礎(chǔ)上，自訓(xùn)練行業(yè)模型，服務(wù)于金融行業(yè)的客戶，可私有化部署，可基于客戶數(shù)據(jù)訓(xùn)練，深度參與到行業(yè)業(yè)務(wù)場景之中。

必優(yōu)科技的創(chuàng)始人周澤安認(rèn)為，模型的生成可控性非常重要，自訓(xùn)練可以完全掌控生成的質(zhì)量。

“通用大模型可以迅速達(dá)到60分，而必優(yōu)科技的自訓(xùn)練模型能夠做到在核心場景里面從60分到90分。”

模型的可控生成可以滿足可信、可控的要求。而如果僅使用通用模型的基礎(chǔ)微調(diào)，其提供給下游場景模型的可控fine-tune優(yōu)化空間有限。

睿企科技董事長于偉博士提出，盡管基礎(chǔ)通用大模型已經(jīng)達(dá)到優(yōu)秀高中畢業(yè)生甚至未來達(dá)到優(yōu)秀本科畢業(yè)生的水平，但是在實(shí)際落地應(yīng)用中所需要的模型能力更多是專業(yè)的能力，需要專業(yè)的知識(shí)和數(shù)據(jù)進(jìn)行訓(xùn)練，而這類知識(shí)和數(shù)據(jù)大多是私有數(shù)據(jù)，不能對外開放。因此，睿企科技自2018年成立之初就致力于基于Transformer的行業(yè)垂直大模型的訓(xùn)練，為行業(yè)提供具備專業(yè)能力的NLU（自然語言處理解）和NLG（自然語言生成）大模型。

03行業(yè)大模型，是中國當(dāng)前最容易看清楚的屬于創(chuàng)業(yè)公司的好機(jī)會(huì)

行業(yè)模型是指，依托特定行業(yè)自有數(shù)據(jù)，結(jié)合行業(yè)場景，通過自訓(xùn)練或基于開源通用模型的API做應(yīng)用開發(fā)的模型。

通用大模型入局成本過高，行業(yè)模型有更多創(chuàng)業(yè)機(jī)會(huì)

通用大模型的創(chuàng)業(yè)成本極其高昂，例如在算力成本方面，1750億參數(shù)的GPT-3用到了上萬塊A100芯片，機(jī)時(shí)費(fèi)用是460萬美元，資金花費(fèi)就高達(dá)1200萬美元。

瀾舟科技創(chuàng)始人周明博士指出，假設(shè)組建10到20人的團(tuán)隊(duì)，購買500塊到1000塊GPU，每年最便宜大概也要投入5000萬人民幣作為研發(fā)費(fèi)用，能夠訓(xùn)練出一個(gè)百億數(shù)據(jù)級(jí)別的模型，如果訓(xùn)練千億級(jí)模型就在需要大概再投入7-10倍的資金，相當(dāng)于兩億到三億人民幣左右。

睿企科技董事長于偉博士指出，隨著用戶對模型能力的期望和要求不斷變高，模型參數(shù)和訓(xùn)練數(shù)據(jù)也需要不斷增加，受限于訓(xùn)練成本，未來只有像微軟和谷歌這類既有技術(shù)又有應(yīng)用場景、還具備超級(jí)財(cái)力的互聯(lián)網(wǎng)高科技公司才有可能在通用大模型訓(xùn)練進(jìn)行持續(xù)的投入。

當(dāng)前國內(nèi)研發(fā)LLM的團(tuán)隊(duì)至少30家，如百度、MiniMax和智譜AI等，均為資金，人才，資源、經(jīng)驗(yàn)密集的大公司及知名創(chuàng)業(yè)者領(lǐng)銜。屬于大多數(shù)創(chuàng)業(yè)者的機(jī)會(huì)并不在通用大模型領(lǐng)域。

相比LLM，行業(yè)模型的創(chuàng)業(yè)并不需要自己訓(xùn)練通用大模型，可以直接基于最先進(jìn)的開源模型或API進(jìn)行二次訓(xùn)練，模型訓(xùn)練成本大幅降低。

不需要一開始就對標(biāo)GPT3.5做千億級(jí)參數(shù)的大模型，減少模型參數(shù)量反而使得訓(xùn)練的算力成本下降、復(fù)雜度降低，在小樣本學(xué)習(xí)下進(jìn)行多次有效的訓(xùn)練，從而迅速獲得know-how和產(chǎn)品反潰

減少模型參數(shù)之后，訓(xùn)練一次的成本甚至能夠從幾百萬美元減小到幾十萬美元。那么就得以在特定領(lǐng)域?qū)δＰ瓦M(jìn)行多次訓(xùn)練，此時(shí)與通用大模型就形成了差異化優(yōu)勢。并且相對低的成本會(huì)帶來客戶可承受的定價(jià)，尤其是在結(jié)合客戶數(shù)據(jù)的二次訓(xùn)練階段和使用階段的成本要低很多。

秘塔科技COO王益為提出創(chuàng)業(yè)公司難以兼顧的三個(gè)難點(diǎn)，即“不可能三角”：投入的成本、模型的多樣性和模型的可信度。除非有無窮無盡的資金、資源可以投入，大多數(shù)模型只能做到其中一點(diǎn)或者兼顧兩點(diǎn)，即使OpenAI也達(dá)不到三者兼顧的程度。

周明博士提出，瀾舟科技目前并沒有做千億級(jí)的大模型，除了成本考量，一個(gè)重要原因就是客戶目前沒有那么強(qiáng)的需求，必須做一個(gè)千億級(jí)大模型。在很多場景，客戶需要低成本且適用的模型。

必優(yōu)科技周澤安認(rèn)為，通用大模型的基礎(chǔ)底座很重要，給各行各業(yè)整體帶來了在泛化生成能力上的提升，但在如何利用通用模型打造出滿足業(yè)務(wù)場景的下游模型更為關(guān)鍵，雖然大模型目前已經(jīng)顯現(xiàn)出在特定場景的具象處理能力，但其在實(shí)際應(yīng)用的可控生成能力（可控輸入/輸出、可信可塑內(nèi)容）卻要弱于場景模型。針對在特定場景和特定用途的數(shù)據(jù)集上訓(xùn)練更精細(xì)的模型，所以必優(yōu)科技依托于自研RFKL智能算法范式迅速嘗試了90多個(gè)場景模型（伯樂、商賈、圖芴三大系列），并基于精準(zhǔn)的高價(jià)值用戶反饋數(shù)據(jù)，可實(shí)現(xiàn)模型自我優(yōu)化。

睿企科技于偉博士提出，睿企科技的產(chǎn)品即是從模型的專業(yè)性和實(shí)戰(zhàn)價(jià)值出發(fā)，不盲目追求模型參數(shù)規(guī)模，而是專注與針對行業(yè)中需要的專業(yè)能力，訓(xùn)練能滿足要求的性價(jià)比最高的模型，解決邏輯應(yīng)用過程中遇到的算力不足的問題。

行業(yè)模型的壁壘在于場景和數(shù)據(jù)

GPT為代表的通用大模型涌現(xiàn)出驚人的理解和生成能力以及強(qiáng)大的知識(shí)儲(chǔ)備。但是通用大模型可以全方位碾壓行業(yè)模型嗎？周明博士指出，“通用大模型是萬能的，這只是一個(gè)幻覺。”

在處理海量數(shù)據(jù)、重復(fù)性流程和追求個(gè)性化的C端場景，通用大模型會(huì)更有優(yōu)勢；而在非常專業(yè)的ToB場景，例如金融、法律和醫(yī)療等一些對輸出內(nèi)容的精準(zhǔn)度以及質(zhì)量要求比較高的行業(yè)，需要在通用模型的基礎(chǔ)上加入私密且專業(yè)的高價(jià)值數(shù)據(jù)集進(jìn)行模型訓(xùn)練和工作流程優(yōu)化，才能滿足專業(yè)場景的需求。

如果能夠掌握充足且獨(dú)特的數(shù)據(jù)量，不單純依賴第三方API，選擇垂直化方式（自訓(xùn)練模型應(yīng)用于面向用戶的應(yīng)用），垂直整合場景中復(fù)雜度足夠深的任務(wù)，快速迭代，尋找真實(shí)的閉環(huán)場景和用戶反饋，從而建立競爭壁壘。

此外，由于通用模型和行業(yè)模型的用戶群體差異較大，因此反饋數(shù)據(jù)有較大差異，使得由垂直行業(yè)模型生成的內(nèi)容更能符合特定垂直場景的需求，生成質(zhì)量和深度也會(huì)更高。用于RLHF（ReinforcementLearningfromHumanFeedback，基于人類反饋的強(qiáng)化學(xué)習(xí)）的高質(zhì)量用戶反饋也起到非常關(guān)鍵的作用，有助于不斷推動(dòng)模型產(chǎn)出的內(nèi)容質(zhì)量進(jìn)一步提升。

這也說明了行業(yè)模型，數(shù)據(jù)為先，場景為王。

睿企科技于偉博士以公檢法行業(yè)為例，提到執(zhí)法辦案工作人員的工作量大、涉及的各種文書種類很多、流程繁瑣、對合規(guī)要求相當(dāng)高，而文書材料也是執(zhí)法辦案過程中的關(guān)鍵部分，不能有一點(diǎn)瑕疵。公檢法行業(yè)有極大的剛性需求、每年也有大量的預(yù)算投入，并且擁有很多高質(zhì)量數(shù)據(jù)。睿企科技結(jié)合公檢法部門的業(yè)務(wù)需求，基于通用大模型，把專屬數(shù)據(jù)和業(yè)務(wù)知識(shí)放在定制化的多模態(tài)垂直大模型里面，幫助公檢法部門訓(xùn)練專屬AI大腦，推出一系列基于大模型的簡單易用的AI產(chǎn)品，包括執(zhí)法辦案智能合規(guī)審核機(jī)器人、智能接處警機(jī)器人等，解決工作痛點(diǎn)提升效率。

秘塔科技COO王益為表示，法律咨詢場景的核心問題在于不能直接使用通用模型，因?yàn)長LM的目前存在Hallucination（機(jī)器幻覺，指事實(shí)性錯(cuò)誤），阻礙了B端的法律場景深度應(yīng)用。通過一個(gè)字去預(yù)測下一句，這種技術(shù)方式在法律咨詢的領(lǐng)域里行不通。所以對于創(chuàng)業(yè)公司來說，首先資源是非常有限的，那么一定要選擇具有特色的一些場景，比如行業(yè)付費(fèi)意愿強(qiáng)，并且對于可信度要求極高的領(lǐng)域。

必優(yōu)科技基于Transformer架構(gòu)，引入了自研WCCG（WernickeControlContentGenerate）模型，并在中間加了一層融合，通過可控的方式去生成模型，并且擁有獨(dú)創(chuàng)的RFKL智能算法范式。通用模型本身有很強(qiáng)的知識(shí)性，但是精確度方面，通用模型只能解決的是6、7成的問題。必優(yōu)科技則通過場景倒推模型的機(jī)制，基于精準(zhǔn)的高價(jià)值用戶反饋數(shù)據(jù)，通過數(shù)據(jù)飛輪強(qiáng)化對場景模型的內(nèi)容生成方向進(jìn)行引導(dǎo)，實(shí)現(xiàn)模型自我優(yōu)化，在特定場景中需要專門優(yōu)化模型來提升生成質(zhì)量，重塑以數(shù)據(jù)為驅(qū)動(dòng)的內(nèi)容創(chuàng)作新模式。必優(yōu)科技在用模型嘗試了近百種行業(yè)場景后，依據(jù)反饋聚焦在了人力招聘、辦公office場景。

“自訓(xùn)練特定的場景模型不僅是單純的在技術(shù)層面實(shí)現(xiàn)，還要配合對數(shù)據(jù)的理解，實(shí)打?qū)嵉娜ピ搅私膺@個(gè)行業(yè)的本質(zhì)，或者內(nèi)容到底輸出是給誰用？這樣才能反向定義數(shù)據(jù)去訓(xùn)練。”

瀾舟科技創(chuàng)始人周明博士認(rèn)為兩年后沒有人再會(huì)談?wù)摯竽Ｐ�，因�(yàn)樗呀?jīng)成為基礎(chǔ)設(shè)施了，行業(yè)競爭格局將會(huì)穩(wěn)定，通用大模型領(lǐng)域不再會(huì)出現(xiàn)新的創(chuàng)業(yè)機(jī)會(huì)。那就意味著將會(huì)就有很多公司倒閉或者轉(zhuǎn)型，這些團(tuán)隊(duì)的從業(yè)人員在市場上面將會(huì)形成很強(qiáng)的技術(shù)外溢效應(yīng)，或者將在非大模型行業(yè)內(nèi)滲透。同時(shí)意味著即使是通用大模型做的很好的企業(yè)也不能僅僅依賴模型業(yè)務(wù)，也應(yīng)該更多去發(fā)展各自的生態(tài)或者在這基礎(chǔ)上做一些新的運(yùn)營。

行業(yè)模型可以與通用模型LLM并存

目前行業(yè)內(nèi)共識(shí)是中國一定要有自己的大模型，大廠一定會(huì)專注在全力迅速地建立通用大模型能力。這給創(chuàng)業(yè)公司留出了生存空間。

在C端，由于大廠的流量、規(guī)模效應(yīng)和千億大模型的通用性，創(chuàng)業(yè)公司的機(jī)會(huì)將被大量擠兌，需要在夾縫中尋找機(jī)會(huì)，做大廠沒有形成共識(shí)的方向；在B端，大型客戶大概率不會(huì)使用大廠的產(chǎn)品，而傾向于選擇可定制的私有化部署解決方案。

行業(yè)模型創(chuàng)業(yè)公司需要具備特定領(lǐng)域的獨(dú)有關(guān)鍵數(shù)據(jù)，在具體場景上又快又好的解決問題，兼具私有化部署能力，就可以與通用模型LLM并存，在行業(yè)中找到生態(tài)位。

秘塔科技COO王益為提出只要選取自己真正懂的場景，即使巨頭都已經(jīng)布局，秘塔科技仍然在細(xì)分領(lǐng)域里面有機(jī)會(huì)和提升的空間。而在法律行業(yè)，對于生成文本的多樣性要求并不是特別高，但是對于法律服務(wù)的嚴(yán)謹(jǐn)度和可信度要求特別高。秘塔科技在選擇技術(shù)路線和產(chǎn)品路線上有一些思考，秘塔科技的模型本身就是為了文生文的任務(wù)去做的單一任務(wù)訓(xùn)練，相應(yīng)去精心準(zhǔn)備數(shù)據(jù)庫，在專項(xiàng)文本上進(jìn)行強(qiáng)化和訓(xùn)練，形成正式文件的文風(fēng)，這就是秘塔科技競爭的優(yōu)勢。

在直接向C端提供文本AIGC服務(wù)的產(chǎn)品中，秘塔科技擁有最多的用戶（近千萬）；在法律行業(yè)中，秘塔科技的現(xiàn)有用戶覆蓋數(shù)千家律師事務(wù)所和公司法務(wù)部。

睿企科技于偉博士指出，盡管行業(yè)模型創(chuàng)業(yè)不需要從頭訓(xùn)練通用大模型，但是挑戰(zhàn)同樣存在。行業(yè)模型創(chuàng)業(yè)需要業(yè)務(wù)、數(shù)據(jù)、模型的有機(jī)融合，因?yàn)橛脩糁粫?huì)采購能滿足他們需求的性價(jià)比最高的服務(wù)和產(chǎn)品。如何找到一個(gè)巨大的市場并把產(chǎn)品和服務(wù)做到極致，成為行業(yè)頭羊，是每個(gè)垂直行業(yè)模型創(chuàng)業(yè)公司必須面對的挑戰(zhàn)。

行業(yè)模型很有可能是中國產(chǎn)業(yè)數(shù)智化的最后一公里

這一波AI被稱為第四次工業(yè)革命，將徹底改變每一個(gè)行業(yè)。阿里董事會(huì)主席張勇提出“所有行業(yè)都值得用大模型重做一遍”。

即便中國在通用模型技術(shù)上是跟隨者，但并不代表著中國市場會(huì)參照美國市場而發(fā)展。

美國的AI賽道創(chuàng)業(yè)環(huán)境，以O(shè)penAI為例，活躍開放的資本市嘗充足的算力資源和人才更適合“大力出奇跡”路線；中國的創(chuàng)業(yè)環(huán)境更加看重技術(shù)應(yīng)用的深度，中國創(chuàng)業(yè)者擅長在產(chǎn)業(yè)應(yīng)用里創(chuàng)新。陸奇博士在奇績創(chuàng)壇的演講中表示，中國的重要優(yōu)勢在于政府在AI領(lǐng)域的投入、支持和重視程度高于其他國家。

睿企科技于偉博士提到，十三五期間中國政府在公檢法領(lǐng)域投入數(shù)萬億，催生了一大批人工智能企業(yè)的高速發(fā)展和上市，加速了人工智能技術(shù)的發(fā)展。十四五期間，中國政府在大模型上的持續(xù)投入也會(huì)縮小和美國的差距，并在很多領(lǐng)域超過美國。

美國從上世紀(jì)90年代就開始了數(shù)字化浪潮，相比于美國而言，中國企業(yè)尚處于數(shù)字化轉(zhuǎn)型初期，中國有大量亟待數(shù)字化轉(zhuǎn)型升級(jí)的傳統(tǒng)產(chǎn)業(yè)，有太多需要依賴人工智能實(shí)現(xiàn)效率提高的業(yè)務(wù)場景。

在中國30年的產(chǎn)業(yè)數(shù)智化浪潮之中，一直延續(xù)著的信息化-數(shù)字化-智能化的演進(jìn)路線，隨著通用模型及行業(yè)模型加入到產(chǎn)業(yè)數(shù)智化浪潮之中，很有可能在部分關(guān)鍵場景率先利用AI模型達(dá)到智能化，從而倒逼產(chǎn)業(yè)其他工作流及場景快速形成數(shù)據(jù)沉淀，這將大大加快中國整個(gè)產(chǎn)業(yè)數(shù)智化的進(jìn)程。