展會(huì)信息港展會(huì)大全

AI工程師二次創(chuàng)業(yè),在垂直場(chǎng)景找“!苯
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-09 17:09:44   瀏覽:4712次  

導(dǎo)讀:巖山科技攜子公司,角逐百模大戰(zhàn) 文丨獵云精選 ID:lieyunjingxuan 作者丨孫媛 2023,百模大戰(zhàn)一觸即發(fā)。 各類大模型產(chǎn)品爭(zhēng)相涌現(xiàn),不僅有阿里百度等大廠帶頭角逐通用大模型,美團(tuán)創(chuàng)始人王興、光年之外創(chuàng)始人王慧文、智譜AI創(chuàng)始人唐杰、搜狗百川智能創(chuàng)始人王...

巖山科技攜子公司,角逐“百模大戰(zhàn)”

文丨獵云精選 ID:lieyunjingxuan

作者丨孫媛

2023,百模大戰(zhàn)一觸即發(fā)。

各類大模型產(chǎn)品爭(zhēng)相涌現(xiàn),不僅有阿里百度等大廠帶頭角逐通用大模型,美團(tuán)創(chuàng)始人王興、光年之外創(chuàng)始人王慧文、智譜AI創(chuàng)始人唐杰、搜狗&百川智能創(chuàng)始人王小川等大佬更是以創(chuàng)業(yè)勢(shì)頭猛進(jìn)。

近期,國(guó)產(chǎn)大模型更是迎來(lái)了集體突圍。

阿里“通義千問(wèn)2.0”以參數(shù)規(guī)模達(dá)千億級(jí)加速追趕GPT-4;成立僅數(shù)月的百川智能半年內(nèi)發(fā)布了7版大模型,中英文表現(xiàn)超過(guò)Llama2。昆侖萬(wàn)維宣布開源百億級(jí)大語(yǔ)言模型“天工”系列,在同等規(guī)模模型中展現(xiàn)出最佳效果。

隨著這場(chǎng)從年初打到年尾的“百模大戰(zhàn)”趨于白熱化,更多人開始有了新的疑問(wèn):我們真的需要這么多“模”嗎?如此高投入,能讓模型提供方行至盈利嗎?而接入模型的企業(yè)到底能從“模”中受益多少?

或許,答案就藏于“模”在垂直場(chǎng)景應(yīng)用的實(shí)操中。

前百度工程師二次創(chuàng)業(yè),給垂直場(chǎng)景應(yīng)用找“模”解

在垂直場(chǎng)景應(yīng)用這一練兵場(chǎng),打造標(biāo)桿形成行業(yè)示范,成為各路玩家新的突圍方向,巖芯數(shù)智也是其中之一。

在中國(guó)科學(xué)技術(shù)大學(xué)研究生就讀期間,機(jī)器學(xué)習(xí)領(lǐng)域科班出身的劉凡平在微軟完成了畢業(yè)論文的撰寫,并在國(guó)內(nèi)外計(jì)算機(jī)眾多賽事中獲得獎(jiǎng)項(xiàng)。后來(lái)懷揣著對(duì)機(jī)器學(xué)習(xí)濃厚的興趣,他便在百度以工程師的身份從事起了相關(guān)工作。

這期間,他兩次出走創(chuàng)業(yè)。

第一次是奔赴深度學(xué)習(xí),第二次便是去年年初對(duì)大模型的擁抱。

從事搜索技術(shù)研究的劉凡平,一直認(rèn)為搜索應(yīng)該是所搜即所得,而不是所謂的給一堆網(wǎng)頁(yè)。在看到這一行業(yè)痛點(diǎn)后,他認(rèn)為現(xiàn)有技術(shù)足以解決這個(gè)問(wèn)題,也值得其再做一次創(chuàng)業(yè)嘗試。

在擔(dān)任百度資深工程師、二三四五(巖山科技前身)算法總監(jiān)時(shí),劉凡平一直深入研究深度學(xué)習(xí)技術(shù),自主設(shè)計(jì)各類模型,并落地應(yīng)用,作為發(fā)明人申請(qǐng)人工智能技術(shù)相關(guān)專利20 余項(xiàng)。

但是,在以解決業(yè)務(wù)實(shí)際問(wèn)題為導(dǎo)向的實(shí)踐中,銀行客戶的一句“能用,但不夠好”的反饋?zhàn)寗⒎财揭庾R(shí)到,對(duì)于垂直行業(yè)場(chǎng)景來(lái)說(shuō),通用大模型不算一個(gè)足夠好的“模”法。

為了深入客戶業(yè)務(wù),劉凡平帶著團(tuán)隊(duì)在接下來(lái)的一周直接到客戶辦公室一起辦公。在了解了他們的工作模式,以及他們?nèi)绾螒?yīng)用現(xiàn)有系統(tǒng)后,劉凡平發(fā)現(xiàn),當(dāng)前行業(yè)尤其是通用的大模型,面臨著算力成本高的挑戰(zhàn),雖有很強(qiáng)的通用任務(wù)能力,卻不足以解決眾多企業(yè)的具體問(wèn)題。

這就反向要求模型提供方去從融合企業(yè)數(shù)據(jù)及業(yè)務(wù)去構(gòu)建超大型的產(chǎn)業(yè)場(chǎng)景,才會(huì)使AI大模型落地垂直行業(yè),發(fā)揮出更大的價(jià)值。但是,垂直行業(yè)模型從研發(fā)到落地,耗時(shí)耗力,這些“苦活兒、累活兒”并不受大多數(shù)大模型廠商所待見。

但這些活兒卻是劉凡平認(rèn)為要做好垂直行業(yè)模型這一解決方案的關(guān)鍵,也是大模型應(yīng)用落地的最后一公里。

“客戶只關(guān)心問(wèn)題能不能解決和優(yōu)化,是不是通過(guò)大模型做到并不重要。很多廠商銷售的是MaaS平臺(tái),但如果不深入具體的某一場(chǎng)景,梳理業(yè)務(wù)發(fā)展的需求或問(wèn)題,就不能給到客戶所要的MaaS平臺(tái)背后的產(chǎn)品和服務(wù)。在給客戶業(yè)務(wù)需求提供解決方案的過(guò)程中,大模型只是解決方案中的一環(huán)。”

在一線充分認(rèn)識(shí)到企業(yè)信息化、數(shù)字化建設(shè)的迫切需求,劉凡平快速改進(jìn)了之前的通用方案,從客戶實(shí)際業(yè)務(wù)和案例去構(gòu)建產(chǎn)品原型,從原有的AI通用大模型衍生到銀行業(yè)的任務(wù)模型,實(shí)現(xiàn)了垂直行業(yè)模型的快速落地。

從實(shí)踐中檢驗(yàn)并迭代大模型的能力,在劉凡平看來(lái),并不是單點(diǎn),而是一個(gè)生態(tài)鏈構(gòu)建的過(guò)程。

“從事大模型行業(yè)不僅要建構(gòu)大模型,還要提供整套解決方案。雖然這樣一來(lái),在接觸一個(gè)新行業(yè)時(shí),對(duì)模型提供方來(lái)說(shuō)成本會(huì)比較高,但一旦接觸好了,后期成本就會(huì)大大降低,客戶也更易接受、更好適用。”

他強(qiáng)調(diào),科技類的基礎(chǔ)創(chuàng)新和應(yīng)用的確是一個(gè)慢工出細(xì)活的過(guò)程,只是單純的做Transformer架構(gòu)的復(fù)制者沒有意義,行業(yè)大模型的設(shè)計(jì)核心是圍繞業(yè)務(wù)進(jìn)行數(shù)據(jù)和模型的構(gòu)建,以及應(yīng)用服務(wù)的構(gòu)建。

“從這個(gè)角度講,巖芯更多是和客戶作為一個(gè)共同體在垂直行業(yè)建模,這是彼此的相輔相成。”

“可控可信”+“高性價(jià)比”,成行業(yè)數(shù)智化解法

事實(shí)上,雖然現(xiàn)在“百模大戰(zhàn)”打得火熱,但問(wèn)題也很顯而易見,即不可避免陷入“一本正經(jīng)的胡說(shuō)八道”的幻覺問(wèn)題。

劉凡平坦言,Transformer架構(gòu)底層設(shè)計(jì)邏輯決定了對(duì)訓(xùn)練數(shù)據(jù)量的要求極大,幻覺問(wèn)題包括訓(xùn)練的資源消耗已成行業(yè)通病,導(dǎo)致用戶對(duì)大多數(shù)模型的輸出結(jié)果產(chǎn)生了“好像能相信,但又不可信”的感受。

“幻覺”其實(shí)也是大模型的智能體現(xiàn),但是對(duì)于大模型已學(xué)習(xí)過(guò)的知識(shí),希望能夠按照已學(xué)習(xí)過(guò)的內(nèi)容客觀表達(dá),而為了避免無(wú)效的大模型幻覺,讓模型輸出結(jié)果更可控可信,實(shí)現(xiàn)大模型助力行業(yè)數(shù)字化和智能化的升級(jí)轉(zhuǎn)型,巖芯數(shù)智在數(shù)據(jù)質(zhì)量管理和算法創(chuàng)新上花了大功夫,提出了基于記憶和邏輯的大模型建設(shè)思路。

首先在數(shù)據(jù)層面,巖芯數(shù)智的數(shù)據(jù)在保證安全可用的情況下,選擇來(lái)自互聯(lián)網(wǎng)公開的數(shù)據(jù)、專業(yè)領(lǐng)域的數(shù)據(jù),以及其他授權(quán)數(shù)據(jù)。

前面的兩方面數(shù)據(jù)是為打造垂直領(lǐng)域的行業(yè)模型,而企業(yè)客戶所提供的數(shù)據(jù)則用于為了更好優(yōu)化模型,使其輸出結(jié)果更符合目標(biāo)企業(yè)的需求。

在技術(shù)創(chuàng)新側(cè),巖芯數(shù)智則是通過(guò)自研Transformer架構(gòu)的大模型和非Trasformer架構(gòu)的大模型來(lái)根據(jù)客戶實(shí)際情況進(jìn)行調(diào)度,通過(guò)對(duì)模型的不斷迭代完善模型效率及應(yīng)用體驗(yàn)。

從去年開始,巖芯數(shù)智就通過(guò)對(duì)第二代Transformer架構(gòu)模型的自主改進(jìn),大幅提升了模型性能。

在第三次迭代中,巖芯從零開始訓(xùn)練并建構(gòu)了非Transformer底層架構(gòu)的大模型,即記憶邏輯模型,通過(guò)無(wú)監(jiān)督學(xué)習(xí)直接對(duì)數(shù)據(jù)學(xué)習(xí),再通過(guò)微調(diào)的方式得到結(jié)果,強(qiáng)化模型記憶能力,使其在訓(xùn)練效率、推理效率以及應(yīng)用效果層面都得到很大的提升,可有效降低幻覺對(duì)應(yīng)用效果的影響。

劉凡平表示,技術(shù)創(chuàng)新及對(duì)優(yōu)質(zhì)數(shù)據(jù)的精選二者結(jié)合促成了模型的“可控可信”,在決策時(shí)可通過(guò)參考內(nèi)容提供并追溯信息源,可準(zhǔn)確判定生成內(nèi)容的安全性,可預(yù)測(cè)輸出結(jié)果的價(jià)值并預(yù)判非安全行為的發(fā)生,能夠在實(shí)現(xiàn)多樣性輸出的同時(shí),保障輸出結(jié)果的相對(duì)公平性和包容性。

同時(shí),巖芯數(shù)智的記憶邏輯模型由于大模型成本和訓(xùn)練效率在服務(wù)器比別人少、算力成本可降至30%~40%的情況下,仍能達(dá)到較好的效果,從一定成本上使其解決方案更為降本。

“可控可信”+“高性價(jià)比”,恰好是行業(yè)所亟需的數(shù)智化解法。

劉凡平依稀記得,在為一家企業(yè)客戶介紹完巖芯垂直大模型后,就要求巖芯“立刻”幫其解決自動(dòng)化管理數(shù)據(jù)的難題,甚至希望公司能立即派人前往支持。

“這是一種由強(qiáng)烈需求激發(fā)出來(lái)的動(dòng)作。智能化管理數(shù)據(jù)過(guò)程不能出任何差錯(cuò),智能化程度越高,專業(yè)度也會(huì)更高,對(duì)模型要求也會(huì)更高。得知巖芯數(shù)智可控可信的大模型能夠幫助他解決這一塊問(wèn)題后,他就希望能趕緊接入。”

雖然這家企業(yè)也同時(shí)溝通了多家大模型提供方,但最后還是選擇了巖芯。據(jù)悉,不到一個(gè)月時(shí)間,巖芯數(shù)智就針對(duì)其業(yè)務(wù)提供了基于大模型的自動(dòng)化數(shù)據(jù)管理方案。

劉凡平透露,通過(guò)巖芯的垂直行業(yè)大模型,能夠?yàn)槠髽I(yè)降低近約30%的成本投入。

深入業(yè)務(wù)打通“最后一公里”,縱向做深、橫向拓寬

據(jù)介紹,巖芯為企業(yè)提供的模型解決方案有兩種。

一種是客戶可以直接接入巖芯的垂直行業(yè)模型,但這就需要企業(yè)有自研能力,包括信息化部門、運(yùn)維團(tuán)隊(duì)等,門檻相對(duì)較高。

另一種則是由巖芯提供一套深入客戶業(yè)務(wù)的大模型解決方案,主要針對(duì)制造業(yè)等信息化程度較低的傳統(tǒng)行業(yè),以及對(duì)迫切的生產(chǎn)力變革有著極大訴求的中小企業(yè),需要模型提供方提供更多支持。

相較于前者,后者的深入業(yè)務(wù)過(guò)程和私有化部署在劉凡平看來(lái),意味著巖芯扛下了“所有累活”,為企業(yè)打通了模型應(yīng)用落地的最后一公里。

劉凡平坦言,如果僅僅在通用大模型的基礎(chǔ)上,利用行業(yè)數(shù)據(jù)進(jìn)行微調(diào),最終的應(yīng)用效果其實(shí)并不足以滿足用戶的實(shí)際需求。但如果在通用數(shù)據(jù)的基礎(chǔ)上,再加上行業(yè)的專業(yè)數(shù)據(jù)以及業(yè)務(wù)數(shù)量進(jìn)行預(yù)訓(xùn)練,即通過(guò)企業(yè)的私有化數(shù)據(jù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,那就會(huì)用更專業(yè)的數(shù)據(jù)產(chǎn)生更專業(yè)的智能涌現(xiàn)現(xiàn)象。

值得注意的是,私有化升級(jí)在早期也面臨著數(shù)據(jù)安全問(wèn)題。

針對(duì)此,劉凡平也給出了巖芯數(shù)智的解法。一是客戶可以通過(guò)少量數(shù)據(jù)提供,結(jié)合巖芯現(xiàn)有數(shù)據(jù),在私有云上進(jìn)行訓(xùn)練;二是可以基于巖芯建立的垂直行業(yè)大模型,改進(jìn)算法后在客戶的機(jī)器上進(jìn)行訓(xùn)練。如此一來(lái),巖芯無(wú)需翻閱數(shù)據(jù),客戶只需將數(shù)據(jù)放在指定目錄下,啟動(dòng)模型訓(xùn)練指令,即可在客戶方進(jìn)行模型訓(xùn)練,完成一個(gè)內(nèi)部的私有化升級(jí)。

據(jù)介紹,巖芯大模型通過(guò)實(shí)現(xiàn)私有化部署,可以將客戶內(nèi)部權(quán)限及模型大腦打通,以實(shí)現(xiàn)安全的權(quán)限管理,以提供豐富的企業(yè)應(yīng)用插件,響應(yīng)企業(yè)內(nèi)部的多元需求,輔助大模型的落地應(yīng)用,并且這些插件通用,比如搜索引擎、天氣、股市等插件,或報(bào)銷流程、請(qǐng)假插件等,滿足客戶的廣泛需求,把模型的能力賦能到企業(yè)內(nèi)部的流程工具當(dāng)中,以提升生產(chǎn)效率。

據(jù)悉,從今年6月開始,巖芯數(shù)智的垂直行業(yè)大模型就開始商業(yè)化,并率先應(yīng)用于對(duì)降本增效訴求較為強(qiáng)烈的金融和制造業(yè),合作了數(shù)家案例。

其中,巖芯數(shù)智與郵儲(chǔ)銀行合作成立了國(guó)內(nèi)最早一批銀企聯(lián)動(dòng)AIGC項(xiàng)目,針對(duì)組織架構(gòu)、硬件保障、軟件創(chuàng)新等方面進(jìn)行了重點(diǎn)部署,著重滿足銀行業(yè)務(wù)對(duì)內(nèi)容專業(yè)性、嚴(yán)謹(jǐn)性、可解釋性、合規(guī)性、數(shù)據(jù)安全性等要求。雙方也將持續(xù)深化技術(shù)探索與產(chǎn)業(yè)投研建設(shè),逐步實(shí)現(xiàn)投產(chǎn)落地與產(chǎn)業(yè)升級(jí)。

“通過(guò)深耕垂類場(chǎng)景,巖芯數(shù)智希望構(gòu)建實(shí)現(xiàn) ‘1個(gè)MaaS平臺(tái),多種應(yīng)用場(chǎng)景策略’,為行業(yè)開發(fā)可信賴的、高性能的垂類模型。未來(lái)在15-30天內(nèi)即能完成對(duì)一個(gè)企業(yè)客戶的私域模型部署。”

角逐百模大戰(zhàn),一家創(chuàng)企能有多少制勝點(diǎn)?

回歸商業(yè)本質(zhì),隨著百模大戰(zhàn)開啟、大廠頭部效應(yīng)顯著,價(jià)格戰(zhàn)不可避免,如此來(lái)看,給創(chuàng)企留下的盈利空間似乎不多。

以始為終來(lái)看,巖芯數(shù)智也做從兩個(gè)維度做了準(zhǔn)備。

一方面,是“往前多邁一步”的技術(shù)創(chuàng)新。在劉凡平看來(lái),無(wú)論是企業(yè)或產(chǎn)品,一定要領(lǐng)先行業(yè)才能收獲更多機(jī)會(huì)。

“目前國(guó)內(nèi)大部分用開源模型進(jìn)行微調(diào)的產(chǎn)品,其實(shí)真正具備自研能力的模型并不多,前者很可能在后面商業(yè)化的浪潮中受到很大的影響,而巖芯大模型具有自主知識(shí)產(chǎn)權(quán),可以對(duì)模型進(jìn)行深度改造及深度的業(yè)務(wù)適配,擁有對(duì)模型底層的構(gòu)建把控能力。”

據(jù)悉,巖芯數(shù)智新一代模型已開始布局多模態(tài)的實(shí)時(shí)人機(jī)交互系統(tǒng),通過(guò)多種感知方式完善自主認(rèn)知及控制能力。

另一方面,構(gòu)建企業(yè)級(jí)AI差異化優(yōu)勢(shì)的關(guān)鍵,是要根據(jù)客戶的特定需求來(lái)定制和調(diào)整技術(shù),巖芯也會(huì)通過(guò)服務(wù)客戶、融入業(yè)務(wù)來(lái)構(gòu)建更深的行業(yè)壁壘。

“垂直行業(yè)大模型需要根據(jù)行業(yè)屬性提供場(chǎng)景化服務(wù),而行業(yè)數(shù)據(jù)的累積對(duì)于AIGC和大模型具有壁壘價(jià)值。在訓(xùn)練語(yǔ)料方面,除常規(guī)的涵蓋該領(lǐng)域的專業(yè)知識(shí)和術(shù)語(yǔ)外,定制的模型還將包含特定領(lǐng)域的實(shí)際案例和數(shù)據(jù)、專家的經(jīng)驗(yàn)和見解等,以適應(yīng)不同垂直領(lǐng)域特定的語(yǔ)言風(fēng)格和表達(dá)方式。”

隨著由ChatGPT掀起的大模型浪潮從通用領(lǐng)域席卷垂直領(lǐng)域,政務(wù)、公共安全、醫(yī)療、金融、健康、制造業(yè)等領(lǐng)域都在開發(fā)專用垂直細(xì)分賽道的大模型產(chǎn)品,加速AI應(yīng)用的場(chǎng)景化落地進(jìn)程,A股上市公司也紛紛成為玩家中的主力軍。

譬如巖芯數(shù)智背靠的巖山科技,近年來(lái)也全面擁抱人工智能,已在人工智能領(lǐng)域的智能駕駛、類腦智能、AIGC等新興領(lǐng)域進(jìn)行了布局。巖芯數(shù)智的成立,既代表著老牌互聯(lián)網(wǎng)公司角逐新時(shí)代的決心,也意味著這波大模型的廝殺已從上半場(chǎng)的自研走入下半場(chǎng)的卷資源、卷落地的商業(yè)化篇章。

大浪淘沙之下,實(shí)踐檢驗(yàn)真理的時(shí)刻或許到了。

(首圖來(lái)源:圖蟲)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港