展會(huì)信息港展會(huì)大全

對(duì)話數(shù)庫(kù)科技創(chuàng)始人沈鑫:大模型是效率工具,真正可供使用的高質(zhì)量數(shù)據(jù)非常缺乏丨WAIC 2023
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-07 09:27:16   瀏覽:5161次  

導(dǎo)讀:每經(jīng)記者:孫嘉夏每經(jīng)實(shí)習(xí)記者:黃海每經(jīng)編輯:董興生 這個(gè)世界不存在魔術(shù),不存在一個(gè)大模型啪得一瞬間把所有問(wèn)題都解決了。 7月6日至8日,2023世界人工智能大會(huì)在上海舉辦。6日下午,數(shù)庫(kù)科技創(chuàng)始人兼總裁沈鑫在大會(huì)現(xiàn)場(chǎng)接受了《每日經(jīng)濟(jì)新聞》記者專訪。...

每經(jīng)記者:孫嘉夏每經(jīng)實(shí)習(xí)記者:黃海每經(jīng)編輯:董興生

“這個(gè)世界不存在魔術(shù),不存在一個(gè)大模型‘啪’得一瞬間把所有問(wèn)題都解決了。”

7月6日至8日,2023世界人工智能大會(huì)在上海舉辦。6日下午,數(shù)庫(kù)科技創(chuàng)始人兼總裁沈鑫在大會(huì)現(xiàn)場(chǎng)接受了《每日經(jīng)濟(jì)新聞》記者專訪。

沈鑫 圖片來(lái)源:企業(yè)供圖

數(shù)庫(kù)科技成立于2009年,是一家專注產(chǎn)融數(shù)字化的數(shù)據(jù)科技公司,主要在金融及產(chǎn)業(yè)領(lǐng)域提供基于產(chǎn)業(yè)邏輯的智能數(shù)據(jù)產(chǎn)品與系統(tǒng)服務(wù),幫助金融機(jī)構(gòu)、企業(yè)集團(tuán)、政府部門解決業(yè)務(wù)場(chǎng)景中的數(shù)據(jù)和系統(tǒng)需求。

本次大會(huì)期間,數(shù)庫(kù)科技將發(fā)布融合統(tǒng)一產(chǎn)品圖譜體系與大模型的概念型產(chǎn)品“istari”。記者現(xiàn)場(chǎng)觀察到,用戶輸入問(wèn)題后,istari可以將需求轉(zhuǎn)化成統(tǒng)一產(chǎn)品知識(shí)圖譜(UPG)相關(guān)的查詢,并呈現(xiàn)出相關(guān)的專業(yè)產(chǎn)業(yè)知識(shí)以及各個(gè)知識(shí)點(diǎn)之間的關(guān)系。

據(jù)沈鑫介紹,目前,istari主要通過(guò)大模型來(lái)做產(chǎn)業(yè)關(guān)系的推演。“以前我們只有單純的上下游關(guān)系,今天大模型可以通過(guò)各種各樣的資訊,來(lái)反推除了產(chǎn)業(yè)關(guān)系之外潛在的經(jīng)營(yíng)聯(lián)系。”

在談及通用大模型是否會(huì)取代行業(yè)大模型時(shí),沈鑫表示,通用大模型如果真的做到垂直領(lǐng)域,經(jīng)過(guò)很高級(jí)別的訓(xùn)練之后,可以做得很好。“但是問(wèn)題在于,能夠真正供大模型使用的高質(zhì)量的數(shù)據(jù)是非常缺乏的……(做得好的)幾家肯定不會(huì)把數(shù)據(jù)貢獻(xiàn)給別人,所以(通用大模型取代行業(yè)大模型)其實(shí)是一個(gè)漫長(zhǎng)的過(guò)程,沒(méi)有大家想象得那么快。

以下是部分問(wèn)答實(shí)錄:

NBD:對(duì)于當(dāng)今市場(chǎng)而言,產(chǎn)業(yè)鏈數(shù)據(jù)價(jià)值體現(xiàn)在哪里?

沈鑫:我們講數(shù)據(jù)想要用好,必須要數(shù)數(shù)相連,要有連接邏輯,產(chǎn)業(yè)關(guān)系是唯一一個(gè)可以連接中國(guó)所有企業(yè)的關(guān)系。我跟你之間哪怕沒(méi)有金錢往來(lái),有了金錢往來(lái)那叫供應(yīng)鏈,(但)直接和間接,兩個(gè)企業(yè)之間一定會(huì)有產(chǎn)業(yè)的傳導(dǎo)路徑。

我們把產(chǎn)業(yè)數(shù)據(jù)網(wǎng)絡(luò)搭起來(lái)以后,第一,它本身是個(gè)數(shù)據(jù)集,你可以看到企業(yè)上下游的情況,可以做企業(yè)定位,它可以單獨(dú)當(dāng)成一個(gè)數(shù)據(jù)集來(lái)用,同時(shí)它又是一個(gè)數(shù)據(jù)編制的核心邏輯,我們可以把宏觀行業(yè)的信息、公司相關(guān)的信息、某一個(gè)產(chǎn)品的產(chǎn)能價(jià)格等定到產(chǎn)品節(jié)點(diǎn)上。

本來(lái)是孤島式的數(shù)據(jù)現(xiàn)在有了邏輯,再去疊加模型的時(shí)候,你會(huì)發(fā)現(xiàn)它的判斷就更加精準(zhǔn)。所以我們主要是做數(shù)據(jù)融合和數(shù)據(jù)組裝。通過(guò)各種各樣的大數(shù)據(jù)線索把這些數(shù)據(jù)融合起來(lái)建模,得出一個(gè)決策的結(jié)論,讓我們的客戶能夠在最佳的市場(chǎng)時(shí)機(jī)去切入這些企業(yè),去授信也好,去服務(wù)也好,找到企業(yè)生命周期中最好的介入時(shí)間點(diǎn)。

圖片來(lái)源:每經(jīng)實(shí)習(xí)記者 黃海 攝

NBD:公司過(guò)去這十年中遇到最大的難點(diǎn)是在哪?

沈鑫:其實(shí)難點(diǎn)很多,為什么講數(shù)據(jù)行業(yè)實(shí)際上門檻比較高,首先想做好數(shù)據(jù)融合,數(shù)據(jù)就要做到高度的結(jié)構(gòu)化和標(biāo)準(zhǔn)化,這件事情就有點(diǎn)像石油冶煉一樣,怎么把粗的、顆粒的數(shù)據(jù)變成更加結(jié)構(gòu)化、更加精細(xì)的,我們叫“好料子”,這有個(gè)提煉的過(guò)程。

在過(guò)去的十多年,我們用很多的人工智能技術(shù),通過(guò)工程化建設(shè)打造自己的數(shù)據(jù)工廠,這個(gè)數(shù)據(jù)工廠會(huì)把一些非標(biāo)數(shù)據(jù)轉(zhuǎn)換成高度結(jié)構(gòu)化和標(biāo)準(zhǔn)化的數(shù)據(jù)。在開(kāi)始的時(shí)候,機(jī)器生產(chǎn)數(shù)據(jù)肯定是不如人的,它需要很多年的積累,但今天它已經(jīng)突破了邊界,生產(chǎn)的精度已經(jīng)超過(guò)人了。

我們相信的一點(diǎn)是,要用工業(yè)化的思維來(lái)經(jīng)營(yíng)一家企業(yè),我們不能回到勞動(dòng)密集型老路上去。

NBD:如何看待大模型的應(yīng)用?

沈鑫:這個(gè)世界不存在魔術(shù),不存在一個(gè)大模型“啪”得一瞬間把所有問(wèn)題都解決了。它本身是一個(gè)效率工具,我們現(xiàn)在會(huì)把大模型的一些技術(shù)融入到數(shù)據(jù)生產(chǎn)端,進(jìn)一步去提升生產(chǎn)效率。這個(gè)實(shí)際上是我們看待大模型的一個(gè)點(diǎn),就是不要為了技術(shù)而技術(shù)。

NBD:如何看待通用大模型和行業(yè)大模型之間的應(yīng)用場(chǎng)景沖突?

沈鑫:如果通用大模型發(fā)展到極致的話,我覺(jué)得也就不存在什么行業(yè)大模型,但這是一個(gè)非常漫長(zhǎng)的過(guò)程。

能夠真正供大模型使用的高質(zhì)量數(shù)據(jù)是非常缺乏的。你看我們行業(yè)里,能把金融相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)做到很高的公司,可能掰手指頭都數(shù)得出來(lái),而這幾家肯定不會(huì)把數(shù)據(jù)貢獻(xiàn)給別人。所以它其實(shí)是一個(gè)漫長(zhǎng)的過(guò)程,沒(méi)有大家想象得那么快。

另外一個(gè)點(diǎn),很多的場(chǎng)景是不需要用到大模型的?赡茉谧稍兎⻊(wù)類的場(chǎng)景中大模型有很大的用場(chǎng),但是在金融這種對(duì)數(shù)據(jù)要求很嚴(yán)謹(jǐn)?shù)男袠I(yè)內(nèi),大模型實(shí)際是沒(méi)有意義的,因?yàn)榛仞伿窍鄬?duì)比較模糊的。

每日經(jīng)濟(jì)新聞

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港