展會信息港展會大全

專訪思必馳:DFM-2百億級大模型主攻汽車、物聯(lián)網(wǎng)等行業(yè),將持續(xù)推進(jìn)IPO
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-28 07:12:06   瀏覽:20646次  

導(dǎo)讀:作為一家16歲AI公司的董事長,思必馳創(chuàng)始人高始興在今年初第一次使用ChatGPT時依舊難掩驚艷,至少,發(fā)言稿可以不用專人寫作了。 然而,伴隨驚艷而來的,還有當(dāng)時外界對幾乎所有AI公司的質(zhì)疑。 大模型走紅后,不論是計算機視覺、語音識別,亦或基于垂直任務(wù)的...

作為一家16歲AI公司的董事長,思必馳創(chuàng)始人高始興在今年初第一次使用ChatGPT時依舊難掩驚艷,“至少,發(fā)言稿可以不用專人寫作了。”

然而,伴隨驚艷而來的,還有當(dāng)時外界對幾乎所有AI公司的質(zhì)疑。

大模型走紅后,不論是計算機視覺、語音識別,亦或基于垂直任務(wù)的自然語言理解,都被統(tǒng)稱為“上一代AI”。在36氪今年的交流中,就有好幾家“上一代”AI公司坦言面對新技術(shù)倍感壓力。

對比之下,雖然思必馳也屬人工智能語音語言公司,高始興的內(nèi)心卻沒有過多波瀾,“我們比較早就布局了這一技術(shù)。之前十億級的模型已經(jīng)用在產(chǎn)品上,只是沒有對外強調(diào)”。

據(jù)介紹,思必馳十億級參數(shù)量的模型,名為DFM-1,于2022年研發(fā)推出,在ChatGPT還未火熱的2022年已進(jìn)行了小規(guī)模產(chǎn)品應(yīng)用。而在7月的發(fā)布會上,思必馳又新推出了DFM-2大模型,參數(shù)量達(dá)到百億級別。

除卻已有布局,高始興對思必馳的信心,還源于大模型的技術(shù)路線和場景積累。

對比其他模型,DFM-2在技術(shù)上強調(diào)對話交互能力,在場景中強調(diào)專業(yè)化和行業(yè)化。

思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱專門厘清了幾個概念,“通用人工智能,必須要大模型加上語言計算才行,否則只是專用大模型。而在此基礎(chǔ)上,通用大模型還分全域和垂域。”而語言計算,恰好是這家對話式人工智能公司的擅長所在。

俞凱解釋,大模型概念由來已久,包括AIphaFold 蛋白質(zhì)折疊、Stable Diffusion 圖像生成大模型到 Whisper 語音大模型等,但都沒有引起產(chǎn)業(yè)廣泛重視。直到對話式語言大模型 ChatGPT 的出現(xiàn),展現(xiàn)出語言計算與大模型結(jié)合所達(dá)成的通用人工智能效果。俞凱篤信,“對話式語言計算大模型”,是認(rèn)知領(lǐng)域通用人工智能發(fā)展的里程碑。

基于大模型和語言計算技術(shù),思必馳的百億參數(shù)模型選擇落地垂直行業(yè),而非全域。俞凱認(rèn)為,目前To C領(lǐng)域,生成式AI已經(jīng)跨越生產(chǎn)力門檻,但在To B領(lǐng)域,對大模型的數(shù)據(jù)和經(jīng)驗的要求都非常高。

思必馳的百億大模型將主要聚焦汽車、物聯(lián)網(wǎng)等行業(yè)也就是這家公司早前已深入的領(lǐng)域。以汽車為例,據(jù)介紹,自2019年正式進(jìn)入汽車前裝,思必馳的產(chǎn)品目前已“上車”600多萬輛。

“汽車和物聯(lián)網(wǎng)領(lǐng)域是思必馳的主要業(yè)務(wù)領(lǐng)域服務(wù)于汽車、家電等智能化,同時,也賦能垂直行業(yè)的信息智能化,如金融、政務(wù)。”高始興表示。

但即便對所選行業(yè)已有積累,高始興依然不否認(rèn)大模型落地到具體垂直行業(yè)場景的困難。在他眼中,現(xiàn)在思必馳的百億大模型“還不錯,但依然有提升空間”。尤其,在汽車和家電等物聯(lián)網(wǎng)領(lǐng)域,產(chǎn)品類別非常多,各種復(fù)雜場景下各系統(tǒng)的融合,都需要差異化方案這種情況下要用好大模型,勢必是一場長期戰(zhàn)。

而在回答大模型是否會促進(jìn)IPO的提問時,高始興坦言,思必馳會在今年或明年繼續(xù)啟動上市,而大模型是否會對此有促進(jìn)作用,還是要看產(chǎn)業(yè)落地。

“我們的主戰(zhàn)場針對幾個重點垂直行業(yè),如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等。這個方向,思必馳在技術(shù)、資源和客戶各方面都有積累。”他總結(jié),“思必馳是一家比較踏實的公司。”

以下是對話部分(經(jīng)節(jié)選):

36氪: 思必馳是什么時候開始考慮做大模型的?而且是大模型加上語言計算的概念?

高始興:語言模型和人機對話,確實是我們首先提出的理念。我們是中國最早做對話式人工智能的公司之一,甚至可以說是首個引入這一理念的公司。

思必馳的聯(lián)合創(chuàng)始人俞凱曾經(jīng)參與創(chuàng)辦過一家人機對話公司,后來被蘋果公司收購,所以我們在人機對話方面的經(jīng)驗非常豐富。而在語言模型方面,我們已經(jīng)做了三四年了。思必馳實際上很早就發(fā)布了十億級別的模型。

36氪:這次發(fā)布的DFM-2百億模型是什么時候開始做的?現(xiàn)在的進(jìn)展是?

高始興:我們的百億級模型在四月份開始內(nèi)部測試,現(xiàn)在已經(jīng)開始與一些客戶進(jìn)行落地應(yīng)用。

另外,思必馳的模型更加深扎行業(yè)。B端和G端與C端有很大不同,我個人認(rèn)為,或許應(yīng)該由國家來做這些能夠覆蓋各種生態(tài)的大模型,因為這應(yīng)該是國家的基礎(chǔ)設(shè)施。對思必馳來說,行業(yè)更應(yīng)該是我們模型所深耕的對象。技術(shù)型公司應(yīng)該深入到行業(yè)場景中去做技術(shù)創(chuàng)新,做產(chǎn)業(yè)應(yīng)用。所以,我們的百億模型的定位是具有一定的通用能力,然后深入到行業(yè)中,服務(wù)于行業(yè)的垂域模型。

36氪:思必馳怎么看生成式人工智能和大模型?

俞凱:今天我們講了大模型和通用人工智能。生成式人工智能其實是諸多人工智能中的一類,它可以不是大模型,也可以不是通用的,而且在人工智能領(lǐng)域早已存在,F(xiàn)在的關(guān)鍵變化是,生成式人工智能在圖像、語音和文字生成的多樣性和質(zhì)量上已經(jīng)到了一個突破性階段。

從產(chǎn)業(yè)上看,現(xiàn)在生成式人工智能在To C領(lǐng)域跨越了門檻。但如果是在To B領(lǐng)域,情況可能會有所不同。C端和B端的需求不一樣,在To B領(lǐng)域,判別式人工智能的問題,生成式人工智能同樣會面臨。判別式人工智能關(guān)注正確與否,生成式人工智能更關(guān)注好與壞。然而在To B領(lǐng)域,即使是生成式人工智能,正確與否也非常重要。

對于我們來說,巨大的機會在于,生成式人工智能已經(jīng)過了門檻,它可以作為輔助工具,與現(xiàn)有的商業(yè)模式結(jié)合來擴大應(yīng)用。但是,出現(xiàn)一種全新的、純技術(shù)的生成式人工智能被大規(guī)模復(fù)制的可能性是相當(dāng)小的。

因此,在我看來,既沒有那么樂觀,也沒有那么悲觀。我不認(rèn)為現(xiàn)在的生成式人工智能能夠改變世界,但我相信,它會擴大我們的工具使用范圍,并促使我們將人工智能系統(tǒng)更全面地應(yīng)用到工作中。

36氪:大模型是否會對To B行業(yè)過去的部署應(yīng)用產(chǎn)生影響?

俞凱:會有一部分影響,但我認(rèn)為影響比較校這個事情特別容易判斷,舉個例子:

假設(shè)你是一名不了解To B業(yè)務(wù)的媒體工作者,我把你派到一個制造工廠,你能否在一天之內(nèi)完成那里的工作?如果能,那么這項工作肯定可以被ChatGPT或其他通用人工智能復(fù)制。如果不能,那么所有的積累都是有價值的。這件事的重點并不在于你生成了一些文案,而是你對整個知識流程的精確理解非常重要。

然而,你要如何獲得這種精確的理解呢?要么需要有數(shù)據(jù),要么需要有人教你。但如果你沒有和廠商合作,沒有處在這個垂域內(nèi),怎么可能有這些呢?所以行業(yè)的數(shù)據(jù)和經(jīng)驗是非常重要的。因為它無法代替人的經(jīng)驗和繁瑣的to B流程,因為在to B領(lǐng)域評價指標(biāo)是多維且復(fù)雜的,這些無法被通用人工智能簡單替代。

36氪:目前思必馳大模型所重點關(guān)注的行業(yè)是?

高始興: 我們主要關(guān)注汽車和物聯(lián)網(wǎng)領(lǐng)域,這與我們的主要業(yè)務(wù)汽車、家電智能化,行業(yè)信息智能化息息相關(guān)。對于垂直行業(yè),如金融,我們也在做智能外呼等項目,像公安的智能審訊和反詐騙等也有。

我覺得我們目前也承載不了太多行業(yè),而且要把幾個垂直行業(yè)的賦能做好,也是一件非常了不起的事情。

比如在汽車、物聯(lián)網(wǎng)領(lǐng)域,產(chǎn)品類別本身非常多,成千上萬。而且,其中有的場景需要本地服務(wù),有的需要云端服務(wù),有的需要本地與云端結(jié)合才能做出好的端到端的人機交互體驗。

在這之外,還有各種系統(tǒng)融合、聲學(xué)環(huán)境等需要考慮。實際上,我認(rèn)為如果不深入到行業(yè)中,是很難做好的。我們必須理解場景,而這些場景實際上非常復(fù)雜。

汽車領(lǐng)域思必馳從后裝到前裝,做了八到九年的時間,才做到現(xiàn)在的程度。我們已經(jīng)做得相當(dāng)好了,比上一代的語音控制技術(shù)已經(jīng)進(jìn)步很大,但還有進(jìn)步的空間,東風(fēng)大模型將會帶來新的體驗升級。

36氪:比如說還存在怎樣的進(jìn)步空間,有具體的例子嗎?

高始興:未來,我覺得汽車一定會有無人駕駛,它(大模型)就是你的駕駛助手、汽車空間的生活娛樂助手。你問它任何問題,除了常見的汽車控制等問題外,其他任何問題都可以回答你,像汽車工程師。車?yán)镆彩且粋生活娛樂空間,車內(nèi)學(xué)習(xí)、辦公等等都可以實現(xiàn)。

36氪:比較像現(xiàn)在流行的"副駕駛模式"。

高始興:對,一定是這樣的。我們實現(xiàn)了很多創(chuàng)新發(fā)布,如多音區(qū)人機對話,我們在這里不僅結(jié)合了人機對話技術(shù),還結(jié)合了一些聲學(xué)技術(shù)。無論你在車內(nèi)的主駕駛座位、副駕駛座位還是后排座位,都可以進(jìn)行人車交互。

有了百億大模型之后,之前的產(chǎn)品就像大腦更聰明了一樣。在車內(nèi),現(xiàn)在的人機對話還無法讓它成為你車內(nèi)的說明書。大模型之后,你可以問它關(guān)于車的任何問題,無論是維修問題,還是其他的問題,都能回答你。這就是一個例子。更高級的場景,你在車內(nèi),它就是你的助理,你可以通過人機對話進(jìn)行訂票、訂酒店,一站式的服務(wù)。我們期待大模型可以像一個智能助理一樣,更好地理解和與人交流。

36氪: 現(xiàn)在我們內(nèi)測的效果怎么樣?

高始興: 還是很不錯的,也還有提升空間。因為這涉及到很多方面,不僅是技術(shù)性能的提升,真正的落地還需要結(jié)合我們在垂直行業(yè)中的經(jīng)驗,結(jié)合這些場景進(jìn)行優(yōu)化,這不是一朝一夕可以完成的。比如剛才提到的讓大模型消化、吸收產(chǎn)品說明書,就需要我們和汽車制造商一起合作。

36氪:思必馳今年還會啟動上市嗎?大模型會對這件事產(chǎn)生怎樣的影響?

高始興:我們肯定會啟動上市,但不一定在今年,有可能是明年。至于大模型是否有促進(jìn)作用,我覺得核心還是要把業(yè)務(wù)做好。大語言模型只是我們一個工具,我們一直在做人機對話語言模型,最終還是要產(chǎn)業(yè)落地。

36氪:作為一家準(zhǔn)備IPO的公司,財務(wù)狀況也非常重要,但訓(xùn)練大模型是一件比較貴的事。

高始興:是的,訓(xùn)練大語言模型是很貴的,但好在我們過去有積累,包括人機對話的語料積累,語言模型技術(shù)的積累,以及早期購買的計算資源。

對思必馳來說,首先,這是必須要做的事情。其次,公司能承受。我們已經(jīng)有了對話語言模型的技術(shù)和數(shù)據(jù),所以這就是一個投入的問題。我們早期也有了GPU算力和超算中心,蘇州政府也給了我們很多支持。

36氪:對于大模型的投入產(chǎn)出比,思必馳有什么預(yù)期嗎?

高始興:我覺得效果是陸續(xù)顯現(xiàn)的,其實并不一定僅從C端直接收費。比如,如果我們的B端產(chǎn)品升級,用戶體驗好了,自然B端客戶就會有源源不斷的升級需求。當(dāng)然我們大模型也有直接的C端用戶。

整體來說,思必馳的大模型主要服務(wù)于"溝通萬物、打理萬事"的理念,主戰(zhàn)場是針對特定行業(yè),如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等,構(gòu)建具有通用能力的行業(yè)專業(yè)模型。對于這件事,我們在技術(shù)、資源和客戶各方面都有積累。思必馳還是一家比較踏實的公司。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港