當(dāng)前位置：人工智能實驗室> 企業(yè)新聞 > 專訪思必馳：DFM-2百億級大模型主攻汽車、物聯(lián)網(wǎng)等行業(yè)，將持續(xù)推進(jìn)IPO

專訪思必馳：DFM-2百億級大模型主攻汽車、物聯(lián)網(wǎng)等行業(yè)，將持續(xù)推進(jìn)IPO
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-28 07:12:06 瀏覽：20646次

導(dǎo)讀：作為一家16歲AI公司的董事長，思必馳創(chuàng)始人高始興在今年初第一次使用ChatGPT時依舊難掩驚艷，至少，發(fā)言稿可以不用專人寫作了。然而，伴隨驚艷而來的，還有當(dāng)時外界對幾乎所有AI公司的質(zhì)疑。大模型走紅后，不論是計算機視覺、語音識別，亦或基于垂直任務(wù)的...

作為一家16歲AI公司的董事長，思必馳創(chuàng)始人高始興在今年初第一次使用ChatGPT時依舊難掩驚艷，“至少，發(fā)言稿可以不用專人寫作了。”

然而，伴隨驚艷而來的，還有當(dāng)時外界對幾乎所有AI公司的質(zhì)疑。

大模型走紅后，不論是計算機視覺、語音識別，亦或基于垂直任務(wù)的自然語言理解，都被統(tǒng)稱為“上一代AI”。在36氪今年的交流中，就有好幾家“上一代”AI公司坦言面對新技術(shù)倍感壓力。

對比之下，雖然思必馳也屬人工智能語音語言公司，高始興的內(nèi)心卻沒有過多波瀾，“我們比較早就布局了這一技術(shù)。之前十億級的模型已經(jīng)用在產(chǎn)品上，只是沒有對外強調(diào)”。

據(jù)介紹，思必馳十億級參數(shù)量的模型，名為DFM-1，于2022年研發(fā)推出，在ChatGPT還未火熱的2022年已進(jìn)行了小規(guī)模產(chǎn)品應(yīng)用。而在7月的發(fā)布會上，思必馳又新推出了DFM-2大模型，參數(shù)量達(dá)到百億級別。

除卻已有布局，高始興對思必馳的信心，還源于大模型的技術(shù)路線和場景積累。

對比其他模型，DFM-2在技術(shù)上強調(diào)對話交互能力，在場景中強調(diào)專業(yè)化和行業(yè)化。

思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱專門厘清了幾個概念，“通用人工智能，必須要大模型加上語言計算才行，否則只是專用大模型。而在此基礎(chǔ)上，通用大模型還分全域和垂域。”而語言計算，恰好是這家對話式人工智能公司的擅長所在。

俞凱解釋，大模型概念由來已久，包括AIphaFold 蛋白質(zhì)折疊、Stable Diffusion 圖像生成大模型到 Whisper 語音大模型等，但都沒有引起產(chǎn)業(yè)廣泛重視。直到對話式語言大模型 ChatGPT 的出現(xiàn)，展現(xiàn)出語言計算與大模型結(jié)合所達(dá)成的通用人工智能效果。俞凱篤信，“對話式語言計算大模型”，是認(rèn)知領(lǐng)域通用人工智能發(fā)展的里程碑。

基于大模型和語言計算技術(shù)，思必馳的百億參數(shù)模型選擇落地垂直行業(yè)，而非全域。俞凱認(rèn)為，目前To C領(lǐng)域，生成式AI已經(jīng)跨越生產(chǎn)力門檻，但在To B領(lǐng)域，對大模型的數(shù)據(jù)和經(jīng)驗的要求都非常高。

思必馳的百億大模型將主要聚焦汽車、物聯(lián)網(wǎng)等行業(yè)也就是這家公司早前已深入的領(lǐng)域。以汽車為例，據(jù)介紹，自2019年正式進(jìn)入汽車前裝，思必馳的產(chǎn)品目前已“上車”600多萬輛。

“汽車和物聯(lián)網(wǎng)領(lǐng)域是思必馳的主要業(yè)務(wù)領(lǐng)域服務(wù)于汽車、家電等智能化，同時，也賦能垂直行業(yè)的信息智能化，如金融、政務(wù)。”高始興表示。

但即便對所選行業(yè)已有積累，高始興依然不否認(rèn)大模型落地到具體垂直行業(yè)場景的困難。在他眼中，現(xiàn)在思必馳的百億大模型“還不錯，但依然有提升空間”。尤其，在汽車和家電等物聯(lián)網(wǎng)領(lǐng)域，產(chǎn)品類別非常多，各種復(fù)雜場景下各系統(tǒng)的融合，都需要差異化方案這種情況下要用好大模型，勢必是一場長期戰(zhàn)。

而在回答大模型是否會促進(jìn)IPO的提問時，高始興坦言，思必馳會在今年或明年繼續(xù)啟動上市，而大模型是否會對此有促進(jìn)作用，還是要看產(chǎn)業(yè)落地。

“我們的主戰(zhàn)場針對幾個重點垂直行業(yè)，如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等。這個方向，思必馳在技術(shù)、資源和客戶各方面都有積累。”他總結(jié)，“思必馳是一家比較踏實的公司。”

以下是對話部分（經(jīng)節(jié)選）：

36氪: 思必馳是什么時候開始考慮做大模型的？而且是大模型加上語言計算的概念？

高始興：語言模型和人機對話，確實是我們首先提出的理念。我們是中國最早做對話式人工智能的公司之一，甚至可以說是首個引入這一理念的公司。

思必馳的聯(lián)合創(chuàng)始人俞凱曾經(jīng)參與創(chuàng)辦過一家人機對話公司，后來被蘋果公司收購，所以我們在人機對話方面的經(jīng)驗非常豐富。而在語言模型方面，我們已經(jīng)做了三四年了。思必馳實際上很早就發(fā)布了十億級別的模型。

36氪：這次發(fā)布的DFM-2百億模型是什么時候開始做的？現(xiàn)在的進(jìn)展是？

高始興：我們的百億級模型在四月份開始內(nèi)部測試，現(xiàn)在已經(jīng)開始與一些客戶進(jìn)行落地應(yīng)用。

另外，思必馳的模型更加深扎行業(yè)。B端和G端與C端有很大不同，我個人認(rèn)為，或許應(yīng)該由國家來做這些能夠覆蓋各種生態(tài)的大模型，因為這應(yīng)該是國家的基礎(chǔ)設(shè)施。對思必馳來說，行業(yè)更應(yīng)該是我們模型所深耕的對象。技術(shù)型公司應(yīng)該深入到行業(yè)場景中去做技術(shù)創(chuàng)新，做產(chǎn)業(yè)應(yīng)用。所以，我們的百億模型的定位是具有一定的通用能力，然后深入到行業(yè)中，服務(wù)于行業(yè)的垂域模型。

36氪：思必馳怎么看生成式人工智能和大模型？

俞凱：今天我們講了大模型和通用人工智能。生成式人工智能其實是諸多人工智能中的一類，它可以不是大模型，也可以不是通用的，而且在人工智能領(lǐng)域早已存在�，F(xiàn)在的關(guān)鍵變化是，生成式人工智能在圖像、語音和文字生成的多樣性和質(zhì)量上已經(jīng)到了一個突破性階段。

從產(chǎn)業(yè)上看，現(xiàn)在生成式人工智能在To C領(lǐng)域跨越了門檻。但如果是在To B領(lǐng)域，情況可能會有所不同。C端和B端的需求不一樣，在To B領(lǐng)域，判別式人工智能的問題，生成式人工智能同樣會面臨。判別式人工智能關(guān)注正確與否，生成式人工智能更關(guān)注好與壞。然而在To B領(lǐng)域，即使是生成式人工智能，正確與否也非常重要。

對于我們來說，巨大的機會在于，生成式人工智能已經(jīng)過了門檻，它可以作為輔助工具，與現(xiàn)有的商業(yè)模式結(jié)合來擴大應(yīng)用。但是，出現(xiàn)一種全新的、純技術(shù)的生成式人工智能被大規(guī)模復(fù)制的可能性是相當(dāng)小的。

因此，在我看來，既沒有那么樂觀，也沒有那么悲觀。我不認(rèn)為現(xiàn)在的生成式人工智能能夠改變世界，但我相信，它會擴大我們的工具使用范圍，并促使我們將人工智能系統(tǒng)更全面地應(yīng)用到工作中。

36氪：大模型是否會對To B行業(yè)過去的部署應(yīng)用產(chǎn)生影響？

俞凱：會有一部分影響，但我認(rèn)為影響比較校這個事情特別容易判斷，舉個例子：

假設(shè)你是一名不了解To B業(yè)務(wù)的媒體工作者，我把你派到一個制造工廠，你能否在一天之內(nèi)完成那里的工作？如果能，那么這項工作肯定可以被ChatGPT或其他通用人工智能復(fù)制。如果不能，那么所有的積累都是有價值的。這件事的重點并不在于你生成了一些文案，而是你對整個知識流程的精確理解非常重要。

然而，你要如何獲得這種精確的理解呢？要么需要有數(shù)據(jù)，要么需要有人教你。但如果你沒有和廠商合作，沒有處在這個垂域內(nèi)，怎么可能有這些呢？所以行業(yè)的數(shù)據(jù)和經(jīng)驗是非常重要的。因為它無法代替人的經(jīng)驗和繁瑣的to B流程，因為在to B領(lǐng)域評價指標(biāo)是多維且復(fù)雜的，這些無法被通用人工智能簡單替代。

36氪：目前思必馳大模型所重點關(guān)注的行業(yè)是？

高始興: 我們主要關(guān)注汽車和物聯(lián)網(wǎng)領(lǐng)域，這與我們的主要業(yè)務(wù)汽車、家電智能化，行業(yè)信息智能化息息相關(guān)。對于垂直行業(yè)，如金融，我們也在做智能外呼等項目，像公安的智能審訊和反詐騙等也有。

我覺得我們目前也承載不了太多行業(yè)，而且要把幾個垂直行業(yè)的賦能做好，也是一件非常了不起的事情。

比如在汽車、物聯(lián)網(wǎng)領(lǐng)域，產(chǎn)品類別本身非常多，成千上萬。而且，其中有的場景需要本地服務(wù)，有的需要云端服務(wù)，有的需要本地與云端結(jié)合才能做出好的端到端的人機交互體驗。

在這之外，還有各種系統(tǒng)融合、聲學(xué)環(huán)境等需要考慮。實際上，我認(rèn)為如果不深入到行業(yè)中，是很難做好的。我們必須理解場景，而這些場景實際上非常復(fù)雜。

汽車領(lǐng)域思必馳從后裝到前裝，做了八到九年的時間，才做到現(xiàn)在的程度。我們已經(jīng)做得相當(dāng)好了，比上一代的語音控制技術(shù)已經(jīng)進(jìn)步很大，但還有進(jìn)步的空間，東風(fēng)大模型將會帶來新的體驗升級。

36氪：比如說還存在怎樣的進(jìn)步空間，有具體的例子嗎？

高始興：未來，我覺得汽車一定會有無人駕駛，它（大模型）就是你的駕駛助手、汽車空間的生活娛樂助手。你問它任何問題，除了常見的汽車控制等問題外，其他任何問題都可以回答你，像汽車工程師。車?yán)镆彩且粋€生活娛樂空間，車內(nèi)學(xué)習(xí)、辦公等等都可以實現(xiàn)。

36氪：比較像現(xiàn)在流行的"副駕駛模式"。

高始興：對，一定是這樣的。我們實現(xiàn)了很多創(chuàng)新發(fā)布，如多音區(qū)人機對話，我們在這里不僅結(jié)合了人機對話技術(shù)，還結(jié)合了一些聲學(xué)技術(shù)。無論你在車內(nèi)的主駕駛座位、副駕駛座位還是后排座位，都可以進(jìn)行人車交互。

有了百億大模型之后，之前的產(chǎn)品就像大腦更聰明了一樣。在車內(nèi)，現(xiàn)在的人機對話還無法讓它成為你車內(nèi)的說明書。大模型之后，你可以問它關(guān)于車的任何問題，無論是維修問題，還是其他的問題，都能回答你。這就是一個例子。更高級的場景，你在車內(nèi)，它就是你的助理，你可以通過人機對話進(jìn)行訂票、訂酒店，一站式的服務(wù)。我們期待大模型可以像一個智能助理一樣，更好地理解和與人交流。

36氪: 現(xiàn)在我們內(nèi)測的效果怎么樣？

高始興: 還是很不錯的，也還有提升空間。因為這涉及到很多方面，不僅是技術(shù)性能的提升，真正的落地還需要結(jié)合我們在垂直行業(yè)中的經(jīng)驗，結(jié)合這些場景進(jìn)行優(yōu)化，這不是一朝一夕可以完成的。比如剛才提到的讓大模型消化、吸收產(chǎn)品說明書，就需要我們和汽車制造商一起合作。

36氪：思必馳今年還會啟動上市嗎？大模型會對這件事產(chǎn)生怎樣的影響？

高始興：我們肯定會啟動上市，但不一定在今年，有可能是明年。至于大模型是否有促進(jìn)作用，我覺得核心還是要把業(yè)務(wù)做好。大語言模型只是我們一個工具，我們一直在做人機對話語言模型，最終還是要產(chǎn)業(yè)落地。

36氪：作為一家準(zhǔn)備IPO的公司，財務(wù)狀況也非常重要，但訓(xùn)練大模型是一件比較貴的事。

高始興：是的，訓(xùn)練大語言模型是很貴的，但好在我們過去有積累，包括人機對話的語料積累，語言模型技術(shù)的積累，以及早期購買的計算資源。

對思必馳來說，首先，這是必須要做的事情。其次，公司能承受。我們已經(jīng)有了對話語言模型的技術(shù)和數(shù)據(jù)，所以這就是一個投入的問題。我們早期也有了GPU算力和超算中心，蘇州政府也給了我們很多支持。

36氪：對于大模型的投入產(chǎn)出比，思必馳有什么預(yù)期嗎？

高始興：我覺得效果是陸續(xù)顯現(xiàn)的，其實并不一定僅從C端直接收費。比如，如果我們的B端產(chǎn)品升級，用戶體驗好了，自然B端客戶就會有源源不斷的升級需求。當(dāng)然我們大模型也有直接的C端用戶。

整體來說，思必馳的大模型主要服務(wù)于"溝通萬物、打理萬事"的理念，主戰(zhàn)場是針對特定行業(yè)，如車聯(lián)網(wǎng)、IOT以及金融政務(wù)等，構(gòu)建具有通用能力的行業(yè)專業(yè)模型。對于這件事，我們在技術(shù)、資源和客戶各方面都有積累。思必馳還是一家比較踏實的公司。