當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > 從 DeepMind 到 Mistral：Arthur Mensch 如何帶領(lǐng)團(tuán)隊(duì)打造下一代人工智能平臺(tái)

從 DeepMind 到 Mistral：Arthur Mensch 如何帶領(lǐng)團(tuán)隊(duì)打造下一代人工智能平臺(tái)
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-05-13 15:02:12 瀏覽：5221次

導(dǎo)讀：文 | 烏鴉智能說人工智能技術(shù)正在快速發(fā)展，并逐漸融入人們生活的各個(gè)方面。為了更好地了解人工智能領(lǐng)域的最新進(jìn)展，來自20VC的Harry Stebbings訪問了 Mistral 聯(lián)合創(chuàng)始人 Arthur Mensch。Arthur Mensch 曾在 DeepMind 工作了兩年多，并在 2021 年創(chuàng)立了 Mi...

文 | 烏鴉智能說

人工智能技術(shù)正在快速發(fā)展，并逐漸融入人們生活的各個(gè)方面。為了更好地了解人工智能領(lǐng)域的最新進(jìn)展，來自20VC的Harry Stebbings訪問了 Mistral 聯(lián)合創(chuàng)始人 Arthur Mensch。Arthur Mensch 曾在 DeepMind 工作了兩年多，并在 2021 年創(chuàng)立了 Mistral，致力于開發(fā)高效的通用人工智能模型。

在對(duì)談中，Arthur Mensch 與我們分享了 Mistral 的發(fā)展歷程、技術(shù)理念、未來規(guī)劃以及他對(duì)人工智能行業(yè)的看法。他認(rèn)為，模型效率比單純追求規(guī)模更加重要。Mistral專注于在特定成本和規(guī)模下實(shí)現(xiàn)業(yè)界頂尖的模型性能。Mistral 7B就是在模型壓縮方面取得了重大突破，并且填補(bǔ)了性能和效率之間的空白。當(dāng)下模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺(tái)會(huì)更加成熟，擁有更豐富的功能，允許進(jìn)行定制、開發(fā)低延遲的特定用途模型、進(jìn)行評(píng)估并隨著時(shí)間的推移進(jìn)行改進(jìn)。模型只是一個(gè)很小的部分，雖然很重要，但它仍然只是應(yīng)用程序的一部分。

通用模型將成為人工智能應(yīng)用程序開發(fā)的基礎(chǔ)，開發(fā)人員可以使用這些模型來創(chuàng)建定制模型，以滿足特定需求。隨著模型性能越來越好，只要擁有相關(guān)數(shù)據(jù)并且理解用例，那么創(chuàng)建垂直應(yīng)用程序就會(huì)變得越來越容易。Mistral 的創(chuàng)立是為了給開發(fā)人員帶來價(jià)值和自由，讓開發(fā)人員可以擁有和修改他們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應(yīng)用開發(fā)者擁有自由，這才是使生成式 AI 盡可能廣泛傳播的最佳方式。

在管理層面上，Arthur Mensch 指出小型團(tuán)隊(duì)的高效性，并表示Mistral目前也在采用這種控制團(tuán)隊(duì)規(guī)模同時(shí)保證信息透明同步的管理方式。同時(shí)他們也在嘗試平衡科研與銷售的關(guān)系，選擇更有復(fù)合背景的人才來減弱不同部門之間的代溝。透明的反饋對(duì)公司來說實(shí)際上非常有用。幾乎完全透明地運(yùn)營公司幫助了他們打破了增長(zhǎng)瓶頸。在戰(zhàn)略層面上，他們?nèi)孕枰嗟馁Y金、強(qiáng)勁的產(chǎn)品，并且不能只局限于歐洲市場(chǎng)，需要迅速進(jìn)軍美國。

數(shù)據(jù)質(zhì)量是提高模型性能的關(guān)鍵，人工智能將改變?nèi)藗兊墓ぷ鞣绞�，因�(yàn)樗笕藗冏兊酶邉?chuàng)造力，并帶來超出自動(dòng)化所能及的價(jià)值。這將對(duì)就業(yè)市場(chǎng)造成結(jié)構(gòu)性變化，需要采取措施幫助人們適應(yīng)。

01 Arthur Mensch的成長(zhǎng)回顧

Harry Stebbings：Arthur，我想從你的成長(zhǎng)經(jīng)歷開始。作為一名杰出的創(chuàng)始人，你小時(shí)候有哪些特質(zhì)和性格呢？你的父母或老師會(huì)如何描述你？

Arthur Mensch：我小時(shí)候總是充滿好奇心，也有些固執(zhí)己見，老實(shí)說，對(duì)待兄弟們也不太友好，不過隨著時(shí)間的推移有所改善。至于他們會(huì)怎么形容我，你應(yīng)該去問他們。不過，我希望他們有美好的回憶吧！

Harry Stebbings：好吧，沒關(guān)系。你第一次接觸到人工智能是在什么時(shí)候？你小時(shí)候在法國，是如何接觸到機(jī)器學(xué)習(xí)的？是什么點(diǎn)燃了你最初的熱情？

Arthur Mensch：大概是在 2013 年，我記得 Andrew Ng 當(dāng)時(shí)展示了用神經(jīng)網(wǎng)絡(luò)控制直升飛機(jī)倒飛，這是一個(gè)非常復(fù)雜的控制問題。雖然我不確定這是否真正屬于人工智能領(lǐng)域，但他確實(shí)提到過使用神經(jīng)網(wǎng)絡(luò)來進(jìn)行控制。

Harry Stebbings：最近你曾在 DeepMind 工作了兩到三年。那段經(jīng)歷對(duì)你影響最大的是什么？它如何影響了你組建 Mistral 團(tuán)隊(duì)的方式？

Arthur Mensch：在 DeepMind 我深刻體會(huì)到，一支由 5 人組成的團(tuán)隊(duì)效率往往比 50 人的團(tuán)隊(duì)高，前提是將 50 人團(tuán)隊(duì)拆分成 10 個(gè)相互獨(dú)立的小組。這也是我們公司在組建科研團(tuán)隊(duì)時(shí)采取不同組織方式的原因之一。正是因?yàn)檫@個(gè)教訓(xùn)，讓我們意識(shí)到即使是小團(tuán)隊(duì)也能做出重要成果。

Harry Stebbings：你能解釋一下 “相互獨(dú)立” 的意思嗎？這樣做難道不會(huì)降低效率嗎？劃分小組會(huì)不會(huì)產(chǎn)生信息孤島，反而降低整體效率？

Arthur Mensch：我們會(huì)共享基礎(chǔ)設(shè)施、代碼庫和研究成果。對(duì)于通用模型來說，你需要讓它們向不同的方向發(fā)展，比如掌握不同的語言、編程、數(shù)學(xué)和推理能力，甚至還需要加入多模態(tài)功能。這些方面雖然彼此關(guān)聯(lián)松散，但我們使用相同的優(yōu)化框架、數(shù)據(jù)和訓(xùn)練方法。團(tuán)隊(duì)不需要花大量時(shí)間進(jìn)行協(xié)調(diào)會(huì)議，這也是一種平衡。到目前為止，我們規(guī)模還比較小，只有 25 個(gè)人，所以協(xié)調(diào)起來并不算太難。不過隨著團(tuán)隊(duì)壯大，這肯定會(huì)成為一個(gè)挑戰(zhàn)。這是我在 DeepMind 的主要收獲之一。剛開始他們的規(guī)模很有效率，后來效率下降了一些，不過現(xiàn)在已經(jīng)有所恢復(fù)�？傊�，我們 Mistral 團(tuán)隊(duì)的優(yōu)化目標(biāo)就是盡可能快地迭代和發(fā)布產(chǎn)品。

Harry Stebbings：離開 DeepMind 創(chuàng)辦 Mistral 是一個(gè)容易的決定嗎？畢竟 DeepMind 是全球頂尖的人工智能研究機(jī)構(gòu)，擁有眾多優(yōu)秀人才。

Arthur Mensch：這不是一個(gè)一開始就說一不二的決定。一開始可能只是 10% 的離開念頭，然后逐漸增加，直到有一天你意識(shí)到自己已經(jīng)無法再待下去了。同事之間的情誼很珍貴，所以不會(huì)是突然的決定。對(duì)我來說，做出決定的關(guān)鍵點(diǎn)可能是在去年 3 月底左右。周五我下定決心，然后周一就遞交了辭呈。

Harry Stebbings：夠干脆！一旦決定離開就立刻行動(dòng)，這很棒！接下來我想從按時(shí)間順序回顧一下。你們發(fā)布的第一個(gè)模型 Mistral 7B 非常受歡迎，你認(rèn)為這背后的原因是什么？你們做對(duì)了什么？又從中吸取了什么教訓(xùn)？

Arthur Mensch：我認(rèn)為 Mistral 7B 取得成功的因素有兩個(gè)。首先，它在模型壓縮方面取得了重大突破，這為整個(gè)科研界提供了寶貴的經(jīng)驗(yàn)和學(xué)習(xí)資料。其次，它填補(bǔ)了性能和效率之間的空白。7B 的模型大小可以在 MacBook 或智能手機(jī)上高效運(yùn)行，同時(shí)又具備足夠的功能實(shí)用性。此前也有 7B 大小的模型，但性能不足以支持有趣的應(yīng)用。因此，我們通過瞄準(zhǔn)這個(gè)特定的領(lǐng)域吸引了開發(fā)人員的注意，因?yàn)?7B 的模型大小正好滿足了業(yè)余愛好者在游戲 GPU 或 Macbook 上運(yùn)行的需求。Mistral 7B 的成功在于填補(bǔ)了性能和效率之間缺失的一環(huán)，從而引起了廣泛的興趣和應(yīng)用。

Harry Stebbings：從中學(xué)到的教訓(xùn)如何影響你們未來的發(fā)布呢？

Arthur Mensch：這讓我們意識(shí)到，比起單純追求更大規(guī)模的模型，效率更受關(guān)注。因此，我們繼續(xù)致力于開發(fā)高效的模型，比如后續(xù)的 Mixtral 8x7B 和 Mixtral 8x22B，都是在特定成本和大小下實(shí)現(xiàn)業(yè)界頂尖性能。追求效率的同時(shí)，我們也會(huì)逐步擴(kuò)展到更大規(guī)模。

02 人工智能領(lǐng)域的效率與規(guī)模

Harry Stebbings：既然你們?nèi)绱俗⒅匦屎颓把�，那么�?guī)模還重要嗎？

Arthur Mensch：規(guī)模在某種程度上很重要，如果你投入更多計(jì)算資源進(jìn)行訓(xùn)練，就可以使模型更加壓縮。因此，壓縮模型確實(shí)需要一定的計(jì)算資源以及一定的訓(xùn)練規(guī)模。規(guī)模并不是唯一要素，并不是成功的秘訣，你還需要合適的數(shù)據(jù)，否則你會(huì)遇到數(shù)據(jù)質(zhì)量瓶頸。還需要合適的訓(xùn)練技術(shù)，你需要找到一些方法來提高效率，這些方法并不需要額外的計(jì)算資源，因?yàn)橛?jì)算資源成本很高。我們?cè)?Mistral 公司做的一件事就是嘗試?yán)?ldquo;計(jì)算乘數(shù)效應(yīng)”來提高效率。

Harry Stebbings：在不增加計(jì)算成本的情況下提高效率，這個(gè)領(lǐng)域還有多少潛力可挖？我可能有點(diǎn)天真，我想問的是，還有很多可以挖掘的空間嗎？還是說我們現(xiàn)在已經(jīng)接近極限，只能做微小的改進(jìn)？

Arthur Mensch：這還很難說。我相信我們可以做到在特定規(guī)模下性能更優(yōu)異的模型。這個(gè)問題就像，通過增加數(shù)據(jù)量和延長(zhǎng)訓(xùn)練時(shí)間，能否在相同類型的數(shù)據(jù)上訓(xùn)練出更好的模型一樣，都是需要探索的問題。你可以嘗試預(yù)測(cè)最終能達(dá)到的性能極限，但最終還是要通過嘗試來驗(yàn)證。

Harry Stebbings：大多數(shù)人認(rèn)為模型格局的最終狀態(tài)會(huì)變成商品化，最終會(huì)有 12 家玩家，然后陷入價(jià)格戰(zhàn)。在你看來，模型的最終狀態(tài)會(huì)是什么？你如何看待商品化問題？

Arthur Mensch：我認(rèn)為模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺(tái)會(huì)更加成熟，擁有更豐富的功能，允許進(jìn)行定制、開發(fā)低延遲的特定用途模型、進(jìn)行評(píng)估并隨著時(shí)間的推移進(jìn)行改進(jìn)。模型只是一個(gè)很小的部分，雖然很重要，但它仍然只是應(yīng)用程序的一部分。當(dāng)你部署一個(gè)面向用戶的應(yīng)用程序時(shí)，你需要確保它的運(yùn)行，確保它的延遲隨著時(shí)間推移降低，確保它的質(zhì)量隨著時(shí)間推移提高。因此，我認(rèn)為最終狀態(tài)是模型將成為任何人工智能應(yīng)用程序開發(fā)人員的起點(diǎn)，它們需要被工具和生命周期管理平臺(tái)所包圍。這就是我們開始構(gòu)建的東西。通用模型有點(diǎn)缺乏差異化，你為你的應(yīng)用程序創(chuàng)建的差異化來自你輸入的數(shù)據(jù)、你收集的用戶反饋以及你理解應(yīng)用程序應(yīng)該做什么的智能。這完全不是商品化，沒有一個(gè)辦法可以讓你從通用模型直接成為一個(gè)超級(jí)好、在特定任務(wù)上優(yōu)于所有其他模型的模型。我認(rèn)為這是一個(gè)缺失的拼圖塊，也是我們?cè)诋a(chǎn)品方面投入力量的方面之一。

03 改善模型質(zhì)量的挑戰(zhàn)與機(jī)遇

Harry Stebbings：Sam Altman 和 Brad 前幾天提到，現(xiàn)在的模型質(zhì)量還并不夠好，還需要大大提高。制約模型質(zhì)量的最大瓶頸是什么？要如何改善？

Arthur Mensch：我認(rèn)為數(shù)據(jù)質(zhì)量是一個(gè)限制因素。如何確保模型能夠利用整個(gè)世界知識(shí)，并沿著學(xué)習(xí)越來越復(fù)雜事物的路徑發(fā)展，這非常重要，但這也是一個(gè)被忽視的方面。計(jì)算資源當(dāng)然也很重要，但是以我們現(xiàn)在擁有數(shù)據(jù)量來看，計(jì)算資源已經(jīng)不再是瓶頸了。例如，文本生成模型，問題在于如何精煉數(shù)據(jù)，以及如何向模型本身輸入高質(zhì)量的數(shù)據(jù)來隨著時(shí)間推移進(jìn)行改進(jìn)。

Harry Stebbings：我們會(huì)看到能夠回答大量復(fù)雜問題的通用模型，還是更垂直領(lǐng)域?qū)Ｓ玫男⌒湍Ｐ停?/p>

Arthur Mensch：我們相信會(huì)出現(xiàn)垂直領(lǐng)域的模型，而且這些模型不會(huì)由我們提供，而是由應(yīng)用程序的創(chuàng)建者構(gòu)建。因?yàn)橄胍@得低延遲且擅長(zhǎng)特定任務(wù)的模型，就必須去除通用性。通用模型雖然可以處理很多事情，但如果你想讓模型深入思考某個(gè)特定主題以供你的 AI 應(yīng)用調(diào)用，同時(shí)還要保持良好的用戶體驗(yàn)和低延遲，那么通用模型就不太適合。

Harry Stebbings：很抱歉這么直白，但好像價(jià)值真正產(chǎn)生的地方是在應(yīng)用程序?qū)用妫簿褪莿?chuàng)建特定模型的地方。那么你們將如何發(fā)揮作用呢？

Arthur Mensch：制作專業(yè)模型是一項(xiàng)非常艱巨的任務(wù)，實(shí)際上這與創(chuàng)建預(yù)訓(xùn)練模型的方式密切相關(guān)。因此，我們提供易于使用的工具，使開發(fā)人員能夠創(chuàng)建性能非常好的定制模型，而這些模型又不需要專家知識(shí)，畢竟這種專家人才很難找到。

Harry Stebbings：我作為投資者很高興聽到你剛才說應(yīng)用程序?qū)訉a(chǎn)生價(jià)值。因?yàn)槲覔?dān)心通用模型會(huì)被我們提到的某些公司碾壓。你如何看待應(yīng)用程序?qū)尤匀荒軇?chuàng)造價(jià)值？對(duì)像我這樣的投資者，你有什么建議？

Arthur Mensch：第一，隨著模型越來越好，只要擁有相關(guān)數(shù)據(jù)并且理解用例，那么創(chuàng)建垂直應(yīng)用程序就會(huì)變得越來越容易，前提是你擁有簡(jiǎn)化操作的工具。這讓我覺得應(yīng)用程序?qū)永麧櫩臻g會(huì)越來越保但另一方面，由于我們可以壓縮模型并顯著提高效率，因此模型的成本也在下降。這意味著加上模型層的競(jìng)爭(zhēng)壓力，模型的價(jià)格肯定會(huì)下降。因此，一方面是不斷增強(qiáng)的能力和壓縮的價(jià)格，這似乎會(huì)讓應(yīng)用程序?qū)幼兊酶�；另一方面，模型部分將�?huì)發(fā)展壯大。對(duì)我們來說，我們的做法是假設(shè)模型部分仍然會(huì)足夠大，我們需要在這個(gè)基礎(chǔ)上構(gòu)建平臺(tái)，因?yàn)檫@將使我們能夠?qū)崿F(xiàn)對(duì)你來說很感興趣的垂直應(yīng)用。

Harry Stebbings：你如何看待你們的定位和品牌？因?yàn)槠渌恍﹨⑴c者更直接地表示他們將主導(dǎo)許多不同的垂直領(lǐng)域，這讓人有點(diǎn)擔(dān)心。你們?nèi)绾慰创@種說法？

Arthur Mensch：我們不是垂直領(lǐng)域的公司。我們創(chuàng)立 Mistral 是為了給開發(fā)人員帶來價(jià)值和自由。當(dāng)我們開始做的時(shí)候，當(dāng)時(shí)只有一個(gè) API，而且生成式人工智能領(lǐng)域似乎由少數(shù)幾家公司主導(dǎo)。因此，我們采取了這種平臺(tái)式的方法，我們讓開發(fā)人員擁有和修改我們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應(yīng)用開發(fā)者擁有自由，這才是使生成式 AI 盡可能廣泛傳播的最佳方式，這也是我們作為公司的目標(biāo)。讓前沿人工智能融入每個(gè)人心中，這就是我們當(dāng)初創(chuàng)立 Mistral 的原因。我認(rèn)為我們做得還不錯(cuò)，當(dāng)然我們還有很多事情要做，但是我認(rèn)為開源部分為社區(qū)帶來了便利，讓人們意識(shí)到他們可以通過修改模型本身來構(gòu)建非常有趣的技術(shù)，而不需要依賴少數(shù)供應(yīng)商的 API。

Harry Stebbings：開發(fā)人員關(guān)心什么？大家都在 Twitter 上討論性能問題，比如本周的 X 模型比上周的 Y 模型更好。他們關(guān)心效率、規(guī)模、成本等因素嗎？這些因素如何影響他們的決策？

Arthur Mensch：開發(fā)人員肯定會(huì)關(guān)心成本，他們也關(guān)心定制的可能性，能夠修改模型。在這方面，我認(rèn)為我們只是觸及了皮毛。微調(diào)一直以來都是常用解決方案，但這可能有點(diǎn)達(dá)不到我們想要的效果。他們還關(guān)心能夠部署到任何地方，比如特定的云端空間、本地環(huán)境或者邊緣設(shè)備。因此，他們也關(guān)心可移植性，而可移植性通常會(huì)帶來數(shù)據(jù)控制的優(yōu)勢(shì)。通常情況下，當(dāng)大型語言模型與知識(shí)庫或與某些企業(yè)相關(guān)的東西連接時(shí)，它們會(huì)變得非常有用，但同時(shí)也會(huì)成為應(yīng)用程序的一個(gè)非常敏感部分。企業(yè)非常關(guān)注確保他們的專有數(shù)據(jù)能夠在一個(gè)完全安全的環(huán)境中被訪問，這就是為什么我們將我們的平臺(tái)部署在Azure和AWS上，為他們提供所需的安全層。

Harry Stebbings：艱難的問題來了，大語言模型基于的產(chǎn)品的邊際收入何時(shí)何地會(huì)超過邊際成本？

Arthur Mensch：我可以告訴你誰目前做得最好，但隨著時(shí)間的推移，情況可能會(huì)發(fā)生變化。目前做得最好的公司是英偉達(dá)，云提供商基本上持平，模型提供商還處于虧損狀態(tài)，但希望不會(huì)一直虧損。我認(rèn)為這將是一個(gè)充滿變動(dòng)的領(lǐng)域，正如我所說，模型的能力使應(yīng)用程序的成本越來越低。我不認(rèn)為大語言模型的核心部分（也就是真正基礎(chǔ)層的邊際成本和利潤率）會(huì)降為零，否則肯定會(huì)存在公平性問題。

Harry Stebbings：你能解釋一下“公平性問題”嗎？

Arthur Mensch：通常，價(jià)值的積累往往集中在最困難的部分和最具可防御性的部分。在一段時(shí)間內(nèi)，這主要體現(xiàn)在基礎(chǔ)模型上。它將成為大多數(shù)創(chuàng)新發(fā)生的地方，也是至少大部分積累價(jià)值的地方。

Harry Stebbings：今天創(chuàng)辦一家基礎(chǔ)模型公司真的有很多障礙嗎？我知道這是一個(gè)非�；\統(tǒng)和愚蠢的問題，但現(xiàn)在有這么多不同的參與者，而且每天都在出現(xiàn)新的參與者，所以障礙是不是在逐日降低？

Arthur Mensch：我不認(rèn)為是這樣。在這個(gè)領(lǐng)域取得成功非常困難。你需要在成本、效率、性能方面占據(jù)主導(dǎo)地位。只有少數(shù)公司目前處于有利地位。你可以嘗試做一些事情，但如果它無關(guān)緊要，如果它被另一個(gè)模型或另一種技術(shù)嚴(yán)格主導(dǎo)，那么你就會(huì)遇到問題。你需要克服一些難以克服的障礙，你需要非常高效地運(yùn)營、籌集足夠的資金來獲得足夠的計(jì)算資源、擁有訓(xùn)練模型的人才（這仍然是一種稀缺資源），以及一個(gè)好的品牌，因?yàn)檎缒闼f，競(jìng)爭(zhēng)非常激烈，這些都不是憑空產(chǎn)生的。

Harry Stebbings：你認(rèn)為計(jì)算成本下降的速度有多快？

Arthur Mensch：計(jì)算成本會(huì)隨著時(shí)間的推移而降低，首先是基于硬件成本。根據(jù) Nvidia 的路線圖，每?jī)赡甑南嗤?FLOPS （Floating point operations per second，每秒浮點(diǎn)運(yùn)算次數(shù)，理解為計(jì)算速度）數(shù)量，計(jì)算成本都會(huì)降低約 30%。另一個(gè)提高效率的因素是算法的改進(jìn)。如果我們看看三年前和今天訓(xùn)練模型的方式，我認(rèn)為我們?cè)谒惴ǚ矫嫒〉昧舜蠹s 100 倍的改進(jìn)。所以這可能是近年來取得的大部分收益。當(dāng)然，計(jì)算成本會(huì)降低，但不會(huì)比摩爾定律更快降低。

Harry Stebbings：正如你提到的，與核心供應(yīng)商（如英偉達(dá)）建立良好關(guān)系似乎是成功的重要因素之一。這不是決定今天成功的核心因素嗎？

Arthur Mensch：這確實(shí)是一個(gè)重要方面。在人工智能層面上，我們對(duì)云服務(wù)提供商和英偉達(dá)都存在一定的戰(zhàn)略依賴關(guān)系。競(jìng)爭(zhēng)也在升溫，但與硬件提供商保持良好合作關(guān)系對(duì)于開發(fā)軟件而言是很有幫助的，他們可以協(xié)助你優(yōu)化硬件利用。當(dāng)你向企業(yè)出售開發(fā)者平臺(tái)時(shí)，通過他們熟悉的云提供商進(jìn)行交付也是很有用的。所以在這方面確實(shí)需要進(jìn)行一些重要的合作。

04 平衡研究團(tuán)隊(duì)與銷售團(tuán)隊(duì)

Harry Stebbings：對(duì)于您這樣一位創(chuàng)始人來說，既要管理研究團(tuán)隊(duì)，又要組建企業(yè)銷售團(tuán)隊(duì)，如何平衡這兩個(gè)團(tuán)隊(duì)之間的關(guān)系呢？

Arthur Mensch：確實(shí)需要用心去平衡。我們希望科學(xué)團(tuán)隊(duì)能夠理解用戶面臨的問題，因?yàn)檫@將反過來促進(jìn)科學(xué)研究的進(jìn)步。畢竟，我們研發(fā)的通用技術(shù)只有在識(shí)別出具體用例后才能真正發(fā)揮作用。因此，讓科學(xué)團(tuán)隊(duì)盡早接觸產(chǎn)品和業(yè)務(wù)團(tuán)隊(duì)是非常重要的。這將幫助他們理解模型的局限性以及如何加以改進(jìn)。另一方面，銷售團(tuán)隊(duì)也需要理解這是一款技術(shù)含量很高的產(chǎn)品。他們并不是在銷售一款成品，而是在銷售驅(qū)動(dòng)該成品的產(chǎn)品。因此，他們需要告訴客戶如何正確使用這些模型，為企業(yè)帶來實(shí)際價(jià)值。這需要對(duì)銷售團(tuán)隊(duì)進(jìn)行強(qiáng)有力的培訓(xùn)。

Harry Stebbings：研究團(tuán)隊(duì)和銷售團(tuán)隊(duì)的工作節(jié)奏似乎并不一致，科學(xué)研究通常需要幾個(gè)月的時(shí)間才能完成一個(gè)周期，而銷售團(tuán)隊(duì)的周期則要短得多。您是如何解決這個(gè)問題的呢？

Arthur Mensch：到目前為止，我們?cè)O(shè)法招募了一些對(duì)技術(shù)感興趣的銷售人員，以及一些對(duì)商業(yè)感興趣的技術(shù)人員。這樣可以避免團(tuán)隊(duì)之間出現(xiàn)代溝。

Harry Stebbings：開源技術(shù)是否適用于企業(yè)領(lǐng)域？企業(yè)是否已經(jīng)準(zhǔn)備好迎接開源技術(shù)，他們是否足夠重視它？

Arthur Mensch：這取決于具體企業(yè)的情況。一些企業(yè)已經(jīng)開始率先采用開源模型，并將它們投入生產(chǎn)使用。但是，要把這些模型應(yīng)用于大規(guī)模生產(chǎn)，還需要額外的產(chǎn)品功能，例如負(fù)載均衡和模型定制。使用自己研發(fā)的解決方案當(dāng)然可以做到這一點(diǎn)，但要使其足夠魯棒和可擴(kuò)展卻并非易事。要想真正提高定制模型的質(zhì)量，就需要一些難以掌握的方法。因此，一些技術(shù)實(shí)力雄厚的企業(yè)無疑已經(jīng)為采用開源技術(shù)做好了準(zhǔn)備，并且已經(jīng)有許多成功的用例在生產(chǎn)環(huán)境中使用開源模型。

Harry Stebbings：為了擴(kuò)大采用范圍，肯定還需要一些配套的工具進(jìn)入市常如今，每個(gè)企業(yè)都在董事會(huì)上討論其人工智能戰(zhàn)略。您會(huì)給他們什么建議？他們應(yīng)該問哪些問題？

Arthur Mensch：不要總是想著利用人工智能徹底改變所有產(chǎn)品，也不要將人工智能視為一種無所不能的代理。現(xiàn)在我們可以構(gòu)建非常智能的代理，但要后退一步，從組織層面理解人工智能帶來的影響。換句話說，不要將生成式人工智能視為提高文字處理工作效率的一種方式，而要將它視為徹底改變核心業(yè)務(wù)運(yùn)營方式的一種手段。這通常涉及到對(duì)模型進(jìn)行大量定制，以便在五年后每個(gè)人都采用這項(xiàng)技術(shù)的情況下為你帶來競(jìng)爭(zhēng)優(yōu)勢(shì)。

05 美歐投資者的區(qū)別

Harry Stebbings：資金來源會(huì)影響擴(kuò)展限制嗎？當(dāng)你融資的時(shí)候，跟歐洲投資人和美國投資人溝通起來有很大差別嗎？

Arthur Mensch：種子輪融資沒什么差別，不過到了更大規(guī)模的 A 輪融資，情況就不同了。歐洲的基金架構(gòu)并不適合我們當(dāng)時(shí)提出的融資方案，所以我們甚至沒跟他們?cè)趺唇涣�，因�(yàn)樗麄兏纠斫獠涣宋覀冃枰啻笠?guī)模的投資。

Harry Stebbings：你們還處于初創(chuàng)階段是吧？

Arthur Mensch：是的，我覺得歐洲缺乏的是像樣的成長(zhǎng)型基金，它們能夠大舉押注，并且滿懷信心。隨著時(shí)間的推移，這種情況肯定會(huì)改善，尤其是如果我們可以更好地利用歐洲的財(cái)富，將更多資金投入到此類成長(zhǎng)型基金中，而不是像現(xiàn)在這樣。

Harry Stebbings：你似乎比我更樂觀一點(diǎn)，你覺得未來幾年歐洲會(huì)出現(xiàn)更多成長(zhǎng)型基金嗎？

Arthur Mensch：我可不覺得，至少在未來三到五年內(nèi)不會(huì)。這取決于一些政治決策，以及資金供應(yīng)和人們是否相信歐洲的未來生態(tài)系統(tǒng)能夠與其他大型生態(tài)系統(tǒng)競(jìng)爭(zhēng)。這是一個(gè)先有雞還是先有蛋的問題，但總歸在某個(gè)時(shí)候需要有人推動(dòng)它往正確的方向發(fā)展。如果政治層面有這個(gè)意愿，如果有一些公司展示出在歐洲可以真正實(shí)現(xiàn)快速增長(zhǎng)，這種情況就會(huì)朝著正確的方向發(fā)展，這正是我們所努力的。

Harry Stebbings：你提到過擴(kuò)展速度是最難的事情之一，作為 CEO，當(dāng)你帶領(lǐng)公司高速擴(kuò)展時(shí)，你覺得最難的是什么？

Arthur Mensch：學(xué)習(xí)新事物！這是一邊干一邊學(xué)的過程。比如，如何讓 45 個(gè)人之間保持良好溝通，如何管理好自己的時(shí)間，用于展示公司、拓展業(yè)務(wù)等等，因?yàn)槲覀儸F(xiàn)在還處于需要深度參與交易談判的階段。

Harry Stebbings：假設(shè)你能夠回到過去，在成為 Mistral AI 的 CEO 之前一天晚上給自己一些建議，你會(huì)說什么？

Arthur Mensch：也許我會(huì)更注重產(chǎn)品開發(fā)和市場(chǎng)推廣。當(dāng)時(shí)我們開展市場(chǎng)推廣的時(shí)候，根本沒什么可賣的東西。雖然最終還是取得了一些品牌知名度，但或許可以稍微改變一下順序，讓產(chǎn)品開發(fā)稍微領(lǐng)先于市場(chǎng)推廣一些。不過，由于這是一個(gè)快速發(fā)展的領(lǐng)域，我們確實(shí)是一起啟動(dòng)了所有項(xiàng)目，這導(dǎo)致了一些組織上的問題�，F(xiàn)在我們正在努力鞏固這方面的工作。

Harry Stebbings：考慮到該領(lǐng)域的快速發(fā)展，你們當(dāng)時(shí)的戰(zhàn)略肯定會(huì)有所變化吧？

Arthur Mensch：總的來說，我們一年前制定的戰(zhàn)略并沒有太大變化。我們意識(shí)到我們需要更多的資金、強(qiáng)勁的產(chǎn)品，并且不能只局限于歐洲市場(chǎng)，需要迅速進(jìn)軍美國。這些都是我們?cè)诎l(fā)展過程中得出的結(jié)論，即使我們一年前就知道這些，也不會(huì)帶來太大幫助。

Harry Stebbings：你們現(xiàn)在覺得資金充足了嗎？

Arthur Mensch：初創(chuàng)公司總是需要融資的。在未來幾年里，投資都會(huì)大于收入，因?yàn)樽鳛榍把毓�，我們需要擴(kuò)展規(guī)模并保持相關(guān)性。因此，肯定需要持續(xù)的投資。收入也在逐漸增加，所以也有一些可以用于再投資的收入。但我認(rèn)為，在今后很長(zhǎng)一段時(shí)間里，研究開發(fā)的速度都應(yīng)該快于市場(chǎng)推廣的速度。

Harry Stebbings：談到目前的技術(shù)格局，你最尊重和欽佩哪家公司？

Arthur Mensch：他們都取得了不錯(cuò)的成績(jī)。最近，OpenAI 讓大家感到驚喜，他們發(fā)布了優(yōu)秀的新模型。還有 Anthropic 和谷歌的朋友們也在出色地工作。這是一個(gè)充滿競(jìng)爭(zhēng)的領(lǐng)域，我們彼此尊重，也朝著相同的更高目標(biāo)共同努力。

06 快速問答環(huán)節(jié)

Harry Stebbings：當(dāng)今世界上最讓你擔(dān)心的是什么？

Arthur Mensch：全球變暖。地球升溫以及美國尋找解決方案的競(jìng)賽讓我很擔(dān)心。我認(rèn)為人工智能是解決方案的一部分，因?yàn)樗梢詭砀嗫刂疲⒃谀承┝鞒讨袔砀叩男�。但�?shí)際上這是一場(chǎng)生存競(jìng)賽，所以我覺得我們應(yīng)該更多地意識(shí)到這一點(diǎn)。

Harry Stebbings：在過去 12 個(gè)月里，你改變了最多的想法是什么？

Arthur Mensch：改變了很多關(guān)于管理的先入為主的觀念，這些觀念以前我從未測(cè)試過。其中最大的一點(diǎn)是，透明的反饋對(duì)公司來說實(shí)際上非常有用。因此，幾乎完全透明地運(yùn)營公司幫助了我們打破增長(zhǎng)瓶頸。

Harry Stebbings：在 Mistral 發(fā)展過程中，哪個(gè)方面出乎意料地最具挑戰(zhàn)性？

Arthur Mensch：我們需要管理的需求量太高了，超出了我們的能力范圍。還有就是品牌出乎意料的成功，人們都認(rèn)識(shí)我們了。我們知道會(huì)引起關(guān)注，但沒想到人們會(huì)這么快開始使用我們的產(chǎn)品。

Harry Stebbings：Arthur，你現(xiàn)在有很多事要做，肩上也有很多期待和資金壓力，你該怎么做才能放松下來？

Arthur Mensch：我會(huì)跑步和騎自行車。我想我伴可能會(huì)對(duì)我心生怨言，但我還是會(huì)盡量照顧我的女兒。

Harry Stebbings：你最近剛當(dāng)了爸爸，現(xiàn)在你有哪些當(dāng)初剛有女兒時(shí)希望自己知道的呢？

Arthur Mensch：老實(shí)說，我完全沒想到照顧一個(gè)小孩子需要這么多精力。

Harry Stebbings：你認(rèn)為未來AI會(huì)在 10 年內(nèi)改變世界嗎？社會(huì)在一切都融入 AI 的情況下會(huì)變成什么樣？

Arthur Mensch：人工智能將顯著改變?nèi)藗兊墓ぷ鞣绞�，因�(yàn)樗笕藗冏兊酶邉?chuàng)造力，并帶來超出自動(dòng)化所能及的價(jià)值。因此，這將對(duì)就業(yè)市場(chǎng)造成非常結(jié)構(gòu)性的變化，這意味著需要迅速采取一些適應(yīng)措施，例如培訓(xùn)和教育，讓人們能夠理解在日常工作中會(huì)有什么樣的期待，以及如何與人工智能協(xié)作。

Harry Stebbings：你認(rèn)為人們對(duì)工作被取代的恐懼被夸大了嗎？

Arthur Mensch：取決于你跟誰交談。我認(rèn)為一些工作肯定會(huì)消失，但也會(huì)有一些新的工作產(chǎn)生。因?yàn)槲覀冋噲D讓人類思維達(dá)到更高的抽象層次，這樣我們才能與機(jī)器對(duì)話，機(jī)器也能理解并以人類的方式回答。這不像計(jì)算機(jī)帶來的那種巨大變革。不過，我認(rèn)為現(xiàn)在正以歷史上前所未有的速度提升思維抽象的層次，這將使社會(huì)適應(yīng)起來更具挑戰(zhàn)性，需要提前預(yù)見到這一點(diǎn)。

Harry Stebbings：最后一個(gè)問題，假設(shè) 10 年后一切都順利，Mistral 會(huì)是什么樣子？

Arthur Mensch：Mistral 將擁有非常相關(guān)的一些商業(yè)和開源模型，還將擁有功能強(qiáng)大的開發(fā)者平臺(tái)，使人們能夠創(chuàng)建他們的人工智能應(yīng)用程序。那將是一個(gè)好的成就。