展會(huì)信息港展會(huì)大全

從 DeepMind 到 Mistral:Arthur Mensch 如何帶領(lǐng)團(tuán)隊(duì)打造下一代人工智能平臺(tái)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-13 15:02:12   瀏覽:5221次  

導(dǎo)讀:文 | 烏鴉智能說 人工智能技術(shù)正在快速發(fā)展,并逐漸融入人們生活的各個(gè)方面。為了更好地了解人工智能領(lǐng)域的最新進(jìn)展,來自20VC的Harry Stebbings訪問了 Mistral 聯(lián)合創(chuàng)始人 Arthur Mensch。Arthur Mensch 曾在 DeepMind 工作了兩年多,并在 2021 年創(chuàng)立了 Mi...

文 | 烏鴉智能說

人工智能技術(shù)正在快速發(fā)展,并逐漸融入人們生活的各個(gè)方面。為了更好地了解人工智能領(lǐng)域的最新進(jìn)展,來自20VC的Harry Stebbings訪問了 Mistral 聯(lián)合創(chuàng)始人 Arthur Mensch。Arthur Mensch 曾在 DeepMind 工作了兩年多,并在 2021 年創(chuàng)立了 Mistral,致力于開發(fā)高效的通用人工智能模型。

在對(duì)談中,Arthur Mensch 與我們分享了 Mistral 的發(fā)展歷程、技術(shù)理念、未來規(guī)劃以及他對(duì)人工智能行業(yè)的看法。他認(rèn)為,模型效率比單純追求規(guī)模更加重要。Mistral專注于在特定成本和規(guī)模下實(shí)現(xiàn)業(yè)界頂尖的模型性能。Mistral 7B就是在模型壓縮方面取得了重大突破,并且填補(bǔ)了性能和效率之間的空白。當(dāng)下模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺(tái)會(huì)更加成熟,擁有更豐富的功能,允許進(jìn)行定制、開發(fā)低延遲的特定用途模型、進(jìn)行評(píng)估并隨著時(shí)間的推移進(jìn)行改進(jìn)。模型只是一個(gè)很小的部分,雖然很重要,但它仍然只是應(yīng)用程序的一部分。

通用模型將成為人工智能應(yīng)用程序開發(fā)的基礎(chǔ),開發(fā)人員可以使用這些模型來創(chuàng)建定制模型,以滿足特定需求。隨著模型性能越來越好,只要擁有相關(guān)數(shù)據(jù)并且理解用例,那么創(chuàng)建垂直應(yīng)用程序就會(huì)變得越來越容易。Mistral 的創(chuàng)立是為了給開發(fā)人員帶來價(jià)值和自由,讓開發(fā)人員可以擁有和修改他們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應(yīng)用開發(fā)者擁有自由,這才是使生成式 AI 盡可能廣泛傳播的最佳方式。

在管理層面上,Arthur Mensch 指出小型團(tuán)隊(duì)的高效性,并表示Mistral目前也在采用這種控制團(tuán)隊(duì)規(guī)模同時(shí)保證信息透明同步的管理方式。同時(shí)他們也在嘗試平衡科研與銷售的關(guān)系,選擇更有復(fù)合背景的人才來減弱不同部門之間的代溝。透明的反饋對(duì)公司來說實(shí)際上非常有用。幾乎完全透明地運(yùn)營公司幫助了他們打破了增長(zhǎng)瓶頸。在戰(zhàn)略層面上,他們?nèi)孕枰嗟馁Y金、強(qiáng)勁的產(chǎn)品,并且不能只局限于歐洲市場(chǎng),需要迅速進(jìn)軍美國。

數(shù)據(jù)質(zhì)量是提高模型性能的關(guān)鍵,人工智能將改變?nèi)藗兊墓ぷ鞣绞,因(yàn)樗笕藗冏兊酶邉?chuàng)造力,并帶來超出自動(dòng)化所能及的價(jià)值。這將對(duì)就業(yè)市場(chǎng)造成結(jié)構(gòu)性變化,需要采取措施幫助人們適應(yīng)。

01 Arthur Mensch的成長(zhǎng)回顧

Harry Stebbings:Arthur,我想從你的成長(zhǎng)經(jīng)歷開始。作為一名杰出的創(chuàng)始人,你小時(shí)候有哪些特質(zhì)和性格呢?你的父母或老師會(huì)如何描述你?

Arthur Mensch:我小時(shí)候總是充滿好奇心,也有些固執(zhí)己見,老實(shí)說,對(duì)待兄弟們也不太友好,不過隨著時(shí)間的推移有所改善。至于他們會(huì)怎么形容我,你應(yīng)該去問他們。不過,我希望他們有美好的回憶吧!

Harry Stebbings:好吧,沒關(guān)系。你第一次接觸到人工智能是在什么時(shí)候?你小時(shí)候在法國,是如何接觸到機(jī)器學(xué)習(xí)的?是什么點(diǎn)燃了你最初的熱情?

Arthur Mensch:大概是在 2013 年,我記得 Andrew Ng 當(dāng)時(shí)展示了用神經(jīng)網(wǎng)絡(luò)控制直升飛機(jī)倒飛,這是一個(gè)非常復(fù)雜的控制問題。雖然我不確定這是否真正屬于人工智能領(lǐng)域,但他確實(shí)提到過使用神經(jīng)網(wǎng)絡(luò)來進(jìn)行控制。

Harry Stebbings:最近你曾在 DeepMind 工作了兩到三年。那段經(jīng)歷對(duì)你影響最大的是什么?它如何影響了你組建 Mistral 團(tuán)隊(duì)的方式?

Arthur Mensch:在 DeepMind 我深刻體會(huì)到,一支由 5 人組成的團(tuán)隊(duì)效率往往比 50 人的團(tuán)隊(duì)高,前提是將 50 人團(tuán)隊(duì)拆分成 10 個(gè)相互獨(dú)立的小組。這也是我們公司在組建科研團(tuán)隊(duì)時(shí)采取不同組織方式的原因之一。正是因?yàn)檫@個(gè)教訓(xùn),讓我們意識(shí)到即使是小團(tuán)隊(duì)也能做出重要成果。

Harry Stebbings:你能解釋一下 “相互獨(dú)立” 的意思嗎?這樣做難道不會(huì)降低效率嗎?劃分小組會(huì)不會(huì)產(chǎn)生信息孤島,反而降低整體效率?

Arthur Mensch:我們會(huì)共享基礎(chǔ)設(shè)施、代碼庫和研究成果。對(duì)于通用模型來說,你需要讓它們向不同的方向發(fā)展,比如掌握不同的語言、編程、數(shù)學(xué)和推理能力,甚至還需要加入多模態(tài)功能。這些方面雖然彼此關(guān)聯(lián)松散,但我們使用相同的優(yōu)化框架、數(shù)據(jù)和訓(xùn)練方法。團(tuán)隊(duì)不需要花大量時(shí)間進(jìn)行協(xié)調(diào)會(huì)議,這也是一種平衡。到目前為止,我們規(guī)模還比較小,只有 25 個(gè)人,所以協(xié)調(diào)起來并不算太難。不過隨著團(tuán)隊(duì)壯大,這肯定會(huì)成為一個(gè)挑戰(zhàn)。這是我在 DeepMind 的主要收獲之一。剛開始他們的規(guī)模很有效率,后來效率下降了一些,不過現(xiàn)在已經(jīng)有所恢復(fù)?傊,我們 Mistral 團(tuán)隊(duì)的優(yōu)化目標(biāo)就是盡可能快地迭代和發(fā)布產(chǎn)品。

Harry Stebbings:離開 DeepMind 創(chuàng)辦 Mistral 是一個(gè)容易的決定嗎?畢竟 DeepMind 是全球頂尖的人工智能研究機(jī)構(gòu),擁有眾多優(yōu)秀人才。

Arthur Mensch:這不是一個(gè)一開始就說一不二的決定。一開始可能只是 10% 的離開念頭,然后逐漸增加,直到有一天你意識(shí)到自己已經(jīng)無法再待下去了。同事之間的情誼很珍貴,所以不會(huì)是突然的決定。對(duì)我來說,做出決定的關(guān)鍵點(diǎn)可能是在去年 3 月底左右。周五我下定決心,然后周一就遞交了辭呈。

Harry Stebbings:夠干脆!一旦決定離開就立刻行動(dòng),這很棒!接下來我想從按時(shí)間順序回顧一下。你們發(fā)布的第一個(gè)模型 Mistral 7B 非常受歡迎,你認(rèn)為這背后的原因是什么?你們做對(duì)了什么?又從中吸取了什么教訓(xùn)?

Arthur Mensch:我認(rèn)為 Mistral 7B 取得成功的因素有兩個(gè)。首先,它在模型壓縮方面取得了重大突破,這為整個(gè)科研界提供了寶貴的經(jīng)驗(yàn)和學(xué)習(xí)資料。其次,它填補(bǔ)了性能和效率之間的空白。7B 的模型大小可以在 MacBook 或智能手機(jī)上高效運(yùn)行,同時(shí)又具備足夠的功能實(shí)用性。此前也有 7B 大小的模型,但性能不足以支持有趣的應(yīng)用。因此,我們通過瞄準(zhǔn)這個(gè)特定的領(lǐng)域吸引了開發(fā)人員的注意,因?yàn)?7B 的模型大小正好滿足了業(yè)余愛好者在游戲 GPU 或 Macbook 上運(yùn)行的需求。Mistral 7B 的成功在于填補(bǔ)了性能和效率之間缺失的一環(huán),從而引起了廣泛的興趣和應(yīng)用。

Harry Stebbings:從中學(xué)到的教訓(xùn)如何影響你們未來的發(fā)布呢?

Arthur Mensch:這讓我們意識(shí)到,比起單純追求更大規(guī)模的模型,效率更受關(guān)注。因此,我們繼續(xù)致力于開發(fā)高效的模型,比如后續(xù)的 Mixtral 8x7B 和 Mixtral 8x22B,都是在特定成本和大小下實(shí)現(xiàn)業(yè)界頂尖性能。追求效率的同時(shí),我們也會(huì)逐步擴(kuò)展到更大規(guī)模。

02 人工智能領(lǐng)域的效率與規(guī)模

Harry Stebbings:既然你們?nèi)绱俗⒅匦屎颓把,那么?guī)模還重要嗎?

Arthur Mensch:規(guī)模在某種程度上很重要,如果你投入更多計(jì)算資源進(jìn)行訓(xùn)練,就可以使模型更加壓縮。因此,壓縮模型確實(shí)需要一定的計(jì)算資源以及一定的訓(xùn)練規(guī)模。規(guī)模并不是唯一要素,并不是成功的秘訣,你還需要合適的數(shù)據(jù),否則你會(huì)遇到數(shù)據(jù)質(zhì)量瓶頸。還需要合適的訓(xùn)練技術(shù),你需要找到一些方法來提高效率,這些方法并不需要額外的計(jì)算資源,因?yàn)橛?jì)算資源成本很高。我們?cè)?Mistral 公司做的一件事就是嘗試?yán)?ldquo;計(jì)算乘數(shù)效應(yīng)”來提高效率。

Harry Stebbings:在不增加計(jì)算成本的情況下提高效率,這個(gè)領(lǐng)域還有多少潛力可挖?我可能有點(diǎn)天真,我想問的是,還有很多可以挖掘的空間嗎?還是說我們現(xiàn)在已經(jīng)接近極限,只能做微小的改進(jìn)?

Arthur Mensch:這還很難說。我相信我們可以做到在特定規(guī)模下性能更優(yōu)異的模型。這個(gè)問題就像,通過增加數(shù)據(jù)量和延長(zhǎng)訓(xùn)練時(shí)間,能否在相同類型的數(shù)據(jù)上訓(xùn)練出更好的模型一樣,都是需要探索的問題。你可以嘗試預(yù)測(cè)最終能達(dá)到的性能極限,但最終還是要通過嘗試來驗(yàn)證。

Harry Stebbings:大多數(shù)人認(rèn)為模型格局的最終狀態(tài)會(huì)變成商品化,最終會(huì)有 12 家玩家,然后陷入價(jià)格戰(zhàn)。在你看來,模型的最終狀態(tài)會(huì)是什么?你如何看待商品化問題?

Arthur Mensch: 我認(rèn)為模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺(tái)會(huì)更加成熟,擁有更豐富的功能,允許進(jìn)行定制、開發(fā)低延遲的特定用途模型、進(jìn)行評(píng)估并隨著時(shí)間的推移進(jìn)行改進(jìn)。模型只是一個(gè)很小的部分,雖然很重要,但它仍然只是應(yīng)用程序的一部分。當(dāng)你部署一個(gè)面向用戶的應(yīng)用程序時(shí),你需要確保它的運(yùn)行,確保它的延遲隨著時(shí)間推移降低,確保它的質(zhì)量隨著時(shí)間推移提高。因此,我認(rèn)為最終狀態(tài)是模型將成為任何人工智能應(yīng)用程序開發(fā)人員的起點(diǎn),它們需要被工具和生命周期管理平臺(tái)所包圍。這就是我們開始構(gòu)建的東西。通用模型有點(diǎn)缺乏差異化,你為你的應(yīng)用程序創(chuàng)建的差異化來自你輸入的數(shù)據(jù)、你收集的用戶反饋以及你理解應(yīng)用程序應(yīng)該做什么的智能。這完全不是商品化,沒有一個(gè)辦法可以讓你從通用模型直接成為一個(gè)超級(jí)好、在特定任務(wù)上優(yōu)于所有其他模型的模型。我認(rèn)為這是一個(gè)缺失的拼圖塊,也是我們?cè)诋a(chǎn)品方面投入力量的方面之一。

03 改善模型質(zhì)量的挑戰(zhàn)與機(jī)遇

Harry Stebbings:Sam Altman 和 Brad 前幾天提到,現(xiàn)在的模型質(zhì)量還并不夠好,還需要大大提高。制約模型質(zhì)量的最大瓶頸是什么?要如何改善?

Arthur Mensch: 我認(rèn)為數(shù)據(jù)質(zhì)量是一個(gè)限制因素。如何確保模型能夠利用整個(gè)世界知識(shí),并沿著學(xué)習(xí)越來越復(fù)雜事物的路徑發(fā)展,這非常重要,但這也是一個(gè)被忽視的方面。計(jì)算資源當(dāng)然也很重要,但是以我們現(xiàn)在擁有數(shù)據(jù)量來看,計(jì)算資源已經(jīng)不再是瓶頸了。例如,文本生成模型,問題在于如何精煉數(shù)據(jù),以及如何向模型本身輸入高質(zhì)量的數(shù)據(jù)來隨著時(shí)間推移進(jìn)行改進(jìn)。

Harry Stebbings:我們會(huì)看到能夠回答大量復(fù)雜問題的通用模型,還是更垂直領(lǐng)域?qū)S玫男⌒湍P停?/p>

Arthur Mensch:我們相信會(huì)出現(xiàn)垂直領(lǐng)域的模型,而且這些模型不會(huì)由我們提供,而是由應(yīng)用程序的創(chuàng)建者構(gòu)建。因?yàn)橄胍@得低延遲且擅長(zhǎng)特定任務(wù)的模型,就必須去除通用性。通用模型雖然可以處理很多事情,但如果你想讓模型深入思考某個(gè)特定主題以供你的 AI 應(yīng)用調(diào)用,同時(shí)還要保持良好的用戶體驗(yàn)和低延遲,那么通用模型就不太適合。

Harry Stebbings:很抱歉這么直白,但好像價(jià)值真正產(chǎn)生的地方是在應(yīng)用程序?qū)用妫簿褪莿?chuàng)建特定模型的地方。那么你們將如何發(fā)揮作用呢?

Arthur Mensch:制作專業(yè)模型是一項(xiàng)非常艱巨的任務(wù),實(shí)際上這與創(chuàng)建預(yù)訓(xùn)練模型的方式密切相關(guān)。因此,我們提供易于使用的工具,使開發(fā)人員能夠創(chuàng)建性能非常好的定制模型,而這些模型又不需要專家知識(shí),畢竟這種專家人才很難找到。

Harry Stebbings:我作為投資者很高興聽到你剛才說應(yīng)用程序?qū)訉a(chǎn)生價(jià)值。因?yàn)槲覔?dān)心通用模型會(huì)被我們提到的某些公司碾壓。你如何看待應(yīng)用程序?qū)尤匀荒軇?chuàng)造價(jià)值?對(duì)像我這樣的投資者,你有什么建議?

Arthur Mensch: 第一,隨著模型越來越好,只要擁有相關(guān)數(shù)據(jù)并且理解用例,那么創(chuàng)建垂直應(yīng)用程序就會(huì)變得越來越容易,前提是你擁有簡(jiǎn)化操作的工具。這讓我覺得應(yīng)用程序?qū)永麧櫩臻g會(huì)越來越保但另一方面,由于我們可以壓縮模型并顯著提高效率,因此模型的成本也在下降。這意味著加上模型層的競(jìng)爭(zhēng)壓力,模型的價(jià)格肯定會(huì)下降。因此,一方面是不斷增強(qiáng)的能力和壓縮的價(jià)格,這似乎會(huì)讓應(yīng)用程序?qū)幼兊酶;另一方面,模型部分將?huì)發(fā)展壯大。對(duì)我們來說,我們的做法是假設(shè)模型部分仍然會(huì)足夠大,我們需要在這個(gè)基礎(chǔ)上構(gòu)建平臺(tái),因?yàn)檫@將使我們能夠?qū)崿F(xiàn)對(duì)你來說很感興趣的垂直應(yīng)用。

Harry Stebbings:你如何看待你們的定位和品牌?因?yàn)槠渌恍﹨⑴c者更直接地表示他們將主導(dǎo)許多不同的垂直領(lǐng)域,這讓人有點(diǎn)擔(dān)心。你們?nèi)绾慰创@種說法?

Arthur Mensch:我們不是垂直領(lǐng)域的公司。我們創(chuàng)立 Mistral 是為了給開發(fā)人員帶來價(jià)值和自由。當(dāng)我們開始做的時(shí)候,當(dāng)時(shí)只有一個(gè) API,而且生成式人工智能領(lǐng)域似乎由少數(shù)幾家公司主導(dǎo)。因此,我們采取了這種平臺(tái)式的方法,我們讓開發(fā)人員擁有和修改我們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應(yīng)用開發(fā)者擁有自由,這才是使生成式 AI 盡可能廣泛傳播的最佳方式,這也是我們作為公司的目標(biāo)。讓前沿人工智能融入每個(gè)人心中,這就是我們當(dāng)初創(chuàng)立 Mistral 的原因。我認(rèn)為我們做得還不錯(cuò),當(dāng)然我們還有很多事情要做,但是我認(rèn)為開源部分為社區(qū)帶來了便利,讓人們意識(shí)到他們可以通過修改模型本身來構(gòu)建非常有趣的技術(shù),而不需要依賴少數(shù)供應(yīng)商的 API。

Harry Stebbings:開發(fā)人員關(guān)心什么?大家都在 Twitter 上討論性能問題,比如本周的 X 模型比上周的 Y 模型更好。他們關(guān)心效率、規(guī)模、成本等因素嗎?這些因素如何影響他們的決策?

Arthur Mensch:開發(fā)人員肯定會(huì)關(guān)心成本,他們也關(guān)心定制的可能性,能夠修改模型。在這方面,我認(rèn)為我們只是觸及了皮毛。微調(diào)一直以來都是常用解決方案,但這可能有點(diǎn)達(dá)不到我們想要的效果。他們還關(guān)心能夠部署到任何地方,比如特定的云端空間、本地環(huán)境或者邊緣設(shè)備。因此,他們也關(guān)心可移植性,而可移植性通常會(huì)帶來數(shù)據(jù)控制的優(yōu)勢(shì)。通常情況下,當(dāng)大型語言模型與知識(shí)庫或與某些企業(yè)相關(guān)的東西連接時(shí),它們會(huì)變得非常有用,但同時(shí)也會(huì)成為應(yīng)用程序的一個(gè)非常敏感部分。企業(yè)非常關(guān)注確保他們的專有數(shù)據(jù)能夠在一個(gè)完全安全的環(huán)境中被訪問,這就是為什么我們將我們的平臺(tái)部署在Azure和AWS上,為他們提供所需的安全層。

Harry Stebbings:艱難的問題來了,大語言模型基于的產(chǎn)品的邊際收入何時(shí)何地會(huì)超過邊際成本?

Arthur Mensch:我可以告訴你誰目前做得最好,但隨著時(shí)間的推移,情況可能會(huì)發(fā)生變化。目前做得最好的公司是英偉達(dá),云提供商基本上持平,模型提供商還處于虧損狀態(tài),但希望不會(huì)一直虧損。我認(rèn)為這將是一個(gè)充滿變動(dòng)的領(lǐng)域,正如我所說,模型的能力使應(yīng)用程序的成本越來越低。我不認(rèn)為大語言模型的核心部分(也就是真正基礎(chǔ)層的邊際成本和利潤率)會(huì)降為零,否則肯定會(huì)存在公平性問題。

Harry Stebbings:你能解釋一下“公平性問題”嗎?

Arthur Mensch:通常,價(jià)值的積累往往集中在最困難的部分和最具可防御性的部分。在一段時(shí)間內(nèi),這主要體現(xiàn)在基礎(chǔ)模型上。它將成為大多數(shù)創(chuàng)新發(fā)生的地方,也是至少大部分積累價(jià)值的地方。

Harry Stebbings:今天創(chuàng)辦一家基礎(chǔ)模型公司真的有很多障礙嗎?我知道這是一個(gè)非;\統(tǒng)和愚蠢的問題,但現(xiàn)在有這么多不同的參與者,而且每天都在出現(xiàn)新的參與者,所以障礙是不是在逐日降低?

Arthur Mensch:我不認(rèn)為是這樣。在這個(gè)領(lǐng)域取得成功非常困難。你需要在成本、效率、性能方面占據(jù)主導(dǎo)地位。只有少數(shù)公司目前處于有利地位。你可以嘗試做一些事情,但如果它無關(guān)緊要,如果它被另一個(gè)模型或另一種技術(shù)嚴(yán)格主導(dǎo),那么你就會(huì)遇到問題。你需要克服一些難以克服的障礙,你需要非常高效地運(yùn)營、籌集足夠的資金來獲得足夠的計(jì)算資源、擁有訓(xùn)練模型的人才(這仍然是一種稀缺資源),以及一個(gè)好的品牌,因?yàn)檎缒闼f,競(jìng)爭(zhēng)非常激烈,這些都不是憑空產(chǎn)生的。

Harry Stebbings:你認(rèn)為計(jì)算成本下降的速度有多快?

Arthur Mensch:計(jì)算成本會(huì)隨著時(shí)間的推移而降低,首先是基于硬件成本。根據(jù) Nvidia 的路線圖,每?jī)赡甑南嗤?FLOPS (Floating point operations per second,每秒浮點(diǎn)運(yùn)算次數(shù),理解為計(jì)算速度)數(shù)量,計(jì)算成本都會(huì)降低約 30%。另一個(gè)提高效率的因素是算法的改進(jìn)。如果我們看看三年前和今天訓(xùn)練模型的方式,我認(rèn)為我們?cè)谒惴ǚ矫嫒〉昧舜蠹s 100 倍的改進(jìn)。所以這可能是近年來取得的大部分收益。當(dāng)然,計(jì)算成本會(huì)降低,但不會(huì)比摩爾定律更快降低。

Harry Stebbings:正如你提到的,與核心供應(yīng)商(如英偉達(dá))建立良好關(guān)系似乎是成功的重要因素之一。這不是決定今天成功的核心因素嗎?

Arthur Mensch:這確實(shí)是一個(gè)重要方面。在人工智能層面上,我們對(duì)云服務(wù)提供商和英偉達(dá)都存在一定的戰(zhàn)略依賴關(guān)系。競(jìng)爭(zhēng)也在升溫,但與硬件提供商保持良好合作關(guān)系對(duì)于開發(fā)軟件而言是很有幫助的,他們可以協(xié)助你優(yōu)化硬件利用。當(dāng)你向企業(yè)出售開發(fā)者平臺(tái)時(shí),通過他們熟悉的云提供商進(jìn)行交付也是很有用的。所以在這方面確實(shí)需要進(jìn)行一些重要的合作。

04 平衡研究團(tuán)隊(duì)與銷售團(tuán)隊(duì)

Harry Stebbings:對(duì)于您這樣一位創(chuàng)始人來說,既要管理研究團(tuán)隊(duì),又要組建企業(yè)銷售團(tuán)隊(duì),如何平衡這兩個(gè)團(tuán)隊(duì)之間的關(guān)系呢?

Arthur Mensch:確實(shí)需要用心去平衡。我們希望科學(xué)團(tuán)隊(duì)能夠理解用戶面臨的問題,因?yàn)檫@將反過來促進(jìn)科學(xué)研究的進(jìn)步。畢竟,我們研發(fā)的通用技術(shù)只有在識(shí)別出具體用例后才能真正發(fā)揮作用。因此,讓科學(xué)團(tuán)隊(duì)盡早接觸產(chǎn)品和業(yè)務(wù)團(tuán)隊(duì)是非常重要的。這將幫助他們理解模型的局限性以及如何加以改進(jìn)。另一方面,銷售團(tuán)隊(duì)也需要理解這是一款技術(shù)含量很高的產(chǎn)品。他們并不是在銷售一款成品,而是在銷售驅(qū)動(dòng)該成品的產(chǎn)品。因此,他們需要告訴客戶如何正確使用這些模型,為企業(yè)帶來實(shí)際價(jià)值。這需要對(duì)銷售團(tuán)隊(duì)進(jìn)行強(qiáng)有力的培訓(xùn)。

Harry Stebbings:研究團(tuán)隊(duì)和銷售團(tuán)隊(duì)的工作節(jié)奏似乎并不一致,科學(xué)研究通常需要幾個(gè)月的時(shí)間才能完成一個(gè)周期,而銷售團(tuán)隊(duì)的周期則要短得多。您是如何解決這個(gè)問題的呢?

Arthur Mensch:到目前為止,我們?cè)O(shè)法招募了一些對(duì)技術(shù)感興趣的銷售人員,以及一些對(duì)商業(yè)感興趣的技術(shù)人員。這樣可以避免團(tuán)隊(duì)之間出現(xiàn)代溝。

Harry Stebbings:開源技術(shù)是否適用于企業(yè)領(lǐng)域?企業(yè)是否已經(jīng)準(zhǔn)備好迎接開源技術(shù),他們是否足夠重視它?

Arthur Mensch:這取決于具體企業(yè)的情況。一些企業(yè)已經(jīng)開始率先采用開源模型,并將它們投入生產(chǎn)使用。但是,要把這些模型應(yīng)用于大規(guī)模生產(chǎn),還需要額外的產(chǎn)品功能,例如負(fù)載均衡和模型定制。使用自己研發(fā)的解決方案當(dāng)然可以做到這一點(diǎn),但要使其足夠魯棒和可擴(kuò)展卻并非易事。要想真正提高定制模型的質(zhì)量,就需要一些難以掌握的方法。因此,一些技術(shù)實(shí)力雄厚的企業(yè)無疑已經(jīng)為采用開源技術(shù)做好了準(zhǔn)備,并且已經(jīng)有許多成功的用例在生產(chǎn)環(huán)境中使用開源模型。

Harry Stebbings:為了擴(kuò)大采用范圍,肯定還需要一些配套的工具進(jìn)入市常如今,每個(gè)企業(yè)都在董事會(huì)上討論其人工智能戰(zhàn)略。您會(huì)給他們什么建議?他們應(yīng)該問哪些問題?

Arthur Mensch:不要總是想著利用人工智能徹底改變所有產(chǎn)品,也不要將人工智能視為一種無所不能的代理。現(xiàn)在我們可以構(gòu)建非常智能的代理,但要后退一步,從組織層面理解人工智能帶來的影響。換句話說,不要將生成式人工智能視為提高文字處理工作效率的一種方式,而要將它視為徹底改變核心業(yè)務(wù)運(yùn)營方式的一種手段。這通常涉及到對(duì)模型進(jìn)行大量定制,以便在五年后每個(gè)人都采用這項(xiàng)技術(shù)的情況下為你帶來競(jìng)爭(zhēng)優(yōu)勢(shì)。

05 美歐投資者的區(qū)別

Harry Stebbings:資金來源會(huì)影響擴(kuò)展限制嗎?當(dāng)你融資的時(shí)候,跟歐洲投資人和美國投資人溝通起來有很大差別嗎?

Arthur Mensch:種子輪融資沒什么差別,不過到了更大規(guī)模的 A 輪融資,情況就不同了。歐洲的基金架構(gòu)并不適合我們當(dāng)時(shí)提出的融資方案,所以我們甚至沒跟他們?cè)趺唇涣,因(yàn)樗麄兏纠斫獠涣宋覀冃枰啻笠?guī)模的投資。

Harry Stebbings:你們還處于初創(chuàng)階段是吧?

Arthur Mensch:是的,我覺得歐洲缺乏的是像樣的成長(zhǎng)型基金,它們能夠大舉押注,并且滿懷信心。隨著時(shí)間的推移,這種情況肯定會(huì)改善,尤其是如果我們可以更好地利用歐洲的財(cái)富,將更多資金投入到此類成長(zhǎng)型基金中,而不是像現(xiàn)在這樣。

Harry Stebbings:你似乎比我更樂觀一點(diǎn),你覺得未來幾年歐洲會(huì)出現(xiàn)更多成長(zhǎng)型基金嗎?

Arthur Mensch:我可不覺得,至少在未來三到五年內(nèi)不會(huì)。這取決于一些政治決策,以及資金供應(yīng)和人們是否相信歐洲的未來生態(tài)系統(tǒng)能夠與其他大型生態(tài)系統(tǒng)競(jìng)爭(zhēng)。這是一個(gè)先有雞還是先有蛋的問題,但總歸在某個(gè)時(shí)候需要有人推動(dòng)它往正確的方向發(fā)展。如果政治層面有這個(gè)意愿,如果有一些公司展示出在歐洲可以真正實(shí)現(xiàn)快速增長(zhǎng),這種情況就會(huì)朝著正確的方向發(fā)展,這正是我們所努力的。

Harry Stebbings:你提到過擴(kuò)展速度是最難的事情之一,作為 CEO,當(dāng)你帶領(lǐng)公司高速擴(kuò)展時(shí),你覺得最難的是什么?

Arthur Mensch:學(xué)習(xí)新事物!這是一邊干一邊學(xué)的過程。比如,如何讓 45 個(gè)人之間保持良好溝通,如何管理好自己的時(shí)間,用于展示公司、拓展業(yè)務(wù)等等,因?yàn)槲覀儸F(xiàn)在還處于需要深度參與交易談判的階段。

Harry Stebbings:假設(shè)你能夠回到過去,在成為 Mistral AI 的 CEO 之前一天晚上給自己一些建議,你會(huì)說什么?

Arthur Mensch:也許我會(huì)更注重產(chǎn)品開發(fā)和市場(chǎng)推廣。當(dāng)時(shí)我們開展市場(chǎng)推廣的時(shí)候,根本沒什么可賣的東西。雖然最終還是取得了一些品牌知名度,但或許可以稍微改變一下順序,讓產(chǎn)品開發(fā)稍微領(lǐng)先于市場(chǎng)推廣一些。不過,由于這是一個(gè)快速發(fā)展的領(lǐng)域,我們確實(shí)是一起啟動(dòng)了所有項(xiàng)目,這導(dǎo)致了一些組織上的問題,F(xiàn)在我們正在努力鞏固這方面的工作。

Harry Stebbings:考慮到該領(lǐng)域的快速發(fā)展,你們當(dāng)時(shí)的戰(zhàn)略肯定會(huì)有所變化吧?

Arthur Mensch:總的來說,我們一年前制定的戰(zhàn)略并沒有太大變化。我們意識(shí)到我們需要更多的資金、強(qiáng)勁的產(chǎn)品,并且不能只局限于歐洲市場(chǎng),需要迅速進(jìn)軍美國。這些都是我們?cè)诎l(fā)展過程中得出的結(jié)論,即使我們一年前就知道這些,也不會(huì)帶來太大幫助。

Harry Stebbings:你們現(xiàn)在覺得資金充足了嗎?

Arthur Mensch:初創(chuàng)公司總是需要融資的。在未來幾年里,投資都會(huì)大于收入,因?yàn)樽鳛榍把毓,我們需要擴(kuò)展規(guī)模并保持相關(guān)性。因此,肯定需要持續(xù)的投資。收入也在逐漸增加,所以也有一些可以用于再投資的收入。但我認(rèn)為,在今后很長(zhǎng)一段時(shí)間里,研究開發(fā)的速度都應(yīng)該快于市場(chǎng)推廣的速度。

Harry Stebbings:談到目前的技術(shù)格局,你最尊重和欽佩哪家公司?

Arthur Mensch:他們都取得了不錯(cuò)的成績(jī)。最近,OpenAI 讓大家感到驚喜,他們發(fā)布了優(yōu)秀的新模型。還有 Anthropic 和谷歌的朋友們也在出色地工作。這是一個(gè)充滿競(jìng)爭(zhēng)的領(lǐng)域,我們彼此尊重,也朝著相同的更高目標(biāo)共同努力。

06 快速問答環(huán)節(jié)

Harry Stebbings:當(dāng)今世界上最讓你擔(dān)心的是什么?

Arthur Mensch:全球變暖。地球升溫以及美國尋找解決方案的競(jìng)賽讓我很擔(dān)心。我認(rèn)為人工智能是解決方案的一部分,因?yàn)樗梢詭砀嗫刂疲⒃谀承┝鞒讨袔砀叩男。但?shí)際上這是一場(chǎng)生存競(jìng)賽,所以我覺得我們應(yīng)該更多地意識(shí)到這一點(diǎn)。

Harry Stebbings:在過去 12 個(gè)月里,你改變了最多的想法是什么?

Arthur Mensch:改變了很多關(guān)于管理的先入為主的觀念,這些觀念以前我從未測(cè)試過。其中最大的一點(diǎn)是,透明的反饋對(duì)公司來說實(shí)際上非常有用。因此,幾乎完全透明地運(yùn)營公司幫助了我們打破增長(zhǎng)瓶頸。

Harry Stebbings:在 Mistral 發(fā)展過程中,哪個(gè)方面出乎意料地最具挑戰(zhàn)性?

Arthur Mensch:我們需要管理的需求量太高了,超出了我們的能力范圍。還有就是品牌出乎意料的成功,人們都認(rèn)識(shí)我們了。我們知道會(huì)引起關(guān)注,但沒想到人們會(huì)這么快開始使用我們的產(chǎn)品。

Harry Stebbings:Arthur,你現(xiàn)在有很多事要做,肩上也有很多期待和資金壓力,你該怎么做才能放松下來?

Arthur Mensch:我會(huì)跑步和騎自行車。我想我伴可能會(huì)對(duì)我心生怨言,但我還是會(huì)盡量照顧我的女兒。

Harry Stebbings:你最近剛當(dāng)了爸爸,現(xiàn)在你有哪些當(dāng)初剛有女兒時(shí)希望自己知道的呢?

Arthur Mensch:老實(shí)說,我完全沒想到照顧一個(gè)小孩子需要這么多精力。

Harry Stebbings:你認(rèn)為未來AI會(huì)在 10 年內(nèi)改變世界嗎?社會(huì)在一切都融入 AI 的情況下會(huì)變成什么樣?

Arthur Mensch:人工智能將顯著改變?nèi)藗兊墓ぷ鞣绞,因(yàn)樗笕藗冏兊酶邉?chuàng)造力,并帶來超出自動(dòng)化所能及的價(jià)值。因此,這將對(duì)就業(yè)市場(chǎng)造成非常結(jié)構(gòu)性的變化,這意味著需要迅速采取一些適應(yīng)措施,例如培訓(xùn)和教育,讓人們能夠理解在日常工作中會(huì)有什么樣的期待,以及如何與人工智能協(xié)作。

Harry Stebbings:你認(rèn)為人們對(duì)工作被取代的恐懼被夸大了嗎?

Arthur Mensch:取決于你跟誰交談。我認(rèn)為一些工作肯定會(huì)消失,但也會(huì)有一些新的工作產(chǎn)生。因?yàn)槲覀冋噲D讓人類思維達(dá)到更高的抽象層次,這樣我們才能與機(jī)器對(duì)話,機(jī)器也能理解并以人類的方式回答。這不像計(jì)算機(jī)帶來的那種巨大變革。不過,我認(rèn)為現(xiàn)在正以歷史上前所未有的速度提升思維抽象的層次,這將使社會(huì)適應(yīng)起來更具挑戰(zhàn)性,需要提前預(yù)見到這一點(diǎn)。

Harry Stebbings:最后一個(gè)問題,假設(shè) 10 年后一切都順利,Mistral 會(huì)是什么樣子?

Arthur Mensch:Mistral 將擁有非常相關(guān)的一些商業(yè)和開源模型,還將擁有功能強(qiáng)大的開發(fā)者平臺(tái),使人們能夠創(chuàng)建他們的人工智能應(yīng)用程序。那將是一個(gè)好的成就。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: DeepMind Mistral Arthur Mensch

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港