展會(huì)信息港展會(huì)大全

微軟又投了一家大模型公司,“法國版OpenAI”剛剛發(fā)布新模型,對(duì)標(biāo)GPT-4
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-28 18:35:39   瀏覽:4204次  

導(dǎo)讀:圖片來源@視覺中國 文|烏鴉智能說 昨晚,被稱為法國版 OpenAI的Mistral AI,發(fā)布了其最新的頂級(jí)文本生成模型 Mistral Large。相比此前的模型,這次 Mistral AI 發(fā)布的版本性能更強(qiáng),甚至直接對(duì)標(biāo)OpenAI 的 GPT-4。 在發(fā)布最新模型的同時(shí),Mistral Large還宣...

圖片來源@視覺中國

文|烏鴉智能說

昨晚,被稱為“法國版 OpenAI”的Mistral AI,發(fā)布了其最新的頂級(jí)文本生成模型 Mistral Large。相比此前的模型,這次 Mistral AI 發(fā)布的版本性能更強(qiáng),甚至直接對(duì)標(biāo)OpenAI 的 GPT-4。

在發(fā)布最新模型的同時(shí),Mistral Large還宣布,與微軟達(dá)成深度合作。據(jù)外媒報(bào)道,微軟收購了少數(shù) Mistral AI 的股權(quán)。

這意味著,Mistral AI成為繼OpenAI后,微軟投資的第二家大模型公司,而Mistral AI 也將獲得 OpenAI 同等待遇,直接將模型資源放在微軟云當(dāng)中售賣。

不過令人詫異的是,以開源公司出道的 Mistral AI ,此次并沒有將這款新旗艦?zāi)P烷_源。這也引發(fā)了外界對(duì)其模型路線改變的諸多猜想。

Mistral AI發(fā)布最新大模型,

對(duì)標(biāo)GPT-4

Mistral Large 是 Mistral AI 的最新旗艦版,特點(diǎn)是具備頂級(jí)的的推理能力,可用于處理復(fù)雜的多語言推理任務(wù),涵蓋文本理解、轉(zhuǎn)換和代碼生成等。

從官方披露的信息看,Mistral Large 在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,并取得了81.2%的好成績(jī),僅次于 GPT-4,并將Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B等其他主流模型甩在身后。與此同時(shí),Mistral Large還 具有以下特點(diǎn):

32K 的上下文窗口,精準(zhǔn)提取大型文檔信息。

在英語、法語、西班牙語、德語和意大利語方面具有天然的流利度,對(duì)語法和文化背景有細(xì)膩的理解。

精確的指令跟隨能力,便于開發(fā)者定制審核策略。

支持函數(shù)調(diào)用和輸出模式限制,助力應(yīng)用開發(fā)規(guī);图夹g(shù)棧現(xiàn)代化。

在 MMLU、Hellas、WinoG 等多項(xiàng)常識(shí)和推理的基準(zhǔn)測(cè)試中,Mistral Large 緊隨 GPT-4 之后,遠(yuǎn)超其他模型。

多語言能力方面,Mistral Large在法語、德語、西班牙語和意大利語的 HellaSwag、Arc Challenge 和MMLU 基準(zhǔn)測(cè)試中,表現(xiàn)大幅優(yōu)于 LLaMA 2 70B。

在編碼和數(shù)學(xué)任務(wù)中,Mistral Large 同樣表現(xiàn)出色。多項(xiàng)基準(zhǔn)測(cè)試依然是遙遙領(lǐng)先。

從定價(jià)上看,Mistral Large的定價(jià)略低于GPT-4 ,其在 Azure AI 上的定價(jià)如下:

輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定價(jià)為:輸出為 0.03 美元/1000 token,輸入 0.01 美元/ 1000 token。

值得一提的是,在發(fā)布Mistral Large的同時(shí),Mistral AI還發(fā)布了針對(duì)延遲和成本優(yōu)化的新模型Mistral Small,性能超越 Mixtral 8x7B,但延遲更低。Mistral AI 認(rèn)為,Mistral Small 將成為介于開源模型和旗艦?zāi)P椭g的理想選擇。

目前,Mistral Large 已經(jīng)可以在 La Plateforme 和 Azure 平臺(tái)上使用,并集成到了 Le Chat 中。Le Chat是一個(gè)類似 ChatGPT 的 AI 聊天機(jī)器人,支持多語言交流。用戶可以在 Mistral Small、Mistral Large 以及 Mistral Next 三種不同的模型之間進(jìn)行選擇。但目前Le Chat 仍然不支持實(shí)時(shí)聯(lián)網(wǎng)功能。

微軟拿下“法國版 OpenAI”

在Mistral Large發(fā)布的同時(shí),還有一則重磅消息曝出:繼OpenAI之后,微軟將Mistral也納入麾下,成為第二家在微軟 Azure 云計(jì)算平臺(tái)上提供商業(yè)語言模型的公司。

與OpenAI類似,Mistral也頗具傳奇色彩。Mistral AI 公司成立于 2023 年 5 月,總部位于法國巴黎,是大模型領(lǐng)域?yàn)閿?shù)不多的歐洲選手。

Mistral AI 在 2023 年 9 月推出開源的 7B 模型,一度引爆了整個(gè)開源社區(qū)。原因在于,Mixtral 8x7B雖然只有 46.7B 的參數(shù)規(guī)模, 但在眾多基準(zhǔn)測(cè)試中的表現(xiàn)卻能與 Llama 2 70B 和 GPT-3.5 媲美,甚至在某些測(cè)試中還略勝一籌。這也讓Mistral AI 成為開源、小模型領(lǐng)域的“尖子生”。

Mistral AI的團(tuán)隊(duì)構(gòu)成很簡(jiǎn)單,以年輕科學(xué)家為主,目前人數(shù)大概有數(shù)十人,其中管理層總共四人:

CEO Arthur Mensch 來自 Deepmind,參與了 Deepmind 的多個(gè)經(jīng)典的模型:Flamingo、Chinchilla、Gopher。CTO 和 首席科學(xué)家分別是 Llama & Llama2 的核心工程、研究角色。Chief Business Officer Florian 則由創(chuàng)始顧問,Alan 的 CEO 推薦加入。

算上這次融資,Mistral 已完成了三輪公開融資,總額超過6億美元,估值已經(jīng)超過20億美元。

2023 年 6 月,公司完成 1.05 億歐元(約合 1.13 億美元)的種子輪融資,由 Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投,投后估值 2.4 億歐元;

2023 年 12 月,Mistral 完成由 Andreessen Horowitz(a16z)領(lǐng)投,英偉達(dá)、Salesforce、法國巴黎銀行、美國風(fēng)投機(jī)構(gòu) General Catalyst 等投資的 3.85 億歐元(約合 4.15 億美元)融資。

微軟對(duì)外證實(shí)了此次對(duì)Mistral AI 的投資,但表示不持有該公司的股權(quán)。此前,這家科技巨頭因向 OpenAI 提供巨額資金而受到歐洲和美國監(jiān)管機(jī)構(gòu)的審查。根據(jù)公告,微軟與 Mistral AI 的合作主要集中在三個(gè)核心領(lǐng)域:

超算基礎(chǔ)設(shè)施:微軟將通過 Azure AI 超級(jí)計(jì)算基礎(chǔ)設(shè)施支持 Mistral AI ,為 Mistral AI 旗艦?zāi)P偷?AI 訓(xùn)練和推理工作負(fù)載提供一流的性能和規(guī)模;

市場(chǎng)推廣:微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機(jī)器學(xué)習(xí)模型目錄中的模型即服務(wù)(MaaS)向客戶提供 Mistral AI 的高級(jí)模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業(yè)模型。

人工智能研發(fā):微軟和 Mistral AI 將探索為特定客戶訓(xùn)練特定目的模型的合作。

隨著與微軟合作的達(dá)成,不僅將有助于 Mistral AI 將自己的模型推向市場(chǎng),也讓其有機(jī)會(huì)使用 Azure 的尖端 AI 基礎(chǔ)設(shè)施,以加速其下一代大型語言模型的開發(fā)和部署。

從開源到閉源?

自成立以來,Mistral AI一直走的是開源路線,也曾在各種采訪中反復(fù)強(qiáng)調(diào)開源的重要性。

在Mistral AI CEO Arthur Mensch此前的采訪中明確表示,和閉源模型相比,開源的確更符合考慮到企業(yè)私有化使用模型的需求,并且開源模型能力也會(huì)逐步升級(jí)從而滿足更多需求。Arthur 在訪談中還提到,開源也能夠讓模型受到公眾監(jiān)督、更加安全。

而Mistral AI在2023年春天向投資者提出的最初方案中,批評(píng)了由美國公司主導(dǎo)的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。對(duì)于Mensch和他的合伙人來說,將他們的初始AI系統(tǒng)作為開源軟件發(fā)布,允許任何人免費(fèi)使用或修改,這是一個(gè)重要的原則。

但有趣的是,這次以開源公司出道的 Mistral AI ,并沒有將這款新旗艦?zāi)P烷_源。不僅如此,有細(xì)心的網(wǎng)友發(fā)現(xiàn),新模型發(fā)布后,Mistral AI 官網(wǎng)還悄悄把所有有關(guān)開源社區(qū)義務(wù)的內(nèi)容全部刪了。

考慮到微軟投的另一家大模型OpenAI 就經(jīng)歷了從開源到閉源的轉(zhuǎn)移,不禁讓人遐想,同樣接受了微軟投資的Mistral AI,會(huì)不會(huì)走OpenAI的老路?

對(duì)此,Mistral CEO Mensch在接受《華爾街日?qǐng)?bào)》采訪時(shí)回應(yīng)稱,Mistral AI 并未違背開源的初衷,而是采用同時(shí)推進(jìn)商業(yè)化戰(zhàn)略和維持開源承諾的雙重策略。

“顯然,在構(gòu)建商業(yè)模式和保持我們的開源價(jià)值觀之間,我們需要找到一個(gè)細(xì)小的平衡點(diǎn)。我們希望發(fā)明新事物和新的架構(gòu),同時(shí)也希望向我們的客戶提供更多可銷售的產(chǎn)品。”

進(jìn)入閉源模型,意味著Mistral AI將面臨更多的競(jìng)爭(zhēng),尤其是來自O(shè)penAI的挑戰(zhàn)。在Scaling Law的推動(dòng)下,OpenAI在閉源模型上的優(yōu)勢(shì)越來越大,就連谷歌也毫無招架之力。而這顯然是接下來Mistral AI需要面對(duì)的事情。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港