<span id="bldzl"></span>

展會信息港展會大全

當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > 首個開源MoE大模型發(fā)布！GPT-4同款架構(gòu)，來自歐洲的OpenAI

首個開源MoE大模型發(fā)布！GPT-4同款架構(gòu)，來自歐洲的OpenAI
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-09 17:41:30 瀏覽：7272次

導(dǎo)讀：夢晨發(fā)自凹非寺量子位 | 公眾號 QbitAI 取消今晚所有計劃！，許多AI開發(fā)者決定不睡了。只因首個開源MoE大模型剛剛由 Mistral AI 發(fā)布。 MoE架構(gòu)全稱專家混合（Mixture-of-Experts），也就是傳聞中 GPT-4采用的方案，可以說這是開源大模型離GPT-4最...

夢晨發(fā)自凹非寺

量子位 | 公眾號 QbitAI

“取消今晚所有計劃！”，許多AI開發(fā)者決定不睡了。

只因首個開源MoE大模型剛剛由Mistral AI發(fā)布。

MoE架構(gòu)全稱專家混合（Mixture-of-Experts），也就是傳聞中GPT-4采用的方案，可以說這是開源大模型離GPT-4最近的一集了。

沒有發(fā)布會、沒有宣傳視頻，只靠一個磁力鏈接，就產(chǎn)生如此轟動效果。

具體參數(shù)還得是網(wǎng)速快的人下載完之后，從配置文件里截圖發(fā)出來的：

7B參數(shù)x8個專家，對每個token選擇前兩個最相關(guān)的專家來處理。

以至于OpenAI創(chuàng)始成員Karpathy都吐槽，是不是少了點什么？

怎么缺了一個那種排練很多次的專業(yè)范視頻，大談特談AI變革埃

至于吐槽的是誰，懂得都懂了。

以及他還解釋了為什么AI社區(qū)這幾天如此活躍：最大的深度學(xué)習(xí)會議NeurIPS即將在下周開啟。

MoE，開源大模型新階段？

為何這款開源MoE模型如此受關(guān)注？

因為其前身Mistral-7B本來就是開源基礎(chǔ)模型里最強的那一檔，經(jīng)�？梢栽郊壧魬�(zhàn)13B、34B。

并且Mistral-7B以寬松的Apache-2.0開源協(xié)議發(fā)布，可免費商用，這次新模型很可能沿用這個協(xié)議。

在多個評測排行榜上，基于Mistral-7B微調(diào)的Zephyr-7B-beta都是前排唯一的7B模型，前后都是規(guī)模比他大得多的模型。

LLMSYS Chatbot Arena上，Zephry-7B-beta目前排第12。

AlpacaEval上，也排到第15。

目前這個新的MoE模型連個正式名字都還沒有，社區(qū)一般稱呼它為Mistral-7Bx8 MoE。

但在大家期待的期待中，新MoE模型對比單體Mistral-7B的提升幅度，就應(yīng)該像GPT-4對比GPT-3.5那樣。

但是注意了，有人提醒大家MoE對于本地運行來說不是太友好，因為更占內(nèi)存

但更適合部署在云端，跨設(shè)備專家并行，給公司處理并發(fā)需求帶來成本優(yōu)勢。

行動比較快的公司是前PyTorch成員出走創(chuàng)辦的fireworks.ai。

第一次嘗試、沒有任何優(yōu)化的情況下，需要兩張80GB內(nèi)存的卡，優(yōu)化版本即將推出。

Replicate上也有了可試玩版本，簡單試用發(fā)現(xiàn)中文水平也不錯。

其實Mistral AI也為大家準(zhǔn)備了官方配套代碼，使用了斯坦福去年發(fā)布的輕量級MoE庫Megablocks。

創(chuàng)始人：小模型支持更多有意思的應(yīng)用

Mistral AI由前DeepMind、前Meta科學(xué)家創(chuàng)辦。

剛剛完成一輪4.87億美元的新融資，最新估值逼近20億美元，已晉升獨角獸。

三位聯(lián)合創(chuàng)始人中，CEOArthur Mensch此前在DeepMind巴黎工作。

CTOTimothée Lacroix和首席科學(xué)家Guillaume Lample則在Meta共同參與過Llama系列的研發(fā)，Lample是通訊作者之一。

Arthur Mensch曾在接受采訪時談到，讓模型變小是支持Agent發(fā)展的路徑之一。

如果能把計算成本降低100倍，就能構(gòu)建起更多有意思的應(yīng)用。

Mistral AI成立于今年5月，種子輪融資1.13億美元。

9月底，Mistral AI以磁力鏈接的形式發(fā)布第一個開源模型Mistral-7B，當(dāng)時很多開發(fā)者試用后都覺得Llama-2不香了。

12月初，Mistral AI再次甩出開源MoE模型磁力鏈接，再次掀起一波熱潮。

這就是公司官號僅有的幾次發(fā)言。

不少人都拿來和最近谷歌的過度宣傳做對比。

最新的梗圖：磁力鏈接就是新的arXiv。

參考鏈接：

[1]https://x.com/MistralAI/status/1733150512395038967?s=20

[2]https://github.com/mistralai/megablocks-public

[3]https://replicate.com/nateraw/mixtral-8x7b-32kseqlen

人工智能實驗室

相關(guān)熱詞： 首個開源 MoE 大模型發(fā)布 GPT-4 同款架構(gòu) 來

上一篇：硅谷AI爭奪戰(zhàn)：被雄心、恐懼和金錢驅(qū)動的人類巔峰創(chuàng)新

下一篇：人形機器人第一股來了！大模型帶來“新故事”

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

馬斯克的xAI連發(fā)兩款新模型，有進步但還談不上領(lǐng)先

閱讀量：69149

Meta Llama 3.1-405B AI模型多項跑分超越 OpenAI GPT-4o

閱讀量：25588

《2024年AI Agent行業(yè)報告》｜甲子光年智庫

閱讀量：18167

從現(xiàn)在起，GitHub上超1億開發(fā)者可直接訪問全球頂級大模型，構(gòu)建AI應(yīng)用

閱讀量：17577

IMF：對人工智能造成大規(guī)模失業(yè)、不平等加劇的可能性深感擔(dān)憂

閱讀量：14672

AI創(chuàng)投的那些荒誕故事

閱讀量：14659

推薦內(nèi)容

2024第21屆中國東盟博覽會綠色建材、智能家居展
2024年伊朗國際礦業(yè)展
2024第13屆深圳國際營養(yǎng)與健康產(chǎn)業(yè)博覽會
2024第十屆廣州國際砂石技術(shù)與設(shè)備展
2024江西省首屆殯葬設(shè)備用品博覽會
2024亞太服裝服飾供應(yīng)鏈博覽會（LINKFOR 2024）
2024中國環(huán)博會深圳展（IE expo Shenzhen）
2024烏茲別克斯坦建筑建材&玻璃門窗展覽會報名方式
2024第18屆中國（深圳）國際物流與供應(yīng)鏈博覽會（物博會 CILF）
俄羅斯莫斯科國際泵閥展會PCVEXPO
2024年世界生命科學(xué)大會暨北京國際生命健康產(chǎn)業(yè)博覽會
2024北京國際進出口食品及餐飲供應(yīng)鏈博覽會
2024中國義烏國際酒店用品及餐飲業(yè)博覽會
2024第27屆江蘇國際醫(yī)療器械展覽會（江蘇醫(yī)博會 Medical Jiangsu）
2024中國中部（鄭州）食品加工與包裝機械展覽會
2024中國中部（鄭州）包裝產(chǎn)業(yè)博覽會
2024中國（南通）家紡行業(yè)展暨電商新渠道選品會
2024第六屆南京國際樂器業(yè)展覽會
2024中國 (安徽)國際煤炭裝備及礦山設(shè)備博覽會暨2024安徽煤博會
2024中國（銀川）茶業(yè)博覽會
2024中國國際機電產(chǎn)品交易會暨先進制造業(yè)博覽會
2024第八屆絲綢之路博覽會暨中國東西部合作與投資貿(mào)易洽談會（絲博會）
2024年第27屆巴西圣保羅游艇展
2024第27屆中國國際衡器展覽會

展開

熱門欄目HotCates

關(guān)于我們

人工智能實驗室（AiLab：Artificial Intelligence Laboratory）中國人工智能領(lǐng)域的專業(yè)媒體平臺，始于2010年的中國AI創(chuàng)業(yè)先行者，專注人工智能、機器人、無人駕駛、可穿戴、模式識別、物聯(lián)網(wǎng)、云計算等新興技術(shù)信息資訊，是人工智能愛好者學(xué)習(xí)和交流平臺，是一群夢想者與實踐者的網(wǎng)絡(luò)家園！

版權(quán)聲明

本站部分文章來源于互聯(lián)網(wǎng)以及網(wǎng)友投稿，本站只負(fù)責(zé)對文章進行整理、排版、編輯，是出于知識傳遞之目的，并不意味著贊同其觀點或證實其內(nèi)容的真實性。如果您有什么意見或建議，請聯(lián)系E-mail：kefu#dcy13.com(將#換成@)！

Copyright © 2010-2024 AiLab Team. 人工智能實驗室版權(quán)所有關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港

<label id="e1jub"></label>

<li id="e1jub"><legend id="e1jub"><ruby id="e1jub"></ruby></legend></li>