展會信息港展會大全

當前位置：人工智能實驗室> 神經(jīng)網(wǎng)絡 > 研究人員推出 xLSTM 神經(jīng)網(wǎng)絡架構(gòu)，可同時處理所有 Token

研究人員推出 xLSTM 神經(jīng)網(wǎng)絡架構(gòu)，可同時處理所有 Token
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-05-13 14:53:30 瀏覽：2108次

導讀：IT之家 5 月 13 日消息，研究人員 Sepp Hochreiter 和 Jrgen Schmidhuber 在 1997 年共同提出了長短期記憶（Long short-term memory，LSTM）神經(jīng)網(wǎng)絡結(jié)構(gòu)，可用來解決循環(huán)神經(jīng)網(wǎng)絡（RNN）長期記憶能力不足的問題。而最近 Sepp Hochreiter 在arXiv上發(fā)布論文...

IT之家 5 月 13 日消息，研究人員 Sepp Hochreiter 和 Jürgen Schmidhuber 在 1997 年共同提出了長短期記憶（Long short-term memory，LSTM）神經(jīng)網(wǎng)絡結(jié)構(gòu)，可用來解決循環(huán)神經(jīng)網(wǎng)絡（RNN）長期記憶能力不足的問題。

而最近 Sepp Hochreiter 在arXiv上發(fā)布論文，提出了一種名為 xLSTM（Extended LSTM）的新架構(gòu)，號稱可以解決 LSTM 長期以來“只能按照時序處理信息”的“最大痛點”，從而“迎戰(zhàn)”目前廣受歡迎的 Transformer 架構(gòu)。

IT之家從論文中獲悉，Sepp Hochreiter 在新的 xLSTM 架構(gòu)中采用了指數(shù)型門控循環(huán)網(wǎng)絡，同時為神經(jīng)網(wǎng)絡結(jié)構(gòu)引入了“sLSTM”和“mLSTM”兩項記憶規(guī)則，從而允許相關神經(jīng)網(wǎng)絡結(jié)構(gòu)能夠有效地利用RAM，實現(xiàn)類 Transformer“可同時對所有 Token 進行處理”的并行化操作。

團隊使用了 150 億個 Token 訓練基于 xLSTM 及 Transformer 架構(gòu)的兩款模型進行測試，在評估后發(fā)現(xiàn) xLSTM 表現(xiàn)最好，尤其在“語言能力”方面最為突出，據(jù)此研究人員認為 xLSTM 未來有望能夠與 Transformer 進行“一戰(zhàn)”。

人工智能實驗室

相關熱詞： 研究人員推出 xLSTM 神經(jīng)網(wǎng)絡架構(gòu) 同時處理所有

上一篇：消息稱高通驍龍 8 Gen 4 芯片正進行重新設計，目標頻率4.26GHz

下一篇：Arm據(jù)稱將開發(fā)AI芯片計劃在2025年秋季開始量產(chǎn)

相關內(nèi)容

AiLab云推薦

最新資訊

本月熱點

熱門排行

存儲芯片年漲七成不算完：AI需求接棒，大廠持續(xù)加注

閱讀量：16558

最新！馬斯克腦機接口公司：首例人類腦機接口手術(shù)后，電極鑲釘螺紋發(fā)生脫落，設備無法正常工作

閱讀量：13368

美大選逼近！傳大陸芯片設計業(yè)計劃從臺積電轉(zhuǎn)單三星

閱讀量：12614

發(fā)布會攜M4芯片來襲，蘋果AI時代開啟？

閱讀量：12505

美國芯片制造業(yè)迎來歷史性投資，狂砸資金新建工廠

閱讀量：11984

馬斯克的腦機接口公司傳來壞消息：首試者植入物出故障了！

閱讀量：11381

推薦內(nèi)容

2024中國（銀川）茶業(yè)博覽會
2024第六屆南京國際樂器業(yè)展覽會
2024中國（南通）家紡行業(yè)展暨電商新渠道選品會
2024中國中部（鄭州）包裝產(chǎn)業(yè)博覽會
2024中國中部（鄭州）食品加工與包裝機械展覽會
2024第27屆江蘇國際醫(yī)療器械展覽會（江蘇醫(yī)博會 Medical Jiangsu）
2024中國義烏國際酒店用品及餐飲業(yè)博覽會
2024北京國際進出口食品及餐飲供應鏈博覽會
2024年世界生命科學大會暨北京國際生命健康產(chǎn)業(yè)博覽會
2024中國 (安徽)國際煤炭裝備及礦山設備博覽會暨2024安徽煤博會
2024第13屆中國臨沂國際木業(yè)博覽會
2024第十九屆中國（溫州）機械裝備展覽會
2024中國（溫州）緊固件產(chǎn)品博覽會
2024遛紙中國（沈陽）生活用紙及衛(wèi)生用品展覽會
2024新疆酒店與餐飲用品、廚房設備展
2024中國（新疆）“一帶一路”國際酒店與餐飲用品、廚房設備交易博覽會
2024第11屆鄭州水展
2024鴻威世界寵物博覽會
2024山東（濰坊）個體防護裝備產(chǎn)品交易會
2024河南省教育后勤博覽會
2024中國安徽國際塑料產(chǎn)業(yè)博覽會
2024常州國際新能源汽車產(chǎn)業(yè)博覽會
2024第二十三屆昆明國際花卉園藝展（昆明花展 IFEX）
2024重慶國際康復醫(yī)療及護理用品展覽會
2024年哈薩克斯坦阿拉木圖國際礦業(yè)與工程機械展覽會
2024第5屆華南日用百貨商品展覽會
2024中國諸暨國際易貨貿(mào)易博覽會
2024中國國際機電產(chǎn)品交易會暨先進制造業(yè)博覽會
2024第八屆絲綢之路博覽會暨中國東西部合作與投資貿(mào)易洽談會（絲博會）
2024常熟國際服裝面料及輔料展覽會
2024中國（臺州）國際汽車零配件及服務用品展覽會（臺州汽配展）
2024貴陽餐飲供應鏈展覽會、貴陽火鍋食材用品展覽會
2024第二十二屆中國國際橡膠技術(shù)展覽會（亞洲埃森輪胎展 REIFEN CHINA）
2024年貴州餐飲食品展覽會
2024第24屆上海國際廣告展第22屆上海國際LED展 2024上海國際數(shù)字標牌展（SIGN CHINA EXPO）
2024第二十七屆中國國際膠粘劑及密封劑展覽會 ASE CHINA 第19屆中國國際膠粘帶與薄膜展覽會 TF-EXPO CHINA
2024第二十一屆中國國際化工展覽會(ICIF China 2024)
2024第47屆（濟南）國際美業(yè)博覽會（CJBE ）
2024第5屆廈門全球跨境電商博覽會
2024中國（成都）國際低空經(jīng)濟大會暨無人機系統(tǒng)博覽會
2024秘魯廣告及數(shù)碼印花展覽會
2024年第27屆巴西圣保羅游艇展
2024第十九屆中國林產(chǎn)品交易會
2024馬來西亞暖通、制冷、通風、凈化、樓宇自控及電力展
2024年馬來西亞吉隆坡國際暖通空調(diào)制冷展
2024第27屆中國國際衡器展覽會

展開

熱門欄目HotCates

關于我們

人工智能實驗室（AiLab：Artificial Intelligence Laboratory）中國人工智能領域的專業(yè)媒體平臺，始于2010年的中國AI創(chuàng)業(yè)先行者，專注人工智能、機器人、無人駕駛、可穿戴、模式識別、物聯(lián)網(wǎng)、云計算等新興技術(shù)信息資訊，是人工智能愛好者學習和交流平臺，是一群夢想者與實踐者的網(wǎng)絡家園！

版權(quán)聲明

本站部分文章來源于互聯(lián)網(wǎng)以及網(wǎng)友投稿，本站只負責對文章進行整理、排版、編輯，是出于知識傳遞之目的，并不意味著贊同其觀點或證實其內(nèi)容的真實性。如果您有什么意見或建議，請聯(lián)系E-mail：kefu#www.dcy13.com(將#換成@)！

Copyright © 2010-2024 AiLab Team. 人工智能實驗室版權(quán)所有關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港