展會信息港展會大全

英特爾開源 NPU 加速庫,方便使開發(fā)人員優(yōu)化其 AI 應用
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-04 14:53:49   瀏覽:4220次  

導讀:IT之家 3 月 3 日消息,@Tony Mongkolsmai 發(fā)現(xiàn),英特爾已經(jīng)在 GitHub 上開源了其 NPU 加速庫,支持 Windows 和 Linux。 開發(fā)人員可以按照相應文檔對其軟件進行優(yōu)化,從而適配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。 根據(jù)官方描述:英特爾 NPU 加速...

IT之家 3 月 3 日消息,@Tony Mongkolsmai 發(fā)現(xiàn),英特爾已經(jīng)在 GitHub 上開源了其 NPU 加速庫,支持 Windows 和 Linux。

開發(fā)人員可以按照相應文檔對其軟件進行優(yōu)化,從而適配新一代 AI 模型,包括TinyLlama 和 Gemma-2b-it。

根據(jù)官方描述:英特爾 NPU 加速庫是一個 Python 庫,旨在利用英特爾神經(jīng)處理單元 (NPU) 的強大性能在兼容硬件上執(zhí)行高速計算,從而提高應用的效率。

英特爾還表示其 NPU 加速庫目前不斷開發(fā)中,后續(xù)將推出各種能顯著提高性能的功能,截至IT之家發(fā)稿已經(jīng)實現(xiàn)了 8bit 量化、Float16 支持、torch.compile 支持等,后續(xù)還將支持 NPU / GPU 異構計算等功能。

贊助本站

人工智能實驗室
相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港