展會(huì)信息港展會(huì)大全

微軟推出 LLaVA-Med AI 模型,可對(duì)醫(yī)學(xué)病理案例進(jìn)行分析
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-15 20:08:46   瀏覽:6459次  

導(dǎo)讀:IT之家 6 月 14 日消息,日前微軟研究人員展示了 LLaVA-Med 模型,該模型主要用于生物醫(yī)學(xué)方面的研究,可根據(jù) CT、X 光圖片等推測出患者的病理狀況。 據(jù)悉,微軟研究人員與一批醫(yī)院合作,獲得了使用生物醫(yī)學(xué)圖像文本對(duì)應(yīng)大型數(shù)據(jù)集來訓(xùn)練多模態(tài) AI 模型。該...

IT之家 6 月 14 日消息,日前微軟研究人員展示了 LLaVA-Med 模型,該模型主要用于生物醫(yī)學(xué)方面的研究,可根據(jù) CT、X 光圖片等推測出患者的病理狀況。

據(jù)悉,微軟研究人員與一批醫(yī)院合作,獲得了使用生物醫(yī)學(xué)圖像文本對(duì)應(yīng)大型數(shù)據(jù)集來訓(xùn)練多模態(tài) AI 模型。該數(shù)據(jù)集包括胸部 X 光、MRI、組織學(xué)、病理學(xué)和 CT 圖像等,覆蓋范圍相對(duì)全面。

▲ 圖源 微軟

微軟使用 GPT-4,基于 Vision Transformer 和 Vicuna 語言模型,在八個(gè)英偉達(dá) A100 GPU 上對(duì) LLaVA-Med 進(jìn)行訓(xùn)練,其中包含“每個(gè)圖像的所有預(yù)分析信息”,用于生成有關(guān)圖像的問答,以滿足“可自然語言回答有關(guān)生物醫(yī)學(xué)圖像問題”的助手愿景。

在學(xué)習(xí)過程中,模型主要圍繞“描述此類圖像的內(nèi)容”以及“闡述生物醫(yī)學(xué)概念(IT之家注:從圖片中判斷是什么樣的)”而展開。據(jù)微軟稱,該模型最終具有“出色的多模式對(duì)話能力”、“在用于回答視覺問題的三個(gè)標(biāo)準(zhǔn)生物醫(yī)學(xué)數(shù)據(jù)集上,LLaVA-Med 在部分指標(biāo)上領(lǐng)先于業(yè)界其他先進(jìn)模型”。

▲ 圖源 微軟

研究團(tuán)隊(duì)表示:“雖然我們認(rèn)為 LLaVA-Med 模型代表了朝著構(gòu)建有用的生物醫(yī)學(xué)視覺助手邁出的重要一步,但當(dāng)下 LLaVA-Med 模型還存在一定的不足之處,即大模型常見的虛假舉例和準(zhǔn)確度不佳的問題,研究團(tuán)隊(duì)未來將側(cè)重于提高模型的質(zhì)量和可靠性,以令模型有朝一日可以在商業(yè)生物醫(yī)學(xué)中應(yīng)用。”

IT之家注意到,目前該模型已經(jīng)開源,大家可以在 GitHub 找到相關(guān)信息。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港