“對于罕見病患者而言,有藥可用永遠都是第一位的。”
中國國際經(jīng)濟交流中心理事長畢井泉曾于 2022 年這樣說。
罕見病,顧名思義,是患病相對較低的一類疾玻由于患病人數(shù)少、市場需求小,以及藥物研發(fā)難度大、成本高、周期長,罕見病治療難度居高不下,罕見病用藥更被稱為“孤兒藥”。絕大多數(shù)罕見病患者都面臨著治療困難、藥物短缺的問題。
據(jù)世界衛(wèi)生組織(WHO)報道,在全球發(fā)現(xiàn)的超過 7000 種的罕見病中,有獲批的相應(yīng)治療方案或藥物的病種不到10%,且大多需要終身藥物治療。在這一嚴峻背景下,如何為罕見病尋求有效治療藥物是緩解罕見病患者治療困境的關(guān)鍵一步。
這一步,在人工智能(AI)的幫助下有望向前邁出“一小步”。
日前,來自哈佛醫(yī)學院的研究團隊及其合作者開發(fā)了一個名為 TxGNN 的 AI 模型,這是首個專門為識別罕見疾病和無藥可治病癥的候選藥物而開發(fā)的新辦法,它從現(xiàn)有藥物中確定了 17000 多種疾病的候選藥物,其中許多疾病沒有任何現(xiàn)有治療方法。與用于藥物再利用的同類 AI 模型相比,TxGNN 在識別候選藥物方面平均提高了近 50%,在預(yù)測哪些藥物會有禁忌癥方面,準確率也高出 35%。
相關(guān)研究論文以“A foundation model for clinician-centered drug repurposing”為題,已發(fā)表在Nature子刊Nature Medicine上。
AI 如何促進藥物再利用?
傳統(tǒng)的藥物再利用(drug repurposing)策略,雖然利用現(xiàn)有藥物的安全性和有效性數(shù)據(jù),可以加快新藥物在臨床中的應(yīng)用,但這種方法往往是偶然的且機會性較強,很難系統(tǒng)地解決罕見病的藥物研發(fā)問題。
在這種背景下,TxGNN 應(yīng)運而生,為藥物重新利用帶來了革命性的突破,特別是在罕見病藥物發(fā)現(xiàn)中展現(xiàn)出巨大的潛力。
TxGNN 是一種基于圖神經(jīng)網(wǎng)絡(luò)(GNN)的基礎(chǔ)模型,專門用于零樣本藥物再利用。與傳統(tǒng)方法不同,TxGNN 并不局限于現(xiàn)有藥物和疾病的已知關(guān)系,而是通過訓練一個醫(yī)學知識圖譜(KG),將疾病和藥物之間的復(fù)雜關(guān)系嵌入到一個潛在的表示空間中,從而能夠針對任何給定的疾病預(yù)測潛在的治療藥物。該知識圖譜包含了 17080 種疾并7957 種藥物、27671 種蛋白質(zhì)等醫(yī)學概念,為 TxGNN 的訓練提供了豐富的數(shù)據(jù)基矗
圖|TxGNN 是藥物再利用的圖基礎(chǔ)模型,可為治療選擇有限且分子數(shù)據(jù)有限的疾病確定候選藥物。(來源:該論文)
在多次實驗中,TxGNN 展現(xiàn)出了其強大的預(yù)測能力。與 8 種現(xiàn)有的方法進行對比,TxGNN 在零樣本環(huán)境下表現(xiàn)出了顯著的優(yōu)勢。根據(jù)論文中的實驗數(shù)據(jù),TxGNN 在藥物指征預(yù)測的準確率上提高了 19%,在副作用預(yù)測上提高了 23.9%。
這些結(jié)果表明,TxGNN 不僅能夠在現(xiàn)有治療方案中找到潛在的新用途,更能夠在沒有已知治療方案的情況下,準確地預(yù)測出可的藥物。這對于罕見病的治療具有重要意義,因為罕見病中超過 95% 沒有現(xiàn)有的治療藥物,而 TxGNN 為這些疾病快速發(fā)現(xiàn)新藥物創(chuàng)造了可能性。
圖|TxGNN 可準確預(yù)測藥物適應(yīng)癥和禁忌癥。(來源:該論文)
除了預(yù)測能力,TxGNN 還特別設(shè)計了一個解釋模塊,用于幫助醫(yī)生和研究人員理解模型的預(yù)測邏輯。這個模塊通過多跳路徑(multi-hop paths),展示了藥物與疾病之間的潛在聯(lián)系。
解釋模塊不僅能夠指出某種藥物為何對特定疾病可能有效,還能提供詳細的醫(yī)學知識路徑,讓使用者能夠追溯到預(yù)測背后的科學依據(jù)。通過這項功能,TxGNN 克服了許多 AI 模型在醫(yī)學應(yīng)用中的“黑箱問題”,大大提高了模型的可解釋性和信任度。
圖|TxGNN Explainer 中多跳可解釋路徑的開發(fā)、可視化和評估。(來源:該論文)
研究團隊對 TxGNN 在罕見病藥物發(fā)現(xiàn)中的實際應(yīng)用進行了驗證,并取得了令人鼓舞的成果。在實驗中,TxGNN 的許多預(yù)測與實際的臨床非處方藥物使用具有高度一致性。
例如,在對 1272085 名患者的電子病歷數(shù)據(jù)分析中,研究人員發(fā)現(xiàn),TxGNN 預(yù)測的頂級藥物在這些患者群體中的使用頻率顯著高于隨機預(yù)測。log(OR)(共現(xiàn)比值)的分析顯示,TxGNN 預(yù)測出的藥物與罕見病的使用關(guān)聯(lián)性比底層藥物預(yù)測高出 107%,進一步證明了該模型在實際臨床環(huán)境中的有效性。
圖|在大型醫(yī)療系統(tǒng)中評估 TxGNN 的預(yù)測結(jié)果。(來源:該論文)
一個具體的案例是,TxGNN 在預(yù)測 Wilson 。ㄒ环N導(dǎo)致銅代謝異常的罕見病)的潛在治療藥物時,推薦了去鐵酮(Deferasirox)作為最有前途的候選藥物。該藥物在臨床中已被用于治療鐵超載疾病,TxGNN 通過其解釋模塊展示了去鐵酮可能通過代謝途徑對 Wilson 病的治療產(chǎn)生積極作用。這一預(yù)測也與醫(yī)學文獻中的相關(guān)研究結(jié)果相符,顯示了該模型的科學合理性。
在當前藥物開發(fā)周期漫長、成本高昂的背景下,TxGNN 為現(xiàn)有藥物的重新利用提供了系統(tǒng)化的解決方案。
未來,隨著這一技術(shù)的不斷完善,它有望成為加速藥物開發(fā)、特別是使罕見病患者“有藥可用”的關(guān)鍵驅(qū)動力。
在醫(yī)學領(lǐng)域,AI 大有可為
除罕見病領(lǐng)域,AI 在其他醫(yī)學領(lǐng)域也有著廣泛的應(yīng)用。
2019 年 9 月,AI 藥物研發(fā)公司 Insilico Medicine 開發(fā)了一個名為 GENTRL 的生成式 AI 平臺,該平臺已用于設(shè)計用于治療纖維化和癌癥等疾病的新藥。通過使用 GENTRL,研究人員僅使用 21 天就發(fā)現(xiàn)了盤狀蛋白結(jié)構(gòu)域受體 1 (DDR1) 的強效抑制劑,極大縮短了藥物發(fā)現(xiàn)時間。
2022 年,倫敦癌癥研究所的研究人員創(chuàng)建了一個原型測試,可以在 24-48 小時內(nèi)預(yù)測哪些藥物組合可能對癌癥患者有效。他們使用 AI 分析來自腫瘤樣本的大規(guī)模數(shù)據(jù),可以比目前的方法更準確地預(yù)測患者對藥物的反應(yīng)。
2023 年,美國公司 Nuance Communications 推出一款新型 AI 驅(qū)動的語音激活軟件應(yīng)用程序Dragon Ambient Experience (DAX) Express。該計劃旨在通過利用自然語言處理技術(shù),促進患者咨詢期間醫(yī)療記錄的實時轉(zhuǎn)錄,有效幫助減輕臨床醫(yī)生的管理負擔。
2024 年,來自哈佛醫(yī)學院的研究團隊及其合作者提出了臨床組織病理學成像評估基礎(chǔ)(CHIEF)模型,用于提取病理成像特征以進行系統(tǒng)的癌癥評估。在包含 11 種癌癥類型的 15 個數(shù)據(jù)集上,CHIEF 在癌癥檢測方面實現(xiàn)了近 94% 的準確率,顯著優(yōu)于之前的 AI 方法。
毋庸置疑,AI 在改善罕見疾病檢測、藥物再利用以及臨床流程優(yōu)化方面的潛力將會越來越大,能夠更好地幫助我們更好抗擊疾玻