展會(huì)信息港展會(huì)大全

AI生物計(jì)算:用“千里眼”和“無影手”助力創(chuàng)新藥研發(fā)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-22 17:47:54   瀏覽:7717次  

導(dǎo)讀:記者/李晶晶 編輯/計(jì)巍 9月12日,百度在北京發(fā)布其十大科技前沿發(fā)明 除了與ChatGPT對(duì)話,AI已經(jīng)從我們?nèi)粘5纳钪醒由斓礁h(yuǎn)AI生物計(jì)算,它可以識(shí)別蛋白大分子小分子化合物,為創(chuàng)新藥的研發(fā)裝上引擎,讓科研人員的雙手從重復(fù)的勞動(dòng)中解放出來。 百度AI生物...

記者/李晶晶

編輯/計(jì)巍

9月12日,百度在北京發(fā)布其十大科技前沿發(fā)明

除了與ChatGPT對(duì)話,AI已經(jīng)從我們?nèi)粘5纳钪醒由斓礁h(yuǎn)AI生物計(jì)算,它可以識(shí)別“蛋白大分子”“小分子化合物”,為創(chuàng)新藥的研發(fā)裝上引擎,讓科研人員的雙手從重復(fù)的勞動(dòng)中解放出來。

百度AI生物計(jì)算團(tuán)隊(duì)三年前開始從計(jì)算機(jī)領(lǐng)域跨界到生物醫(yī)藥,助力國(guó)產(chǎn)創(chuàng)新藥物的研發(fā)。

你可以想象一個(gè)場(chǎng)景,在藥物分子的海洋中,海量的、令人眼花繚亂的分子化合物從你眼前倏忽而過,似乎都長(zhǎng)得一模一樣,而你需要一一去辨別、去“貼上”它們,看看能不能和你起反應(yīng),這是傳統(tǒng)的生物實(shí)驗(yàn)。

而AI算法就像“千里眼”,可以迅速對(duì)藥物分子的物理、化學(xué)、藥學(xué)性質(zhì)的表征進(jìn)行篩選歸類、推斷其空間結(jié)構(gòu);自動(dòng)化則是“無影手”,在算法指導(dǎo)下進(jìn)行標(biāo)準(zhǔn)化、無間斷的實(shí)驗(yàn)操作與數(shù)據(jù)采集,為AI模型的優(yōu)化提供數(shù)據(jù)反潰

生物計(jì)算,這是一個(gè)“坑”

“我這里有個(gè)大坑,你要不要接一下。”三年前,剛得知要挑起百度AI生物計(jì)算研究的重任時(shí),張肖男和團(tuán)隊(duì)就被領(lǐng)導(dǎo)說的話來了個(gè)下馬威。當(dāng)時(shí)她還在做關(guān)于機(jī)器語(yǔ)言學(xué)習(xí)方面的工作,雖然也不能停止學(xué)習(xí),但還算熟門熟路得心應(yīng)手,在得知要步入一個(gè)全新的領(lǐng)域從零開始時(shí),她幾乎是“硬著頭皮上的”。

在生物領(lǐng)域,她和團(tuán)隊(duì)技術(shù)負(fù)責(zé)人都算得上是“小白”,經(jīng)常被提及的“小分子化合物”,也是看了書才了解它真正的定義。在百度工作十多年,這一次,她和團(tuán)隊(duì)又要重新做回學(xué)生了!端幬锇l(fā)現(xiàn)與設(shè)計(jì)》《新藥藥理學(xué)研究方法》等書是那時(shí)生物計(jì)算團(tuán)隊(duì)桌子上擺的最多的書。

2020年正值新冠疫情爆發(fā)的年份,對(duì)于藥物研制有著迫切的需求,AI在生命科學(xué)領(lǐng)域的應(yīng)用也有了一些新進(jìn)展,如谷歌AlphaFold2的出現(xiàn),這也加速了人工智能技術(shù)在生命科學(xué)領(lǐng)域的落地。但在中國(guó),關(guān)于此方面的探究還處于早期階段。

“在中國(guó),藥物研發(fā)是一個(gè)容易被歐美卡脖子的領(lǐng)域。”張肖男不無感慨地說,那時(shí),她和團(tuán)隊(duì)頻繁往返于全國(guó)各地的藥企做調(diào)研,了解國(guó)內(nèi)藥企的痛點(diǎn)和實(shí)際需求。

仿制是制藥產(chǎn)業(yè)中被允許的普遍做法,當(dāng)創(chuàng)新藥(即原研藥)20年專利有效期到期后,其他藥企即可使用藥物的化學(xué)合成物專利,自行開發(fā)配方工藝并合法生產(chǎn)仿制藥。國(guó)內(nèi)醫(yī)藥市場(chǎng)八成以上為仿制藥,而仿制藥資金投入的一大部分都不在研發(fā)而在營(yíng)銷怎么和其他仿制藥企進(jìn)行價(jià)格廝殺、維護(hù)和醫(yī)院的關(guān)系以博得進(jìn)入藥品展臺(tái)的機(jī)會(huì)。

創(chuàng)新藥歷來有“十年時(shí)間加十億美金”的說法,新藥研發(fā)周期漫長(zhǎng)、成本高的特點(diǎn)讓很多藥企望而卻步。但創(chuàng)新藥也有更廣袤的市常創(chuàng)新藥投入高、研發(fā)周期長(zhǎng)、失敗率高,但是產(chǎn)品一旦研發(fā)成功確實(shí)能夠解決臨床問題,帶來的回報(bào)也非?捎^。

總要有人來做創(chuàng)新的事,這不僅需要藥企的努力,也需要科技的助力。周期漫長(zhǎng),那就想辦法縮短研制的周期,減少實(shí)驗(yàn)人員的重復(fù)性工作;成本高昂,那就盡力在計(jì)算機(jī)模擬的階段找到更合適的分子,讓藥企在分子采買階段就能省下錢來,而AI就可以完成這件事。

據(jù)張肖男了解,生物計(jì)算方面國(guó)內(nèi)外還有一定差距,這種差距更多體現(xiàn)在數(shù)據(jù)、人才、商業(yè)環(huán)境上。目前該領(lǐng)域大部分的公開數(shù)據(jù)集都來自國(guó)外的科研機(jī)構(gòu),國(guó)內(nèi)數(shù)據(jù)幾乎沒有。交叉人才的儲(chǔ)備上,懂AI也懂生物、藥學(xué)的國(guó)內(nèi)更是稀缺。受限于仿制藥工業(yè)等歷史原因,國(guó)內(nèi)藥企對(duì)創(chuàng)新藥的研發(fā)投入本就不高,愿意花在計(jì)算上的錢相比國(guó)外藥企就更低了。

張肖男在會(huì)議上交流

從“搜索”到“做藥”

以小分子為例,要找到一個(gè)候選藥物,理論上可檢索的化學(xué)空間達(dá)到10的60次方,傳統(tǒng)計(jì)算方法很難高效完成,且過程會(huì)略顯笨拙。實(shí)驗(yàn)人員要在一塊塊高通量的板子上面不斷地重復(fù)做實(shí)驗(yàn),可能要做很多塊板子才能找到一個(gè)兩個(gè)可以用的分子。但通過計(jì)算方法,可以快速定位到最有可能的候選分子,大大降低實(shí)驗(yàn)的數(shù)量。

但在剛開始什么都沒有時(shí),百度生物計(jì)算團(tuán)隊(duì)去拜訪客戶時(shí),很多時(shí)候是被藥企的資深專家們先進(jìn)行一番“靈魂拷問”:“百度不是做搜索的嗎?現(xiàn)在也開始做藥了?”“你們只懂AI是沒用的,領(lǐng)域的know how更重要。”

但隨著研發(fā)成果和成功案例的出現(xiàn),百度在生物計(jì)算上的技術(shù)實(shí)力和所提供的產(chǎn)品方案,逐漸得到了行業(yè)專家們的認(rèn)可。質(zhì)疑的聲音逐漸弱了,取而代之的是,更多合作的促成。

百度自主研發(fā)的文心生物計(jì)算大模型,其多個(gè)成果發(fā)表在國(guó)際頂級(jí)期刊和會(huì)議上。例如,在化合物屬性預(yù)測(cè)上,2022年在國(guó)際頂級(jí)期刊Nature子刊Nature Machine Intelligence上發(fā)表的HelixGEM,揭示了一種基于化合物三維幾何空間建模的新方法,能夠更準(zhǔn)確的預(yù)測(cè)化合物的屬性,提升虛擬篩選的精準(zhǔn)度。在RNA領(lǐng)域,百度自主研發(fā)的mRNA序列設(shè)計(jì)算法LinearDesign,發(fā)表于Nature雜志,旨在幫助設(shè)計(jì)出穩(wěn)定性更好、蛋白表達(dá)更優(yōu)的mRNA序列。而這僅僅是百度生物計(jì)算能力的冰山一角。

生物計(jì)算不僅要獲得科研層面的認(rèn)可,更重要的是獲得行業(yè)客戶的認(rèn)可,將領(lǐng)先的技術(shù)轉(zhuǎn)化為可落地的產(chǎn)品服務(wù),賦能產(chǎn)業(yè),而這也是百度生物計(jì)算團(tuán)隊(duì)的長(zhǎng)期愿景。目前,基于文心生物計(jì)算大模型和飛槳深度學(xué)習(xí)框架搭建的面向小分子、大分子和RNA的藥物設(shè)計(jì)平臺(tái)飛槳螺旋槳PaddleHelix,已經(jīng)幫助超過三十家合作伙伴,利用百度的生物計(jì)算大模型能力,找到并設(shè)計(jì)出活性更好、性質(zhì)更優(yōu)的候選藥物分子,從而大幅提升合作伙伴在新藥研發(fā)和疫苗設(shè)計(jì)上的效率,其中不乏很多國(guó)內(nèi)外的頭部藥企。

從開始的不被認(rèn)可,到現(xiàn)在的引領(lǐng)行業(yè),百度在試圖走出一條自己的路。

AI生物計(jì)算為創(chuàng)新藥的研發(fā)裝上引擎

變化與革新正在發(fā)生

全球老齡化加上氣候變化,人類需要應(yīng)對(duì)的醫(yī)學(xué)難題接踵而至,想要趕上變化的速度,就需要科技的助力;蛟S藥物的研發(fā)是一個(gè)愚公移山的過程,但可以想見的是,AI的助力是將這把鏟子變成了挖掘機(jī)。

9月12日,百度在北京發(fā)布了其十大科技前沿發(fā)明,生物計(jì)算團(tuán)隊(duì)的發(fā)明“數(shù)據(jù)和原理雙驅(qū)動(dòng)的生物計(jì)算大模型”也在其中。

百度專利事務(wù)部的崔玲玲介紹,入選的十大發(fā)明體現(xiàn)了百度多項(xiàng)國(guó)際前沿核心技術(shù)的實(shí)現(xiàn)與突破,涉及大模型、基于大模型的端到端搜索、飛槳、AI芯片、生成式檢索、內(nèi)容生成推薦技術(shù)、自動(dòng)駕駛決策系統(tǒng)、生物計(jì)算大模型、高性能量子芯片。

百度首席技術(shù)官王海峰表示,十大科技前沿發(fā)明是百度前沿創(chuàng)新成果的集中展現(xiàn),有超過70%的發(fā)明都涉及到大模型和重構(gòu)創(chuàng)新,我們用AI原生思維,踴躍創(chuàng)新AI原生應(yīng)用。

全球知識(shí)產(chǎn)權(quán)綜合信息服務(wù)提供商IPRdaily中文網(wǎng)今年4月份發(fā)布的《中國(guó)人工智能大模型企業(yè)發(fā)明專利排行榜》顯示,百度以602件大模型專利申請(qǐng)量排名第一,百度大模型專利的授權(quán)量也是第一名。

百度集團(tuán)資深副總裁、總法律顧問梁志祥表示,技術(shù)競(jìng)爭(zhēng)的背后是知識(shí)產(chǎn)權(quán)的競(jìng)爭(zhēng)。強(qiáng)大公司背后凝聚著一個(gè)強(qiáng)大技術(shù)團(tuán)隊(duì),強(qiáng)大技術(shù)團(tuán)隊(duì)背后凝聚著很多強(qiáng)大的專利。百度擁有充滿技術(shù)基因的強(qiáng)大技術(shù)團(tuán)隊(duì)和知識(shí)產(chǎn)權(quán)團(tuán)隊(duì),大模型技術(shù)和專利布局業(yè)界領(lǐng)先,為百度產(chǎn)品的領(lǐng)先提供了重要支撐。“這個(gè)世界在改變,這個(gè)世界在不斷革新,現(xiàn)在就是各類技術(shù)人員的時(shí)刻。”梁志祥感慨道。

【版權(quán)聲明】本作品的著作權(quán)等知識(shí)產(chǎn)權(quán)歸北京青年報(bào)【北青深一度】所有,未經(jīng)授權(quán),不得轉(zhuǎn)載。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港