11月1日,2024四川網(wǎng)信“數(shù)智領(lǐng)航”第十四期川網(wǎng)聯(lián)“走進新質(zhì)生產(chǎn)力前沿”系列活動暨第十屆生物醫(yī)學(xué)大數(shù)據(jù)智能技術(shù)會議在成都舉行。會上,中國科學(xué)院院士、中國科學(xué)院生物物理研究所研究員陳潤生接受了封面新聞記者的專訪。
中國科學(xué)院院士、中國科學(xué)院生物物理研究所研究員陳潤生
陳潤生是我國最早從事理論生物學(xué)和生物信息學(xué)研究的科研人員之一,是以基因組為研究對象進行生物信息學(xué)研究的先行者。此次采訪中,他闡述了自己對人工智能與生物信息的深度思考與見解。
AI在生物醫(yī)藥的應(yīng)用還在早期階段
人工智能大模型和生物醫(yī)學(xué)大數(shù)據(jù)之間的淵源已久。陳潤生提到,人工智能最早應(yīng)用在醫(yī)療領(lǐng)域的是病案管理,基本信息的記錄包括電子病歷的管理,這些流程都實現(xiàn)了自動化!叭斯ぶ悄懿粌H僅是讓醫(yī)療管理更方便,實際上整個過程中也在積累多層次大數(shù)據(jù),這些內(nèi)容可以分析出一些規(guī)律。比如過去一個新藥的發(fā)現(xiàn),往往要篩選上萬個點,用十年時間投資10億美金,現(xiàn)在用了大模型可以大大縮減流程!
陳潤生看到,特別是今年很多獎項,包括諾貝爾物理學(xué)獎、化學(xué)獎,都授予了人工智能大模型領(lǐng)域,他認為這是極端少見的,所以可以充分體會到大模型的震撼和深遠的社會影響。
那么大模型到底對社會帶來了哪些變革?陳潤生認為最典型的兩點是解決了自然語言的處理和實現(xiàn)了多模態(tài)的融合。“比如我們生物醫(yī)學(xué)用的組學(xué)大數(shù)據(jù),包括基因組、轉(zhuǎn)錄組、蛋白組、代謝組、表觀組,再加上醫(yī)學(xué)當中各種各樣的生理生化指標,包括心電、腦電和影像學(xué)資料,每一個的基本標準都不一樣,怎么融合?從現(xiàn)在看來建模是不現(xiàn)實的,大模型給我們提出了一個非常好的場所!
但總的來說,陳潤生認為大模型在各個行業(yè)的應(yīng)用還需要一個漫長的路程,目前AI在生物醫(yī)藥的應(yīng)用還處在早期階段。
構(gòu)造專業(yè)大模型是一條更敏捷的路
當下,大模型成為兵家必爭之地。但是大模型怎么構(gòu)造?陳潤生指出了一條“更敏捷的路”。
他提到,因普適大模型建造成本非常高,所以更好的辦法是建造一個行業(yè)大模型。“選擇一個在國際上公開發(fā)表的并合適的足夠前沿的大模型,把它拷貝過來作為大模型的基底,保證你的大模型具有國際水平。然后把你自己收集的數(shù)據(jù),建立的技術(shù)方法,加載到這個基底上,就建成了具有國際水平又有自身特色的行業(yè)大模型,實際行業(yè)大模型還可以分層再細化!
那么在行業(yè)大模型的發(fā)展中還有哪些問題急需解決?陳潤生告訴記者,一個是數(shù)據(jù)的標準化,另一個是數(shù)據(jù)的整合。他指出,行業(yè)內(nèi)的很多數(shù)據(jù)標準化不同,此外很多數(shù)據(jù)不透明,數(shù)據(jù)整合是應(yīng)用者的訴求也是管理部門需要協(xié)調(diào)的。實際上,依靠醫(yī)學(xué)數(shù)據(jù),能夠讓大模型發(fā)揮更好的作用。
“面向未來的發(fā)展中,大模型并不僅僅是提供了一個輔助工具,更重要的是大模型出現(xiàn)了所謂的涌現(xiàn)、頓悟和幻覺!标悵櫳硎,當大模型系統(tǒng)達到一定程度之后,它會產(chǎn)生新的智能,人工智能能否超過人類智能?這又成為一個深刻的科學(xué)問題。
封面新聞記者 朱珠