展會(huì)信息港展會(huì)大全

人工智能輔助科研要從可用走向可信
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-04 12:12:43   瀏覽:5357次  

導(dǎo)讀:對(duì)于科研工作者來(lái)說(shuō),檢索、閱讀文獻(xiàn)是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。在大模型發(fā)展如火如荼的今天,以其為代表的人工智能正滲透進(jìn)人們工作生活的各個(gè)角落,科研領(lǐng)域也不例外。 日前,阿里巴巴發(fā)布了基于Transformer架構(gòu)自主研發(fā)的千億參數(shù)級(jí)夸克大模型。據(jù)介紹,該大...

對(duì)于科研工作者來(lái)說(shuō),檢索、閱讀文獻(xiàn)是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。在大模型發(fā)展如火如荼的今天,以其為代表的人工智能正滲透進(jìn)人們工作生活的各個(gè)角落,科研領(lǐng)域也不例外。

日前,阿里巴巴發(fā)布了基于Transformer架構(gòu)自主研發(fā)的千億參數(shù)級(jí)夸克大模型。據(jù)介紹,該大模型可用于科研資料收集、文獻(xiàn)快速閱讀與翻譯、創(chuàng)作潤(rùn)色等場(chǎng)景。

不僅是阿里巴巴,科大訊飛股份有限公司(以下簡(jiǎn)稱科大訊飛)、騰訊等企業(yè),也都推出了用于輔助科研的大模型產(chǎn)品。這一系列產(chǎn)品的問(wèn)世,正悄然改變著科研工作者的工作方式。

大模型已進(jìn)入科研領(lǐng)域

今年初,ChatGPT的走紅掀起了語(yǔ)言大模型熱潮。人們可以隨心所欲地提出問(wèn)題,大模型總會(huì)給出答案。這股風(fēng)很快也吹到了科研領(lǐng)域。ChatGPT發(fā)布后不久,一款名為txyz.ai的應(yīng)用插件在科研圈中受到追捧。

這是一款借助ChatGPT的強(qiáng)大理解能力,專門用來(lái)閱讀科研文獻(xiàn)的插件。用戶可以直接將論文全文上傳至該應(yīng)用,并提出相應(yīng)解讀要求,它便能夠以最快速度對(duì)用戶提出的問(wèn)題予以回答。

即使沒(méi)有下載論文全文也沒(méi)關(guān)系,txyz.ai支持對(duì)論文預(yù)印本網(wǎng)站進(jìn)行檢索。用戶可以只提供一個(gè)論文ID序號(hào),txyz.ai就會(huì)自動(dòng)檢索、學(xué)習(xí)該論文,并根據(jù)用戶需求給出回答。不僅如此,用戶還能以聊天的方式與其進(jìn)行對(duì)話,就論文中的內(nèi)容提出各種問(wèn)題。

視頻網(wǎng)站嗶哩嗶哩知名科普博主嚴(yán)伯鈞是txyz.ai的忠實(shí)用戶,他時(shí)常在各類科普視頻中使用txyz.ai來(lái)協(xié)助解讀論文。在他看來(lái),txyz.ai給出的論文解讀準(zhǔn)確率已經(jīng)非常高,具備很強(qiáng)的實(shí)際應(yīng)用價(jià)值,可以幫助科研工作者更加高效地檢索、閱讀文獻(xiàn)。

“txyz.ai無(wú)法解讀的情況當(dāng)然也會(huì)有。”嚴(yán)伯鈞表示,以他的使用經(jīng)驗(yàn)來(lái)看,向txyz.ai提出的問(wèn)題必須是一個(gè)能被回答的“有效問(wèn)題”,“如果問(wèn)題問(wèn)得太細(xì)、太深,或者過(guò)于刁鉆古怪,那么它就會(huì)直接告訴你,無(wú)法回答”。

但必須承認(rèn)的是,在大模型迅猛發(fā)展并逐漸進(jìn)入千行百業(yè)的今天,專門針對(duì)科研領(lǐng)域的大模型產(chǎn)品仍然不算多,且大多數(shù)是試驗(yàn)性質(zhì)的產(chǎn)品。

不久前,科大訊飛在發(fā)布最新版本的訊飛星火認(rèn)知大模型V3.0時(shí),也一口氣發(fā)布了12個(gè)面向行業(yè)的專用大模型。其中便有聯(lián)合中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心共同研發(fā)的、面向科研工作者的科技文獻(xiàn)大模型,以及基于該大模型的應(yīng)用產(chǎn)品星火科研助手。這也是國(guó)內(nèi)為數(shù)不多的專門為科研工作推出的大模型產(chǎn)品。目前,星火科研助手有成果調(diào)研、論文研讀、學(xué)術(shù)寫作三大功能。

浙江大學(xué)第一附屬醫(yī)院圖書館工作人員以“大語(yǔ)言模型”為關(guān)鍵詞對(duì)星火科研助手進(jìn)行了試用。在“成果調(diào)研”板塊,星火科研助手在檢索到的1251314篇文獻(xiàn)中遴選了167篇文章進(jìn)行分析,給出了關(guān)于大語(yǔ)言模型的概述。其還可以進(jìn)一步從遴選的167篇文章中勾選最多30篇文章,據(jù)此生成綜述。

星火科研助手的論文研讀功能則采用當(dāng)前大語(yǔ)言模型通用的問(wèn)答模式,可默認(rèn)生成論文摘要、方法、結(jié)論等主要信息;用戶也可以就自己關(guān)心的論文內(nèi)容進(jìn)行提問(wèn),科研助手會(huì)根據(jù)文章內(nèi)容進(jìn)行回答。其學(xué)術(shù)寫作功能則主要聚焦科研文章的翻譯與潤(rùn)色,目前支持中英文互譯,也可以對(duì)研究人員撰寫的英文文章進(jìn)行潤(rùn)色。

須保證內(nèi)容真實(shí)且專業(yè)

由于技術(shù)原因,大模型有時(shí)會(huì)出現(xiàn)編造信息、“一本正經(jīng)地胡說(shuō)八道”的現(xiàn)象。這種現(xiàn)象在業(yè)內(nèi)被稱為AI幻覺(jué)。生活中,人們?cè)诤痛竽P土奶鞎r(shí),如果出現(xiàn)了AI幻覺(jué),人們可能會(huì)一笑了之;但若AI幻覺(jué)出現(xiàn)在追求嚴(yán)謹(jǐn)精確的科研領(lǐng)域,后果可能就會(huì)很嚴(yán)重。

科大訊飛北京研究院執(zhí)行院長(zhǎng)、科技文獻(xiàn)大模型研發(fā)負(fù)責(zé)人伍大勇表示,研發(fā)科技文獻(xiàn)大模型,核心難點(diǎn)就在于保證其內(nèi)容的可信性和專業(yè)性。“一方面,這要依靠高質(zhì)量的論文數(shù)據(jù);另一方面,在模型預(yù)訓(xùn)練和監(jiān)督微調(diào)方面也需要下功夫。”伍大勇說(shuō)。

他介紹,科大訊飛通過(guò)與中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心合作,在合規(guī)的情況下獲取了豐富的科技文獻(xiàn)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行了去重、去噪等處理,以提升數(shù)據(jù)質(zhì)量。“星火科研助手采用中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心提供的論文接口來(lái)進(jìn)行論文檢索。此外,我們還使用了基于論文知識(shí)庫(kù)的檢索增強(qiáng)和知識(shí)增強(qiáng)策略。這些都使大模型生成的結(jié)果有據(jù)可依。”伍大勇表示,這些措施從技術(shù)上保證了星火科研助手回答結(jié)果的準(zhǔn)確性,也盡量避免了大模型出現(xiàn)AI幻覺(jué)。

同時(shí),伍大勇表示,針對(duì)科技文獻(xiàn)服務(wù)的各個(gè)場(chǎng)景,星火科研助手研發(fā)團(tuán)隊(duì)還邀請(qǐng)專業(yè)團(tuán)隊(duì),對(duì)大模型訓(xùn)練數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),以提升星火科研助手在科技文獻(xiàn)服務(wù)上的性能表現(xiàn)。“例如在成果調(diào)研和論文研讀功能上,我們采用大模型結(jié)合知識(shí)圖譜和知識(shí)庫(kù)的策略,以保證產(chǎn)品輸出的內(nèi)容有據(jù)可依。在學(xué)術(shù)寫作上,我們針對(duì)學(xué)術(shù)翻譯和學(xué)術(shù)英語(yǔ)潤(rùn)色專門進(jìn)行了大模型監(jiān)督微調(diào),以達(dá)到比通用翻譯和校對(duì)產(chǎn)品更強(qiáng)的專業(yè)性。”伍大勇說(shuō)。

或能激發(fā)科研工作者更多靈感

雖然目前尚未有太多人工智能產(chǎn)品被應(yīng)用于科研領(lǐng)域,但已有學(xué)者對(duì)人工智能進(jìn)軍科研提出了反對(duì)意見(jiàn),認(rèn)為這會(huì)讓科研工作者變得懶惰。在嚴(yán)伯鈞看來(lái),科研工作者在應(yīng)該“懶惰”的地方“懶惰”,反而可以節(jié)省出更多時(shí)間用在更有價(jià)值的工作上。

閱讀文獻(xiàn)前首先要進(jìn)行文獻(xiàn)檢索。為此,科研工作者往往需要搜尋大量文獻(xiàn),在此基礎(chǔ)上對(duì)部分感興趣的文獻(xiàn)進(jìn)行粗讀,以進(jìn)一步判斷哪些是自己真正需要的文獻(xiàn)。這是實(shí)打?qū)嵉?ldquo;體力活”。嚴(yán)伯鈞認(rèn)為,在這種情況下,借助人工智能工具幫助科研工作者跳過(guò)檢索、粗讀的過(guò)程,以更高效的方式直接找到需要的文獻(xiàn),可大幅提升科研工作者的文獻(xiàn)閱讀效率。

雖然可以借助大模型等工具來(lái)檢索閱讀文獻(xiàn),但嚴(yán)伯鈞也不否認(rèn)讀原文的價(jià)值。“原文當(dāng)然要讀,但并不一定是每篇都要讀。更加精準(zhǔn)地定位到需要的文獻(xiàn)后再進(jìn)行精讀,是更加高效的方式。”

伍大勇同樣表示,研發(fā)星火科研助手的初衷在于幫助用戶快速了解論文核心內(nèi)容,提高論文研讀效率,讓科研工作者能夠把更多精力花在更為重要的實(shí)驗(yàn)驗(yàn)證等工作上。“輔助提升科研效率是科技文獻(xiàn)大模型的關(guān)鍵和目標(biāo),但科研工作所需要的靈感、思路、邏輯推理、實(shí)驗(yàn)驗(yàn)證、創(chuàng)新與探索等仍離不開(kāi)科研工作者發(fā)揮主觀能動(dòng)性。”

事實(shí)上,除了能夠輔助閱讀文獻(xiàn),人工智能已經(jīng)在多個(gè)科學(xué)研究領(lǐng)域帶來(lái)實(shí)際成果。例如在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)方面,人工智能產(chǎn)生的成果已經(jīng)遠(yuǎn)超人類過(guò)去工作的總和。嚴(yán)伯鈞認(rèn)為,這種需要大量計(jì)算、反復(fù)試錯(cuò)的工作,正是人工智能的強(qiáng)項(xiàng),人類應(yīng)與其形成合理分工,擁抱新技術(shù)。

談及未來(lái)人工智能可能給科研工作帶來(lái)的改變,嚴(yán)伯鈞認(rèn)為,目前的文獻(xiàn)閱讀、翻譯潤(rùn)色等功能,可能只發(fā)揮了人工智能在科研工作領(lǐng)域潛力的1%。在他看來(lái),當(dāng)下科研發(fā)展正呈現(xiàn)出細(xì)分化的趨勢(shì),一位學(xué)者往往只深耕于某一科研領(lǐng)域,而人工智能的跨界思維模式未來(lái)或能給科研工作帶來(lái)一些改變。“或許人工智能可給科研工作者帶來(lái)更多跨領(lǐng)域、交叉學(xué)科的原創(chuàng)性啟發(fā),激發(fā)科研工作者更多想象力。”(記者 都)

來(lái)源:科技日?qǐng)?bào)

贊助本站

人工智能實(shí)驗(yàn)室
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港