展會(huì)信息港展會(huì)大全

可令 AI 自我判斷輸出內(nèi)容正確性,谷歌公布模型訓(xùn)練框架 ASPIRE
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-23 17:57:23   瀏覽:6610次  

導(dǎo)讀:IT之家 1 月 23 日消息,谷歌日前發(fā)布新聞稿,介紹了一款專為大語言模型設(shè)計(jì)的 ASPIRE 訓(xùn)練框架,該框架號(hào)稱可以增強(qiáng) AI 模型的選擇性預(yù)測(cè)能力。 谷歌提到,當(dāng)下大語言模型在自然語言理解和生成內(nèi)容方面發(fā)展迅速,已被用于構(gòu)建各種創(chuàng)新應(yīng)用,但要應(yīng)用于高風(fēng)...

IT之家 1 月 23 日消息,谷歌日前發(fā)布新聞稿,介紹了一款專為大語言模型設(shè)計(jì)的 ASPIRE 訓(xùn)練框架,該框架號(hào)稱可以增強(qiáng) AI 模型的選擇性預(yù)測(cè)能力。

谷歌提到,當(dāng)下大語言模型在自然語言理解和生成內(nèi)容方面發(fā)展迅速,已被用于構(gòu)建各種創(chuàng)新應(yīng)用,但要應(yīng)用于高風(fēng)險(xiǎn)決策類場(chǎng)合依然不妥。這是由于模型預(yù)測(cè)具有不確定性及“幻覺”可能,因此谷歌開發(fā)了一款 ASPIRE 訓(xùn)練框架,為系列模型引入了“可信度”機(jī)制,即 模型會(huì)輸出一系列答案,每個(gè)答案都會(huì)具有正確概率評(píng)分。

▲ 圖源 谷歌新聞稿(下同)

在技術(shù)層面,IT之家注意到該訓(xùn)練框架主要分為三階段,分別為“特定任務(wù)調(diào)整”、“答案采樣”和“自我評(píng)估學(xué)習(xí)”。

其中“特定任務(wù)調(diào)整”階段是對(duì)已接受過基礎(chǔ)訓(xùn)練的大型語言模型進(jìn)行深入訓(xùn)練,專注于強(qiáng)化模型的預(yù)測(cè)能力。研究人員主要為模型引入一系列可調(diào)參數(shù),在特定任務(wù)的訓(xùn)練數(shù)據(jù)集上微調(diào)預(yù)訓(xùn)練語言模型,從而提升模型預(yù)測(cè)性能,讓模型能夠更好地解決特定問題。

第二階段為“答案采樣”,經(jīng)過特定微調(diào)后,模型可以利用先前學(xué)習(xí)到的可調(diào)參數(shù),為每個(gè)訓(xùn)練問題生成不同的答案,并創(chuàng)建用于自我評(píng)估學(xué)習(xí)的數(shù)據(jù)集,生成一系列可信度較高的答案。研究人員同時(shí)使用“集束搜索(Beam Search)”方法及 Rouge-L 算法來評(píng)估答案的質(zhì)量,并將生成的答案及評(píng)分重新輸入給模型開啟第三階段。

而在第三階段“自我評(píng)估學(xué)習(xí)”中,研究人員為模型添加一組可調(diào)參數(shù),專門用于提升模型自我評(píng)估能力。該階段的目標(biāo)是讓模型學(xué)會(huì)“自己判斷輸出的答案準(zhǔn)確性”,從而讓大語言模型在生成答案時(shí),還會(huì)附上答案的正確概率評(píng)分。

谷歌研究人員使用 CoQA、TriviaQA 和 SQuAD 三個(gè)問答數(shù)據(jù)集來驗(yàn)證 ASPIRE 訓(xùn)練框架的成果,據(jù)稱“經(jīng)過 ASPIRE 調(diào)整的 OPT-2.7B 小模型,表現(xiàn)遠(yuǎn)超更大的 OPT-30B 模型”。而這項(xiàng)實(shí)驗(yàn)結(jié)果也同時(shí)表明,只要經(jīng)過適當(dāng)?shù)恼{(diào)整,即使是小語言模型,在部分場(chǎng)景下也可以超越大語言模型。

研究人員總結(jié)稱,ASPIRE 框架訓(xùn)練能夠顯著提升大語言模型輸出準(zhǔn)確率,即使是較小的模型,也可以在經(jīng)過微調(diào)后進(jìn)行“準(zhǔn)確且有自信”的預(yù)測(cè)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港