展會信息港展會大全

讓 AI 模型互相教學(xué),谷歌推出社會學(xué)習(xí)框架
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-03-11 15:59:17   瀏覽:7208次  

導(dǎo)讀:IT之家 3 月 11 日消息,谷歌近日公開了一項名為社會學(xué)習(xí)(Social Learning)的 AI 框架,該框架允許 AI語言模型能夠通過自然語言互相學(xué)習(xí),由于不需要直接交換敏感關(guān)鍵信息,因此訓(xùn)練出的 AI 模型更具隱私保護(hù)性。 據(jù)介紹,在這款社會學(xué)習(xí)框架中,學(xué)生模型...

IT之家 3 月 11 日消息,谷歌近日公開了一項名為“社會學(xué)習(xí)(Social Learning)”的 AI 框架,該框架允許 AI語言模型能夠通過自然語言互相學(xué)習(xí),由于不需要直接交換敏感關(guān)鍵信息,因此訓(xùn)練出的 AI 模型更具隱私保護(hù)性。

據(jù)介紹,在這款“社會學(xué)習(xí)框架”中,“學(xué)生模型”會向多個已知特定任務(wù)解法的“教師模型”學(xué)習(xí)各種問題的解決方案,研究人員設(shè)計了“垃圾短信檢測”、“解決小學(xué)數(shù)學(xué)問題”、“根據(jù)特定文字回答問題”等多項測試,來評估相關(guān)“社會學(xué)習(xí)”框架的成效。

研究人員表示,部分AI模型只經(jīng)過短暫的“社會學(xué)習(xí)”框架訓(xùn)練,便能夠能獲得良好的任務(wù)解決能力。在研究人員的“垃圾短信檢測任務(wù)”中,教師模型首先從用戶所標(biāo)記的數(shù)據(jù)學(xué)習(xí),而在教師獲得檢測垃圾信息知識后,便可以教會學(xué)生模型區(qū)分垃圾和非垃圾信息。

▲ 圖源 谷歌官方新聞稿

IT之家注意到,相關(guān)教師模型可以依據(jù)實際數(shù)據(jù)集,合成出新的范例與學(xué)生模型共享,合成數(shù)據(jù)集與原始數(shù)據(jù)完全不同,因此能在保證起到相同教育作用的同時,降低原始數(shù)據(jù)中隱私內(nèi)容泄露的可能性。

研究人員還嘗試了合成指令的方式,讓教師模型針對特定任務(wù)生成一系列指令,學(xué)生模型依據(jù)教師模型指令學(xué)習(xí)執(zhí)行任務(wù)的方式,有點(diǎn)類似“人類遵循他人口頭指令做事,并在執(zhí)行任務(wù)中掌握如何做事”。

而實驗證明,相關(guān)教師模型生成的指令能夠提高學(xué)生模型執(zhí)行任務(wù)的效率,相比于零樣本學(xué)習(xí),研究人員認(rèn)為,這顯示出AI模型在遵循指令方面的強(qiáng)大能力。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港