IT之家 10 月 26 日消息,谷歌公司于 10 月 24 日發(fā)布博文,宣布推出 SAIF 風(fēng)險(xiǎn)評(píng)估工具,旨在幫助人工智能開發(fā)者和組織評(píng)估其安全態(tài)勢(shì),識(shí)別潛在風(fēng)險(xiǎn),并實(shí)施更強(qiáng)的安全措施。
SAIF 簡(jiǎn)介IT之家注:谷歌去年發(fā)布了安全人工智能框架(SAIF),旨在幫助用戶安全、負(fù)責(zé)任地部署 AI 模型,SAIF 不僅分享了最佳實(shí)踐,還為行業(yè)提供了一個(gè)安全設(shè)計(jì)的框架。
為了推廣這一框架,谷歌與行業(yè)伙伴共同成立了安全人工智能聯(lián)盟(CoSAI),以推動(dòng)關(guān)鍵的 AI 安全措施。
SAIF 風(fēng)險(xiǎn)評(píng)估工具谷歌目前已經(jīng)在新網(wǎng)站 SAIF.Google 上提供 SAIF 風(fēng)險(xiǎn)評(píng)估工具,該工具以問(wèn)卷形式運(yùn)行,用戶回答后會(huì)生成定制化的檢查清單,指導(dǎo)他們確保 AI 系統(tǒng)的安全。
工具涵蓋多個(gè)主題,包括:
AI 系統(tǒng)的訓(xùn)練、調(diào)優(yōu)和評(píng)估
對(duì)模型和數(shù)據(jù)集的訪問(wèn)控制
防止攻擊和對(duì)抗性輸入
生成性 AI 的安全設(shè)計(jì)與編碼框架
用戶在回答問(wèn)題后,工具會(huì)立即生成一份報(bào)告,突出 AI 系統(tǒng)面臨的具體風(fēng)險(xiǎn),如數(shù)據(jù)中毒、提示注入和模型源篡改等。
每個(gè)風(fēng)險(xiǎn)都附有詳細(xì)解釋及建議的緩解措施,此外用戶還可以通過(guò)互動(dòng) SAIF 風(fēng)險(xiǎn)地圖了解在 AI 開發(fā)過(guò)程中如何引入與緩解不同的安全風(fēng)險(xiǎn)。