展會信息港展會大全

化身“安全黑客”找茬大模型,這個AI平臺將亮相人工智能大會
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-06 19:37:43   瀏覽:6177次  

導(dǎo)讀:AI安全檢測平臺蟻鑒2.0亮相世博展覽館H2館。本文圖片均由澎湃新聞記者俞凱 攝 7月5日,澎湃新聞(www.thepaper.cn)記者前往世博展覽館的2023世界人工智能大會探營時看到,全新升級的AI安全檢測平臺蟻鑒2.0亮相世博展覽館H2館。 現(xiàn)場工作人員在演示AI安全檢...

“AI安全檢測平臺蟻鑒2.0”亮相世博展覽館H2館。本文圖片均由澎湃新聞記者俞凱 攝

7月5日,澎湃新聞(www.thepaper.cn)記者前往世博展覽館的2023世界人工智能大會探營時看到,全新升級的“AI安全檢測平臺蟻鑒2.0”亮相世博展覽館H2館。

現(xiàn)場工作人員在演示“AI安全檢測平臺蟻鑒2.0”進(jìn)行評測的過程。

在去年WAIC上,螞蟻推出“蟻鑒AI安全檢測平臺”,面向全球開發(fā)者免費(fèi)提供AI模型的評測工具。今年世界人工智能大會,螞蟻集團(tuán)帶來的“蟻鑒AI安全檢測平臺2.0”,是業(yè)內(nèi)首個產(chǎn)業(yè)級支持文本、圖像等全數(shù)據(jù)類型的AI安全檢測平臺,將其推向通用化和標(biāo)準(zhǔn)化。該平臺新增推出AIGC安全性、AI可解釋性兩項(xiàng)評測能力,針對性護(hù)航大模型和AIGC時代的數(shù)字化安全,不僅可以支持?jǐn)?shù)字金融,還可以支持教育、文化、醫(yī)療、電商等AI、AIGC應(yīng)用突出的產(chǎn)業(yè)對AI安全性檢測的需求。

“蟻鑒機(jī)器人”可通過智能對抗技術(shù),自動生成海量測試集。

現(xiàn)場展示的裝置模擬了蟻鑒2.0對AIGC安全性進(jìn)行評測的過程,左邊的“蟻鑒機(jī)器人”通過智能對抗技術(shù),自動生成海量測試集,對右邊的“AIGC生成式模型”進(jìn)行交互誘導(dǎo),每分鐘可調(diào)用10余種不同難度系數(shù)的對抗手法,生成超過30個誘導(dǎo)問題。它很像一個24小時不眠不休的“安全黑客”在找茬大模型,同時比“安全黑客”更智能化的是,在誘導(dǎo)的同時,會對大模型的回答進(jìn)行實(shí)時、自動化的檢測計算,從近200個子類維度,找到大模型存在的弱點(diǎn)和安全問題所在,進(jìn)行量化計算,最后生成大模型的安全體檢報告。

評測后會生成大模型的安全體檢報告。

“蟻鑒”應(yīng)用沉淀的這一套標(biāo)準(zhǔn),已經(jīng)在國內(nèi)乃至國際可信AI標(biāo)準(zhǔn)制定過程中發(fā)揮了重要的參考價值,目前已經(jīng)支持內(nèi)容安全、數(shù)據(jù)安全、科技倫理三大類的安全性檢測,構(gòu)建了一套“可靠、可控、可信、可用”的評測標(biāo)準(zhǔn)框架。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港