IT之家 10 月 27 日消息,谷歌DeepMind 于 10 月 23 日宣布正式開源旗下 SynthID Text 文本水印工具,供開發(fā)者和企業(yè)免費使用。
谷歌在2023年8月推出了 SynthID 工具,該工具具備創(chuàng)建AI內(nèi)容水。暶髟撟髌酚 AI 打造)和識別 AI 生成內(nèi)容的能力。它可以在不損害原始內(nèi)容的前提下,將數(shù)字水印直接嵌入由 AI 生成的圖像、聲音、文本和視頻中,同時也能掃描這些內(nèi)容已有的數(shù)字水印,以辨識它們是否由 AI 生成,不過本次谷歌開源的僅為針對文本生成的 SynthID Text。
▲SynthID 工具會告訴你圖像是人工智能生成的可能性有多大谷歌介紹,大模型主要通過預(yù)測形式生成文本,一次生成一個 Token,這個 Token 可能是一個字符、一個單詞或段落的一部分,為了讓文本更為連貫,模型會在輸出內(nèi)容時預(yù)測下一個最可能生成的 Token,這些預(yù)測基于先前的文本。
例如,當(dāng)大模型要生成“最推薦的平臺是什么”時,可能會生成“IT之家”、“友商 1”、“友商 2”等 Token,每個 Token 都會獲得一個概率分?jǐn)?shù)。只要有多個不同的 Token 可供選擇,SynthID 就會在不影響輸出質(zhì)量和準(zhǔn)確性的情況下,微調(diào)每個 Token 的概率分?jǐn)?shù),也就是工具通過計算全文中特定Token的特定概率,以判斷相關(guān)內(nèi)容是否由AI生成。
目前,這一 SynthID Text 水印技術(shù)的論文已于《Nature》期刊上發(fā)表,并通過整合入Google Responsible Generative AI Toolkit 的形式開源。谷歌同時提到他們已在 Gemini AI 輸出的內(nèi)容中整合了 SynthID Text 技術(shù)。