IT之家3 月 1 日消息,近日外媒 404 Media 稱,博客平臺 WordPress、Tumblr 運營方 Automattic 計劃向多家 AI 公司出售用戶數(shù)據(jù)。Automattic 官方就此澄清,表示其默認(rèn)屏蔽 AI 爬蟲且不會分享非公開數(shù)據(jù)。
404 Media 指出,根據(jù)其掌握的內(nèi)部文檔,Tumblr 產(chǎn)品經(jīng)理表示 Automattic 正為 OpenAI 和 Midjourney 準(zhǔn)備數(shù)據(jù)集。
而在這一包含 Tumblr 近十年所有公開帖子內(nèi)容的數(shù)據(jù)集里,混入了大量不該向外部提供的部分,包括但不限于:
公共博客上的私人帖子
已刪除 / 停用博客上發(fā)布的帖子
在 404 Media 的報道后,Automattic 發(fā)布了一份關(guān)于在快速發(fā)展的 AI 世界中“保護(hù)用戶選擇”的聲明,表示其正在密切關(guān)注 AI 技術(shù)的最新進(jìn)展,并努力在尊重用戶隱私和數(shù)據(jù)控制的前提下研究如何與 AI 公司合作。
Automattic 稱其目前默認(rèn)阻止 AI 平臺爬蟲。WordPress 和 Tumblr 用戶可通過設(shè)置阻止 AI 公司的數(shù)據(jù)抓齲IT之家注意到,Automattic 表示如果用戶之前禁用了搜索引擎的爬取,則默認(rèn)情況下新阻止選項會打開。
此外,Automatic 承認(rèn)目前還沒有法律強制 AI 爬蟲遵守這種不抓取偏好。不過由于歐盟相關(guān)立法即將落地,這種情況可能很快就會改變。
該公司還證實,它正在直接與特定 AI 公司合作,僅提供 WordPress 和 Tumblr 上公開且用戶未禁止向第三方公司分享的內(nèi)容。