展會信息港展會大全

AI生成書籍泛濫:誰在制造“假書”?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-10-21 08:46:43   瀏覽:9834次  

導(dǎo)讀:亞馬遜的自助出版系統(tǒng)允許任何人在亞馬遜上自行出版和銷售書籍,這給AI生成書籍的泛濫提供了漏洞。 (視覺中國/圖) 誰在寫我的傳記? 當(dāng)羅里塞蘭-瓊斯在亞馬遜上發(fā)現(xiàn)一本自己的傳記時,他奇怪地發(fā)出疑問。他翻閱了部分內(nèi)容,書中顯示他生活在一個學(xué)術(shù)家庭中...

亞馬遜的自助出版系統(tǒng)允許任何人在亞馬遜上自行出版和銷售書籍,這給AI生成書籍的泛濫提供了漏洞。 (視覺中國/圖)

“誰在寫我的傳記?”

當(dāng)羅里塞蘭-瓊斯在亞馬遜上發(fā)現(xiàn)一本自己的傳記時,他奇怪地發(fā)出疑問。他翻閱了部分內(nèi)容,書中顯示他生活在一個學(xué)術(shù)家庭中,父親是一位和藹可親的學(xué)者,母親是一名教師。這本書幾乎可以與他自己寫的回憶錄相媲美,只不過上面的信息“完全是幻想”,他告訴《衛(wèi)報》。

事實(shí)上,羅里的父親是BBC的一位電視導(dǎo)演,母親也在BBC工作。某一天,他在一個裝著信件的鞋盒中發(fā)現(xiàn)了父母的感情故事,并由此揭開家族的歷史真相,這些故事被記錄在他真正的回憶錄中。

至于那本有關(guān)他的傳記,羅里從未聽說過那位傳記作者,不過,他很快發(fā)現(xiàn),這本書是由AI生成的。

羅里的遭遇并非孤例。據(jù)多家外媒報道,AI生成的書籍正充斥在亞馬遜上,這些書籍涉及范圍廣泛,從傳記、食譜、科普書籍到旅游指南等,無所不有。其中,有些書中的某些錯誤信息甚至?xí){到生命。

紐約真菌學(xué)會(NYMS)便公開表示,亞馬遜等電商平臺上的許多AI生成的蘑菇覓食科普書籍存在諸多錯誤描述,這可能會誤導(dǎo)大眾吃到有毒蘑菇,“意味著生與死”。

“AI已經(jīng)擊垮亞馬遜”

6月,作家凱特琳林奇在社交平臺上發(fā)帖,指出在亞馬遜青少年當(dāng)代愛情電子書暢銷排行榜的前100名中,只有19本是正常的書籍,其余都是AI生成的“廢話”。

她還附上了一本書的截圖,名字叫《等你愛我》,封面是一張黑白的海鷗照片。在此之前,在亞馬遜的青少年當(dāng)代愛情類別前100名暢銷書排行榜中,這本書位于第90名。底下的兩條一星評論也指出,它是一本由AI生成的書籍。

“AI已經(jīng)擊垮了亞馬遜。”林奇在推文中這樣寫道。

據(jù)8月《紐約時報》報道,旅游指南也成為AI書籍泛濫的主要類別之一。3月,旅行者艾米科爾斯基為即將到來的法國之旅在亞馬遜上購買旅行指南。當(dāng)她輸入幾個搜索關(guān)鍵詞“旅行”“指南”“法國”后,一本排名靠前的《法國旅游指南》引起了她的注意。

根據(jù)作者頁面顯示,該書作者邁克史蒂夫斯是一位“著名的旅行作家”。書籍的界面上有一百多個五星好評,該指南還承諾有行程安排和當(dāng)?shù)厝说耐扑]。于是,艾米科爾斯基下了單。

令她失望的是,收到書籍后,她發(fā)現(xiàn)里面的描述模糊、文字重復(fù),并且缺乏行程安排,看起來像是從維基百科上復(fù)制粘貼的。她將這本書退回了。

《紐約時報》發(fā)現(xiàn)事情并不簡單。他們無法找到該書所謂的“作者”之前發(fā)表的任何作品,甚至界面上“作者”的照片也顯得奇怪,比如耳朵附近存在的異常元素、歪歪扭扭的衣服等,看起來是由AI生成的照片。

根據(jù)AI檢測工具Originality.ai的結(jié)果,幾乎可以肯定邁克史蒂夫斯的書AI生成。此外,《紐約時報》發(fā)現(xiàn),AI生成的書籍也開始滲透到烹飪、編程、醫(yī)學(xué)、園藝等許多類別中。

而在許多媒體的報道中,AI生成的書籍不僅給讀者帶來誤導(dǎo)信息,也給真人作者造成了極大的困擾。8月,作家簡弗里德曼在自己的博客上稱,有一些“垃圾書”被上傳到亞馬遜上,作者一欄赫然寫著她的名字,但她并沒有寫過這些書,它們極大可能是AI生成的。

從2009年開始,她一直在寫博客,很多內(nèi)容都是公開的,可以用于AI的模型訓(xùn)練。因此,當(dāng)她讀到這些“假書”的第一頁時,就像在閱讀自己生成的ChatGPT回復(fù)一樣。更讓她覺得雪上加霜的是,這些“假書”被添加到她的Goodreads個人資料中,這很容易引起誤導(dǎo)。

她在社交平臺上抱怨這件事情之后,一些作者回應(yīng)稱,他們也有過類似的經(jīng)歷。“人們一直告訴我他們買了我的新書,上面有我的名字,但我從未寫過。”一位作者說。還有的作者僅僅一周就舉報了29本類似情況的書籍。

“可怕的是,這種情況可能發(fā)生在任何一個有名聲、有地位、有需求的人身上,有人看到了從中獲利的途徑。”在接受美國有線電視新聞網(wǎng)采訪時,簡弗里德曼說道。

“實(shí)際上是在允許‘垃圾書’的存在”

在羅里發(fā)現(xiàn)有關(guān)他的傳記是AI生成的內(nèi)容后,亞馬遜給他發(fā)了一封電子郵件,上面推薦說,“你可能會喜歡這本書”。這讓羅里感到生氣,亞馬遜的算法竟認(rèn)為這是一本他想要的書。

“他們實(shí)際上是在允許‘垃圾書’的存在,還把它推薦給最討厭它的人。”羅里告訴《衛(wèi)報》。盡管亞馬遜之后刪除了這本書,但還是有很多作品通過了旨在剔除低質(zhì)量圖書的過濾系統(tǒng)。

實(shí)際上,許多AI生成的書籍出現(xiàn)在亞馬遜平臺上,跟它本身的自助出版系統(tǒng)KDP(Kindle Direct Publishing)被濫用有很大關(guān)系。2007年,亞馬遜創(chuàng)建KDP,允許任何人在亞馬遜上自行出版和銷售書籍。目前,它可以提供超過45種語言選擇。

在亞馬遜KDP平臺,作者可以自由選擇自助出版電子書或紙質(zhì)書,完成自助出版書籍的上傳流程后,亞馬遜大約72小時內(nèi)就能通過審核并進(jìn)行銷售。在此平臺上自助出版書籍是免費(fèi)的,不過,如果出版紙質(zhì)書,印刷成本會從每本書銷售所得的版稅中扣除。一般來說,作者可獲得的紙質(zhì)書版稅最高為60%,電子書的版稅為35%或70%。

另外,隨著人工智能技術(shù)的發(fā)展,在YouTube、TikTok等平臺上,許多利用AI生成書籍的教程也紛紛出現(xiàn),其主題范圍廣泛,不少用戶可以從中快速掌握AI生成書籍的方法,再加上亞馬遜自助出版功能的便利與收益,濫用此功能進(jìn)行AI書籍出版和銷售的行為也很難避免。

在接到許多作者的投訴后,9月,亞馬遜在其KDP的社區(qū)頁面上引入了新的規(guī)則和指南。新規(guī)要求作者在發(fā)布作品時,回答系統(tǒng)關(guān)于作品是否為人工智能生成的提問。在其內(nèi)容指南部分,亞馬遜也增加了有關(guān)AI的內(nèi)容,包括對“人工智能生成”和“人工智能輔助”的定義。

據(jù)《衛(wèi)報》報道,出于對人工智能的擔(dān)憂,亞馬遜推出限制自助出版者每日最多發(fā)布3本書的新規(guī)。

但即使新規(guī)已經(jīng)發(fā)布,有些影響卻已造成。簡弗里德曼的相關(guān)事件發(fā)酵后,那些假冒她之名的書籍從亞馬遜和她的Goodreads個人資料中被刪去。但這一過程并不順利,亞馬遜一開始拒絕停止出售那些書籍。簡弗里德曼認(rèn)為,最終是由于她在寫作和出版界的知名度和聲譽(yù)才促使亞馬遜撤下那些書。

“現(xiàn)在亞馬遜上發(fā)布的人工智能內(nèi)容泛濫成災(zāi),有時還以誤導(dǎo)或欺詐的方式歸屬于作者,怎么能理所當(dāng)然地指望在職作者在余生中每周都花時間來監(jiān)管這些內(nèi)容呢?”她發(fā)出質(zhì)問。

而即使那些書不再出現(xiàn)在她的亞馬遜或Goodreads頁面上,它們的影響仍然存在。簡弗里德曼在自己的博客上寫道:“不幸的是,即使你把這些瘋狂的書從你的官方資料中刪除了,它們?nèi)匀粫湍愕拿衷谝黄?hellip;…而你對此卻無能為力。”

南方周末記者 翁榕榕 南方周末實(shí)習(xí)生 陳荃新

責(zé)編 李慕琰

贊助本站

人工智能實(shí)驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港