展會信息港展會大全

AI浪潮下的勞作:大量人類開始為機(jī)器服務(wù),工作乏味重復(fù)且收入低
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-17 16:51:02   瀏覽:13872次  

導(dǎo)讀:從內(nèi)羅畢的大學(xué)畢業(yè)幾個月后,30歲的喬(化名)得到了一份標(biāo)注員的工作。這是一份繁瑣的工作,工作內(nèi)容是處理用于訓(xùn)練人工智能的原始信息。AI是通過在大量數(shù)據(jù)中尋找模式來學(xué)習(xí)的,但首先這些數(shù)據(jù)需要由人類進(jìn)行分類和標(biāo)注。這涉及一支龐大的勞動力隊(duì)伍,他...

從內(nèi)羅畢的大學(xué)畢業(yè)幾個月后,30歲的喬(化名)得到了一份標(biāo)注員的工作。這是一份繁瑣的工作,工作內(nèi)容是處理用于訓(xùn)練人工智能的原始信息。AI是通過在大量數(shù)據(jù)中尋找模式來學(xué)習(xí)的,但首先這些數(shù)據(jù)需要由人類進(jìn)行分類和標(biāo)注。這涉及一支龐大的勞動力隊(duì)伍,他們大多隱藏在機(jī)器的背后。喬的工作是為自動駕駛汽車進(jìn)行影像標(biāo)注,他需要逐幀識別各種拍攝角度下的全部車輛、行人、騎行者,以及駕駛員需要注意的所有事物。這是一項(xiàng)困難且重復(fù)的工作。一段幾秒鐘的影像需要8個小時來進(jìn)行標(biāo)注,而喬的報酬大約是10美元。

然后,在2019年,一個機(jī)會出現(xiàn)了:喬為一家迫切渴求標(biāo)注員的新公司運(yùn)行一個標(biāo)注訓(xùn)練營,以此他可以賺取四倍于以往的收入。每兩周,會有50個新人進(jìn)入內(nèi)羅畢的一座辦公大樓開始他們的學(xué)徒期。對這項(xiàng)工作的需求似乎無窮無荊他們被要求對鏡子自拍照中的衣服進(jìn)行分類,透過機(jī)器人吸塵器的眼睛判斷它們所處的房間,以及在摩托車的雷達(dá)掃描圖上畫框。通常會有超過一半的學(xué)生堅(jiān)持不到訓(xùn)練營結(jié)束。喬得體而委婉地解釋說:“有些人不知道如何長時間待在一個地方。”他也承認(rèn):“這確實(shí)非常無聊。”

但這是一份工作,而當(dāng)?shù)氐墓ぷ鳈C(jī)會并不多。喬培養(yǎng)出了數(shù)百名畢業(yè)生。離開訓(xùn)練營之后,他們各自回到家,在臥室和廚房里獨(dú)自工作,并被禁止向任何人透露他們正在做的事情。這實(shí)際上并不成問題,因?yàn)樗麄冏约阂埠苌偾宄约涸谧鍪裁。為自動駕駛汽車標(biāo)記物體還是容易搞懂的,但對扭曲的對話片段進(jìn)行分類,區(qū)分它們是機(jī)器人還是人說的,這是在做什么呢?又或者要求你上傳一張面無表情盯著攝像頭的照片,然后上傳一張笑臉的照片,再然后上傳一張戴著摩托車頭盔的照片,這又是什么樣的訓(xùn)練?每個項(xiàng)目都只是某個更大工序的一小部分,很難搞清它們實(shí)際在訓(xùn)練AI做什么。項(xiàng)目的名字里也沒有任何線索:螃蟹生成、鯨魚片段、林地陀螺、藥箱香腸。這些都是給無邏輯的工作使用的無邏輯的項(xiàng)目代號。

而至于雇傭他們的公司,大多數(shù)標(biāo)注員只知道它叫Remotasks,這是一個向任何懂英語的人提供工作的網(wǎng)站。像我采訪的大多數(shù)標(biāo)注員一樣,喬在聽到我的介紹后才知道,Remotasks實(shí)際上是一家名為Scale AI的公司下設(shè)的面向工人的子公司,而Scale AI是一家價值數(shù)十億美元的硅谷數(shù)據(jù)供應(yīng)商,其客戶包括OpenAI和美國軍方。Remotasks和Scale AI的網(wǎng)站都沒有提到對方。

公眾對語言模型,如OpenAI的聊天機(jī)器人ChatGPT的討論,主要集中于它們可能會使之實(shí)現(xiàn)自動化的所有工作。但即使是最令人印象深刻的AI系統(tǒng)背后,也有人,而且是大量的人在標(biāo)注數(shù)據(jù)以訓(xùn)練它,并在它混亂時澄清數(shù)據(jù)。只有買得起此類數(shù)據(jù)的公司才能參與競爭,而那些得到這些數(shù)據(jù)的公司有很強(qiáng)的動力對其進(jìn)行保密。結(jié)果就是,除了少數(shù)例外,我們對塑造這些AI系統(tǒng)行為的信息知之甚少,對那些塑造這些系統(tǒng)的人更是幾乎一無所知。

對于喬的學(xué)生們來說,他們所從事的是一份沒有任何正常外在形式的工作:沒有時間表,沒有同事,對他們在做什么或?yàn)檎l工作一無所知。實(shí)際上,他們很少稱之為工作只是“任務(wù)”。他們是任務(wù)執(zhí)行者。

人類學(xué)家大衛(wèi)格雷伯(David Graeber)將沒有意義或目標(biāo)的工作定義為“狗屁工作”,這種工作本應(yīng)被自動化,但由于官僚主義、社會地位或惰性的原因而沒有自動化。這些AI的工作是其對立面:人們想要自動化的工作,并且經(jīng)常認(rèn)為其已經(jīng)實(shí)現(xiàn)自動化,但實(shí)際仍然需要人類的參與。這些工作有其目的,只是工作者常常不知道它是什么。

-Sarah Wilkins-

當(dāng)前人工智能繁榮發(fā)展。聊天機(jī)器人聽起來幾乎就像人類,人們只需通過簡單的提示就能讓AI生成藝術(shù)作品,這些技術(shù)背后的公司則有著高達(dá)數(shù)十億美元的估值。而這一切,都始于一項(xiàng)前所未有的乏味且重復(fù)的勞動壯舉。

2007年,人工智能研究員、當(dāng)時在普林斯頓大學(xué)任教的李飛飛,懷疑改進(jìn)圖像識別神經(jīng)網(wǎng)絡(luò)(一種已經(jīng)停滯多年的機(jī)器學(xué)習(xí)方法)的關(guān)鍵是用更多的數(shù)據(jù)進(jìn)行訓(xùn)練要有數(shù)百萬個經(jīng)過標(biāo)注的圖像,而不是幾萬個。問題是,她的本科生團(tuán)隊(duì)需要幾十年的時間和數(shù)百萬美元的資金來標(biāo)注那么多的照片。

李飛飛在亞馬遜的眾包平臺Mechanical Turk上找到了數(shù)千名工人,以低廉的價格雇傭他們在世界各地完成小的任務(wù)。最終得到的標(biāo)注數(shù)據(jù)集(名為ImageNet)使得機(jī)器學(xué)習(xí)取得了突破性的進(jìn)展,重新激活了這個領(lǐng)域,并帶來了接下來十年的發(fā)展。

標(biāo)注依然是制作AI的基礎(chǔ)部分,但工程師們時常視其為一個暫時而不便的先決條件,它所通向的是搭建模型這一更為奪目的工作。你盡可能便宜地獲取最多標(biāo)注數(shù)據(jù)來訓(xùn)練模型,理論上,如果模型有效,你就再也不需要標(biāo)注員了。然而,標(biāo)注工作從未真正結(jié)束。就像研究人員所說的那樣,機(jī)器學(xué)習(xí)系統(tǒng)是“脆弱的”,它無法應(yīng)付在訓(xùn)練數(shù)據(jù)中沒有被很好表示的事物。這些被稱為“邊緣情況”的失敗,可能會帶來嚴(yán)重的后果。2018年,一輛Uber的自動駕駛測試車撞死了一名女性。因?yàn)殡m然該自動駕駛系統(tǒng)的程序設(shè)計(jì)要求它避開騎自行車的人和行人,但它卻不知道如何對待推著自行車走在街上的人。越多的人工智能系統(tǒng)被投入世界,去給人們提供法律咨詢和醫(yī)療幫助,它們就會遇到越多的邊緣情況,也就需要更多的人去處理這些情況。這已經(jīng)催生了一個全球性的行業(yè),在其中,像喬這樣的人會利用他們獨(dú)特的人類能力來幫助機(jī)器。

這是一件紅底白條紋的襯衫,還是白底紅條紋的襯衫?如果一只藤編碗裝滿了蘋果,它算“裝飾碗”嗎?豹紋是什么顏色?

在過去的六個月里,我與全球二十多名標(biāo)注員交談過。雖然他們中的很多人在訓(xùn)練最前沿的聊天機(jī)器人,但這些人在做的是維持AI運(yùn)行所需的平凡手工勞動。有人在對TikTok視頻的情感內(nèi)容進(jìn)行分類,有人在辨認(rèn)垃圾電子郵件的新變體,還有人在對在線廣告的性挑逗度做精確的判定。其他一些人則在查看信用卡交易,推斷它們與哪種購買行為相關(guān),或者檢查電商平臺的推薦,判斷那件襯衫是否真的是你在購買了其他襯衫后可能會喜歡的。人們正在糾正客服聊天機(jī)器人,監(jiān)聽Alexa收到的請求,對視頻通話中的人的情緒進(jìn)行分類。他們在標(biāo)注食物,以便智能冰箱不會因?yàn)樾掳b而搞混;他們在檢查智能安全攝像頭,然后發(fā)出警報;他們還在幫助一頭霧水的自動化拖拉機(jī)識別玉米。

“全球有一條完整的供應(yīng)鏈,”非營利性組織Partnership on AI的項(xiàng)目和研究負(fù)責(zé)人索納姆金達(dá)爾(Sonam Jindal)說,“業(yè)界的普遍認(rèn)識是,這項(xiàng)工作并非開發(fā)的關(guān)鍵部分,也不會長久需要。所有的激動人心都是關(guān)于構(gòu)建人工智能,一旦我們建成了,就再也不需要這項(xiàng)工作,那為什么還要考慮它呢?但它是AI的基礎(chǔ)設(shè)施。人類的智能是人工智能的根本,我們需要將這些工作視為AI經(jīng)濟(jì)中的真實(shí)工作,它們將會伴隨我們很長一段時間。

OpenAI、谷歌、微軟等耳熟能詳?shù)拿直澈蟮臄?shù)據(jù)供應(yīng)商有著不同的形式。有的是私人外包公司,他們設(shè)有像呼叫中心一樣的辦公室,比如把公司開在肯尼亞和尼泊爾的CloudFactory。喬在轉(zhuǎn)到Remotasks之前就在那里以1.20美元的時薪進(jìn)行標(biāo)注工作。也有像Mechanical Turk和Clickworker這樣的“眾包”網(wǎng)站,任何人都可以注冊完成任務(wù)。介于這兩者之間的是Scale AI一類的服務(wù)商。任何人都可以注冊,但是每個人都必須接受培訓(xùn),通過資格考試,并接受績效監(jiān)控。標(biāo)注是一項(xiàng)大生意。2016年創(chuàng)立的Scale AI,到2021年已估值73億美元,創(chuàng)立公司時僅19歲的亞歷山大王Alexandr Wang因此被福布斯稱為“最年輕的白手起家的億萬富翁”,盡管該雜志在最近一篇專題報道中指出,自那時起他在二級市場的股份已經(jīng)下跌。

-Richard Parry-

這個錯綜復(fù)雜的供應(yīng)鏈被刻意設(shè)計(jì)得難以厘清。根據(jù)業(yè)內(nèi)人士的說法,購買數(shù)據(jù)的公司要求嚴(yán)格保密。(這也是Scale AI解釋為什么Remotasks有不同名稱時給出的理由。)標(biāo)注工作會泄露太多關(guān)于正在開發(fā)的系統(tǒng)的信息,而且大量的工作人員導(dǎo)致秘密的泄露很難防止。標(biāo)注員被反復(fù)警告不要向任何人,甚至包括他們的朋友和同事透露他們的工作,除了公司別名、項(xiàng)目代號。而且關(guān)鍵的是,極其分散的勞動使得他們即使想要談?wù),也沒有足夠的信息。(大多數(shù)工作人員要求使用化名,以免被從平臺上除名。)因此,對于從事標(biāo)注工作的人數(shù)并沒有準(zhǔn)確的估計(jì),但我們知道這是一個龐大的群體,并且還在不斷擴(kuò)大。近期一篇谷歌研究院論文給出的數(shù)量級是“數(shù)以百萬計(jì)”,且可能最終將發(fā)展到“數(shù)以十億計(jì)”。

自動化進(jìn)程常常以出人意料的方式展開。醫(yī)療數(shù)據(jù)標(biāo)注公司Centaur Labs的首席執(zhí)行官埃里克杜海姆(Erik Duhaime)回憶起幾年前,一些杰出的機(jī)器學(xué)習(xí)工程師預(yù)測AI會讓放射科醫(yī)生的工作變得多余。然而,這個預(yù)測沒有成真,于是人們普遍的看法轉(zhuǎn)變?yōu)椋派淇漆t(yī)生會將AI作為工具使用。這些觀點(diǎn)都與他所看到的現(xiàn)象略有出入。杜海姆表示,AI在特定任務(wù)上的表現(xiàn)非常出色,這使得工作被分解并分配給專門的算法和專門的人。他舉了一個假設(shè)的例子。一個AI系統(tǒng)可能能夠發(fā)現(xiàn)癌癥,但只能在某種特定類型的設(shè)備產(chǎn)生的某種特定類型的圖像中。因此,你現(xiàn)在需要一個人來檢查AI是否被提供了正確類型的數(shù)據(jù),或許還需要另一個人來檢查它的工作成果,然后把結(jié)果傳遞給另一個編寫報告的AI,然后報告又被傳給另一個人,等等。“AI并未取代工作,”他說,“但它的確改變了工作的組織方式。”

如果你覺得AI是一臺靈活的思考機(jī)器,你可能會看不到這一點(diǎn)。但是,只要你稍微拉開一點(diǎn)帷幕,你就會發(fā)現(xiàn)它看起來更為熟悉。這是硅谷特有的新一代勞動力分配方式。在其中,新科技的未來主義光環(huán)掩蓋了龐大的制造機(jī)構(gòu)和讓它運(yùn)轉(zhuǎn)的人們。杜海姆深入對比歷史中的相似情形,認(rèn)為這是數(shù)字時代的一次工匠向工業(yè)制造的轉(zhuǎn)變:原本內(nèi)在連貫的單一生產(chǎn)過程被拆分成一個個任務(wù),并按照生產(chǎn)線的順序排列,其中一些步驟由機(jī)器完成,另一些步驟由人類完成,但其工作方式都發(fā)生了變化。

人們會擔(dān)心AI帶來的顛覆,對此經(jīng)常有一種反駁的論點(diǎn),即AI自動化的是任務(wù),而非工作,而這些任務(wù)會是一些枯燥無味的事情,人們于是可以有更多時間去追求更有成就感和更加人性化的工作。但同樣可能的是,AI的崛起會像過去一些節(jié)省勞動力的技術(shù)的情形。比如可能會像電話或打字機(jī),它們雖然消滅了傳遞消息和手寫這樣的繁重任務(wù),但新興的通信、商務(wù)和文書工作卻帶來了新的需求,需要新類型的工作人員,如文員、會計(jì)、打字員來處理這些工作。當(dāng)AI來取代你的工作,你可能并不會失去工作,但你的工作可能會變得更加陌生,更加孤立,更加枯燥。

-Xiao Hua Yang-

今年早些時候,我注冊了Scale AI的Remotasks。流程很簡明。在輸入了我的計(jì)算機(jī)配置、互聯(lián)網(wǎng)速度和一些基本聯(lián)系信息之后,我發(fā)現(xiàn)自己進(jìn)入了“培訓(xùn)中心”的頁面。想要接觸到有償任務(wù),我首先需要完成一個相關(guān)的(無償?shù)模┤腴T課程。

培訓(xùn)中心中有一系列名字晦澀的課程,比如膠水游泳衣、海報堅(jiān)果樹。我點(diǎn)擊了一個叫做“GFD 斷句”的東西,發(fā)現(xiàn)它在教你如何標(biāo)注社交媒體照片中的服裝。

然而,其中的指示卻很奇怪。首先,它們基本上是一些重復(fù)的指示,其怪異的顏色和某些大寫字母的排版方式讓人聯(lián)想到那些拼貼的炸彈威脅信。“對于真實(shí)的、能被人穿戴或本來就打算讓人穿戴的物品,務(wù)必要進(jìn)行標(biāo)注。”指示中寫道。

“所有以下物品都應(yīng)被標(biāo)注,因?yàn)樗鼈兪钦鎸?shí)的,并且可以被現(xiàn)實(shí)生活中的人穿戴”,這條指示在Air Jordans的廣告圖片、有人頭戴Kylo Ren頭盔的圖片,以及假人模特穿著連衣裙的圖片上面一再重復(fù)。上面有一個酸橙綠色的框再次解釋:“務(wù)必標(biāo)注真實(shí)的、能被真實(shí)的人穿戴的物品。”

Remotasks的服裝標(biāo)注指示。

The Verge

我瀏覽到手冊的底部,發(fā)現(xiàn)了一條大號鮮紅字體的指示,它仿佛在握住你的肩膀猛烈地?fù)u晃你:“下面的物品不應(yīng)被標(biāo)注,因?yàn)槿藗儫o法真正穿上這些物品!”該指示上面的照片內(nèi)容是C-3PO、《阿拉丁神燈》中的茉莉公主,以及一只有眼睛的卡通鞋子。

我對自己分辨能被真人穿上的真實(shí)衣物和不能被真人穿上的非真實(shí)衣物的能力充滿信心,于是我開始了測試。馬上我就遭到了一種本體論式的狡猾攻擊:一張女性穿著連衣裙的雜志照片。服裝的照片是真實(shí)的服裝嗎?我原以為,人類不能穿著一張服裝的照片,所以答案是不。然而,錯誤!在AI的視角中,真實(shí)服裝的照片就是真實(shí)的服裝。接著出現(xiàn)了一張女子在昏暗的臥室里對著全身鏡自拍的照片。她穿著的上衣和短褲是真實(shí)的。那么它們的倒影呢?也是真實(shí)的!真實(shí)服裝的倒影也是真實(shí)的服裝。

經(jīng)過令人尷尬的大量試錯,我終于進(jìn)入到實(shí)際的工作環(huán)節(jié)。此時我卻驚恐地發(fā)現(xiàn),那些我一直努力理解的指示已經(jīng)被大量更新和細(xì)化,現(xiàn)在已經(jīng)變成了整整43頁的指令:不要標(biāo)注裝滿衣服的打開的行李箱;要標(biāo)注鞋子但不要標(biāo)注腳蹼;要標(biāo)注緊身褲但不要標(biāo)注打底褲;不要標(biāo)注毛巾,哪怕它被穿在身上;要標(biāo)注戲服,但不要標(biāo)注盔甲。如此等等。

德國魏岑鮑姆研究所(Weizenbaum Institute)的研究員米拉格羅斯米切利(Milagros Miceli)稱,行業(yè)內(nèi)普遍存在指令混亂的情況。這在一定程度上是機(jī)器學(xué)習(xí)系統(tǒng)的學(xué)習(xí)方式導(dǎo)致的。人類只需幾個例子就能理解“襯衫”的概念,而機(jī)器學(xué)習(xí)程序需要數(shù)千個例子,而且這些例子需要嚴(yán)格遵循一致的分類,同時又足夠多樣化(比如當(dāng)中要有Polo襯衫、戶外穿著的襯衫、掛在架子上的襯衫),以便這個只能教一個學(xué)一個的系統(tǒng)能處理現(xiàn)實(shí)世界的多樣性。“想象一下,你要把復(fù)雜的現(xiàn)實(shí)簡化,讓一個呆笨至極的機(jī)器可以理解。”她說。

有一次,維克多連續(xù)36個小時沒有睡覺,給一些拍攝人群的照片標(biāo)注肘部、膝部和頭部他都不知道為什么要做這些。

為機(jī)器簡化現(xiàn)實(shí)的行為,卻讓人類的工作變得繁復(fù)。編寫指示的人必須制定規(guī)則,讓人類以完全一致的方式進(jìn)行分類工作。為此,他們經(jīng)常創(chuàng)造出人類不會使用的分類。如果讓一個人標(biāo)注照片中的所有襯衫,他可能不會標(biāo)注鏡子中的襯衫,因?yàn)樗滥侵皇欠瓷洌⒉徽鎸?shí)。然而在對世界沒有絲毫認(rèn)知的AI眼中,一切都只是像素的組合,二者完全等同。當(dāng)一個數(shù)據(jù)集中,有些襯衫得到了標(biāo)注,而另一些(被反射的)襯衫沒有得到標(biāo)注時,模型就無法正常工作。于是,工程師就返回供應(yīng)商,更新指示:務(wù)必標(biāo)注襯衫的反射圖像。很快,你就會看到一個43頁的指南,細(xì)則嚴(yán)謹(jǐn),紅字滿篇。

“在你一開始工作時,規(guī)則相對簡單,”一位因保密協(xié)議而要求匿名的Scale AI前員工說,“然后他們收到了一千張返回的圖片,他們說,‘等一下’,接著好多工程師開始互相爭論。這很大程度上是人的事情。”

從事標(biāo)注員的工作往往要放下人類的理解,非常、非常直接地遵循指示就像一位標(biāo)注員所說的,像一個機(jī)器人一樣思考。這是一種奇怪的心理狀態(tài),盡最大努力遵循荒謬但嚴(yán)謹(jǐn)?shù)囊?guī)則,就像在迷幻藥物的影響下參加標(biāo)準(zhǔn)化考試。標(biāo)注員無一例外都會遇到令人困惑的問題,比如,這是一件紅底白條紋的襯衫,還是白底紅條紋的襯衫?如果一只藤編碗裝滿了蘋果,它算“裝飾碗”嗎?豹紋是什么顏色?當(dāng)指示說要標(biāo)注交通管制人員時,是否也要標(biāo)注在人行道上吃午餐的交通管制人員?每個問題都必須回答,一個錯誤的猜測可能會導(dǎo)致你不被允許繼續(xù)這項(xiàng)任務(wù),并被分配到一個全新的任務(wù)中,而這個新任務(wù)又有著新的令人困惑的問題。

-Richard Parry-

Remotasks上的大部分工作是按件支付的,一個任務(wù)的收入從幾分錢到幾美元不等。因?yàn)橥耆蝿?wù)可能只需幾秒鐘,也可能需要幾個小時,所以工資難以預(yù)測。當(dāng)Remotasks剛開始進(jìn)入肯尼亞時,標(biāo)注員表示,它的薪酬相對較高根據(jù)任務(wù)的不同,平均每小時大約5到10美元。但隨著時間的推移,這個數(shù)額在降低。

Scale AI的發(fā)言人安娜弗蘭科(Anna Franko)表示,公司中的經(jīng)濟(jì)學(xué)家會分析項(xiàng)目的具體情況、所需技能、地域生活成本及其他要素,“以確保報酬是公平且有競爭力的”。Scale AI的前員工也稱其薪酬遵循一種類似動態(tài)定價的機(jī)制,會隨著標(biāo)注員的供給量及數(shù)據(jù)需求的迫切度而調(diào)整。

根據(jù)我與工人們的談話以及招聘啟示,坐標(biāo)在美國的Remotasks標(biāo)注員時薪為10至25美元,而精通某些領(lǐng)域的人可望獲得更高收益。截至今年年初,我所咨詢的肯尼亞標(biāo)注員的時薪已跌至1至3美元。

這是在他們有錢賺的時候。關(guān)于Remotasks的工作,最常見的牢騷便是其多變性。雖然它足夠穩(wěn)定成為一個長期的全職工作,但又過于不可預(yù)測而無法提供安全感。標(biāo)注員花費(fèi)數(shù)小時閱讀指示,完成無償培訓(xùn),只為完成十幾個任務(wù),然后項(xiàng)目就告終結(jié)。接下來可能連日無新任務(wù),然后毫無預(yù)兆地,一個完全不同的任務(wù)出現(xiàn)了,它可能持續(xù)幾個小時至數(shù)周。任何任務(wù)都可能是他們的最后一項(xiàng)任務(wù),他們永遠(yuǎn)不知道下一項(xiàng)任務(wù)何時來臨。

根據(jù)工程師和數(shù)據(jù)供應(yīng)商的說法,這種繁榮與蕭條的市場需求周期是由AI的開發(fā)節(jié)奏造成的。培訓(xùn)一個大型模型需要大量的標(biāo)注,之后是更多的迭代更新,工程師們希望盡快完成這一切,以便趕上他們的目標(biāo)發(fā)布日期。可能在幾個月的時間里,市場對標(biāo)注員的需求是幾千名,然后只需要幾百名,接著只需要幾十名某種類型的專家,然后又是數(shù)千名。“問題是,誰為這些波動付出代價?”Partnership on AI的金達(dá)爾說,“因?yàn)楝F(xiàn)在,是工人在承受。”

“如果我把某人變成了億萬富翁,而我每周只掙幾塊錢,我真的是在這里浪費(fèi)我的生命。”

為了順利完成任務(wù),標(biāo)注者聯(lián)手同行。維克多(Victor),一位在內(nèi)羅畢的大學(xué)里開始為Remotasks工作的人,聽到我在標(biāo)注交通管制人員的任務(wù)中所遇到的困擾時告訴我,所有人都知道要避開那個任務(wù):太棘手,報酬太低,不值得。就像很多標(biāo)注者一樣,維克多使用非正式的WhatsApp群組,在好的任務(wù)出現(xiàn)時廣而告之。當(dāng)他摸索出完成新任務(wù)的方法時,他會發(fā)起臨時的Google會議,向他人展示這一方法。任何人都可以加入,并一同工作一段時間,分享技巧。“我們培養(yǎng)出了互助的文化,因?yàn)槲覀冎,靠一個人的力量無法掌握所有的訣竅。”他說。

由于工作總是無預(yù)警地出現(xiàn)和消失,任務(wù)執(zhí)行者總是需要保持警覺。維克多發(fā)現(xiàn),項(xiàng)目通常在深夜冒出來,所以他養(yǎng)成了每隔三個小時左右就醒來檢查任務(wù)隊(duì)列的習(xí)慣。當(dāng)有任務(wù)出現(xiàn)時,他會盡可能長時間保持清醒來工作。有一次,維克多連續(xù)36個小時沒有睡覺,給一些拍攝人群的照片標(biāo)注肘部、膝部和頭部他都不知道為什么要做這些。還有一次,他熬夜太久,母親問他眼睛出了什么問題。他照鏡子才發(fā)現(xiàn)眼睛腫了。

標(biāo)注者通常只知道他們正在為不知在哪里的公司訓(xùn)練AI,但有時候,遮擋的面紗會掉落指示中提到了品牌,或者聊天機(jī)器人透露了太多。“我讀完后,Google了一下,發(fā)現(xiàn)我正在為一個25歲的億萬富翁工作。”一位工人說。當(dāng)我們交談時,他正在給點(diǎn)了達(dá)美樂披薩的人的情緒做標(biāo)注。“如果我把某人變成了億萬富翁,而我每周只掙幾塊錢,我真的是在這里浪費(fèi)我的生命。”

維克多自稱是AI的“狂熱愛好者”,他開始標(biāo)注工作就是因?yàn)樗M軒椭鷮?shí)現(xiàn)一個完全自動化的后工作時代。但是今年早些時候,有人在他的WhatsApp群組里分享了一篇《時代》雜志的文章。文章說有些工人正在訓(xùn)練ChatGPT識別有害內(nèi)容,但是供應(yīng)商Sama AI支付他們的時薪低于2美元。“人們憤怒于這些公司賺取如此多的利潤,卻付給我們?nèi)绱宋⒈〉墓べY。”維克多說。在我告知后,他才知道Remotasks與Scale AI的關(guān)聯(lián)。他從事的一項(xiàng)任務(wù)的指示幾乎與OpenAI使用的指示相同,這意味著他可能也在以3美元的時薪訓(xùn)練ChatGPT。

“我記得有人在網(wǎng)絡(luò)上發(fā)帖說,將來我們會被人們銘記。”他說。“又有人回應(yīng)說,‘我們比步兵還要受虐。未來沒人會記得我們。’這句話我記得特別清楚。我們的工作,我們的努力,無人能認(rèn)識,無人會記得。”

-仵浮-

識別衣物、標(biāo)記客服對話,只是現(xiàn)有標(biāo)注工作中的一部分種類。近來,市場上最火爆的崗位是聊天機(jī)器人的訓(xùn)練師。因?yàn)檫@項(xiàng)工作需要特定的專業(yè)知識或語言流利,并且工資通常會根據(jù)地區(qū)進(jìn)行調(diào)整,所以這個工作往往薪酬更高。特定類型的專業(yè)標(biāo)注者可以賺取每小時50美元甚至更高。

安娜(化名)當(dāng)時在德克薩斯州尋找工作,無意間發(fā)現(xiàn)了一個在線工作的通用列表,并提交了申請。這是Remotasks。通過了入門考試后,她被引入了一個有1500人的Slack聊天室,他們正在為一個代號為“Dolphin”的項(xiàng)目進(jìn)行訓(xùn)練。她后來發(fā)現(xiàn)這其實(shí)就是Google DeepMind的聊天機(jī)器人Sparrow,它是與ChatGPT競爭的眾多機(jī)器人之一。她的工作就是一整天與它對話。她說:“每小時14美元的工資,做的多還有獎金,這肯定比在當(dāng)?shù)氐腄ollar General商店每小時賺10美元強(qiáng)多了。”

另外,她也真的很享受這份工作。她曾與機(jī)器人討論過科幻小說、數(shù)學(xué)悖論、兒童謎語和電視節(jié)目。有時,機(jī)器人的回答讓她發(fā)笑。有時,她又找不出要說什么。“有些日子,我的大腦就像,我實(shí)在是不知道現(xiàn)在應(yīng)該問它什么了,”她說,“所以我手頭有一個小本子,我已經(jīng)寫了大約兩頁的內(nèi)容就是在網(wǎng)上搜了一些有趣的主題我想,今天我應(yīng)該能對付得了七個小時的工作,不過,情況并非總是如此。”

每次安娜給出提示指令,Sparrow都會提供兩種回應(yīng),然后她選擇最好的那個,由此生成了所謂的“人類反饋數(shù)據(jù)”。當(dāng)ChatGPT于去年底首次亮相時,人們認(rèn)為其令人印象深刻的自然對話風(fēng)格,應(yīng)歸功于大量的網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練。但是,訓(xùn)練ChatGPT及其競爭者的語料,經(jīng)過了多輪人工標(biāo)注的過濾。一群承包商會編寫一些樣例,以說明工程師希望機(jī)器人如何回應(yīng)。這些樣例是成對的形式:問題后緊跟正確答案;對電腦程序的描述后緊跟功能代碼;犯罪咨詢后緊跟禮貌的拒絕。在這些樣例上訓(xùn)練模型后,又會引入更多的承包商,繼續(xù)給模型提示,并對其回應(yīng)進(jìn)行等級排序。這就是安娜正在對Sparrow做的事情。評級人員所要遵循的具體標(biāo)準(zhǔn)會有所不同,可能是誠實(shí),或是有幫助,或者只是個人喜好。關(guān)鍵在于他們正在生成人類品味的數(shù)據(jù),一旦有足夠的數(shù)據(jù),工程師們就可以訓(xùn)練出第二個模型,它將大規(guī)模地模擬人類標(biāo)注員的喜好,自動化排序過程,并被用來訓(xùn)練AI以人類贊同的方式行事。結(jié)果我們得到了一個看起來非常像人的機(jī)器人,它在大多數(shù)情況下會拒絕有害的請求,并在解釋自身的AI本質(zhì)時看上去就好像有自我意識一樣。

換句話說,ChatGPT之所以看起來像人,是因?yàn)樗怯赡7氯祟悩?biāo)注員的AI訓(xùn)練出來的。人類標(biāo)注員所訓(xùn)練的AI也在模仿人類,這些人類假裝自己是基于人類寫作材料被訓(xùn)練出來的AI的進(jìn)階版本。

這一路線曲折的技術(shù)被稱為“通過人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(RLHF),其效果如此顯著,以至于我們需要暫停一下來充分理解它的局限性。例如,當(dāng)標(biāo)注員教模型怎樣是準(zhǔn)確的時,該模型并未學(xué)習(xí)如何以邏輯或外部信息校驗(yàn)答案,甚至不會學(xué)習(xí)“準(zhǔn)確”這一概念到底是什么。模型仍舊是一臺模仿人類寫作模式的文本預(yù)測機(jī)器,只不過現(xiàn)在其訓(xùn)練語料庫已增加了定制的樣例,且模型被調(diào)整以偏好這些樣例。也許會出現(xiàn)這樣的情況:模型從其語言圖譜中標(biāo)記為準(zhǔn)確的部分中提取模式,其生成的文本剛好與事實(shí)相符。但也可能出現(xiàn)這樣的情況:模型模仿準(zhǔn)確文本中自信的風(fēng)格和專業(yè)術(shù)語,卻寫出完全錯誤的內(nèi)容。沒有任何保證說標(biāo)注者標(biāo)記為準(zhǔn)確的文本事實(shí)上就是準(zhǔn)確的,而且即使它是,也無法保證模型從中學(xué)到正確的模式。

這一動態(tài)發(fā)展過程使得聊天機(jī)器人的標(biāo)注過程變得非常精細(xì)。它必須嚴(yán)謹(jǐn)一致,因?yàn)榇植诘姆答仯鐚H看起來正確的材料標(biāo)記為準(zhǔn)確的,可能會將模型訓(xùn)練成更具說服力的胡說八道者。OpenAI和DeepMind的一項(xiàng)早期聯(lián)合項(xiàng)目使用了RLHF(通過人類反饋進(jìn)行強(qiáng)化學(xué)習(xí)),以訓(xùn)練一只虛擬的機(jī)器人手臂抓取物品,結(jié)果它同時還學(xué)會了將手放在物體和評級人員之間晃動,這樣它只是在人類監(jiān)督者那里看起來抓住了物品。對一個語言模型的回答進(jìn)行評級總會有些主觀,因?yàn)檫@涉及語言。任何長度的文本都會有多個元素,它們可能正確,可能錯誤,或者文本整體具有誤導(dǎo)性。OpenAI的研究人員在另一篇研究RLHF的早期論文*中遇到了這個困難。研究人員試圖讓模型總結(jié)文本,最終發(fā)現(xiàn)他們只有60%的時間同意一個總結(jié)是好的。“與機(jī)器學(xué)習(xí)中的許多任務(wù)不同,我們的問詢沒有明確的基于客觀事實(shí)的答案。”他們感嘆道。

當(dāng)安娜評估Sparrow的回應(yīng)時,她需仔細(xì)注意其準(zhǔn)確性、有用性和無害性,同時確認(rèn)這個模型沒有給出醫(yī)療或財務(wù)建議,沒有將自身擬人化,也沒有觸犯其他準(zhǔn)則。為了成為有效的訓(xùn)練數(shù)據(jù),模型的回答必須在可量化的意義上得到排序:一個會告訴你如何制作炸彈的機(jī)器人,以及一個因太過無害而拒答任何問題的機(jī)器人,哪一個“更好”?在一篇DeepMind的論文中,當(dāng)Sparrow的制造者輪流進(jìn)行標(biāo)注時,四位研究人員激烈地爭論起他們的機(jī)器人是否對一位向它尋求戀愛建議的用戶進(jìn)行了性別假設(shè)。據(jù)DeepMind的研究科學(xué)家杰弗里歐文(Geoffrey Irving)說,公司的研究人員每周會開展標(biāo)注會議,他們在會上重新評價數(shù)據(jù)并討論模棱兩可的案例。當(dāng)遇到尤其棘手的案例時,他們會咨詢倫理或主題專家。

有人在對TikTok視頻的情感內(nèi)容進(jìn)行分類,有人在辨認(rèn)垃圾電子郵件的新變體,還有人在對在線廣告的性挑逗度做精確的判定。

安娜經(jīng)常發(fā)現(xiàn)自己必須在兩個糟糕的選擇中做出決定。“即使它們都絕對錯誤,錯到可笑,你仍然需要弄清哪個更好,然后寫下你的理由。”她說道。有時,當(dāng)兩個回應(yīng)都很糟糕時,她被鼓勵自己寫出更好的回應(yīng),她大概有一半的時間會這么做。

因?yàn)榉答仈?shù)據(jù)難以收集,所以它的價格較高。根據(jù)了解行業(yè)的人士,像安娜正在生產(chǎn)的這種基本偏好的類型大約為每條1美元。但是,如果你想訓(xùn)練一個模型進(jìn)行法律研究,你需要一個有法律訓(xùn)練的人,這會變得昂貴。每個參與者都不愿透露他們花了多少錢,但通常來說,專業(yè)的書面示例可以要價幾百美元,而請專業(yè)人士評級可能要花費(fèi)50美元或更多。有一位工程師告訴我,他花高達(dá)300美元買了一段蘇格拉底式對話的示例。另一人告訴我,他花15美元買了一首“關(guān)于金魚的黑色幽默的五行詩”。

OpenAI、微軟、Meta以及Anthropic對于有多少人為其模型提供標(biāo)注,他們獲得了多少薪酬,以及這些人分布在世界哪些地區(qū)等問題均未發(fā)表評論。DeepMind(Google子公司)的歐文表示,為Sparrow工作的標(biāo)注者的薪酬至少達(dá)到了能在其所在地“維持生活的時薪”。安娜對Remotasks“一無所知”,但Sparrow的情況相對更為公開。于是她從正在訓(xùn)練的AI那里獲取信息。安娜并不是個例,很多跟我交談過的標(biāo)注者從AI那里獲取的信息,甚至比從雇主那里得到的更多。有幾個人通過詢問AI所在公司的服務(wù)條款,了解了他們?yōu)檎l工作。安娜說:“我直接問它,‘你的目的是什么,Sparrow?’”它提供了指向DeepMind網(wǎng)站的鏈接,并解釋說它是一種AI助手,其創(chuàng)造者使用RLHF進(jìn)行訓(xùn)練,以使其有助于人類并保證其安全性。

-roselle-

直到最近,辨認(rèn)出語言模型的糟糕輸出還是一件相對容易的事,那些輸出看起來就像胡言亂語。但隨著模型的改進(jìn),這個問題變得越來越難這就是所謂的“可擴(kuò)展監(jiān)督”(scalable oversight)問題。Google在其AI助手Bard的首秀上無意中展示了現(xiàn)代語言模型中的錯誤有多難被發(fā)現(xiàn),當(dāng)時Bard犯了一個錯誤,它自信地宣稱詹姆斯韋伯太空望遠(yuǎn)鏡“拍攝了首張?jiān)谖覀兲栂抵獾男行堑恼掌?rdquo;這是錯誤的。這樣的發(fā)展軌跡意味著,標(biāo)注越來越需要特定的技能和專業(yè)知識。

去年,劉易斯(化名)在Mechanical Turk上完成一項(xiàng)任務(wù)后收到了一條消息,他被邀請申請一個從未聽說過的平臺。這個平臺叫做Taskup.ai,其網(wǎng)站異常簡潔,只有一個深藍(lán)色的背景,上面的文字寫道:“按需完成任務(wù)并獲得報酬。”他提交了申請。

這份工作的報酬比他之前嘗試過的任何工作都要好,時薪通常約為30美元。這份工作也更具挑戰(zhàn)性。他需要精心設(shè)計(jì)復(fù)雜的場景,誘導(dǎo)聊天機(jī)器人給出危險的建議,以考驗(yàn)?zāi)P捅3纸巧O(shè)定的能力。他也會探討科學(xué)話題,這些話題深奧到需要做大量的研究。劉易斯覺得這份工作“令人滿足且振奮”。他在檢查一個模型嘗試用Python編程的過程中,也在不斷學(xué)習(xí)。他不敢連續(xù)工作超過四個小時,以免心力耗竭,犯下錯誤,而他希望保住這份工作。

“如果有一件事是我可以改變的,那我希望能了解更多關(guān)于工作另一端的情況,”他說,“我們只知道完成工作所需的信息,但如果我能知道更多,那我或許能做得更好,并考慮將此作為一種職業(yè)。”

除了劉易斯,我還與其他八位類似的工作者交談過。他們大多都在美國。他們也是在一些平臺上填寫了調(diào)查問卷,或完成了任務(wù)后,被Taskup.ai或其他幾個類似的通用網(wǎng)站,如DataAnnotation.tech或Gethybrid.io招募過來。他們的工作通常是訓(xùn)練聊天機(jī)器人,不過相比他們之前在其他網(wǎng)站的工作,新工作要求更高的質(zhì)量,訓(xùn)練目的也更加特殊和專業(yè)。有一個人的任務(wù)是演示電子表格中宏的操作,另一個人只需進(jìn)行對話并根據(jù)她想要的任何標(biāo)準(zhǔn)來評估回應(yīng)。她經(jīng)常問聊天機(jī)器人一些她七歲的女兒在談話中提出的問題,比如“什么是最大的恐龍?”和“寫一個關(guān)于老虎的故事”。“我還沒有完全理解他們想要用它做什么。”她對我說。

Taskup.ai、DataAnnotation.tech和Gethybrid.io似乎歸同一家公司所有:Surge AI。其首席執(zhí)行官埃德溫陳(Edwin Chen)并未證實(shí)也未否認(rèn)這一聯(lián)系,但他愿意談?wù)撍墓疽约八绾慰创龢?biāo)注工作的發(fā)展。

“我一直覺得標(biāo)注領(lǐng)域過于簡單化。”Surge AI辦公室里的陳在視頻電話中說道。他在Google、Facebook和Twitter做過AI相關(guān)的工作,之后于2020年創(chuàng)辦了Surge AI,因?yàn)樗_信眾包的標(biāo)注工作是不夠的。“我們希望AI能講笑話,能撰寫出色的市場營銷文案,或者在我需要治療或其他什么的時候能幫助我,”陳說,“你不能要求五個人分別想一個笑話,然后將它們組合成一個主流答案。并非所有人都能講笑話或解決Python編程問題。這種低質(zhì)量、低技能的標(biāo)注觀念需要變得更豐富,要能夠抓取那些我們希望AI系統(tǒng)擁有的人類技能、創(chuàng)造力和價值觀。”

-Richard Parry-

去年,Surge AI重新標(biāo)注了谷歌對Reddit帖子的情緒分類數(shù)據(jù)集。之前,谷歌曾將每條發(fā)言從上下文中剝離,并將它們送給印度的工作人員進(jìn)行標(biāo)注。熟悉美國互聯(lián)網(wǎng)文化的Surge AI員工發(fā)現(xiàn),30%的標(biāo)注都是錯誤的。像“hell yeah my brother”這樣的帖子被歸入煩惱的類別,“Yay, cold McDonald’s. My favorite”被歸入喜愛的類別。

Surge AI聲稱會對其工作人員進(jìn)行資質(zhì)審查,例如,做創(chuàng)意寫作任務(wù)的人要有創(chuàng)意寫作經(jīng)驗(yàn)。但陳表示,Surge AI找到工作人員的具體方式是“獨(dú)有且保密的”。就像Remotasks一樣,工作人員通常需要完成培訓(xùn)課程,但與Remotasks不同的是,根據(jù)我與標(biāo)注者的交談,他們是有報酬的。陳說,擁有數(shù)量較少、訓(xùn)練有素的工人,同時產(chǎn)生更高質(zhì)量的數(shù)據(jù),這使Surge AI能夠比其他同行提供更好的報酬。但他拒絕進(jìn)一步的說明,只說人們得到了“公平和合乎道德的工資”。我采訪的工人每小時的收入在15到30美元之間,但他們只是所有標(biāo)注者中的一小部分,陳說,現(xiàn)在這個群體已經(jīng)有10萬人。他解釋說,這種保密是由于客戶對保密性的要求。

Surge AI的客戶包括OpenAI、谷歌、微軟、Meta和Anthropic。Surge AI擅長反饋和語言標(biāo)注,ChatGPT推出后,它收到了大量的請求。陳說:“我原以為每個人都知道RLHF的力量,但我猜人們并沒有從內(nèi)心深處理解它。”

新的模型非常令人印象深刻,它們激發(fā)了另一輪預(yù)測,即標(biāo)注即將實(shí)現(xiàn)自動化?紤]到涉及的成本,需要標(biāo)注的公司有很大的財務(wù)壓力來實(shí)現(xiàn)這一點(diǎn)。Anthropic、Meta以及其他公司,近期在利用AI大幅減少指導(dǎo)模型所需的人工標(biāo)注方面取得了一定的突破,其他開發(fā)者也開始使用GPT-4生成訓(xùn)練數(shù)據(jù)。然而,近期的一篇論文發(fā)現(xiàn),GPT-4訓(xùn)練出來的模型可能學(xué)會了模仿GPT的權(quán)威式風(fēng)格,但準(zhǔn)確性反而有所下降。此外,盡管人工智能的提升使得某種形式的標(biāo)注變得過時,但對更復(fù)雜類型的標(biāo)注的需求反而上升。這場爭議在今年初被推向公眾視野,當(dāng)時Scale AI公司的首席執(zhí)行官亞歷山大王在推特上預(yù)測,人工智能實(shí)驗(yàn)室會像對待算力一樣,在人類數(shù)據(jù)上投入大量資金。OpenAI的首席執(zhí)行官薩姆阿特曼(Sam Altman)回應(yīng)說,隨著人工智能的改進(jìn),對數(shù)據(jù)的需求將會下降。

“我的意思是,它能做的事情令人驚訝,”她如此評價聊天機(jī)器人,“但它仍然會做一些真的很奇怪的事情。”

陳對AI是否有一天可以無需人類反饋表示懷疑,但他確實(shí)看到,隨著模型的改進(jìn),標(biāo)注工作變得更加困難。像許多研究者一樣,他認(rèn)為將來的發(fā)展路徑是人們會借助AI系統(tǒng)來監(jiān)督其他AI。Surge AI最近與Anthropic進(jìn)行了一項(xiàng)概念驗(yàn)證實(shí)驗(yàn)的合作。他們讓人類標(biāo)注員在不可靠的AI助手的幫助下回答長長的問題,其理論是,人類將不得不探究他們的AI助手的弱點(diǎn),并協(xié)作推理出正確的答案。另一種可能的方式是讓兩個AI進(jìn)行辯論,再由人類最終判定哪個是正確的。“我們還沒看到這些方式真的被很好地實(shí)踐,但它們開始變得必要,因?yàn)闃?biāo)注員越來越難跟上模型的發(fā)展了。” OpenAI的研究科學(xué)家約翰舒爾曼(John Schulman)最近在伯克利的一次演講中說道。

“我認(rèn)為你總是需要一個人來監(jiān)控AI正在做什么,因?yàn)樗鼈兙褪沁@樣一種外星人一樣的存在。”陳說道。機(jī)器學(xué)習(xí)系統(tǒng)實(shí)在是太奇怪了,人們不能完全信任它。他還補(bǔ)充說,如今最令人嘆為觀止的那些模型,在人類看來都有些詭異的弱點(diǎn)。例如,GPT-4能夠生成復(fù)雜而令人信服的文章,卻無法區(qū)分出哪些詞是形容詞。“要不然就是模型變得非常優(yōu)秀,在所有事物上都超越了人類。如果是這種情況,你就進(jìn)入了烏托邦,誰會在意人類要不要監(jiān)督AI這種事情呢?”

2022年末,喬開始聽到他的學(xué)生反饋,他們的任務(wù)隊(duì)列經(jīng)常為空。然后,他收到一封電郵,告知他肯尼亞的培訓(xùn)營將要關(guān)閉。他繼續(xù)在線培訓(xùn)工作者,但他開始擔(dān)憂未來。“有跡象表明工作無法持久。”標(biāo)注工作正在離開肯尼亞。他從網(wǎng)上認(rèn)識的同事那里聽說,任務(wù)正在轉(zhuǎn)向尼泊爾、印度和菲律賓。“公司從一個地方轉(zhuǎn)向另一個地方,”喬說,“他們在當(dāng)?shù)貨]有基礎(chǔ)設(shè)施,因此他們可以靈活地轉(zhuǎn)移到運(yùn)營成本更低的地方。”

AI行業(yè)與手機(jī)和汽車制造商的一個不同之處在于其流動性。工作內(nèi)容不斷變化,工作不斷被自動化,并被新類型的數(shù)據(jù)需求取代。這是一條生產(chǎn)線,但這條生產(chǎn)線可以被無限次且即時地重新配置,轉(zhuǎn)移到擁有合適的技能、帶寬和工資組合的任何地方。

最近,報酬最高的工作在美國。五月份,Scale AI開始在自己的網(wǎng)站上發(fā)布標(biāo)注工作,尋求幾乎所有在AI預(yù)計(jì)會征服的領(lǐng)域中經(jīng)驗(yàn)豐富的人。招聘的專業(yè)AI訓(xùn)練者所屬的領(lǐng)域包括:健康指導(dǎo)、人力資源、金融、經(jīng)濟(jì)、數(shù)據(jù)科學(xué)、編程、計(jì)算機(jī)科學(xué)、化學(xué)、生物、會計(jì)、稅收、營養(yǎng)學(xué)、物理、旅游、K-12 教育、體育新聞和自助學(xué)習(xí)等。你可以以45美元的時薪教機(jī)器人法律,或者以25美元的時薪教它們詩歌。有些崗位在招聘通過安全審查的人,這很可能是為了幫助訓(xùn)練軍用AI。Scale AI最近推出了一個名為Donovan的防御語言模型,亞歷山大王將其稱為“AI戰(zhàn)爭中的彈藥”,并借其贏得了軍方機(jī)器人戰(zhàn)車項(xiàng)目的合同。

安娜還在德克薩斯州培訓(xùn)聊天機(jī)器人。她的同事們變成了審查員和Slack管理員她不清楚原因,但這給了她希望,這個兼職或許能成為一個長期的工作。她唯一不擔(dān)心的就是自動化會讓她失去工作。“我的意思是,它能做的事情令人驚訝,”她如此評價聊天機(jī)器人,“但它仍然會做一些真的很奇怪的事情。”

Remotasks首次來到肯尼亞時,喬認(rèn)為標(biāo)注會是一個好的職業(yè)。即使工作機(jī)會已經(jīng)轉(zhuǎn)移到其他地方,他仍決心將其變?yōu)樗闹械暮寐殬I(yè)。他推斷,內(nèi)羅畢有數(shù)千人知道如何做這項(xiàng)工作畢竟他培訓(xùn)過許多人。喬在市里租了個辦公室,并開始尋找客戶。他找到了一項(xiàng)為建筑公司標(biāo)注藍(lán)圖的工作,又找到了一項(xiàng)為某農(nóng)業(yè)項(xiàng)目標(biāo)注被蟲子咬壞的水果的工作,還有那些為自動駕駛汽車和電商做標(biāo)注的常規(guī)工作。

但他發(fā)現(xiàn)自己的愿景難以實(shí)現(xiàn)。他現(xiàn)在只有一個全職員工,之前他有兩個。“我們沒有持續(xù)的工作流。”他說。有好幾周的時間,因?yàn)榭蛻羧栽谑占瘮?shù)據(jù),所以他們沒有任何事情可以做。而當(dāng)客戶完成數(shù)據(jù)收集,他必須引進(jìn)短期合同工以滿足客戶的期限要求。“客戶并不在乎我們是否有穩(wěn)定的工作。只要數(shù)據(jù)集完成,一切就結(jié)束了。”

于是,一些工作者決定不讓他們的技能被浪費(fèi),工作機(jī)會在哪里,他們就追去哪里。他們租用代理服務(wù)器來偽裝他們的位置,購買假身份證以通過安全檢查,假裝自己是在新加坡、荷蘭、密西西比或任何有任務(wù)的地方工作。這是一件冒險的事情。根據(jù)多位工作者的說法,Scale AI對于被發(fā)現(xiàn)偽裝位置的賬號變得越來越嚴(yán)厲。在其中一次打擊行動中,我的賬號被封禁,可能是因?yàn)槲乙恢痹谑褂肰PN查看其他國家工作者頁面的內(nèi)容,我的全部1.50美元左右的收入都被凍結(jié)。

“現(xiàn)在我們變得有點(diǎn)狡猾,因?yàn)槲覀冏⒁獾皆谄渌麌宜麄冎Ц兜男匠旰芨?rdquo;,維克多說,他在馬來西亞做任務(wù)的收入是肯尼亞的兩倍。“你得謹(jǐn)慎行事。”

另一位肯尼亞的標(biāo)注員說,他的賬號因莫名的原因被暫時封禁后,他決定不再按規(guī)則辦事,F(xiàn)在,他有多個國家的多個賬號,在報酬最高的地方做任務(wù)。他說,他工作迅速,在質(zhì)檢中得分很高,而這要感謝ChatGPT。他說,這個機(jī)器人很棒,讓他能在幾分鐘內(nèi)快速完成10美元的任務(wù)。我們交談時,他正在讓它根據(jù)七個不同的標(biāo)準(zhǔn)評估另一個聊天機(jī)器人的回應(yīng),用一個AI在訓(xùn)練另一個AI。

作者:Josh Dzieza|譯者:ChatGPT&光影

審校:安靜蟲|編輯:宴梁

排版:鹽|封面:Richard Parry

原文:

https://www.theverge.com/features/23764584/ai-artificial-intelligence-data-notation-labor-scale-surge-remotasks-openai-chatbots

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港