展會(huì)信息港展會(huì)大全

揭秘ChatGPT背后的“AI民工”:枯燥重復(fù)、按件計(jì)酬,時(shí)薪低至1美元
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-24 10:21:11   瀏覽:8753次  

導(dǎo)讀:劃重點(diǎn): 1人工智能通過在大量數(shù)據(jù)中尋找模式來學(xué)習(xí),但首先這些數(shù)據(jù)必須由人類進(jìn)行分類和標(biāo)記,數(shù)據(jù)注釋員由此應(yīng)然而生,他們被視為隱藏在機(jī)器背后的幽靈勞工。 2注釋員們的工作枯燥而乏味,經(jīng)常需要做重復(fù)性的工作,按件計(jì)酬,平均時(shí)薪在5到10美元(約合人...

劃重點(diǎn):

1人工智能通過在大量數(shù)據(jù)中尋找模式來學(xué)習(xí),但首先這些數(shù)據(jù)必須由人類進(jìn)行分類和標(biāo)記,數(shù)據(jù)注釋員由此應(yīng)然而生,他們被視為隱藏在機(jī)器背后的“幽靈勞工”。

2注釋員們的工作枯燥而乏味,經(jīng)常需要做重復(fù)性的工作,按件計(jì)酬,平均時(shí)薪在5到10美元(約合人民幣36到72元)之間。到今年年初,部分注釋員的時(shí)薪已經(jīng)降到了每小時(shí)1到3美元(約合人民幣7到22元)。

3注釋工作依然是人工智能的基礎(chǔ),它已經(jīng)形成了完整的供應(yīng)鏈。這類工作將在很長時(shí)間內(nèi)繼續(xù)存在。

4注釋工作與智能手機(jī)、汽車制造不同的地方在于,它有易變形和流動(dòng)性,經(jīng)常會(huì)流向運(yùn)營成本更低的地方。

從內(nèi)羅畢大學(xué)畢業(yè)幾個(gè)月后,現(xiàn)年30歲的喬(Joe)找到了一份注釋員的工作,主要幫助處理用于訓(xùn)練人工智能的原始信息,這樣的工作枯燥而乏味。人工智能通過在大量數(shù)據(jù)中尋找模式來學(xué)習(xí),但首先這些數(shù)據(jù)必須由人類進(jìn)行分類和標(biāo)記,因此可以說人類是隱藏在機(jī)器背后的“幽靈勞工”。

以喬的工作為例,他正在為自動(dòng)駕駛汽車標(biāo)記視頻,一幀一幀地從每個(gè)攝像頭角度識(shí)別汽車、行人、騎單車者,以及司機(jī)需要注意的任何東西。這是一項(xiàng)困難且需要不斷重復(fù)的工作。一個(gè)幾秒鐘的短視頻需要8個(gè)小時(shí)來注釋,喬為此可以得到大約10美元的報(bào)酬。

然后,在2019年,一個(gè)機(jī)會(huì)突然出現(xiàn)在他面前,喬開始為一家急需注釋員的新公司培訓(xùn)新人,收入是以前的四倍。每隔兩周,50名新員工就會(huì)排隊(duì)進(jìn)入內(nèi)羅畢的一棟辦公樓,開始他們的學(xué)徒生涯。對(duì)注釋員的需求似乎無窮無荊他們將被要求對(duì)鏡子自拍中看到的衣服進(jìn)行分類,通過機(jī)器人吸塵器的眼睛來確定他們所在的房間,并在激光雷達(dá)掃描的摩托車周圍畫出方框。喬的半數(shù)以上學(xué)生通常在培訓(xùn)結(jié)束前就退出了。“有些人不知道如何長時(shí)間呆在一個(gè)地方,”他委婉地解釋道。此外,他承認(rèn),“這項(xiàng)工作很無聊”。

但在一個(gè)工作機(jī)會(huì)稀缺的地方,這畢竟是一份不錯(cuò)的工作,喬培養(yǎng)了數(shù)百名畢業(yè)生。培訓(xùn)結(jié)束后,這些學(xué)徒可以回到家里,獨(dú)自在臥室和廚房里工作,不準(zhǔn)告訴任何人他們?cè)谧鍪裁。這不是真正的問題所在,因?yàn)榫瓦B他們自己甚至都不理解他們?cè)诟墒裁础?/p>

為自動(dòng)駕駛汽車標(biāo)記對(duì)象的工作很容易,但對(duì)扭曲的對(duì)話片段進(jìn)行分類、識(shí)別說話者是機(jī)器人還是人類,卻充滿了挑戰(zhàn)。每個(gè)識(shí)別對(duì)象都是某個(gè)更大項(xiàng)目的一小部分,所以很難說他們到底在訓(xùn)練人工智能做什么。這些對(duì)象的名稱也沒有提供任何線索,Crab Generation、Whale Segment、Woodland Gyro以及Pillbox Bratwurst,都是些沒有任何邏輯順序的工作代號(hào)。

至于雇傭他們的公司,大多數(shù)人只知道它叫Remotasks,一個(gè)為任何英語流利的人提供工作機(jī)會(huì)的網(wǎng)站。就像大多數(shù)注釋員一樣,喬也不知道Remotasks是Scale AI公司旗下合同工外包公司。Scale AI是一家估值數(shù)十億美元的硅谷數(shù)據(jù)供應(yīng)商,其客戶包括人工智能初創(chuàng)企業(yè)OpenAI和美國軍方。Remotasks和Scale AI的網(wǎng)站上都沒有提到過對(duì)方。

01 用獨(dú)特的人類能力幫助機(jī)器

公眾對(duì)OpenAI的ChatGPT等大語言模型的大部分反應(yīng),都集中在它們似乎準(zhǔn)備自動(dòng)化的工作方面。但即使是最令人印象深刻的人工智能系統(tǒng)也離不開人類的幫助,無數(shù)人都在通過給數(shù)據(jù)貼上標(biāo)簽來訓(xùn)練它,并在數(shù)據(jù)被混淆時(shí)介入干預(yù)。只有那些有能力購買這些數(shù)據(jù)的公司才能參與行業(yè)競爭,而那些得到這些數(shù)據(jù)的公司則會(huì)竭盡全力保守這些數(shù)據(jù)的秘密。其結(jié)果是,除了少數(shù)人外,我們對(duì)影響這些系統(tǒng)行為的信息知之甚少,對(duì)塑造這些系統(tǒng)行為背后的人更是如此。

對(duì)喬的學(xué)生們來說,這是一份剝?nèi)チ艘磺姓1硐蟮墓ぷ鳎核麄冃枰袷貒?yán)格的時(shí)間表,不需要知道在做什么,或者在為誰工作。事實(shí)上,他們很少稱自己是在工作,只是在例行完成“任務(wù)”。他們自稱為任務(wù)工作者。

人類學(xué)家大衛(wèi)格雷伯(David Graeber)曾為所謂的“狗屁工作”(bullshit jobs)下過定義,即沒有意義或目的的工作。這些工作應(yīng)該被自動(dòng)化,但由于受到官僚主義、地位或惰性等原因影響,卻沒有被自動(dòng)化。培訓(xùn)人工智能的工作與之類似:人們想要自動(dòng)化的工作,通常認(rèn)為已經(jīng)自動(dòng)化了,但仍然需要人類來參與。這些工作是有特殊用途的,只是注釋員們不知道罷了。

當(dāng)前的人工智能熱潮就始于這種相當(dāng)乏味、重復(fù)性的勞動(dòng)。早在2007年,時(shí)任普林斯頓大學(xué)教授的人工智能研究員李飛飛就曾懷疑,改善圖像識(shí)別神經(jīng)網(wǎng)絡(luò)的關(guān)鍵是在更多數(shù)據(jù)上進(jìn)行訓(xùn)練,需要數(shù)百萬而非數(shù)萬張經(jīng)過標(biāo)記的圖像。問題是,她的團(tuán)隊(duì)需要花費(fèi)數(shù)十年時(shí)間和數(shù)百萬美元才能給這么多照片貼上標(biāo)簽。

李飛飛在亞馬遜的眾包平臺(tái)Mechanical Turk上找到了數(shù)千名工人,世界各地的人們?cè)谶@個(gè)平臺(tái)上以低廉的報(bào)酬完成各種小任務(wù)。由此產(chǎn)生的標(biāo)注數(shù)據(jù)集被稱為ImageNet,它使機(jī)器學(xué)習(xí)取得了重大突破,使該領(lǐng)域重新煥發(fā)活力,并迎來了最近十年的進(jìn)步。

注釋仍然是開發(fā)人工智能必不可少的部分,但工程師們經(jīng)常覺得,對(duì)于更有魅力的建模工作來說,它只是一個(gè)短暫的、繁瑣的先決條件。你可以盡可能便宜地收集盡可能多的標(biāo)記數(shù)據(jù)來訓(xùn)練自己的模型,如果能夠成功,至少在理論上,你就不再需要注釋員了。但是,注釋工作永遠(yuǎn)不會(huì)真正完成。研究人員認(rèn)為機(jī)器學(xué)習(xí)系統(tǒng)“十分脆弱”,當(dāng)遇到訓(xùn)練數(shù)據(jù)中沒有被很好解釋的東西時(shí),很容易失敗。這些失敗被稱為“邊緣案例”,可能會(huì)產(chǎn)生嚴(yán)重的后果。

2018年,網(wǎng)約車公司Uber的一輛自動(dòng)駕駛測試車撞死了一名女性,原因在于:盡管它的編程要求避開騎單車者和行人,但它不知道該如何對(duì)待騎自行車過馬路的人。隨著提供法律建議和醫(yī)療幫助的人工智能系統(tǒng)越多,它們遇到的邊緣案例就越多,就需要更多的人類來對(duì)它們進(jìn)行分類。這已經(jīng)催生了一個(gè)全球性的產(chǎn)業(yè),由像喬這樣的人組成,他們用自己獨(dú)特的人類能力來幫助機(jī)器。

在過去的六個(gè)月里,科技調(diào)查記者喬什齊耶扎(Josh Dzieza)與來自世界各地的二十多名注釋員進(jìn)行了交談,其中許多人正在訓(xùn)練尖端的聊天機(jī)器人,但也有許多人在做維持人工智能運(yùn)行所需的平凡體力勞動(dòng)。有人對(duì)TikTok視頻的情緒化內(nèi)容、垃圾郵件新變體以及不當(dāng)在線廣告進(jìn)行分類。還有人在查看信用卡交易,找出與之相關(guān)的購買類型,或者查看電子商務(wù)推薦,并決定在購買了另一件襯衫后,你是否真的會(huì)喜歡那件襯衫。

人類正在糾正客服聊天機(jī)器人的錯(cuò)誤,傾聽亞馬遜智能助手Alexa的請(qǐng)求,并在視頻通話中對(duì)人們的情緒進(jìn)行分類。他們給食物貼上標(biāo)簽,這樣智能冰箱就不會(huì)被新包裝弄混,在發(fā)出警報(bào)之前檢查自動(dòng)安全攝像頭,并幫助陷入困惑的自動(dòng)拖拉機(jī)識(shí)別玉米。

02 注釋是一門大生意,催生了“最年輕白手起家億萬富翁”

非營利組織Partnership on AI的項(xiàng)目和研究負(fù)責(zé)人索納姆金達(dá)爾(Sonam Jindal)說:“這是一條完整的供應(yīng)鏈。業(yè)界的普遍看法是,這項(xiàng)工作不是技術(shù)開發(fā)的關(guān)鍵部分,不會(huì)繁榮很長時(shí)間。所有的興奮都圍繞著構(gòu)建人工智能擴(kuò)散,一旦我們構(gòu)建了它,就不再需要注釋了,所以為什么要費(fèi)心考慮它呢?但數(shù)據(jù)標(biāo)記是人工智能的基礎(chǔ),就像人類智能是人工智能的基礎(chǔ)那樣,我們需要將這些視為人工智能經(jīng)濟(jì)中真正的工作,這些工作將在很長時(shí)間內(nèi)繼續(xù)存在。”

OpenAI、谷歌和微軟等我們所熟知名字背后的數(shù)據(jù)供應(yīng)商以不同的形式出現(xiàn)。還有些私人外包公司擁有類似呼叫中心的辦公室,比如位于肯尼亞和尼泊爾的CloudFactory,喬在那里做注釋工作,時(shí)薪1.2美元,然后才轉(zhuǎn)投Remotasks。

還有像Mechanical Turk和Clickworker這樣的“眾工”網(wǎng)站,任何人都可以注冊(cè)來完成任務(wù)。處于中間的是Scale AI之類的服務(wù)。任何人都可以注冊(cè),但每個(gè)人都必須通過資格考試和培訓(xùn)課程,并接受績效監(jiān)控。注釋是一門大生意。Scale AI由當(dāng)時(shí)19歲的亞歷山大王(Alexander Wang)于2016年創(chuàng)立,2021年的估值為73億美元,使他進(jìn)入《福布斯》“最年輕白手起家億萬富翁”之列。

這條錯(cuò)綜復(fù)雜的供應(yīng)鏈,外人很難了解。據(jù)業(yè)內(nèi)人士透露,購買標(biāo)記數(shù)據(jù)的公司要求嚴(yán)格保密。注釋有時(shí)候會(huì)泄露正在開發(fā)的人工智能系統(tǒng)信息,而大量注釋人員的加入使得泄漏難以防止。注釋員總是被警告不要告訴任何人他們的工作,甚至不要告訴他們的朋友和同事。最重要的是,極端的勞動(dòng)分工確保了他們沒有足夠的信息來談?wù)撟约旱墓ぷ鳎词顾麄兿胝f也沒辦法。

有鑒于此,沒有辦法對(duì)從事注釋工作的人數(shù)進(jìn)行詳細(xì)的估計(jì),但可以肯定的是,從業(yè)人數(shù)很多,而且還在快速增長。谷歌研究院最近發(fā)表了一篇論文,對(duì)注釋員的數(shù)量給出含糊的估計(jì),約有“數(shù)百萬人”,將來甚至有可能達(dá)到“數(shù)十億”。

自動(dòng)化常常以令人意想不到的方式到來。醫(yī)療數(shù)據(jù)注釋公司Centaur Labs的首席執(zhí)行官埃里克杜海姆(Erik Duhaime)回憶說,幾年前,多位知名機(jī)器學(xué)習(xí)工程師預(yù)測,人工智能將取代放射科醫(yī)生的工作。當(dāng)這種情況沒有發(fā)生時(shí),傳統(tǒng)看法轉(zhuǎn)為放射科醫(yī)生將使用人工智能作為工具。

杜海姆認(rèn)為,這兩種情況都沒有發(fā)生。人工智能非常擅長特定的任務(wù),這促使工作被分解,并分配給專門的算法系統(tǒng)和同樣專業(yè)的人類。他舉例稱,人工智能系統(tǒng)可能能夠發(fā)現(xiàn)癌癥,但只能在特定類型的機(jī)器、特定類型的圖像中發(fā)現(xiàn)。所以,你需要有人來幫助檢查人工智能是否被輸入了正確類型的數(shù)據(jù),也許還需要其他人來檢查它的工作,然后再把它交給另一個(gè)人工智能撰寫報(bào)告,最后再交給人類。杜海姆說:“人工智能不會(huì)取代人類的工作,但它確實(shí)改變了工作的組織方式。”

如果你認(rèn)為人工智能是一臺(tái)聰明的、會(huì)思考的機(jī)器,你可能會(huì)忽略它背后的人類。杜海梅認(rèn)為,人工智能對(duì)現(xiàn)代工作的影響就像是從工匠過度到工業(yè)制造時(shí)代:連貫的過程被分解成小任務(wù),沿著裝配線排列,有些步驟由機(jī)器完成,有些由人類完成,但與以前的情況完全不同。

對(duì)人工智能將帶來顛覆的擔(dān)憂常常被反駁為,人工智能自動(dòng)化了某些任務(wù),而不是整個(gè)工作。這些任務(wù)通常是乏味而枯燥的,可以讓人們?nèi)プ非蟾谐删透小⒏诵曰墓ぷ。但同樣可能的是,人工智能的崛起看起來也像過去節(jié)省勞動(dòng)力的技術(shù),也許就像電話或打字機(jī)那樣,它們消除了傳遞信息和手寫的苦差事,但產(chǎn)生了更多有關(guān)通信、商業(yè)和文書方面的工作,以至于需要由文員、會(huì)計(jì)師、打字員等新型員工組成的新辦公室來管理這些工作。當(dāng)人工智能加入你的工作時(shí),你可能不會(huì)失去工作,但它可能會(huì)變得更陌生、更孤立、更乏味。

03 將復(fù)雜的現(xiàn)實(shí)簡化為機(jī)器可以讀懂的東西

今年早些時(shí)候,記者齊耶扎注冊(cè)了Remotasks的工作。這個(gè)過程很簡單。只需要輸入電腦規(guī)格、網(wǎng)速和基本的聯(lián)系信息,就可以進(jìn)入“培訓(xùn)中心”。為了獲得付費(fèi)任務(wù),齊耶扎首先必須完成相關(guān)的、但沒有任何報(bào)酬的入門課程。培訓(xùn)中心展示了一系列課程,這些課程的名字令人難以理解,比如膠水泳衣和海報(bào)夏威夷等。齊耶扎點(diǎn)擊了名為GFD Chunking的東西,它要求在社交媒體照片中給衣服貼標(biāo)簽。

除此之外,還有關(guān)于任務(wù)的指示說明,比如必須給真實(shí)的、可以供人類穿著或打算供真人穿著的物品貼標(biāo)簽。齊耶扎對(duì)自己區(qū)分真人可以穿的真衣服和不能穿的假衣服的能力充滿信心,于是他開始了測試。然而,他馬上遭到了當(dāng)頭一擊:電腦給出一張雜志圖片,上面是一位穿著裙子的女性照片。衣服的照片應(yīng)該被視為真正的衣服嗎?不,齊耶扎想,因?yàn)槿瞬荒艽┮路恼掌。結(jié)果顯示錯(cuò)誤!因?yàn)樵谌斯ぶ悄芸磥,真衣服的照片就相?dāng)于真衣服。

接下來的照片是一個(gè)女人在昏暗的臥室里對(duì)著一面全身鏡自拍。她穿的襯衫和短褲是真衣服,那衣服的倒影也是真的嗎?齊耶扎同樣給出了否定答案,但人工智能系統(tǒng)認(rèn)為,真實(shí)衣服的倒影也應(yīng)該是真實(shí)的衣服。

在經(jīng)歷了令人尷尬的反復(fù)試驗(yàn)之后,齊耶扎終于開始了真正的工作,但他卻驚恐地發(fā)現(xiàn),他一直在努力遵循的指示已經(jīng)被更新了很多次,而且長度增至43頁,包括不要在裝滿衣服的打開的行李箱上貼標(biāo)簽;不要給鞋子貼標(biāo)簽,但要給腳蹼貼標(biāo)簽;要給緊身褲貼標(biāo)簽,但不要給緊身衣貼標(biāo)簽;即使有人穿著毛巾,也不要給毛巾貼標(biāo)簽;給服裝貼標(biāo)簽,但不要給盔甲貼標(biāo)簽。等等......

德國魏森鮑姆研究所(Weizenbaum Institute)研究數(shù)據(jù)工作的研究員米拉格羅斯米塞利(Milagros Miceli)表示,整個(gè)行業(yè)都存在指示說明普遍混亂的情況。在某種程度上,這是機(jī)器學(xué)習(xí)系統(tǒng)學(xué)習(xí)方式的產(chǎn)物。人類只需要幾個(gè)例子就能理解“襯衫”的概念,而機(jī)器學(xué)習(xí)程序需要成千上萬個(gè)例子,而且它們需要以完美的一致性和足夠的多樣性(馬球衫、戶外穿的襯衫、掛在架子上的襯衫)進(jìn)行分類,這樣系統(tǒng)才能處理現(xiàn)實(shí)世界的多樣性。米塞利說:“想象一下,我們需要將復(fù)雜的現(xiàn)實(shí)簡化為笨拙機(jī)器可以閱讀的東西。”

對(duì)于機(jī)器來說,簡化現(xiàn)實(shí)的行為會(huì)給其帶來極大的復(fù)雜性。指令編寫者必須提出規(guī)則,使人類能夠以完美的一致性對(duì)世界進(jìn)行分類。為了做到這一點(diǎn),他們經(jīng)常創(chuàng)建人類不會(huì)使用的類別。如果一個(gè)人被要求給一張照片中的所有襯衫貼上標(biāo)簽,他可能不會(huì)給鏡子里的襯衫貼上標(biāo)簽,因?yàn)樗麄冎滥鞘欠瓷涞挠白,并非真?shí)的衣服。但對(duì)于不了解現(xiàn)實(shí)世界的人工智能來說,這只是像素,兩者是完全相同的。如果數(shù)據(jù)集中有些襯衫被標(biāo)記,而其他反射的襯衫沒有被標(biāo)記,那么該模型將不起作用。于是,工程師帶著更新的信息回到供應(yīng)商那里,要求給鏡子反射的襯衫貼標(biāo)簽。很快,你就會(huì)有另一份長達(dá)43頁的指南,上面全是紅色的大寫字母。

注釋員的工作通常是把人類的理解放在一邊,非常非常嚴(yán)格地按照指示去做。正如一位注釋員所說,像機(jī)器人一樣思考。這是一個(gè)奇怪的精神空間,盡你所能遵循荒謬但嚴(yán)格的規(guī)則,就像在服用致幻劑時(shí)參加標(biāo)準(zhǔn)測試那樣。注釋員總是會(huì)遇到些令人困惑的問題,比如,這是一件帶有白色條紋的紅襯衫還是一件帶有紅色條紋的白襯衫?如果柳條碗里裝滿了蘋果,那它是“裝飾碗”嗎?豹紋是什么顏色的?每個(gè)問題都必須回答,一個(gè)錯(cuò)誤的猜測可能會(huì)讓你被禁,并啟動(dòng)一個(gè)全新的、完全不同的任務(wù),它有自己令人費(fèi)解的規(guī)則。

04 按件計(jì)酬,每隔三個(gè)小時(shí)就要查看任務(wù)

Remotasks上的大部分工作都是按件計(jì)酬的,一項(xiàng)任務(wù)的收入從幾美分到幾美元不等。因?yàn)槿蝿?wù)可能需要幾秒鐘或幾個(gè)小時(shí)完成,所以工資很難預(yù)測。當(dāng)Remotasks剛進(jìn)入肯尼亞時(shí),注釋員說它的報(bào)酬相對(duì)較高。根據(jù)任務(wù)的不同,平均每小時(shí)大約5到10美元。但隨著時(shí)間的推移,報(bào)酬會(huì)下降。

Scale AI發(fā)言人安娜弗蘭科(Anna Franko)表示,該公司的經(jīng)濟(jì)學(xué)家會(huì)分析項(xiàng)目的細(xì)節(jié)、所需的技能、地區(qū)生活成本和其他因素,“以確保公平和有競爭力的薪酬”。Scale AI的前員工還表示,薪酬是通過一種類似暴漲定價(jià)的機(jī)制確定的,該機(jī)制會(huì)根據(jù)可用的注釋員數(shù)量和需要數(shù)據(jù)的速度進(jìn)行調(diào)整。統(tǒng)計(jì)顯示,美國的Remotasks注釋員通常每小時(shí)可賺10到25美元,但有些專業(yè)標(biāo)注領(lǐng)域的專家報(bào)酬更高。到今年年初,肯尼亞注釋員的工資已經(jīng)降到了每小時(shí)1到3美元(約合人民幣7到22元)。

對(duì)遠(yuǎn)程任務(wù)工作最常見的抱怨是其易變性。這類工作足夠穩(wěn)定,可以作為一份長期全職工作,但有太多不可預(yù)測性,不能完全依賴它。注釋員花費(fèi)數(shù)小時(shí)閱讀說明并完成無償培訓(xùn),只是為了完成十幾個(gè)任務(wù),然后項(xiàng)目就結(jié)束了。可能幾天都沒有什么新任務(wù),然后,毫無征兆地,一個(gè)完全不同的任務(wù)出現(xiàn)了,可能持續(xù)幾小時(shí)到幾周。任何任務(wù)都可能是他們的最后任務(wù),他們也永遠(yuǎn)不知道下一個(gè)任務(wù)什么時(shí)候會(huì)到來。

工程師和數(shù)據(jù)供應(yīng)商表示,這種繁榮與蕭條的周期源于人工智能的開發(fā)節(jié)奏。訓(xùn)練一個(gè)大型模型需要大量的注釋,然后是更多的迭代更新,工程師們希望所有這些都盡可能快地進(jìn)行,這樣他們就能趕上目標(biāo)發(fā)布日期。他們可能在幾個(gè)月的時(shí)間里需要數(shù)千名注釋員,然后降至幾百人,最后只需要十幾名特定類型的專家。這個(gè)過程有時(shí)候會(huì)循環(huán)進(jìn)行。“問題是,誰來承擔(dān)這些波動(dòng)的成本?”Partnership on AI的金達(dá)爾說。

要想取得成功,注釋員必須協(xié)同工作。維克多在內(nèi)羅畢上大學(xué)時(shí)就開始為Remotasks工作,當(dāng)有人告訴他在交通管制任務(wù)中遇到困難時(shí),他說每個(gè)人都知道要遠(yuǎn)離那個(gè)任務(wù):太棘手,薪水低,不值得。像許多注釋員一樣,當(dāng)有好任務(wù)出現(xiàn)時(shí),維克多會(huì)使用非官方的WhatsApp群來傳播消息。當(dāng)他想出一個(gè)新點(diǎn)子時(shí),他就會(huì)開始即興的谷歌會(huì)議,向其他人展示如何做到這一點(diǎn)。任何人都可以加入并一起工作一段時(shí)間,分享技巧。他說:“我們已經(jīng)形成了一種互相幫助的文化,因?yàn)槲覀冎,一個(gè)人不可能知道所有的訣竅。”

因?yàn)楣ぷ骱翢o征兆地出現(xiàn)又消失,所以注釋員總是需要保持警惕。維克多發(fā)現(xiàn),項(xiàng)目通常會(huì)在深夜突然出現(xiàn),所以他習(xí)慣每三個(gè)小時(shí)左右就起來檢查一次。當(dāng)有任務(wù)時(shí),他會(huì)一直保持清醒。有一次,他連續(xù)36個(gè)小時(shí)不睡覺,在人群的照片中給肘部、膝蓋和頭部做標(biāo)記,盡管他也不知道為什么。還有一次,他熬夜太久,以至于眼睛紅腫不堪。

注釋員通常只知道他們正在為其他地方的公司訓(xùn)練人工智能系統(tǒng),但有時(shí)匿名的面紗會(huì)消失,指示說明中提到的品牌或聊天機(jī)器人線索太多了。一名注釋員稱:“我讀了指示說明,在谷歌上進(jìn)行了搜索,發(fā)現(xiàn)我在為一位25歲的億萬富翁工作。如果我讓某人成為億萬富翁,而我每周能賺幾美元,那我真的是在浪費(fèi)生命。”

維克多自稱是人工智能的“狂熱信徒”,他開始做注釋工作是因?yàn)樗霂椭鷮?shí)現(xiàn)一個(gè)完全自動(dòng)化的未來。但今年早些時(shí)候,有人在他的WhatsApp群里發(fā)了一篇《時(shí)代》雜志的報(bào)道,講的是供應(yīng)商Sama AI的員工培訓(xùn)ChatGPT識(shí)別有毒內(nèi)容的情況,他們的時(shí)薪不到2美元。維克多說:“人們對(duì)這些公司利潤豐厚但薪酬卻如此之低感到憤怒。”直到被告知Remotasks與Scale AI的聯(lián)系,他才知道兩者的關(guān)系。他參與的其中一項(xiàng)任務(wù)的說明與OpenAI使用的幾乎相同,這意味著他可能也參與了ChatGPT的訓(xùn)練,時(shí)薪大約為3美元。

“我記得有人發(fā)帖說,我們將來會(huì)被人銘記,”他說。零一人回答說:“我們受到的待遇比步兵還差。我們?cè)谖磥淼娜魏蔚胤蕉疾粫?huì)被記住,這一點(diǎn)我記得很清楚。沒有人會(huì)認(rèn)可我們所做的工作和付出的努力。”

識(shí)別服裝和標(biāo)注客戶服務(wù)對(duì)話只是注釋工作中的一小部分。最近,市場上最熱門的是聊天機(jī)器人培訓(xùn)師。因?yàn)樗枰囟I(lǐng)域的專業(yè)知識(shí)或語言流利程度,而且工資往往會(huì)根據(jù)地區(qū)進(jìn)行調(diào)整,所以這份工作的薪酬往往更高。某些類型的專業(yè)注釋每小時(shí)薪酬可達(dá)50美元或更多。

一個(gè)名叫安娜(Anna)的女人在得克薩斯州找工作時(shí),偶然發(fā)現(xiàn)了一個(gè)通用的在線工作清單,于是她申請(qǐng)了工作。在通過了入門考試后,她被帶進(jìn)了一個(gè)有1500人的Slack房間,那里正在訓(xùn)練代號(hào)為Dolphin的項(xiàng)目,后來她發(fā)現(xiàn)這是谷歌DeepMind的聊天機(jī)器人Sparrow,它是與ChatGPT競爭的眾多聊天機(jī)器人之一。安娜的工作就是整天和Sparrow聊天,時(shí)薪約為14美元,加上工作效率高的獎(jiǎng)金,“這絕對(duì)比在當(dāng)?shù)爻写蚬べ嵢?0美元時(shí)薪要好”。

05 AI響應(yīng)三大標(biāo)準(zhǔn):準(zhǔn)確性、有用性和無害性

而且,安娜很喜歡這份工作。她與Sparrow討論過科幻小說、數(shù)學(xué)悖論、兒童謎語和電視節(jié)目等話題。有時(shí),聊天機(jī)器人的回答會(huì)讓她大笑不止。有時(shí)候,她也會(huì)覺得無話可說。安娜稱:“有時(shí)候,我真的不知道到底該問什么,所以我有一個(gè)小筆記本,里面已經(jīng)寫了兩頁的東西。我在谷歌上搜尋有趣的話題,所以我認(rèn)為自己可以很好地應(yīng)付七個(gè)小時(shí),但情況并非總是如此。”

每次安娜提示Sparrow時(shí),它都會(huì)給出兩個(gè)回答,然后她要選出最好的一個(gè),從而創(chuàng)造出所謂的“人類反饋數(shù)據(jù)”。當(dāng)ChatGPT去年年底首次亮相時(shí),其令人印象深刻的自然對(duì)話風(fēng)格被歸功于它經(jīng)過了大量互聯(lián)網(wǎng)數(shù)據(jù)的訓(xùn)練。但是,為ChatGPT及其競爭對(duì)手提供動(dòng)力的語言是經(jīng)過幾輪人工注釋過濾的。

一組承包商編寫了工程師希望聊天機(jī)器人如何表現(xiàn)的示例,他們先提出問題然后給出正確答案,描述計(jì)算機(jī)程序然后給出功能代碼,詢問犯罪技巧然后禮貌地拒絕。在用這些例子對(duì)模型進(jìn)行訓(xùn)練之后,還會(huì)引入更多的承包商來提示它并對(duì)其響應(yīng)進(jìn)行排序。這就是安娜對(duì)Sparrow所做的。

確切地說,評(píng)分者被告知使用的標(biāo)準(zhǔn)各不相同,比如誠實(shí)、樂于助人或只是個(gè)人偏好等。關(guān)鍵是,他們正在創(chuàng)造關(guān)于人類品味的數(shù)據(jù),一旦有了足夠的數(shù)據(jù),工程師們就可以訓(xùn)練第二個(gè)模型來大規(guī)模模仿他們的偏好,使排名過程自動(dòng)化,并訓(xùn)練他們的人工智能以人類認(rèn)可的方式行事。結(jié)果是一個(gè)非常像人類的機(jī)器人誕生了,它基本上會(huì)拒絕有害的請(qǐng)求,并以似乎有自我意識(shí)的方式解釋了它的人工智能本質(zhì)。

換句話說,ChatGPT看起來很人性化,因?yàn)樗怯梢粋(gè)模仿人類的人工智能訓(xùn)練出來的,而這個(gè)人工智能正在模仿人類行事。

這種技術(shù)被稱為“從人類反饋中強(qiáng)化學(xué)習(xí)”,簡稱RLHF,它非常有效,可以停下反思人工智能沒有做的事情。例如,當(dāng)注釋員教模型要準(zhǔn)確時(shí),模型并沒有學(xué)習(xí)根據(jù)邏輯或外部來源檢查答案,甚至不知道作為概念,準(zhǔn)確性到底為何物。盡管這個(gè)模型仍然是一個(gè)模仿人類寫作模式的文本預(yù)測機(jī)器,但現(xiàn)在它的訓(xùn)練語料庫已經(jīng)補(bǔ)充了定制的示例,并且該模型已經(jīng)加權(quán)以支持它們。

這可能會(huì)促使模型從其語言地圖中被標(biāo)記為準(zhǔn)確的部分提取模式,并產(chǎn)生恰好與事實(shí)相符的文本,但也可能導(dǎo)致它模仿準(zhǔn)確文本的自信風(fēng)格和專業(yè)術(shù)語,同時(shí)寫出完全錯(cuò)誤的東西。不能保證注釋員標(biāo)記為準(zhǔn)確的文本實(shí)際上是準(zhǔn)確的。即使它是準(zhǔn)確的,也不能保證模型從中學(xué)習(xí)到正確的模式。

這種動(dòng)態(tài)使得為聊天機(jī)器人注釋并不容易。它必須是嚴(yán)格和一致的,因?yàn)椴萋实姆答,比如把聽起來正確的材料標(biāo)記為準(zhǔn)確的,可能會(huì)讓訓(xùn)練出來的模型更有說服力。OpenAI和DeepMind在早期的聯(lián)合項(xiàng)目中使用了RLHF,在這個(gè)案例中,訓(xùn)練虛擬機(jī)器人手抓取物品,結(jié)果也訓(xùn)練了機(jī)器人的手在物體和它的評(píng)分者之間的位置,并在周圍擺動(dòng),這樣它就只會(huì)出現(xiàn)在它的人類監(jiān)督者面前。

對(duì)語言模型的響應(yīng)進(jìn)行排名總是有些主觀,因?yàn)檫@是一種語言。任何長度的文本都可能包含多個(gè)元素,這些元素可能是正確的,也可能是錯(cuò)誤的,或者具有誤導(dǎo)性。OpenAI的研究人員在另一篇早期RLHF論文中遇到了這個(gè)障礙。為了讓他們的模型對(duì)文本進(jìn)行總結(jié),研究人員發(fā)現(xiàn),只有60%的模型總結(jié)是好的。“與機(jī)器學(xué)習(xí)中的許多任務(wù)不同,我們的查詢沒有明確的基本事實(shí),”他們哀嘆道。

當(dāng)安娜給Sparrow的回答打分時(shí),她應(yīng)該查看它們的準(zhǔn)確性、有用性和無害性,同時(shí)還要檢查這個(gè)模型沒有給出醫(yī)療或財(cái)務(wù)建議,沒有把自己擬人化,也沒有違反其他標(biāo)準(zhǔn)。為了成為有用的訓(xùn)練數(shù)據(jù),模型的反應(yīng)必須被量化地排序:一個(gè)能告訴你如何制造炸彈的機(jī)器人比一個(gè)拒絕回答任何問題的無害機(jī)器人“更好”嗎?

在DeepMind的一篇論文中,當(dāng)Sparrow的制造者輪流注釋時(shí),四名研究人員爭論他們的機(jī)器人是否假設(shè)了向其尋求情感建議的用戶的性別。據(jù)DeepMind的研究科學(xué)家杰弗里歐文(Geoffrey Irving)介紹,該公司的研究人員每周都會(huì)舉行注釋會(huì)議,在會(huì)上他們自己審核數(shù)據(jù),討論模棱兩可的案例。當(dāng)某個(gè)案例特別棘手時(shí),他們會(huì)咨詢倫理或主題專家。

安娜經(jīng)常發(fā)現(xiàn),她不得不在兩個(gè)糟糕的選擇中做出選擇。她說:“即使它們都是錯(cuò)得離譜的答案,你仍然需要找出哪一個(gè)更好,然后寫下解釋原因的文字。”有時(shí),當(dāng)兩個(gè)回答都不好時(shí),她會(huì)被鼓勵(lì)自己給出更好的回答。在訓(xùn)練過程中,約有半數(shù)時(shí)間需要她這樣做。

06 注釋越來越需要特定技能和專業(yè)知識(shí)

因?yàn)榉答伒臄?shù)據(jù)很難收集,所以出售的價(jià)格更高。據(jù)了解該行業(yè)的人士透露,安娜正在收集的這類基本偏好數(shù)據(jù)售價(jià)約為每條1美元。但如果你想訓(xùn)練一個(gè)模特做法律研究,你需要一個(gè)受過法律培訓(xùn)的人,這會(huì)導(dǎo)致成本增加。參與其中的每個(gè)人都不愿透露自己到底花了多少錢,但一般來說,專業(yè)的書面示例可能要幾百美元,而專家評(píng)級(jí)可能要50美元或更多。一位工程師透露,他曾花300美元買過Socratic對(duì)話的樣本。

OpenAI、微軟、Meta和Anthropic沒有透露有多少人為他們的模型貢獻(xiàn)了注釋,他們的報(bào)酬是多少,或者他們位于世界的什么地方。谷歌姊妹公司DeepMind的歐文說,在Sparrow上工作的注釋員根據(jù)他們所在的位置,得到的報(bào)酬至少相當(dāng)于最低工資的時(shí)薪。安娜對(duì)Remotasks“一無所知”,但對(duì)Sparrow更了解,知道它是DeepMind的人工智能助手,其創(chuàng)建者使用RLHF對(duì)它進(jìn)行了培訓(xùn)。

直到最近,發(fā)現(xiàn)語言模型的不良輸出還是相對(duì)容易的,看起來像是胡言亂語。但隨著模型變得越來越好,這樣的工作變得更加困難,這是個(gè)被稱為“可擴(kuò)展監(jiān)督”的問題。谷歌在其人工智能助手Bard首次亮相時(shí)使用了現(xiàn)代語言模型,這無意中證明了發(fā)現(xiàn)現(xiàn)代語言模型的錯(cuò)誤是多么困難。這條軌跡意味著,注釋越來越需要特定的技能和專業(yè)知識(shí)。

去年,一個(gè)叫劉易斯(Lewis)的人在Mechanical Turk上工作,在完成一項(xiàng)任務(wù)后,他收到了一條消息,邀請(qǐng)他加入一個(gè)他從未聽說過的平臺(tái)。它被稱為Taskup.ai,這個(gè)網(wǎng)站非常簡單,只有一個(gè)海軍背景,上面寫著“按需付費(fèi)”的文字。劉易斯選擇了注冊(cè)。

這份工作的報(bào)酬比他以前做過的其他工作都要高得多,通常是每小時(shí)30美元左右。不過,它也更具挑戰(zhàn)性,要求設(shè)計(jì)復(fù)雜的場景來欺騙聊天機(jī)器人給出危險(xiǎn)的建議,測試模型保持自身角色的能力,以及就科學(xué)話題進(jìn)行詳細(xì)的對(duì)話,這些話題有很強(qiáng)的技術(shù)性,需要進(jìn)行廣泛的研究。劉易斯覺得這份工作“令人滿意、令人興奮”。在檢查一個(gè)模型嘗試用Python編寫代碼的同時(shí),劉易斯也在學(xué)習(xí)。他不能連續(xù)工作超過4個(gè)小時(shí),以免精神疲憊導(dǎo)致犯下錯(cuò)誤,他想保住這份工作。

劉易斯說:“如果有什么是我可以改變的,我只想知道更多關(guān)于另一端發(fā)生了什么。我們只知道完成工作所需的知識(shí),但如果我能知道得更多,也許我就能取得更大成就,也許還能把它當(dāng)成一種職業(yè)。”

科技調(diào)查記者齊耶扎采訪了另外八人,他們大多在美國工作,都有類似的經(jīng)歷,即在其他平臺(tái)上回答調(diào)查或完成任務(wù),然后發(fā)現(xiàn)自己被Taskup.ai或幾個(gè)類似網(wǎng)站錄用了,比如DataAnnotation.tech或Gethybrid.io。他們的工作通常涉及訓(xùn)練聊天機(jī)器人,盡管與他們工作過的其他網(wǎng)站相比,他們對(duì)聊天機(jī)器人的質(zhì)量要求更高,目的也更專業(yè)。其中一個(gè)是演示電子表宏,另一個(gè)只需要進(jìn)行對(duì)話,并根據(jù)她想要的任何標(biāo)準(zhǔn)對(duì)回應(yīng)進(jìn)行評(píng)級(jí)。她經(jīng)常問聊天機(jī)器人一些問題,這些問題在與7歲女兒聊天時(shí)也會(huì)出現(xiàn),比如“最大的恐龍是什么?”,“寫一個(gè)關(guān)于老虎的故事。”

Taskup.ai、DataAnnotation.tech和Gethybri.io似乎都屬于同一家公司:Surge AI。其首席執(zhí)行官埃德溫陳(Edwin Chen)既不愿證實(shí)也不否認(rèn)這一聯(lián)系,但他愿意談?wù)撍墓疽约八绾慰创⑨尩难葑儭?/p>

埃德溫表示:“我一直覺得標(biāo)注領(lǐng)域過于簡單化了。”在谷歌、Facebook和推特從事人工智能研究后,他確信眾包標(biāo)簽是不夠的,并于2020年創(chuàng)立了Surge AI。埃德溫說:“我們希望人工智能可以講笑話,寫很好的營銷文案,或者在我需要治療的時(shí)候幫助我。但不是每個(gè)人都能講笑話或解決Python編程問題的,注釋領(lǐng)域需要從這種低質(zhì)量、低技能的思維模式轉(zhuǎn)變?yōu)楦S富的東西,并捕捉到我們希望人工智能系統(tǒng)擁有的人類技能、創(chuàng)造力和價(jià)值觀。”

07 機(jī)器學(xué)習(xí)系統(tǒng)太奇怪了,永遠(yuǎn)不能完全信任

去年,Surge AI重新標(biāo)記了谷歌根據(jù)情緒對(duì)Reddit帖子進(jìn)行分類的數(shù)據(jù)集。谷歌剝離了每條帖子的上下文,并將其發(fā)送給印度的注釋員進(jìn)行標(biāo)注。熟悉美國互聯(lián)網(wǎng)文化的Surge AI員工發(fā)現(xiàn),30%的標(biāo)注是錯(cuò)誤的。像“見鬼了,我的兄弟”這樣的帖子被歸類為“討厭”,而“涼爽麥當(dāng)勞,我的最愛”則被歸入“喜愛”行列。

埃德溫表示,Surge AI會(huì)審查注釋員的資質(zhì),比如從事創(chuàng)意寫作任務(wù)的人是否有創(chuàng)意寫作的經(jīng)驗(yàn),但具體如何尋找員工是“秘密”。與Remotasks一樣,工作人員通常必須完成培訓(xùn)課程,盡管與Remotasks不同的是,培訓(xùn)期間接受任務(wù)可以得到報(bào)酬。擁有更少、更訓(xùn)練有素的員工,產(chǎn)生更高質(zhì)量的數(shù)據(jù),使得Surge AI的薪酬比同行更高,但他拒絕詳細(xì)說明,只說員工的工資是“公平、合乎道德水平”。這類注釋員的時(shí)薪在15美元到30美元之間,但他們只是所有注釋員中的一小部分,這個(gè)群體現(xiàn)在有10萬人。他解釋說,這種保密源于客戶的要求。

Surge AI的客戶包括OpenAI、谷歌、微軟、Meta和Anthropic。Surge AI專注于反饋和語言注釋,在ChatGPT推出后,它收到了大量的請(qǐng)求,埃德溫說:“我以為每個(gè)人都知道RLHF的力量,但我猜人們只是沒有從內(nèi)心上理解。”

這些新模型令人印象深刻,它們激發(fā)了新一輪的預(yù)測,即注釋即將實(shí)現(xiàn)自動(dòng)化?紤]到所涉及的費(fèi)用,這樣做的財(cái)政壓力很大。Anthropic、Meta和其他公司最近在使用人工智能方面取得了長足的進(jìn)步,減少了指導(dǎo)模型所需的人工注釋量,其他開發(fā)人員已經(jīng)開始使用GPT-4來生成訓(xùn)練數(shù)據(jù)。

然而,最近的一篇論文發(fā)現(xiàn),經(jīng)過GPT-4訓(xùn)練的模型可能正在學(xué)習(xí)模仿GPT的權(quán)威風(fēng)格,準(zhǔn)確性更低。到目前為止,當(dāng)人工智能的改進(jìn)使一種形式的標(biāo)注過時(shí)時(shí),對(duì)其他更復(fù)雜類型的標(biāo)注需求就會(huì)上升。今年早些時(shí)候,這場辯論公開化了,Scale AI的首席執(zhí)行官在推特上說,他預(yù)測人工智能實(shí)驗(yàn)室在人類數(shù)據(jù)上的投入將很快達(dá)到數(shù)十億美元,就像他們?cè)谒闵系耐度胍粯印penAI首席執(zhí)行官薩姆奧特曼(Sam Altman)回應(yīng)說,隨著人工智能的進(jìn)步,數(shù)據(jù)需求將會(huì)減少。

埃德溫懷疑人工智能是否會(huì)達(dá)到不再需要人類反饋的程度,但他確實(shí)看到,隨著模型的改進(jìn),標(biāo)注變得越來越困難。像許多研究人員一樣,他認(rèn)為未來的道路將涉及人工智能系統(tǒng)幫助人類監(jiān)督其他人工智能。Surge AI最近與Anthropic合作進(jìn)行了一個(gè)概念驗(yàn)證,讓人類注釋員在一個(gè)不可靠人工智能助手的幫助下回答關(guān)于一篇冗長文本的問題,其理論是人類必須感覺到他們?nèi)斯ぶ悄苤值娜觞c(diǎn),并合作推理找到正確答案。

另一種可能性是兩個(gè)人工智能相互辯論,然后由人類做出最終判斷。OpenAI研究科學(xué)家約翰舒爾曼(John Schulman)最近在伯克利的一次演講中表示:“我們還沒有看到這種東西真正的實(shí)際應(yīng)用潛力,但它開始變得必要,因?yàn)樽⑨寙T很難跟上模型的進(jìn)步。”

埃德溫說:“我認(rèn)為你總是需要一個(gè)人來監(jiān)視人工智能在做什么,就因?yàn)樗麄兪沁@種外星人。機(jī)器學(xué)習(xí)系統(tǒng)太奇怪了,永遠(yuǎn)不能完全信任。當(dāng)今最令人印象深刻的模型有些在人類看來似乎非常奇怪的弱點(diǎn)。盡管GPT-4可以生成復(fù)雜而令人信服的文本,但它無法辨別出哪些詞是形容詞。”

08 隨著任務(wù)流動(dòng),ChatGPT幫了大忙

隨著2022年的結(jié)束,喬開始從他的學(xué)生那里聽說,他們的任務(wù)清單經(jīng)常是空的。然后他收到一封電子郵件,通知他肯尼亞的訓(xùn)練營即將關(guān)閉。他繼續(xù)在網(wǎng)上培訓(xùn)任務(wù),但他開始擔(dān)心未來。

“有跡象表明,這種情況不會(huì)持續(xù)太久,”喬說。注釋工作即將離開肯尼亞。從他在網(wǎng)上認(rèn)識(shí)的同事那里,他聽說這類任務(wù)要被送去尼泊爾、印度和菲律賓。喬說:“公司從一個(gè)地區(qū)轉(zhuǎn)移到另一個(gè)地區(qū)。他們?cè)诋?dāng)?shù)貨]有基礎(chǔ)設(shè)施,因此可以靈活地轉(zhuǎn)移到運(yùn)營成本對(duì)他們更有利的地方。”

人工智能行業(yè)與手機(jī)和汽車制造商的一個(gè)不同之處在于它的流動(dòng)性。這項(xiàng)工作在不斷變化,不斷實(shí)現(xiàn)自動(dòng)化,取而代之的是對(duì)新類型數(shù)據(jù)的新需求。這是一條流水線,但它可以不斷地、迅速地重新配置,移動(dòng)到任何有合適技能、帶寬和薪資的地方。

最近,注釋任務(wù)薪水最高的工作回到美國。今年5月,Scale AI開始在自己的網(wǎng)站上列出注釋工作,招聘在人工智能有望征服的幾乎所有領(lǐng)域都有經(jīng)驗(yàn)的人。其中有些人工智能培訓(xùn)師的名單,他們擁有健身教練、人力資源、金融、經(jīng)濟(jì)、數(shù)據(jù)科學(xué)、編程、計(jì)算機(jī)科學(xué)、化學(xué)、生物、會(huì)計(jì)、稅務(wù)、營養(yǎng)、物理、旅游、K-12教育、體育新聞和自助等領(lǐng)域的專業(yè)知識(shí)。

你可以教機(jī)器人學(xué)習(xí)法律,每小時(shí)可以賺45美元;教它們?cè)姼,每小時(shí)可以賺25美元。網(wǎng)站上還列出了招募有安全經(jīng)驗(yàn)的人,大概是為了幫助訓(xùn)練軍事人工智能。Scale AI最近推出了一種名為Donovan的防御語言模型,該公司高管將其稱為“人工智能戰(zhàn)爭中的彈藥”,并贏得了參與陸軍機(jī)器人戰(zhàn)斗車輛項(xiàng)目的合同。

安娜仍在得克薩斯州訓(xùn)練聊天機(jī)器人。同事們變成了評(píng)論者和Slack管理員,她不知道為什么,但這給了她希望,這份工作可能是一份長期的職業(yè)。她不擔(dān)心的一件事是被自動(dòng)化取代工作,她說:“我的意思是,聊天機(jī)器人能做很多驚人的事情,但它們也會(huì)做些非常奇怪的事情。”

Remotasks剛進(jìn)入肯尼亞時(shí),喬認(rèn)為注釋可能是一份不錯(cuò)的職業(yè)。即使在工作轉(zhuǎn)移到其他地方后,他也決心繼續(xù)從事這份工作。他推斷,內(nèi)羅畢有成千上萬的人知道如何做這項(xiàng)工作。畢竟,他訓(xùn)練了很多人。喬在城里租了一間辦公室,開始尋找外包合同:一份是為一家建筑公司標(biāo)注設(shè)計(jì)圖的工作,另一份為某種農(nóng)業(yè)項(xiàng)目標(biāo)注被昆蟲破壞的水果,還有一份是為自動(dòng)駕駛汽車和電子商務(wù)做標(biāo)注的日常工作。

但喬發(fā)現(xiàn),他的愿景很難實(shí)現(xiàn)。他現(xiàn)在只有一名全職員工,而之前有兩名。他說:“我們一直沒有穩(wěn)定的工作流程。”因?yàn)榭蛻暨在收集數(shù)據(jù),所以好幾周都無事可做。當(dāng)客戶收集完數(shù)據(jù)后,他不得不引入短期承包商來滿足他們的最后期限:“客戶不在乎我們是否有持續(xù)的工作。只要數(shù)據(jù)集標(biāo)注工作完成,那就沒問題了。”

為了不讓自己的技能被白白浪費(fèi)掉,其他的任務(wù)執(zhí)行者決定任務(wù)去哪里,他們也去哪里。他們租用代理服務(wù)器來掩飾自己的位置,購買假身份證來通過安全檢查,這樣他們就可以假裝在新加坡、荷蘭、密西西比州或任何任務(wù)流動(dòng)的地方工作。這是一項(xiàng)有風(fēng)險(xiǎn)的業(yè)務(wù)。據(jù)多名任務(wù)執(zhí)行者稱,Scale AI越來越積極地暫停那些被發(fā)現(xiàn)隱瞞位置的賬戶。

“這些天來,我們變得有點(diǎn)聰明了,因?yàn)槲覀冏⒁獾,在其他國家,他們的工資很高,”維克多說。他在馬來西亞工作的收入是肯尼亞的兩倍,但“你要謹(jǐn)慎行事”。

另一位肯尼亞注釋員說,在他的賬戶因神秘原因被封后,他決定不再按規(guī)則行事,F(xiàn)在,他在多個(gè)國家經(jīng)營多個(gè)賬戶,在收入最高的地方執(zhí)行任務(wù)。他說,多虧了ChatGPT,他工作速度很快,質(zhì)量評(píng)分也很高。他說,這個(gè)機(jī)器人很棒,能讓他在幾分鐘內(nèi)快速完成10美元的任務(wù)。 (金鹿)

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港