展會信息港展會大全

AI 工程師的崛起
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-22 10:25:34   瀏覽:105959次  

導(dǎo)讀:【 編者按: 大模型涌現(xiàn)的能力也催生新的工程師角色:遠(yuǎn)遠(yuǎn)超越提示工程師和軟件工程師。近期,IT博主 Shawn Wang發(fā)表了名為The Rise of the AI engineer (AI 工程師的崛起) 的文章,探討AI 工程師角色的興起,以及人工編程和大語言模型 (large languagemodel...

編者按:大模型涌現(xiàn)的能力也催生新的工程師角色:遠(yuǎn)遠(yuǎn)超越提示工程師和軟件工程師。近期,IT博主 Shawn Wang發(fā)表了名為“The Rise of the AI engineer (AI 工程師的崛起)” 的文章,探討AI 工程師角色的興起,以及人工編程和大語言模型 (large languagemodel, LLM) 在軟件3.0應(yīng)用中的重要性。文章指出,基礎(chǔ)大模型的新興能力、開源和API的可用性正推動AI工程師這個角色的崛起,使得AI應(yīng)用能夠以前所未有的速度和效率解決各種問題。雖然提示工程曾被炒作,但其仍然是AI工程師工具中不可或缺的一部分。同時,AI的進(jìn)步也促使AI工程師和其它工程師相互融合,直至將來無法區(qū)分。在這個充滿機(jī)遇和挑戰(zhàn)的時代,我們期待AI工程師的嶄新角色將推動技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的飛速前進(jìn)。

我們正在目睹一次十年一遇的應(yīng)用AI“向右轉(zhuǎn)移”,這得益于新興的能力和基礎(chǔ)模型的開源/API可用性。

在2013年,許多AI任務(wù)需要五年時間和一個研究團(tuán)隊才能完成,而在2023年,現(xiàn)在只需要API文檔和一個空閑的下午即可。

API的界限是滲透性的 - AI工程師可以向左轉(zhuǎn)來調(diào)整/托管模型,而研究工程師也可以向右轉(zhuǎn)來在API之上構(gòu)建。但是,它們的相對優(yōu)勢和“主要領(lǐng)域”是清晰的。

“從數(shù)量上來看,AI工程師的數(shù)量可能會遠(yuǎn)遠(yuǎn)超過機(jī)器學(xué)習(xí)工程師和大語言模型工程師的數(shù)量。在這個角色中,一個人可以非常成功,而無需進(jìn)行任何訓(xùn)練。” - Andrej Karpathy

然而,細(xì)節(jié)決定成敗 - 在成功評估、應(yīng)用和產(chǎn)品化AI方面,面臨著無盡的挑戰(zhàn):

模型:從評估最大的GPT-4和Claude模型,到最小的開源Huggingface、LLaMA和其他模型。

工具:從最受歡迎的鏈?zhǔn)健z索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新興的自主智能體領(lǐng)域,如Auto-GPT和BabyAGI(Lilian Weng的必讀總結(jié))。

新聞:除此之外,每天發(fā)表的論文、模型和技術(shù)的數(shù)量隨著興趣和資金的增加呈指數(shù)級增長,以至于跟上這一切幾乎成了一份全職工作。

我認(rèn)真地對待這一點,我認(rèn)為這是一份全職工作。我認(rèn)為軟件工程將孕育出一個新的子學(xué)科,專門研究AI應(yīng)用,并有效地利用新興技術(shù)棧,就像“站點可靠性工程師”、“開發(fā)運(yùn)維工程師”、“數(shù)據(jù)工程師”和“分析工程師”一樣涌現(xiàn)出來。

這個新興且最具吸引力的職位似乎是:AI工程師。

我所了解的每個創(chuàng)業(yè)公司都有一些關(guān)于AI討論的Slack頻道。隨著Amplitude、Replit和Notion等公司的做法,這些頻道將從非正式的群組轉(zhuǎn)變?yōu)檎降膱F(tuán)隊。成千上萬的軟件工程師正在致力于將AI API和開源模型投入生產(chǎn),無論是在公司時間內(nèi)還是在晚上和周末,在企業(yè)的Slack或獨立的Discord平臺上,他們將逐漸形成一個職稱AI工程師。這很可能會成為未來十年來需求最高的工程職位。

AI工程師無處不在,從微軟和谷歌等大型公司,到Figma(通過Diagram收購)、Vercel(如HassanEl Mghari的病毒式RoomGPT)和Notion(如Ivan Zhao和Simon Last的Notion AI)等前沿創(chuàng)業(yè)公司,再到像Simon Willison、Pieter Levels(Photo/InteriorAI的創(chuàng)始人)和Riley Goodside(現(xiàn)在在Scale AI工作)這樣的獨立黑客。他們在Anthropic進(jìn)行快速工程提示,可以獲得30萬美元/年的收入,在OpenAI構(gòu)建軟件可以獲得90萬美元的收入。他們在AGI House度過閑暇的周末,分享/r/LocalLLaMA上的技巧。他們共同的特點是,他們將AI的進(jìn)步轉(zhuǎn)化為實際產(chǎn)品,幾乎在一夜之間就被數(shù)百萬人使用。

沒有一個博士學(xué)位出現(xiàn)在他們的履歷中。在推出AI產(chǎn)品時,你需要的是工程師,而不是研究人員。

AI與ML工程師的對決

我只是在提醒大家關(guān)注這一趨勢,而不是發(fā)起它。在Indeed網(wǎng)站上,ML工程師的職位數(shù)量是AI工程師職位數(shù)量的十倍,但“AI”領(lǐng)域的更高增長率使我預(yù)測這一比例將在5年內(nèi)發(fā)生逆轉(zhuǎn)。

每個月的工作趨勢每個正在招聘的HN

所有職位名稱都有缺陷,但有些是有用的。我們對于關(guān)于AI和ML之間區(qū)別的無休止的語義爭論既謹(jǐn)慎又疲倦,我們也很清楚普通的“軟件工程師”角色完全有能力構(gòu)建AI軟件。然而,最近在Ask HN(Hacker News的問答專欄)上發(fā)布的一個問題是如何進(jìn)入AI工程師領(lǐng)域,這說明了在市場上仍然存在的根本看法:

“如何進(jìn)入AI工程”的最佳答案

大多數(shù)人仍然將AI工程視為機(jī)器學(xué)習(xí)或數(shù)據(jù)工程的一種形式,因此他們推薦相同的先決條件。但是我向你保證,上面提到的高效AI工程師中沒有一個人完成了Andrew Ng在Coursera上的課程,也不知道PyTorch,也不知道數(shù)據(jù)湖和數(shù)據(jù)倉庫之間的區(qū)別。

在不久的將來,沒有人會推薦通過閱讀《Attention is All You Need》來開始學(xué)習(xí)AI工程,就像你不會通過閱讀Ford Model T的設(shè)計圖來開始開車一樣。當(dāng)然,理解基礎(chǔ)知識和歷史總是有幫助的,并且可以幫助你找到尚未為大眾所知的想法和提高效率/能力的方法。但有時候你可以簡單地使用產(chǎn)品,并通過經(jīng)驗學(xué)習(xí)它們的特點。

我并不希望這種課程的“轉(zhuǎn)變”會在一夜之間發(fā)生。人類天性就是希望填充簡歷,填寫市場地圖,并通過引用更深入的主題來脫穎而出。換句話說,提示工程和AI 工程在很長一段時間內(nèi)會感覺比具有良好數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)背景的人要遜色。然而,我認(rèn)為供需經(jīng)濟(jì)學(xué)將占上風(fēng)。

為什么AI工程師現(xiàn)在開始崛起

基礎(chǔ)模型是“少樣本學(xué)習(xí)者”,展現(xiàn)出上下文學(xué)習(xí)甚至零樣本遷移的能力,可以泛化到超越模型訓(xùn)練者最初意圖的領(lǐng)域。換句話說,創(chuàng)建這些模型的人并不完全知道它們的能力。那些不是大語言模型(LLM)研究者的人,只需花更多時間與這些模型互動,并將它們應(yīng)用于研究所低估的領(lǐng)域(例如Jasper在文案撰寫方面),就能找到并利用它們的能力。

微軟、谷歌、Meta和大型基礎(chǔ)模型實驗室已經(jīng)壟斷了稀缺的研究人才,實際上提供了“AI研究即服務(wù)”的API。你不能雇傭他們,但你可以租用他們?nèi)绻阌卸萌绾闻c他們合作的軟件工程師。全球大約有5000名LLM研究者,但有約5000萬名軟件工程師。供應(yīng)限制決定了一個“中間”類別的AI工程師將會崛起來滿足需求。

GPU囤積。當(dāng)然,OpenAI/微軟是第一批,但StabilityAI通過強(qiáng)調(diào)他們擁有4000個GPU的集群,開啟了初創(chuàng)公司之間的GPU競爭。

還記得2022年10月嗎?

從那時起,新的初創(chuàng)公司,如Inflection(13億美元)、Mistral(1.13億美元)、Reka(5800萬美元)、Poolside(2600萬美元)和Contextual(2000萬美元),都普遍獲得了巨額的種子輪融資,以擁有自己的硬件。甚至Dan Gross和Nat Friedman也宣布了他們的100億美元的Andromeda GPU集群,專門為他們投資的初創(chuàng)公司而設(shè)。全球芯片短缺的問題還在不斷加劇。在API線的另一側(cè),AI工程師將有更多的能力來使用模型,而不僅僅是訓(xùn)練它們。

“先點火,然后準(zhǔn)備,再瞄準(zhǔn)”,與其在訓(xùn)練一個特定領(lǐng)域的模型并投入生產(chǎn)之前,要求數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)工程師進(jìn)行費時的數(shù)據(jù)收集工作,產(chǎn)品經(jīng)理/軟件工程師可以向LLM發(fā)出提示,構(gòu)建/驗證產(chǎn)品創(chuàng)意,然后再獲取特定的數(shù)據(jù)進(jìn)行微調(diào)。

(注:“先點火,然后準(zhǔn)備,再瞄準(zhǔn)” 是英語俚語,指的是先行動再考慮后果。作者在此使用這個俚語暗示AI工程師們能夠更迅速地進(jìn)行實際應(yīng)用,而無需過多的數(shù)據(jù)預(yù)處理和訓(xùn)練。)

假設(shè)后者的數(shù)量比前者多100到1000倍,而通過提示LLM原型的“先點火,然后準(zhǔn)備,再瞄準(zhǔn)”的工作流程使您能夠比傳統(tǒng)的ML快10到100倍。因此,AI工程師將能夠以1,000到10,000倍更便宜的成本驗證AI產(chǎn)品。這就像瀑布流(Waterfall)和敏捷開發(fā)(Agile)的較量一樣,AI就是敏捷的。

Python →JavaScript。數(shù)據(jù)/AI傳統(tǒng)上是極度依賴Python的,而且最早的AI工程工具,如LangChain、LlamaIndex和Guardrails,都是出自同一社區(qū)。然而,至少有與Python開發(fā)者一樣多的JavaScript開發(fā)者,因此現(xiàn)在工具正在越來越多地迎合這個廣泛擴(kuò)展的受眾,從LangChain.js和Transformers.js到Vercel的新AI SDK。這意味著總地址市場(TAM)的擴(kuò)張和機(jī)會是巨大的。

生成AI vs分類器ML。“生成AI”作為一個術(shù)語已經(jīng)不再受歡迎,讓位于其他類比,如“推理引擎”,但在簡明地闡述現(xiàn)有一組MLOps工具和ML從業(yè)者之間的區(qū)別時仍然有用。而AI工程師則使用LLMs和文本到圖像生成器,并且他們正在構(gòu)建寫作應(yīng)用程序、個性化學(xué)習(xí)工具、自然語言電子表格和類似Factorio的可視化編程語言,與現(xiàn)有一代的ML可能更關(guān)注欺詐風(fēng)險、推薦系統(tǒng)、異常檢測和特征存儲不同。

每當(dāng)出現(xiàn)一個完全不同背景、使用不同語言、生產(chǎn)完全不同產(chǎn)品、使用完全不同工具的子群體時,它們最終都會分成自己的小組。

1+2=3:從軟件2.0到軟件3.0演進(jìn)中的代碼角色

6年前,Andrej Karpathy撰寫了一篇非常有影響力的文章,描述了“軟件2.0” - 將精確建模邏輯的“經(jīng)典棧”手工編碼編程語言與“機(jī)器學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)的新棧進(jìn)行對比,后者近似邏輯,使軟件能夠解決比人類能夠建模的問題更多。今年,他繼續(xù)指出,最熱門的新編程語言是英語,最終填補(bǔ)了他在原始文章中留下未標(biāo)記的灰色區(qū)域。

更新:Karpathy回應(yīng)了!有一些不同意見!

去年,提示工程成為了一種基本概念,描述了人們開始利用GPT-3和Stable Diffusion的工作方式將如何改變。人們嘲笑AI初創(chuàng)公司為“OpenAI封裝器”,并擔(dān)心LLM應(yīng)用程序容易受到提示注入和反向提示工程的影響。沒有堡壘可以找到?

但2023年最重要的主題之一是重新建立人工編寫代碼的作用,用以編排和取代LLM的功能。從超過2億美元的龐然大物L(fēng)angchain,到由Nvidia支持的Voyager,顯示了代碼生成和重用的不可置疑的重要性(我最近參加了與Harrison舉行的鏈?zhǔn)綉?yīng)用與自主智能體的網(wǎng)絡(luò)研討會,在那里我擴(kuò)展了代碼核心與LLM核心應(yīng)用的論點)。

主要的架構(gòu)劃分:“智能之上的軟件”vs“智能軟件”

提示工程既被過度炒作又穩(wěn)定存在,但在軟件3.0應(yīng)用中重新出現(xiàn)的軟件1.0范式既是一個巨大的機(jī)遇/混亂領(lǐng)域,也為一大批初創(chuàng)公司創(chuàng)造了白色空間:

如果你不能記住這個地圖,你還算VC嗎?

當(dāng)然,這不僅僅是人工編寫的代碼。我最近與smol-developer、更大范圍的gpt-engineer以及其他代碼生成智能體如Codium AI、Codegen.ai和Morph/Rift的合作將越來越成為AI工程師工具包的一部分。隨著人類工程師學(xué)會駕馭AI,AI也將越來越多地進(jìn)行工程工作,直到一個遙遠(yuǎn)的未來,我們將在某一天抬頭望去,再也無法區(qū)分它們的區(qū)別。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港