當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > AI 工程師的崛起

AI 工程師的崛起
來源：互聯(lián)網(wǎng) 發(fā)布日期：2023-07-22 10:25:34 瀏覽：105959次

導(dǎo)讀：【編者按：大模型涌現(xiàn)的能力也催生新的工程師角色：遠(yuǎn)遠(yuǎn)超越提示工程師和軟件工程師。近期，IT博主 Shawn Wang發(fā)表了名為The Rise of the AI engineer (AI 工程師的崛起) 的文章，探討AI 工程師角色的興起，以及人工編程和大語言模型 (large languagemodel...

【編者按：大模型涌現(xiàn)的能力也催生新的工程師角色：遠(yuǎn)遠(yuǎn)超越提示工程師和軟件工程師。近期，IT博主 Shawn Wang發(fā)表了名為“The Rise of the AI engineer (AI 工程師的崛起)” 的文章，探討AI 工程師角色的興起，以及人工編程和大語言模型 (large languagemodel, LLM) 在軟件3.0應(yīng)用中的重要性。文章指出，基礎(chǔ)大模型的新興能力、開源和API的可用性正推動AI工程師這個角色的崛起，使得AI應(yīng)用能夠以前所未有的速度和效率解決各種問題。雖然提示工程曾被炒作，但其仍然是AI工程師工具中不可或缺的一部分。同時，AI的進(jìn)步也促使AI工程師和其它工程師相互融合，直至將來無法區(qū)分。在這個充滿機(jī)遇和挑戰(zhàn)的時代，我們期待AI工程師的嶄新角色將推動技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的飛速前進(jìn)。

我們正在目睹一次十年一遇的應(yīng)用AI“向右轉(zhuǎn)移”，這得益于新興的能力和基礎(chǔ)模型的開源/API可用性。

在2013年，許多AI任務(wù)需要五年時間和一個研究團(tuán)隊才能完成，而在2023年，現(xiàn)在只需要API文檔和一個空閑的下午即可。

API的界限是滲透性的 - AI工程師可以向左轉(zhuǎn)來調(diào)整/托管模型，而研究工程師也可以向右轉(zhuǎn)來在API之上構(gòu)建。但是，它們的相對優(yōu)勢和“主要領(lǐng)域”是清晰的。

“從數(shù)量上來看，AI工程師的數(shù)量可能會遠(yuǎn)遠(yuǎn)超過機(jī)器學(xué)習(xí)工程師和大語言模型工程師的數(shù)量。在這個角色中，一個人可以非常成功，而無需進(jìn)行任何訓(xùn)練。” - Andrej Karpathy

然而，細(xì)節(jié)決定成敗 - 在成功評估、應(yīng)用和產(chǎn)品化AI方面，面臨著無盡的挑戰(zhàn)：

模型：從評估最大的GPT-4和Claude模型，到最小的開源Huggingface、LLaMA和其他模型。

工具：從最受歡迎的鏈?zhǔn)健z索和向量搜索工具，如LangChain、LlamaIndex和Pinecone，到新興的自主智能體領(lǐng)域，如Auto-GPT和BabyAGI（Lilian Weng的必讀總結(jié)）。

新聞：除此之外，每天發(fā)表的論文、模型和技術(shù)的數(shù)量隨著興趣和資金的增加呈指數(shù)級增長，以至于跟上這一切幾乎成了一份全職工作。

我認(rèn)真地對待這一點，我認(rèn)為這是一份全職工作。我認(rèn)為軟件工程將孕育出一個新的子學(xué)科，專門研究AI應(yīng)用，并有效地利用新興技術(shù)棧，就像“站點可靠性工程師”、“開發(fā)運(yùn)維工程師”、“數(shù)據(jù)工程師”和“分析工程師”一樣涌現(xiàn)出來。

這個新興且最具吸引力的職位似乎是：AI工程師。

我所了解的每個創(chuàng)業(yè)公司都有一些關(guān)于AI討論的Slack頻道。隨著Amplitude、Replit和Notion等公司的做法，這些頻道將從非正式的群組轉(zhuǎn)變?yōu)檎降膱F(tuán)隊。成千上萬的軟件工程師正在致力于將AI API和開源模型投入生產(chǎn)，無論是在公司時間內(nèi)還是在晚上和周末，在企業(yè)的Slack或獨立的Discord平臺上，他們將逐漸形成一個職稱AI工程師。這很可能會成為未來十年來需求最高的工程職位。

AI工程師無處不在，從微軟和谷歌等大型公司，到Figma（通過Diagram收購）、Vercel（如HassanEl Mghari的病毒式RoomGPT）和Notion（如Ivan Zhao和Simon Last的Notion AI）等前沿創(chuàng)業(yè)公司，再到像Simon Willison、Pieter Levels（Photo/InteriorAI的創(chuàng)始人）和Riley Goodside（現(xiàn)在在Scale AI工作）這樣的獨立黑客。他們在Anthropic進(jìn)行快速工程提示，可以獲得30萬美元/年的收入，在OpenAI構(gòu)建軟件可以獲得90萬美元的收入。他們在AGI House度過閑暇的周末，分享/r/LocalLLaMA上的技巧。他們共同的特點是，他們將AI的進(jìn)步轉(zhuǎn)化為實際產(chǎn)品，幾乎在一夜之間就被數(shù)百萬人使用。

沒有一個博士學(xué)位出現(xiàn)在他們的履歷中。在推出AI產(chǎn)品時，你需要的是工程師，而不是研究人員。

AI與ML工程師的對決

我只是在提醒大家關(guān)注這一趨勢，而不是發(fā)起它。在Indeed網(wǎng)站上，ML工程師的職位數(shù)量是AI工程師職位數(shù)量的十倍，但“AI”領(lǐng)域的更高增長率使我預(yù)測這一比例將在5年內(nèi)發(fā)生逆轉(zhuǎn)。

每個月的工作趨勢每個正在招聘的HN

所有職位名稱都有缺陷，但有些是有用的。我們對于關(guān)于AI和ML之間區(qū)別的無休止的語義爭論既謹(jǐn)慎又疲倦，我們也很清楚普通的“軟件工程師”角色完全有能力構(gòu)建AI軟件。然而，最近在Ask HN（Hacker News的問答專欄）上發(fā)布的一個問題是如何進(jìn)入AI工程師領(lǐng)域，這說明了在市場上仍然存在的根本看法：

“如何進(jìn)入AI工程”的最佳答案

大多數(shù)人仍然將AI工程視為機(jī)器學(xué)習(xí)或數(shù)據(jù)工程的一種形式，因此他們推薦相同的先決條件。但是我向你保證，上面提到的高效AI工程師中沒有一個人完成了Andrew Ng在Coursera上的課程，也不知道PyTorch，也不知道數(shù)據(jù)湖和數(shù)據(jù)倉庫之間的區(qū)別。

在不久的將來，沒有人會推薦通過閱讀《Attention is All You Need》來開始學(xué)習(xí)AI工程，就像你不會通過閱讀Ford Model T的設(shè)計圖來開始開車一樣。當(dāng)然，理解基礎(chǔ)知識和歷史總是有幫助的，并且可以幫助你找到尚未為大眾所知的想法和提高效率/能力的方法。但有時候你可以簡單地使用產(chǎn)品，并通過經(jīng)驗學(xué)習(xí)它們的特點。

我并不希望這種課程的“轉(zhuǎn)變”會在一夜之間發(fā)生。人類天性就是希望填充簡歷，填寫市場地圖，并通過引用更深入的主題來脫穎而出。換句話說，提示工程和AI 工程在很長一段時間內(nèi)會感覺比具有良好數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)背景的人要遜色。然而，我認(rèn)為供需經(jīng)濟(jì)學(xué)將占上風(fēng)。

為什么AI工程師現(xiàn)在開始崛起

基礎(chǔ)模型是“少樣本學(xué)習(xí)者”，展現(xiàn)出上下文學(xué)習(xí)甚至零樣本遷移的能力，可以泛化到超越模型訓(xùn)練者最初意圖的領(lǐng)域。換句話說，創(chuàng)建這些模型的人并不完全知道它們的能力。那些不是大語言模型（LLM）研究者的人，只需花更多時間與這些模型互動，并將它們應(yīng)用于研究所低估的領(lǐng)域（例如Jasper在文案撰寫方面），就能找到并利用它們的能力。

微軟、谷歌、Meta和大型基礎(chǔ)模型實驗室已經(jīng)壟斷了稀缺的研究人才，實際上提供了“AI研究即服務(wù)”的API。你不能雇傭他們，但你可以租用他們?nèi)绻阌卸萌绾闻c他們合作的軟件工程師。全球大約有5000名LLM研究者，但有約5000萬名軟件工程師。供應(yīng)限制決定了一個“中間”類別的AI工程師將會崛起來滿足需求。

GPU囤積。當(dāng)然，OpenAI/微軟是第一批，但StabilityAI通過強(qiáng)調(diào)他們擁有4000個GPU的集群，開啟了初創(chuàng)公司之間的GPU競爭。

還記得2022年10月嗎?

從那時起，新的初創(chuàng)公司，如Inflection（13億美元）、Mistral（1.13億美元）、Reka（5800萬美元）、Poolside（2600萬美元）和Contextual（2000萬美元），都普遍獲得了巨額的種子輪融資，以擁有自己的硬件。甚至Dan Gross和Nat Friedman也宣布了他們的100億美元的Andromeda GPU集群，專門為他們投資的初創(chuàng)公司而設(shè)。全球芯片短缺的問題還在不斷加劇。在API線的另一側(cè)，AI工程師將有更多的能力來使用模型，而不僅僅是訓(xùn)練它們。

“先點火，然后準(zhǔn)備，再瞄準(zhǔn)”，與其在訓(xùn)練一個特定領(lǐng)域的模型并投入生產(chǎn)之前，要求數(shù)據(jù)科學(xué)家/機(jī)器學(xué)習(xí)工程師進(jìn)行費時的數(shù)據(jù)收集工作，產(chǎn)品經(jīng)理/軟件工程師可以向LLM發(fā)出提示，構(gòu)建/驗證產(chǎn)品創(chuàng)意，然后再獲取特定的數(shù)據(jù)進(jìn)行微調(diào)。

（注：“先點火，然后準(zhǔn)備，再瞄準(zhǔn)” 是英語俚語，指的是先行動再考慮后果。作者在此使用這個俚語暗示AI工程師們能夠更迅速地進(jìn)行實際應(yīng)用，而無需過多的數(shù)據(jù)預(yù)處理和訓(xùn)練。）

假設(shè)后者的數(shù)量比前者多100到1000倍，而通過提示LLM原型的“先點火，然后準(zhǔn)備，再瞄準(zhǔn)”的工作流程使您能夠比傳統(tǒng)的ML快10到100倍。因此，AI工程師將能夠以1,000到10,000倍更便宜的成本驗證AI產(chǎn)品。這就像瀑布流（Waterfall）和敏捷開發(fā)（Agile）的較量一樣，AI就是敏捷的。

Python →JavaScript。數(shù)據(jù)/AI傳統(tǒng)上是極度依賴Python的，而且最早的AI工程工具，如LangChain、LlamaIndex和Guardrails，都是出自同一社區(qū)。然而，至少有與Python開發(fā)者一樣多的JavaScript開發(fā)者，因此現(xiàn)在工具正在越來越多地迎合這個廣泛擴(kuò)展的受眾，從LangChain.js和Transformers.js到Vercel的新AI SDK。這意味著總地址市場（TAM）的擴(kuò)張和機(jī)會是巨大的。

生成AI vs分類器ML。“生成AI”作為一個術(shù)語已經(jīng)不再受歡迎，讓位于其他類比，如“推理引擎”，但在簡明地闡述現(xiàn)有一組MLOps工具和ML從業(yè)者之間的區(qū)別時仍然有用。而AI工程師則使用LLMs和文本到圖像生成器，并且他們正在構(gòu)建寫作應(yīng)用程序、個性化學(xué)習(xí)工具、自然語言電子表格和類似Factorio的可視化編程語言，與現(xiàn)有一代的ML可能更關(guān)注欺詐風(fēng)險、推薦系統(tǒng)、異常檢測和特征存儲不同。

每當(dāng)出現(xiàn)一個完全不同背景、使用不同語言、生產(chǎn)完全不同產(chǎn)品、使用完全不同工具的子群體時，它們最終都會分成自己的小組。

1+2=3：從軟件2.0到軟件3.0演進(jìn)中的代碼角色

6年前，Andrej Karpathy撰寫了一篇非常有影響力的文章，描述了“軟件2.0” - 將精確建模邏輯的“經(jīng)典棧”手工編碼編程語言與“機(jī)器學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)的新棧進(jìn)行對比，后者近似邏輯，使軟件能夠解決比人類能夠建模的問題更多。今年，他繼續(xù)指出，最熱門的新編程語言是英語，最終填補(bǔ)了他在原始文章中留下未標(biāo)記的灰色區(qū)域。

更新：Karpathy回應(yīng)了！有一些不同意見！

去年，提示工程成為了一種基本概念，描述了人們開始利用GPT-3和Stable Diffusion的工作方式將如何改變。人們嘲笑AI初創(chuàng)公司為“OpenAI封裝器”，并擔(dān)心LLM應(yīng)用程序容易受到提示注入和反向提示工程的影響。沒有堡壘可以找到？

但2023年最重要的主題之一是重新建立人工編寫代碼的作用，用以編排和取代LLM的功能。從超過2億美元的龐然大物L(fēng)angchain，到由Nvidia支持的Voyager，顯示了代碼生成和重用的不可置疑的重要性（我最近參加了與Harrison舉行的鏈?zhǔn)綉?yīng)用與自主智能體的網(wǎng)絡(luò)研討會，在那里我擴(kuò)展了代碼核心與LLM核心應(yīng)用的論點）。

主要的架構(gòu)劃分:“智能之上的軟件”vs“智能軟件”

提示工程既被過度炒作又穩(wěn)定存在，但在軟件3.0應(yīng)用中重新出現(xiàn)的軟件1.0范式既是一個巨大的機(jī)遇/混亂領(lǐng)域，也為一大批初創(chuàng)公司創(chuàng)造了白色空間：

如果你不能記住這個地圖，你還算VC嗎?

當(dāng)然，這不僅僅是人工編寫的代碼。我最近與smol-developer、更大范圍的gpt-engineer以及其他代碼生成智能體如Codium AI、Codegen.ai和Morph/Rift的合作將越來越成為AI工程師工具包的一部分。隨著人類工程師學(xué)會駕馭AI，AI也將越來越多地進(jìn)行工程工作，直到一個遙遠(yuǎn)的未來，我們將在某一天抬頭望去，再也無法區(qū)分它們的區(qū)別。