展會信息港展會大全

2023亞馬遜云科技re: Invent,圍繞生成式AI技術堆棧展開
來源:互聯(lián)網   發(fā)布日期:2023-12-08 14:15:46   瀏覽:7124次  

導讀:一年前的亞馬遜云科技re: Invent 2022大會上,生成式AI幾乎沒有被提及。但幾天之后橫空出世的OpenAI ChatGPT聊天機器人瞬間掀起變革的狂潮,裹挾著整個世界進入生成式AI新時代。 短短一年之間,生成式AI已經成為科技領域的發(fā)展重心。亞馬遜云科技在今年的re:...

一年前的亞馬遜云科技re: Invent 2022大會上,生成式AI幾乎沒有被提及。但幾天之后橫空出世的OpenAI ChatGPT聊天機器人瞬間掀起變革的狂潮,裹挾著整個世界進入生成式AI新時代。

短短一年之間,生成式AI已經成為科技領域的發(fā)展重心。亞馬遜云科技在今年的re: Invent 2023會議上突顯了該技術如何成為這家云巨頭議程的首要任務。

在今年的主題演講中,亞馬遜云科技首席執(zhí)行官Adam Selipsky表示:“圍繞生成式AI模型的創(chuàng)新具有爆炸性。”他補充說:“它將重塑我們在工作和家庭中交互的每一個應用程序。我們正在以一種跟以往完全不同的方式來探討生成式AI的整個概念。”

并且他還具體介紹了亞馬遜云科技的“生成式AI技術堆棧”,旨在為客戶提供生成式AI應用程序、用于構建大型語言模型的新工具,以及加速模型訓練和推理的基礎設施。

全新生成式AI技術堆棧

在快速發(fā)展的AI領域中構建和部署生成式AI模型與應用,往往會帶來一系列獨特的挑戰(zhàn)。亞馬遜云科技的應對之法是一套新的生成式AI基礎設施,由三層技術棧組成,分別是基礎設施層、基礎模型服務層和AI應用層,希望能幫助客戶在這三層之上輕松進行創(chuàng)新。

在今年re:Invent上近兩個半小時的主題演講中,Selipsky提供了有關生成式AI策略的很多細節(jié),Selipsky認為,他們的全新AI技術棧在模型選擇、芯片成本和性能方面都有優(yōu)勢,能夠幫助AI開發(fā)者在構建、訓練和運行生成式AI應用時立足基礎模型占得先機。

堆棧第一層:存儲和計算重大革新

隨著對生成式AI的需求不斷增長,GPU供應出現了短缺。據報道,Nvidia性能最優(yōu)越的芯片在2024年之前可能已經售罄。臺積電首席執(zhí)行官最近表示對前景不太樂觀,認為Nvidia以及Nvidia競爭對手的GPU短缺情況可能會一直持續(xù)到2025年。為了減少對GPU的依賴,一些有能力的科技巨頭正在研發(fā)定制芯片,用于創(chuàng)建、迭代和產品化人工智能模型,亞馬遜云科技就是其中之一。

憑借著Nitro虛擬機管理程序以及Graviton、Trainium和Inferentia等芯片家族,亞馬遜云科技已經積累起豐富的芯片開發(fā)技術經驗,這也使其在云和生成式AI領域擁有顯著優(yōu)勢。Selipsky在此前接受外媒采訪時解釋了這些創(chuàng)新的切實好處,并強調了在計算能力與成本水平間取得平衡的重要意義。“生成式AI工作負載有著極高的計算密度,因此性價比絕對至關重要。”

在本次大會上,亞馬遜云科技推出了為生成式AI和機器學習訓練設計的云端AI芯片Amazon Trainium2,以及第四代自研服務器CPU芯片Amazon Graviton4。

Amazon Trainium2為擁有數千億甚至數萬億個參數的基礎模型訓練做了優(yōu)化,性能相比2020年12月推出的第一代Trainium提高了4倍,同時能效提高了2倍。Trainium2將在亞馬遜云科技中的Amazon EC Trn2實例中使用,這是一個由16個芯片組成的集群,同時在Amazon EC2 UltraCluster產品中可擴展到多達10萬個芯片。亞馬遜云科技表示,用由10萬個Trainium芯片組成的集群來訓練3000億個參數的AI大模型,可將訓練時間從數月縮短為僅幾個星期。

發(fā)布的另一款芯片是基于Arm的Graviton4,專注于推理環(huán)節(jié)。Selipsky稱,與在Amazon EC2上運行的上一代Graviton處理器Graviton3(但不是更新的Graviton3E)相比,Graviton4的處理速度提高了30%,內核增加了50%,內存帶寬增加了75%。

此外,亞馬遜云科技宣布其S3對象存儲服務推出重大更新:一種新的高性能、低延遲層S3存儲類別Amazon S3 Express One Zone,旨在為延遲敏感的應用提供個位數、毫秒級的每秒數十萬次數據訪問。Amazon S3 Express One Zone的數據訪問速度比Amazon S3標準版快10倍,請求成本降低50%,計算成本降低60%。

堆棧第二層:聯(lián)手OpenAI最強競爭對手反擊微軟

在此前接受外媒采訪時,針對Sam Altman的突然離職和最終回歸這一列事件,Selipsky分享了自己的看法,“對企業(yè)來說,必須努力擴大技術獲取來源;任何單一模型或者供應商都不應占據主導地位。最近發(fā)生的一切,也再次證明亞馬遜云科技所選定路線的合理性。”Selipsky認為“可靠的模型與可靠的供應商至關重要,而提供選項并致力于支持相關技術的云服務商也同樣重要。”

Selipsky重點介紹了Amazon Bedrock平臺,表示已經有上萬用戶在使用Bedrock。Amazon Bedrock平臺是亞馬遜云科技4月推出、9月全面開放的大模型開發(fā)平臺,支持用戶調用來自亞馬遜自己的泰坦(Titan)模型,以及AI21 Labs、Anthropic、Stability AI等第三方的多樣化模型進行調用和定制化開發(fā)。

特別的是,亞馬遜云科技還特地邀請了Anthropic CEO Dario Amodei到現場分享。在對談中,他們提到Anthropic圍繞亞馬遜云服務打造了獨家定制功能,用戶只能通過Amazon Bedrock加Anthropic的第一方產品才能享受得到。“這些服務將提供重要的微調與定制功能,且在限定時期內僅在Amazon Bedrock上通過Anthropic的第一方產品對外發(fā)布。只此一家,別無分號。”

Anthropic由前OpenAI工程師于2021年創(chuàng)立,其創(chuàng)始人“從一開始就在模型安全性方面有著不同的愿景”。今年9月25日,亞馬遜云科技與Anthropic宣布達成戰(zhàn)略合作,亞馬遜云科技稱將向Anthropic投資至多40億美元,在體量上幾乎可以與OpenAI同微軟之間的合作相媲美?梢哉f,在爭奪先進AI基礎模型的競賽當中,亞馬遜云科技與Anthropic之間的戰(zhàn)略合作伙伴關系已經成為其基礎模型服務層中的重要組成部分。

  • 定制化AI

具體來說,Amazon Bedrock是一個可對托管基礎模型進行訪問的平臺。其中既包括亞馬遜云科技內部開發(fā)的Amazon Titan系列大語言模型(LLM),也提供來自其他廠商及開源生態(tài)系統(tǒng)的神經網絡選項。亞馬遜云科技此次還公布兩項新功能:微調與持續(xù)預訓練,允許客戶針對特定任務對Bedrock中的大模型進行定制。

定制神經網絡就是使用知識庫中未包含的新數據進行模型訓練。例如,電子商務企業(yè)可以利用產品文檔進行模型訓練,使其學會回答客戶提出的產品相關問題。這種定制過程能夠顯著提高大模型的回答準確率。

亞馬遜云科技此次推出的首個定制化功能為fine-tuning微調,允許開發(fā)人員在標記數據集上訓練受支持的Bedrock模型。此類數據集包含樣本輸入、常見提示詞以及針對這些提示詞預先編寫的AI答案。這些記錄以問答形式組織而成,可供AI模型通過示例快速進行學習。

亞馬遜云科技推出的另一項定制功能為continued pretraining持續(xù)預訓練,面向的則是另外一組用例。它允許企業(yè)在規(guī)模極大的數據集上對Bedrock大模型進行定制,例如涉及數十億token的代碼庫。所謂token,就是對應幾個字符或數字的數據單元。這項新功能還可使用新信息對訓練數據集做定期刷新。

它還允許客戶在未經標注的數據集上進行持續(xù)預訓練。此類數據集包含樣本輸入,但往往并不具備AI模型所需要的輸出示例,F在用戶無需創(chuàng)建輸出示例,因此能夠大大減少創(chuàng)建訓練數據集的工作量,從而降低AI定制成本。

亞馬遜云科技生成式AI首席開發(fā)者布道師Antje Barth在博文中表示,“用戶可以指定最多10萬條訓練數據記錄,且一般在至少提交10億條token后即可看到顯著的定制效果。”

  • AI安全性

這個月,有報道稱,微軟員工被禁止使用其斥巨資投資的OpenAI的產品ChatGPT。“出于安全和數據方面的考慮,許多人工智能工具不再供員工使用,”據說當時這是在微軟內部網站上的消息。微軟稱,“雖然微軟確實投資了OpenAI,ChatGPT也有內置的保護措施來防止不當使用,但該網站仍然是第三方外部服務。”

在本次的主題演講中,有一個很有意思的點,在Selipsky講述Bedrock很注重安全性和隱私保護能力時,大屏幕上則展示出了這則有關ChatGPT的新聞報道。

Selipsky并沒有點名微軟,但他表達了對“友商”在缺少全面安全保障的情況下發(fā)布AI產品早期版本的行為表示驚訝,“令我難以置信的是,某友商居然在缺少全面安全保障的情況下發(fā)布AI產品的早期版本。他們對自己的模型以及數據的安全性沒有信心。”

堆棧第三層:AI助手Amazon Q預覽版正式發(fā)布

在今天的主題演講中,亞馬遜云科技還宣布推出Amazon Q預覽版,該應用處于技術棧的最上層。有分析師認為Amazon Q是本屆re: Invent上最具份量的發(fā)布。“這是在用AI武裝開發(fā)者,幫助他們取得成功。”

Amazon Q能夠回答諸如“怎樣使用亞馬遜云科技構建Web應用程序?”之類的問題。經過亞馬遜過去17年積累下的知識進行訓練,Amazon Q能夠解答各種問題并提供相應的原因解釋。

亞馬遜云科技CEO Adam Selipsky在演講中表示,“你可以使用Amazon Q輕松進行對話、內容生成并執(zhí)行操作。Amazon Q完全了解你的系統(tǒng)、數據存儲庫和運營需求。”

用戶可以將Amazon Q接入組織指定的應用程序和軟件(例如Salesforce、Jira、Zendesk、Gmail以及Amazon S3存儲實例等),并據此進行自定義配置。Amazon Q能夠根據所有關聯(lián)數據及內容進行索引,“學習”關于當前業(yè)務的方方面面,包括組織結構、核心概念和產品名稱等。

例如,公司可以通過Web應用程序要求Amazon Q分析客戶在使用哪些功能時遇到了問題、應該如何改進這些功能;也可以像使用ChatGPT那樣直接上傳文件(支持Word文檔、PDF、電子表格等)并詢問與內容相關的問題。Amazon Q則通過聯(lián)系、整合和數據(包括特定業(yè)務數據)提供響應與參考。

Amazon Q不僅能夠回答問題,還能作為助手生成或總結博文內容、新聞稿和電子郵件。它還為工作中的常規(guī)操作提供一組可配置的插件,包括自動創(chuàng)建服務工單、通過Slack中的特定團隊以及更新ServiceNow中的儀表板等。為了防止錯誤,Amazon Q要求用戶在行動之前檢查其操作建議,并展示結果以供驗證。

如大家所想,Amazon Q可以通過亞馬遜云科技的管理控制臺、各類Web應用程序以及Slack等聊天應用進行訪問,而且對亞馬遜云科技家族的產品和服務有著透徹了解。亞馬遜云科技表示,Amazon Q能夠理解亞馬遜云科技上各種應用工作負載間的細微差別,哪怕是只需運行短短幾秒的應用、或者極少訪問存儲內容的程序也可以接受Amazon Q的指引和操作。

在臺上,Selipsky展示了一段高性能視頻編碼與轉碼應用示例。Selipsky表示,在被問及哪種EC2實例最適合當前用例時,Amazon Q列出了一份涵蓋性能與成本因素的清單。

“我堅信這將是一場生產力層面的變革,希望來自不同行業(yè)、從事不同崗位的人們都能從Amazon Q身上獲益。”

Amazon Q與Amazon CodeWhisperer服務相結合,可以生成并解釋應用程序代碼。在受支持的IDE(例如亞馬遜云科技的CodeCatalyst)當中,Amazon Q可以為客戶代碼生成測試,借此衡量其質量水平。Amazon Q還能創(chuàng)建軟件新功能、執(zhí)行代碼轉換,并為代碼包、存儲庫和框架更新草案和文檔,使用自然語言對計劃進行完善和執(zhí)行。

Selipsky表示,亞馬遜云科技內部的一支小團隊就成功在短短兩天之內,使用Amazon Q將上千款應用程序從Java 8升級到了Java 17,甚至完成了相應的測試。

Amazon Q的代碼轉換功能僅支持從Java 8和Java 11升級至Java 17(后續(xù)將推出.NET Framework到跨平臺.NET轉換),且所有代碼相關功能(包括代碼轉換)都需要配合CodeWhisperer Professional訂閱服務。不清楚這方面要求后續(xù)是否會有所放松。

Selipsky還再次強調了亞馬遜云科技重視安全責任,讓潛在生成式AI客戶更加放心,“如果你的用戶本來就無權訪問某些內容,那么在使用Amazon Q之后也仍然無權訪問。Amazon Q理解并尊重用戶的當前身份、角色和權限……我們也永遠不會使用業(yè)務內容來訓練底層模型。”

寫在最后

很明顯,亞馬遜云科技在AI云領域維持統(tǒng)治地位的核心戰(zhàn)略,就是繼續(xù)增強其云基礎設施并為市場開發(fā)出獨特的生成式AI技術棧。

Selipsky認為亞馬遜云科技的生成式AI技術棧有獨特優(yōu)勢,“我們獨特的生成式AI技術棧為客戶提供了優(yōu)于其他云廠商的比較優(yōu)勢。并不是每家競爭對手都愿意在各個層上開展創(chuàng)新,而客戶也不清楚他們需要多長時間才能消弭這部分差距。”

生成式AI的興起為大型云提供商開辟了一個巨大的新市場,在這個快速發(fā)展變化的過程中,行業(yè)已經深切感受到生成式AI適應性和創(chuàng)新能力的重要性。正如Selipsky所說,“適應能力是你可以擁有的最有價值的能力。”亞馬遜云科技也通過Graviton前沿芯片、Trainium等專用芯片、模型平臺以及Amazon Q應用產品展示了這些創(chuàng)新要素。

可以看到,亞馬遜云科技在其獨特的三層生成AI技術棧上投入了巨大心力,希望借此支撐起多樣化的AI模型與平臺、戰(zhàn)略合作伙伴關系、最具性價比的服務以及更豐富的技術選項。

贊助本站

人工智能實驗室
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港