展會(huì)信息港展會(huì)大全

亞馬遜云科技,如何解決生成式 AI 落地的四個(gè)關(guān)鍵問(wèn)題?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-25 09:31:47   瀏覽:5436次  

導(dǎo)讀:今天,可能是成為創(chuàng)業(yè)者的絕佳時(shí)機(jī)。 但再?gòu)?qiáng)大的大模型 api,距離產(chǎn)品落地,仍有不少距離。 如何尋找最佳落地場(chǎng)景,根據(jù)場(chǎng)景找到最合適的大模型,解決模型的工程化部署以及數(shù)據(jù)的實(shí)時(shí)交互,以及如何在和用戶(hù)進(jìn)行互動(dòng)時(shí),保證模型本身的的安全性以及用戶(hù)數(shù)據(jù)...

今天,可能是成為創(chuàng)業(yè)者的絕佳時(shí)機(jī)。

但再?gòu)?qiáng)大的大模型 api,距離產(chǎn)品落地,仍有不少距離。

如何尋找最佳落地場(chǎng)景,根據(jù)場(chǎng)景找到最合適的大模型,解決模型的工程化部署以及數(shù)據(jù)的實(shí)時(shí)交互,以及如何在和用戶(hù)進(jìn)行互動(dòng)時(shí),保證模型本身的的安全性以及用戶(hù)數(shù)據(jù)的安全性……

技術(shù)的落地,面臨著各種苦難和挑戰(zhàn)。

所幸,我們不是在 PC 互聯(lián)網(wǎng)早期的年代,需要手搓代碼、自行搭建服務(wù)器,所有業(yè)務(wù)完全從 0 起步。

我們有了云服務(wù),以及圍繞云服務(wù)誕生的各種上下層的服務(wù),讓創(chuàng)業(yè),尤其是 AI 創(chuàng)業(yè)這件事,變得「如此簡(jiǎn)單」。

在 AGI Playground 2024 上,亞馬遜云科技大中華區(qū)產(chǎn)品部 大數(shù)據(jù)與人工智能產(chǎn)品總監(jiān) Troy Cui,分享了亞馬遜云科技在幫助創(chuàng)業(yè)者如何實(shí)現(xiàn) AI 應(yīng)用、乃至應(yīng)用出海上的優(yōu)秀經(jīng)驗(yàn)。

以下內(nèi)容基于公開(kāi)演講,經(jīng) Founder Park 整理。

01 讓企業(yè)更輕松拿下全球市場(chǎng)

英國(guó)著名科幻作家亞瑟克拉克曾提到:「任何非常先進(jìn)的技術(shù),初看都與魔法無(wú)異」,在人類(lèi)歷史上,這句話(huà)被一次次的印證。

19 世紀(jì),用電能驅(qū)動(dòng)燈泡的時(shí)候,1979 年愛(ài)迪生發(fā)明電燈泡,極大地推動(dòng)了第二次工業(yè)革命。

1947 年開(kāi)始的數(shù)字革命,晶體管和運(yùn)算放大器的創(chuàng)新引發(fā)了電子學(xué)的「大爆炸」,導(dǎo)致了手機(jī)和筆記本電腦的誕生,這場(chǎng)革命也徹底改變了通信方式,使科技成為我們?nèi)粘I畹囊徊糠帧?/p>

1983 年,TCP/IP、互聯(lián)網(wǎng)技術(shù)的誕生,誕生了基于互聯(lián)網(wǎng)的各種新業(yè)務(wù)。亞馬遜也應(yīng)運(yùn)而生。

亞馬遜在線(xiàn)的零售業(yè)務(wù),服務(wù)于全球數(shù)以?xún)|計(jì)的客戶(hù)。這些強(qiáng)大的技術(shù)也讓亞馬遜云科技在早期就關(guān)注到怎么去做管理和配置我們的基礎(chǔ)設(shè)施服務(wù)。

不管客戶(hù)規(guī)模大小,不管他有多新,也可以應(yīng)用到和大公司同等能力的基礎(chǔ)設(shè)施服務(wù),不管是存儲(chǔ)網(wǎng)絡(luò)還是數(shù)據(jù)服務(wù),應(yīng)該有一個(gè)擁有同等安全、按需付費(fèi)、可靠且足夠經(jīng)濟(jì)的方案。

時(shí)至今日,亞馬遜云科技在全球 33 個(gè)國(guó)家和地區(qū)有 105 個(gè)可用區(qū),提供超過(guò) 200 個(gè)服務(wù)。

而且,這些服務(wù)仍舊在持續(xù)創(chuàng)新中。

哪怕是已經(jīng)存在 18 年之久的 Amazon S3 存儲(chǔ)服務(wù)、數(shù)據(jù)庫(kù)服務(wù),在去年也進(jìn)行了新的發(fā)布Amazon S3 Express。這已經(jīng)是上一個(gè) 18 年,大家認(rèn)為非常成熟的服務(wù),亞馬遜云科技至今仍在做進(jìn)一步的更新和迭代。

而借助亞馬遜云科技的服務(wù),我們讓大量客戶(hù)可以更方便地服務(wù)全球客戶(hù),開(kāi)拓更多商業(yè)市常

原來(lái)做錄像帶租賃的 Netflix,用了亞馬遜云科技的大量服務(wù),如今在全球 190 多個(gè)國(guó)家和地區(qū)做流媒體服務(wù)。

對(duì)于中國(guó)企業(yè)的出海,也有像 OPPO 這樣借由亞馬遜云科技在海外進(jìn)行布局的企業(yè),他們已經(jīng)成功做到全球手機(jī)出貨量 Top5。

02 構(gòu)建 AI 應(yīng)用第一步:選擇合適的模型

2023 年,ChatGPT 引領(lǐng)的 AI 之年。

亞馬遜云科技在幫助客戶(hù)做 AI 落地的過(guò)程中,也觀(guān)察到 2023 年是「生成式 AI 的 POC(概念驗(yàn)證測(cè)試)年」。我們更多是做原型的驗(yàn)證,以及可行性的驗(yàn)證。

但是從去年年底到今年上半年,我們看到很多場(chǎng)景下,AI 已經(jīng)真的逐漸被客戶(hù)用于生產(chǎn)了。很多企業(yè)客戶(hù)已經(jīng)開(kāi)始走這一步了,在這中間我們認(rèn)為不可避免地會(huì)有以下四個(gè)內(nèi)容要做。

首先要選好應(yīng)用場(chǎng)景、切入場(chǎng)景;第二是要選擇一個(gè)合適的工具幫助落地;第三是真正落地后涉及到的三公里問(wèn)題:工程化怎么解決?

這個(gè)問(wèn)題很重要,當(dāng)做到生產(chǎn)的時(shí)候就需要考慮規(guī);瘧(yīng)用。今天是一個(gè)人、十個(gè)人、一百個(gè)人做 POC testing(proof of concept,概念驗(yàn)證測(cè)試),但當(dāng)開(kāi)始生產(chǎn)的時(shí)候,DAU 要做到千萬(wàn)級(jí),你的工程化一定和 100 個(gè)人用完全不一樣。上線(xiàn)之后,一定會(huì)面臨非常多的監(jiān)管,這又涉及到安全的問(wèn)題怎么解決。

關(guān)于業(yè)務(wù)場(chǎng)景的選擇,首先是目標(biāo)的創(chuàng)新,我們看到一些 toC 的業(yè)務(wù),尤其是新的 workflow(工作流),往往是基于「目標(biāo)」的創(chuàng)新。很多企業(yè)客戶(hù),他們?cè)谒伎紕?chuàng)新從哪開(kāi)始的時(shí)候,往往想的是從大處著眼、小處著手,think big but start small。先從一個(gè)具體的場(chǎng)景做可行性驗(yàn)證,之后才在企業(yè)里面爭(zhēng)取更大的投入。

在場(chǎng)景選擇之外的另外三項(xiàng),亞馬遜科技就有比較強(qiáng)大的能力,能夠支撐創(chuàng)業(yè)者依次實(shí)現(xiàn)項(xiàng)目的落地。

首先是模型和模型工具的選擇:Performance & Accepability(高性能,可觸達(dá))。

大家普遍都會(huì)非常關(guān)注性能,在涉及選擇 AI 模型的時(shí)候,大家首先會(huì)思考「我要選擇什么樣的模型」,「我要保證這個(gè)模型在能力上能滿(mǎn)足自己應(yīng)用的需求」。

在進(jìn)行可行性驗(yàn)證的時(shí)候,我們得知道「上限」在哪,選擇一個(gè)最棒的模型來(lái)保證自己的上限達(dá)標(biāo)。

但是當(dāng)我們?nèi)ニ伎忌a(chǎn)布局的時(shí)候,一個(gè)「上限」的 performance,不見(jiàn)得是你需要思考的全部。我們還需要考慮一個(gè)大模型的 inference status 能不能保證終端客戶(hù)的實(shí)時(shí)性要求?當(dāng)你開(kāi)始規(guī)模化做業(yè)務(wù)的時(shí)候,單一模型的推理成本是不是可以保證 ROI 在你的口徑空間里?

很多時(shí)候,我們?cè)诤芏嘈袠I(yè)都會(huì)碰到一個(gè)三角難題,沒(méi)辦法同時(shí)滿(mǎn)足三項(xiàng)都達(dá)到完美。這里面一定會(huì)是一個(gè)折中的結(jié)果。

質(zhì)量、時(shí)延和成本的不可能三角

這也是為什么亞馬遜云科技會(huì)推出 Amazon Bedrock 這款產(chǎn)品,我們致力于給大家提供廣泛的有頭部能力的模型選擇。

大家可以看到,今年我們陸續(xù)更新了 Claude 3.0、Mistral、Llama 3 等模型。6 月 21 日,Claude 3.5 Sonnet 也剛剛上線(xiàn)了亞馬遜科技的 Amazon Bedrock,它比 Claude 3 擁有更智能的能力,但價(jià)格只有 1/5。模型的迭代在我們看來(lái)是非?斓模珻laude 3 上線(xiàn)三個(gè)月不到,我們就又上線(xiàn)了 Claude 3.5 這個(gè)模型。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港