當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能動(dòng)態(tài) > AI從科學(xué)到商業(yè)，火山引擎的少數(shù)派答案

AI從科學(xué)到商業(yè)，火山引擎的少數(shù)派答案
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-27 09:18:32 瀏覽：2889次

導(dǎo)讀：今年5月的一場(chǎng)發(fā)布會(huì)上，火山引擎總裁譚待表示，豆包比行業(yè)價(jià)格低了99.3%，大模型從此以厘計(jì)價(jià)。對(duì)于人工智能產(chǎn)業(yè)而言，這實(shí)際上釋放了一個(gè)明顯信號(hào)隨著基礎(chǔ)設(shè)施成本下降，應(yīng)用爆發(fā)期即將來(lái)臨。深度學(xué)習(xí)泰斗吳恩達(dá)曾在一次公開(kāi)演講中表示，AI是一系列工具...

今年5月的一場(chǎng)發(fā)布會(huì)上，火山引擎總裁譚待表示，“豆包比行業(yè)價(jià)格低了99.3%，大模型從此以厘計(jì)價(jià)”。

對(duì)于人工智能產(chǎn)業(yè)而言，這實(shí)際上釋放了一個(gè)明顯信號(hào)隨著基礎(chǔ)設(shè)施成本下降，應(yīng)用爆發(fā)期即將來(lái)臨。

深度學(xué)習(xí)泰斗吳恩達(dá)曾在一次公開(kāi)演講中表示，AI是一系列工具的集合。這些工具包括了監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)，以及現(xiàn)在的生成式人工智能它們都是通用技術(shù)，意味著AI與電力、互聯(lián)網(wǎng)等其他通用技術(shù)，并沒(méi)有什么區(qū)別。

電力本身并沒(méi)有創(chuàng)造價(jià)值，但它驅(qū)動(dòng)了電燈、冰箱和空調(diào)，后者誕生的基礎(chǔ)是低廉的電力成本。與之對(duì)應(yīng)，把大模型看作電力，它的繁榮取決于能夠帶動(dòng)多少下游的應(yīng)用，組成一個(gè)生機(jī)勃勃的生態(tài)。

如果一定要用一個(gè)指標(biāo)衡量生態(tài)的繁榮程度，那顯然不是模型本身的參數(shù)和性能，而是什么樣的人在調(diào)用它，有多少人正在使用它。

在8月21日舉辦的火山引擎AI創(chuàng)新巡展上公布的數(shù)據(jù)顯示，最新版豆包大語(yǔ)言模型的綜合能力相比三個(gè)月前首次發(fā)布時(shí)提升了20.3%，同時(shí)日均Tokens使用量超過(guò)5000億，發(fā)布2個(gè)月以來(lái)，平均每家企業(yè)客戶日均Tokens使用量增長(zhǎng)了22倍，是國(guó)內(nèi)使用量最大的大模型之一。

每一次API調(diào)用，都是在為技術(shù)大廈添磚加瓦，逐步搭建出豐富多樣的應(yīng)用樓宇。

應(yīng)用之辯

金沙江創(chuàng)投朱嘯虎曾在朋友圈吐槽：“當(dāng)年看不起（互聯(lián)網(wǎng)的）商業(yè)模式創(chuàng)新，覺(jué)得沒(méi)有壁壘：百團(tuán)大戰(zhàn)、百車大戰(zhàn)、百播大戰(zhàn)；沒(méi)想到硬科技大模型創(chuàng)業(yè)，依然是百模大戰(zhàn)...”

這種對(duì)商業(yè)化有著執(zhí)著信仰的投資人被稱作是“市場(chǎng)派”，而在他的另一邊，則是高舉scaling law大旗的技術(shù)派，其信條是人工智能的市場(chǎng)會(huì)隨著模型能力的飛躍而自然形成，更應(yīng)該不計(jì)成本的投入模型的訓(xùn)練。

這場(chǎng)爭(zhēng)論背后的分歧，也在谷歌和國(guó)內(nèi)大模型的更新頻率中體現(xiàn)。

今年2月，谷歌推出了Gemini1.0、Gemini Advanced、Gemini 1.5 pro、Gemma、Genie一系列模型，還有一堆Ultra、Pro、Nano這種不同參數(shù)量的版本，不光看的用戶眼花繚亂，谷歌員工看著既熟悉又陌生的大模型軍團(tuán)，也難免迷惑。

中國(guó)公司自然也不遑多讓，各家大模型在參數(shù)和排名上輪番打破紀(jì)錄，聊天繪畫(huà)和吟詩(shī)作對(duì)無(wú)所不能。但高頻更新的模型能力，和大規(guī)模商業(yè)化應(yīng)用場(chǎng)景之間的落差，就構(gòu)成了紅杉研報(bào)中一連串的數(shù)據(jù)：

全球的科技公司每年預(yù)計(jì)將花費(fèi)2000億美元，用于大模型基礎(chǔ)設(shè)施建設(shè)，相比之下，大模型每年最多只能產(chǎn)生750億美元的收入，中間存在著至少1250億美元的缺口。

國(guó)聯(lián)證券統(tǒng)計(jì)A股上市公司2023年財(cái)報(bào)顯示，AIGC整體滲透率不足20%，在超過(guò)一半的一級(jí)行業(yè)滲透率不到10%[1]，由此帶來(lái)了諸多類似“朱嘯虎之問(wèn)”的爭(zhēng)論與質(zhì)疑。

種種爭(zhēng)論與質(zhì)疑往往會(huì)被引向?qū)Υ竽Ｐ蛢r(jià)值的懷疑，但事實(shí)上，對(duì)模型性能的追逐，與應(yīng)用和商業(yè)化的成長(zhǎng)并不矛盾。

舉例來(lái)說(shuō)，iPhone并非第一臺(tái)觸屏手機(jī)，蘋果真正的開(kāi)創(chuàng)性是基于“觸摸”這個(gè)場(chǎng)景，開(kāi)發(fā)了一系列交互方式。而觸摸屏的分辨率、感應(yīng)精度等指標(biāo)，與觸控操作并不矛盾，反而相輔相成。

與之對(duì)應(yīng)，模型本身的能力與應(yīng)用的落地也不是非黑即白。橫空出世的ChatGPT既是GPT模型性能的體現(xiàn)，也是OpenAI的產(chǎn)品團(tuán)隊(duì)基于“聊天”這個(gè)場(chǎng)景的產(chǎn)品化能力。

只不過(guò)，面對(duì)各行各業(yè)細(xì)分又復(fù)雜的需求，大模型的應(yīng)用很難用代碼推導(dǎo)出來(lái)，只能躬身入局，深入具體的業(yè)務(wù)場(chǎng)景。

有了這個(gè)背景，便不難理解火山引擎牽頭搭建包括零售、汽車、智能終端等行業(yè)大模型生態(tài)聯(lián)盟的用意。其核心思路在于，讓一部分企業(yè)先將大模型嵌入業(yè)務(wù)場(chǎng)景，在這個(gè)過(guò)程中，探索各行各業(yè)融入AI的參考教材。

換句話說(shuō)，豆包把握企業(yè)需求的方式，嘗試和企業(yè)用戶一起去探索未來(lái)更新方向。

從零售開(kāi)始，到千行百業(yè)去

零售行業(yè)最顯著的特點(diǎn)是非標(biāo)。相比高度標(biāo)準(zhǔn)化的生產(chǎn)環(huán)節(jié)，零售存在大量的非標(biāo)環(huán)節(jié)，比如商品組合設(shè)計(jì)、直播數(shù)據(jù)復(fù)盤、售后服務(wù)響應(yīng)等等。同時(shí)，零售行業(yè)雖然信息化/數(shù)字化底子不俗，但智能化空間依然很大。

真實(shí)的銷售場(chǎng)景中，促成消費(fèi)者“購(gòu)買”動(dòng)作的核心要素很多時(shí)候是“說(shuō)不清道不明”的，單純的數(shù)字化工具，很難學(xué)會(huì)用“嘮家常”、“喚起共情”來(lái)賣產(chǎn)品。但這恰恰是大模型與智能化能夠滲透的業(yè)務(wù)空間。

一套經(jīng)典培訓(xùn)話術(shù)

零售大模型生態(tài)聯(lián)盟成立的背景，一方面是零售業(yè)借助AI提升經(jīng)營(yíng)效率，在存量中創(chuàng)造增量；另一方面對(duì)豆包和火山引擎來(lái)說(shuō)，這也是與行業(yè)伙伴協(xié)同探索業(yè)內(nèi)真實(shí)需求，以進(jìn)一步完善豆包服務(wù)能力的機(jī)會(huì)。

截至目前，零售大模型生態(tài)聯(lián)盟發(fā)布了七種核心解決方案，基本覆蓋零售行業(yè)“人、嘗貨”三大核心要素。

“人”指消費(fèi)者需求，解決方案包括：VOC，多維度挖掘消費(fèi)者需求，洞察流失原因；零售客服質(zhì)檢，實(shí)現(xiàn)全量智能質(zhì)檢和實(shí)時(shí)預(yù)警，統(tǒng)一服務(wù)標(biāo)準(zhǔn)，對(duì)所有會(huì)話進(jìn)行智能監(jiān)控，一旦發(fā)現(xiàn)異常，立即標(biāo)記并告警。

“場(chǎng)”指渠道以及銷售場(chǎng)景（比如直播），解決方案包括：零售客服陪練，模擬買家與客服的對(duì)話，加快客服水平提升速度；練播房，教-學(xué)-練-考-評(píng)全面融入豆包大模型，提升主播帶貨水平；直播洞察，結(jié)合抖店授權(quán)精準(zhǔn)數(shù)據(jù)，輔以豆包大模型及抖音同源的技術(shù)復(fù)盤歸因，提升抖音直播間表現(xiàn)。

“貨”指產(chǎn)品及服務(wù)，也被認(rèn)為是三大要素中，AI附加值最高的環(huán)節(jié)。

以豆包大模型為基礎(chǔ)的商城導(dǎo)購(gòu)助手，可以實(shí)現(xiàn)會(huì)籍知識(shí)問(wèn)答、大模型推薦商品信息列表、基于購(gòu)物偏好購(gòu)買清單、基于購(gòu)物清單給出商品鏈接、智能回復(fù)等核心場(chǎng)景，提高顧客的體驗(yàn)和滿意度。

在一系列解決方案中，不難看出火山引擎在其中扮演的角色：

一是將一些非標(biāo)的環(huán)節(jié)盡可能標(biāo)準(zhǔn)化。比如售后服務(wù)和直播復(fù)盤歸因，大量數(shù)據(jù)歸集、指標(biāo)篩選的“Excel式”工作可以交由大模型完成，將人的決策能力釋放出來(lái)。二是在數(shù)字化的基礎(chǔ)上智能化，比如直播洞察、企業(yè)商品知識(shí)庫(kù)這類應(yīng)用，本質(zhì)上利用的是大模型對(duì)非標(biāo)數(shù)據(jù)的處理能力。

在與零售行業(yè)的合作中，豆包扮演的其實(shí)是一個(gè)“修鐵路”的角色即針對(duì)行業(yè)的需求，針對(duì)性開(kāi)發(fā)一系列作為基礎(chǔ)設(shè)施的應(yīng)用，并在實(shí)際的行業(yè)應(yīng)用過(guò)程中逐漸去粗取精。

在零售之外，火山引擎的工具箱正在一個(gè)又一個(gè)行業(yè)中復(fù)制。

今年5月，火山引擎正式發(fā)布“汽車大模型生態(tài)聯(lián)盟”，成員除了吉利、長(zhǎng)城、一汽紅旗、東風(fēng)本田、智己等車企外，還包括中國(guó)電動(dòng)汽車百人會(huì)等行業(yè)組織，同時(shí)最新入會(huì)成員包括領(lǐng)克、吉利銀河、上汽榮威、上汽名爵等。

在本月火山引擎與梅賽德斯-奔馳的合作中，可以窺見(jiàn)前者扮演的角色提升智艙信息檢索能力、提升智艙系統(tǒng)反應(yīng)速度、擴(kuò)展智能應(yīng)用場(chǎng)景等。

在與領(lǐng)克汽車的合作中，在豆包大模型幫助下，領(lǐng)克實(shí)現(xiàn)了智慧邀約坐席、AI 對(duì)練&內(nèi)訓(xùn)、AI 銷售助手、智慧經(jīng)營(yíng)報(bào)表以及 AI 用車說(shuō)明書(shū)等多項(xiàng)基于模型能力的功能。

除此之外，在教育、金融、游戲、智能終端等行業(yè)，大模型應(yīng)用也取得積極進(jìn)展。

比如在教育領(lǐng)域，據(jù)浙江大學(xué)求是特聘教授、信息技術(shù)中心主任陳文智介紹，在自研 OpenBuddy 模型，以及豆包大模型等極具性價(jià)比的商業(yè)模型及智能體的共同賦能下，浙大創(chuàng)建了“浙大先生”智能體應(yīng)用開(kāi)發(fā)平臺(tái)，并搭建了AI科學(xué)家、慧學(xué)外語(yǔ)、AI百事通、數(shù)字教師等多個(gè)大模型校園應(yīng)用場(chǎng)景。

在大模型的參數(shù)指標(biāo)不斷突破極限的同時(shí)，它的應(yīng)用案例，也在一個(gè)又一個(gè)常被忽視的業(yè)務(wù)場(chǎng)景中不斷積累。

從科學(xué)到商業(yè)

SuperCLUE在今年4月發(fā)布的《中文大模型基準(zhǔn)測(cè)評(píng)報(bào)告》中，將豆包大模型劃入了“實(shí)用主義者”象限[3]，點(diǎn)出了豆包大模型區(qū)別于國(guó)內(nèi)許多大模型的特質(zhì)：更加重視實(shí)用性。

大模型的性能和參數(shù)，更多是一種學(xué)術(shù)意義的指標(biāo)，但讓各行各業(yè)用上大模型，則是一個(gè)有關(guān)成本、效率和價(jià)值的商業(yè)問(wèn)題。

從學(xué)術(shù)角度看，生成式AI的終極目標(biāo)是一個(gè)超級(jí)模型解決所有問(wèn)題。但放在具體的商業(yè)應(yīng)用中，顯然更看重模型與業(yè)務(wù)的適配，這也是火山引擎在通用模型之外，針對(duì)細(xì)分場(chǎng)景開(kāi)發(fā)專用模型的核心因素。

今年的春季火山引擎FORCE原動(dòng)力大會(huì)上，字節(jié)跳動(dòng)發(fā)布了豆包模型家族，包含大語(yǔ)言模型、語(yǔ)音模型、視覺(jué)模型等九大模型，到今年7月，家族又迎來(lái)新成員豆包圖生圖模型，為更細(xì)分的需求進(jìn)行了針對(duì)性開(kāi)發(fā)。

在8月21日的創(chuàng)新巡展上，豆包再次宣布重磅更新，性能方面，豆包大模型在角色扮演、語(yǔ)言理解、長(zhǎng)文任務(wù)、數(shù)學(xué)等維度，綜合能力提升20.3%。

在垂類模型方面，比如語(yǔ)音識(shí)別模型，在識(shí)別率上，與國(guó)內(nèi)公開(kāi)發(fā)布的語(yǔ)音識(shí)別大模型相比，錯(cuò)誤率降低了 10%-40%；在上下文感知上，帶來(lái)超過(guò)15%的召回率提升；同時(shí)在保持高準(zhǔn)確率后，豆包語(yǔ)音識(shí)別支持包括上海話、粵語(yǔ)、四川話、陜西話、閩南語(yǔ)等方言識(shí)別。

語(yǔ)音合成模型重點(diǎn)升級(jí)了流式語(yǔ)音合成能力，實(shí)時(shí)生成語(yǔ)音，讓大模型“邊想邊說(shuō)”，接近人類語(yǔ)音交互方式，大模型理解文本語(yǔ)義和情感的能力的升級(jí)，實(shí)現(xiàn)精準(zhǔn)斷句，同時(shí)有26種超自然音色可供選擇。

FlagEval6月發(fā)布的評(píng)測(cè)榜單顯示，在閉源大模型的“客觀評(píng)測(cè)”中，豆包大模型以綜合評(píng)分75.96分排名國(guó)產(chǎn)大模型第一。

在模型落地環(huán)節(jié)，火山引擎推出了火山方舟、扣子專業(yè)版、HiAgent等一系列平臺(tái)和工具。以火山方舟為例，企業(yè)可以通過(guò)火山方舟進(jìn)行模型精調(diào)、推理、評(píng)測(cè)等，也可以通過(guò)豐富的插件生態(tài)，進(jìn)行AI原生應(yīng)用開(kāi)發(fā)。

扣子是“工具箱”諸多應(yīng)用中非常出圈的，其本質(zhì)是“低代碼”構(gòu)建AI Bot，用戶不懂編程知識(shí)也可以構(gòu)建各種AI Bot，并發(fā)布到應(yīng)用商店，還能分享到豆包、微信、飛書(shū)等平臺(tái)。

扣子專業(yè)版主要面向企業(yè)需求，在原版基礎(chǔ)上提供了企業(yè)級(jí)SLA和多種高級(jí)特性，使AI應(yīng)用更易落地，驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)。

HiAgent則是企業(yè)專屬的AI應(yīng)用創(chuàng)新平臺(tái)，高度適配企業(yè)個(gè)性化需求，企業(yè)業(yè)務(wù)人員可以像搭積木一樣低代碼搭建智能體，讓業(yè)務(wù)創(chuàng)新不受生產(chǎn)技能的限制。

一系列高強(qiáng)度開(kāi)發(fā)的目的，就是從價(jià)格到易用性等多個(gè)方面，全面降低模型的使用調(diào)度成本。

在承載力方面，豆包提供了業(yè)內(nèi)最高標(biāo)準(zhǔn)的初始TPM（每分鐘Tokens）和RPM（每分鐘請(qǐng)求數(shù)），每分鐘處理Tokens限額最高可達(dá)同梯隊(duì)模型數(shù)倍。

而在價(jià)格上，在各家大模型最強(qiáng)版本價(jià)格對(duì)比中，豆包比行業(yè)價(jià)格低98%以上。

在解決了成本問(wèn)題后，大模型落地到行業(yè)內(nèi)的難題，就只剩下大模型與企業(yè)的協(xié)同。換句話說(shuō)，就是模型要“懂”行業(yè)。

何為“懂”？法律條文教育出的大模型會(huì)在法考中拿高分或是提供法律條文注釋，但更多案件實(shí)例的投喂和專業(yè)律師不斷反饋的意見(jiàn)，才能“培養(yǎng)”出一個(gè)AI律師。在更多行業(yè)，一些“只可意會(huì)不可言傳”的know-how，需要大模型公司與行業(yè)更多的協(xié)作和磨合。

對(duì)大模型企業(yè)來(lái)說(shuō)，這就不僅要求其本身有足夠強(qiáng)的“技術(shù)能力”，更依賴在無(wú)數(shù)行業(yè)實(shí)踐中積累的“工程能力”。火山引擎大神云集的研發(fā)團(tuán)隊(duì)常被輿論提及，但其多年的成功實(shí)踐中，不斷完善的“工程能力”，同樣舉足輕重。

從零售大模型生態(tài)聯(lián)盟到汽車大模型生態(tài)聯(lián)盟，再到火山引擎與多家頭部智能終端廠商一同成立的智能終端大模型聯(lián)盟，一個(gè)個(gè)行業(yè)的智能化重塑和人工智能真正的革命性，正在這些行業(yè)落地中一點(diǎn)點(diǎn)展露。

尾聲

AIGC產(chǎn)業(yè)的評(píng)價(jià)體系向來(lái)和數(shù)字強(qiáng)相關(guān)，去年是各大參數(shù)性能，今年則是各大公司的盈虧額。

上個(gè)月，行業(yè)媒體the Information發(fā)表長(zhǎng)文《How does OpenAI Survive》，估算OpenAI今年的運(yùn)營(yíng)虧損將到50億美元。這意味著奧特曼的化緣之路尚且漫漫，短時(shí)間內(nèi)看不到盡頭。

OpenAI的最大競(jìng)爭(zhēng)對(duì)手Anthropic情況也不好。今年早些時(shí)候，公司高管曾預(yù)測(cè)，2024年的年化收入在與亞馬遜分成后在4億美元到6億美元之間，但同時(shí)全年耗費(fèi)資金將達(dá)到27億美元。

這似乎進(jìn)一步驗(yàn)證了一個(gè)歷史規(guī)律：技術(shù)革命的最大受益者，通常不是率先做出突破的開(kāi)拓者，而是那些率先將技術(shù)擴(kuò)散出去的一方。

中國(guó)有句老話叫“要想富先修路”，AI時(shí)代，技術(shù)與實(shí)際生產(chǎn)生活的融合迎來(lái)全新的高度，也給“修路”帶來(lái)了新的挑戰(zhàn)。

超級(jí)工程向來(lái)不是拔地而起，技術(shù)的變革總是厚積薄發(fā)。今天，火山引擎通車了高速公路的一條快車道。

參考資料

[1] 千家公司年報(bào)，看AI在A股的“滲透率”，國(guó)聯(lián)證券

[2] Andrew Ng: Opportunities in AI - 2023，Stanford Online

[3] 中文大模型基準(zhǔn)測(cè)評(píng)2024年度4月報(bào)告，SuperCLUE

作者：何律衡

編輯：張澤一

視覺(jué)設(shè)計(jì)：疏睿

責(zé)任編輯：張澤一

相關(guān)熱詞： 學(xué)到商業(yè) 火山引擎少數(shù)派答案

上一篇：“ChatGPT之父”又一項(xiàng)目：開(kāi)發(fā)無(wú)人駕駛公交系統(tǒng)，接送機(jī)場(chǎng)旅客

下一篇：專訪元蘿卜總裁馬堃：造出新品類機(jī)器人落地產(chǎn)品難在找到剛需

AiLab云推薦

AI從科學(xué)到商業(yè)，火山引擎的少數(shù)派答案
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-27 09:18:32 瀏覽：2889次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI從科學(xué)到商業(yè)，火山引擎的少數(shù)派答案 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-27 09:18:32 瀏覽：2889次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

AI從科學(xué)到商業(yè)，火山引擎的少數(shù)派答案
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2024-08-27 09:18:32 瀏覽：2889次