展會(huì)信息港展會(huì)大全

博士“下礦井、進(jìn)車間”,站在華為云盤古大模型背后的人
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-09-21 19:44:55   瀏覽:9962次  

導(dǎo)讀:圖片來源:視覺中國 務(wù)實(shí)點(diǎn)看,大模型要先走向行業(yè);再務(wù)實(shí)點(diǎn),華為云直接將博士們推向了一線。 盤古大模型初見真章是在2021年4月,NLP大模型與CV大模型正式發(fā)布;此后,科學(xué)計(jì)算大模型、藥物分子大模型、礦山大模型和萬眾矚目的氣象大模型等紛紛浮出水面;...

圖片來源:視覺中國

務(wù)實(shí)點(diǎn)看,大模型要先走向行業(yè);再務(wù)實(shí)點(diǎn),華為云直接將博士們推向了一線。

盤古大模型初見真章是在2021年4月,NLP大模型與CV大模型正式發(fā)布;此后,科學(xué)計(jì)算大模型、藥物分子大模型、礦山大模型和萬眾矚目的氣象大模型等紛紛浮出水面;再到此前7月7日,華為開發(fā)者大會(huì)發(fā)布盤古大模型3.0,9月21日華為全聯(lián)接大會(huì)發(fā)布盤古汽車大模型和醫(yī)學(xué)大模型,華為云逐漸將盤古大模型在各行業(yè)的布局徐徐展開。

可是,做B端市場不是件容易的事情,貼近生活的大語言模型雖說能夠滿足豐富的日常交互,但其本身的語料內(nèi)容缺乏不同行業(yè)的專業(yè)背景,在工作實(shí)用性上難以深入;金融、醫(yī)療、生物、氣象等垂直領(lǐng)域真正能觸發(fā)大模型潛力,需要大模型設(shè)計(jì)者了解特定的行業(yè),而行業(yè)術(shù)語、行業(yè)邏輯、行業(yè)場景等,是大模型算力、算法技術(shù)之外的天地。

行先于言,過去幾年,華為云把一批又一批博士、專家、科學(xué)家派到客戶現(xiàn)場,走田頭、跑工地、下礦井、進(jìn)車間,目前已幫助超過1000家企業(yè)落地智能化創(chuàng)新項(xiàng)目。今年,華為云還計(jì)劃將200+博士送到一線。長遠(yuǎn)來看,做出實(shí)用、好用的行業(yè)大模型,了解行業(yè)才是先見。

隔行如隔山

行業(yè)大模型是“行業(yè)”+“大模型”,實(shí)為兩個(gè)不同的專業(yè)與專業(yè)的結(jié)合碰撞。

好用的行業(yè)大模型首先是要懂行業(yè),最終的產(chǎn)品需要運(yùn)行在每個(gè)車間、礦井、田間地頭,使用者說好,才算實(shí)現(xiàn)大模型落地這一關(guān)。將博士送往一線,是華為云做出的最樸實(shí)的決定。

在所有前往一線的博士們印象中,“隔行如隔山”的感受在預(yù)想之內(nèi),但還是來得有些“生猛”。華為不缺擅長大模型的專業(yè)技術(shù)人才,也不缺來自各行業(yè)的一線經(jīng)驗(yàn),但每個(gè)行業(yè)都有自己的專業(yè)術(shù)語和獨(dú)特業(yè)務(wù),與博士們本職的技術(shù)研發(fā)工作相比,知識(shí)壁壘的確存在。尤其在行業(yè)體系更復(fù)雜的自動(dòng)駕駛、金融、重工業(yè)等領(lǐng)域,這些阻隔更為強(qiáng)烈。

先拿自動(dòng)駕駛來說,華為云EI人工智能算法專家金博士對于下一線有著頗多感悟。

初次進(jìn)入自動(dòng)駕駛行業(yè),感受到的是其技術(shù)鏈條非常長,行業(yè)體系龐大。”金博士直言。原來在縱深的自動(dòng)駕駛行業(yè)技術(shù)鏈條中,只硬件層面就包含了車輛硬件、視覺和雷達(dá)等多傳感器的選型、傳感器的布局安裝等細(xì)節(jié);軟件層面則分類更多,圍繞數(shù)據(jù)與算法,包含了數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、感知算法、定位算法、決策規(guī)劃和執(zhí)行控制等等。而每一個(gè)模塊,都有各自對應(yīng)的專業(yè)團(tuán)隊(duì)。

所謂隔行如隔山,在眾多專業(yè)模塊中,找到華為云盤古大模型在自動(dòng)駕駛行業(yè)的切入點(diǎn),則是最難的業(yè)務(wù)問題。破題的火苗,出現(xiàn)在金博士與客戶共同的“封閉會(huì)戰(zhàn)”期間,“那段時(shí)間經(jīng)常是6點(diǎn)多出發(fā)的高鐵去上海,有一次我坐在位置上閉上雙眼,腦海里沖擊著完全不同的兩個(gè)畫面:早晨起床看窗外僅僅亮著那么三四盞燈,和幾小時(shí)后淹沒在一杯一杯水中的密集交談、連帶著高速頭腦風(fēng)暴,一根根頭發(fā)都立了起來。”

需要高強(qiáng)度溝通的客戶很多,傳統(tǒng)車企、造車新勢力、自動(dòng)駕駛科技公司等不同類型行業(yè)客戶,都在落地大模型所要溝通了解的范圍之中,這些行業(yè)在一線的業(yè)務(wù)問題或多或少都有不同。不過,對金博士來說,行業(yè)多也好理解難也罷,想要?jiǎng)?chuàng)造出好用的東西,理解都是第一步,但總要走這第一步。

比對、總結(jié)、與思緒紛飛,溝通的成功讓大家落實(shí)了切入方向?qū)Ω队绊懜唠A自動(dòng)駕駛落地的關(guān)鍵因素:各類不常見但不斷出現(xiàn)的“長尾問題”,因?yàn)槿绾渭铀匍L尾場景的數(shù)據(jù)閉環(huán),是自動(dòng)駕駛量產(chǎn)的關(guān)鍵。

大模型時(shí)代,自動(dòng)駕駛行業(yè)的突破依賴高質(zhì)量、高場景覆蓋度、精細(xì)標(biāo)注的數(shù)據(jù)。而現(xiàn)在的問題恰恰是:當(dāng)前路采數(shù)據(jù)采集效率低、成本高、corner case數(shù)據(jù)難獲取,場景覆蓋率低。一個(gè)包含視覺、雷達(dá)等多傳感器的10秒clip,采集標(biāo)注等成本卻達(dá)幾百元,而自動(dòng)駕駛需要的,是幾百萬小時(shí)的行駛數(shù)據(jù)。下到了一線后,金博士才如此真切地體會(huì)到了自動(dòng)駕駛數(shù)據(jù)的價(jià)值。

科學(xué)家費(fèi)曼說“只要我不能創(chuàng)造的,我就還不理解”。也正是在博士們一線的深入體會(huì)與理解中,盤古汽車大模型能夠生成多種Corner case場景,讓自動(dòng)駕駛遍歷各種復(fù)雜場景變成可能。

通過應(yīng)用盤古大模型,自動(dòng)駕駛的Corner Case可以實(shí)現(xiàn)天級(jí)的閉環(huán),顯著提高數(shù)據(jù)閉環(huán)效率;诒P古大模型的場景生成能力,企業(yè)可以構(gòu)造出雨天、下雪天的場景用于模型的訓(xùn)練,不必等待特殊天氣才能進(jìn)行數(shù)據(jù)采集。此外,20%的路測工作也可以通過大模型的場景生成來實(shí)現(xiàn),縮短了里程積累的周期。大模型能夠快速地構(gòu)建出場景豐富的樣本,而且對樣本的數(shù)量要求也只有以前小模型的十分之一。

山外有山

只是山外還有山,除了打破行業(yè)間專業(yè)壁壘的難題,橫亙在大模型設(shè)計(jì)者與使用者之間的,還有來自一線客戶的真實(shí)需求,這往往與預(yù)想中不一致。做行業(yè)大模型,首先要尊重行業(yè),其次要尊重來自一線的從業(yè)者的經(jīng)驗(yàn)。

參與盤古金融大模型研發(fā)的謝博士感受尤為深刻:“深入一線后,我們對金融行業(yè)客戶現(xiàn)場交付有了新的認(rèn)知,客戶側(cè)存在不同的業(yè)務(wù)線、不同背景的人,因此他們對大模型的需求和偏好是多樣的,甚至有時(shí),需求的特點(diǎn)是相對的。”

比如,宣傳部門希望大模型生成的內(nèi)容要更發(fā)散,更有創(chuàng)意性,能夠幫助他們打開思路;但授信部門要撰寫授信報(bào)告,則要求大模型生成的內(nèi)容更客觀、更精確、更尊重原文。“引導(dǎo)客戶群說出他們在工作中遇到的難點(diǎn)與真實(shí)需求是必要的。”謝博士說到。

在一線,謝博士收集了宣傳部門人員在撰寫宣傳文案會(huì)考慮宣傳的對象特點(diǎn)作為人設(shè),比如以年齡段來區(qū)分,針對老人、中年人、大學(xué)生等分別對應(yīng)的寫作文案的特點(diǎn),將這些信息加入到prompt中,就能很好提升大模型生成效果。針對授信部門的人群,發(fā)現(xiàn)他們在撰寫過程中經(jīng)常引用財(cái)報(bào)等專業(yè)性較高的材料,那么在大模型書寫過程中,就需要提示大模型參考特定材料,書寫與原文保持一致。也正如此,不同場景的需求都在盤古金融大模型中有了精細(xì)劃分。

而深入溝通,除了能夠了解最真實(shí)的業(yè)務(wù)需求外,還聊出了更多業(yè)務(wù)之外的想法。祝博士主要負(fù)責(zé)了金融大模型的落地,更專注于盤古大模型的效果評測與效果提升。和銀行員工的交流,是他在一線活動(dòng)中印象最深刻的事。

大模型成風(fēng)的那段時(shí)間,“我會(huì)不會(huì)失業(yè)?”“會(huì)不會(huì)有一天,我將被技術(shù)終結(jié)?”這些飄零的話語深深叩問著職場打工人的心。是擁抱技術(shù)還是換個(gè)姿勢擁抱技術(shù),大家深知,其實(shí)我們沒有選擇權(quán)。但當(dāng)這看似遙遠(yuǎn)的事被真正考慮在企業(yè)發(fā)展中,還是會(huì)有些不可思議。

針對人力密集型場景,也就是大模型提質(zhì)增效最具想象的場景,有銀行表示并不希望員工被大模型取代,而應(yīng)該讓大模型提升服務(wù)質(zhì)量與服務(wù)效率,釋放員工做更多更高價(jià)值的事;诖讼敕,華為云則聯(lián)合該銀行,梳理了大模型在企業(yè)應(yīng)用的人員轉(zhuǎn)身實(shí)踐。

同樣在銀行一線駐扎的祝博士說到:“這次交流也驅(qū)動(dòng)我們梳理了一整套企業(yè)落地方法論,我們想做到授人以漁,讓企業(yè)、企業(yè)員工深入擁抱新技術(shù),主動(dòng)應(yīng)用大模型解決業(yè)務(wù)痛點(diǎn)。”通過聯(lián)合實(shí)踐,他們形成了一系列培訓(xùn)課程,從產(chǎn)品需求洞察、prompt調(diào)優(yōu)、微調(diào)、大模型運(yùn)營等各個(gè)維度,并和遠(yuǎn)程銀行、UX設(shè)計(jì)、網(wǎng)點(diǎn)等部門合作,建立聯(lián)合項(xiàng)目組,目的是驅(qū)動(dòng)企業(yè)人員能力提升。也或許,這才是一線工作人員的真實(shí)需求。

最終,付出得到的回報(bào)也讓祝博士十分開心。在當(dāng)前已經(jīng)上線的場景中,客戶把網(wǎng)點(diǎn)文檔問答包裝成了該銀行的“爆款”場景,10月時(shí)計(jì)劃全行推廣,此外,因?yàn)閼?yīng)用效果比較好,他們還計(jì)劃橫向推廣到信貸、金融、內(nèi)審等場景。

見山

過去幾年,通過把一批又一批博士、專家、科學(xué)家派到客戶現(xiàn)場,直面難題、解決難題。除了上文提到的金博士、謝博士、祝博士的經(jīng)歷,華為做過的難事不算少數(shù),也贏得了許多業(yè)內(nèi)好評。

在礦山領(lǐng)域,有博士被送到了山東能源集團(tuán),下到礦井實(shí)地調(diào)研,目的是為了解決提升精煤產(chǎn)率這一困擾業(yè)界多年的難題。精煤不僅低碳環(huán)保,而且經(jīng)濟(jì)價(jià)值更高,廣泛應(yīng)用于電力、鋼鐵、化工等領(lǐng)域。2022年,我國原煤產(chǎn)量達(dá)到45.6億噸,但精煤產(chǎn)量僅為4.9億噸。

只是,洗選煤生產(chǎn)的工藝參數(shù)涉及100多種,傳統(tǒng)洗選密度控制依靠人工經(jīng)驗(yàn)確定,無法及時(shí)準(zhǔn)確地通過數(shù)據(jù)分析對分選密度進(jìn)行實(shí)時(shí)調(diào)整,容易導(dǎo)致指標(biāo)波動(dòng),造成精煤回收損失。

基于實(shí)地考察的結(jié)果,最終博士們提出通過盤古預(yù)測大模型能力,對不同煤層、不同季節(jié)、不同灰分(煤炭完全燃燒后余下的殘?jiān)┑脑好嘿|(zhì)數(shù)據(jù)和工藝參數(shù)智能分析,同時(shí),基于華為自研的圖網(wǎng)絡(luò)融合技術(shù)對多個(gè)最優(yōu)算法進(jìn)行堆疊、動(dòng)態(tài)調(diào)優(yōu),能夠精準(zhǔn)預(yù)測精煤產(chǎn)品的灰分值,從而實(shí)現(xiàn)重介選煤分選密度的精準(zhǔn)控制與動(dòng)態(tài)調(diào)整。在這一新方案下,山能濟(jì)二煤礦每年能多產(chǎn)出8000噸精煤。而如果能將這個(gè)能力推廣到全國,可以讓每個(gè)煤礦每年平均多產(chǎn)出2000噸精煤。

推動(dòng)“數(shù)智山能”之外,華為云的博士們通過將大模型技術(shù)賦能藥物分子及醫(yī)療,也讓一線的醫(yī)療科研按下加速鍵。

西交大一附院劉冰教授團(tuán)隊(duì)發(fā)現(xiàn)世界40年來首個(gè)抗生素,就是在盤古藥物分子大模型助力下實(shí)現(xiàn)的,目前該項(xiàng)目已進(jìn)入臨床階段,價(jià)值達(dá)到了1億美元。據(jù)測算,通過盤古藥物分子大模型,可以將先導(dǎo)藥物研發(fā)周期縮短至1個(gè)月,研發(fā)成本降低70%。

負(fù)責(zé)華為科學(xué)計(jì)算與生物醫(yī)療領(lǐng)域產(chǎn)品的劉星星博士說到:“我本身是生物醫(yī)療領(lǐng)域的博士,五年前畢業(yè)之后,看到華為在生物醫(yī)療領(lǐng)域投入的決心,以及華為在AI、大模型的整體規(guī)劃吸引了我,因此我決定,那就加入到華為。”

在自己的科研愿景下,劉星星博士也收獲到了想要的東西:“當(dāng)時(shí)有個(gè)客戶反饋說,和其它大廠也聊了很多,但最終發(fā)現(xiàn)華為最懂他們,我覺得這是最讓我感到自豪的事情。我們長期深入一線的功夫沒有白費(fèi)。”

華為云對待科研的務(wù)實(shí)做法,對于一批真正想實(shí)現(xiàn)科研落地的人才來說,就是安撫躁動(dòng)夢想的解藥。

一作發(fā)Nature的華為工程師愷峰,是清華大學(xué)錢學(xué)森力學(xué)班2016級(jí)本科畢業(yè)生。7月6日,愷峰和同事們的論文《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》發(fā)表于Nature雜志,報(bào)告了業(yè)內(nèi)“首個(gè)在中長期氣象預(yù)報(bào)上精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的AI模型”。這也是近年來中國科技公司首篇作為唯一署名單位的Nature正刊論文。

回憶起盤古氣象大模型,時(shí)間穿回2021年底,愷峰在一次偶然的機(jī)會(huì)中發(fā)現(xiàn)中期氣象預(yù)報(bào)可能是AI很好的運(yùn)用場景。當(dāng)時(shí),他半開玩笑半認(rèn)真地和同事說:“我準(zhǔn)備做一個(gè)很大的項(xiàng)目,用2000TB的歷史氣象數(shù)據(jù)去構(gòu)建一個(gè)AI模型,要是成功了那么全世界氣象預(yù)報(bào)的范式都要被徹底改變。”

當(dāng)時(shí),擺在面前的有三個(gè)問題,第一個(gè)是天量的數(shù)據(jù),第二個(gè)是不均勻的經(jīng)緯度網(wǎng)格和扭曲的等壓面,第三個(gè)則是不斷累積的迭代誤差。但在解決問題的過程中,不斷出現(xiàn)了與業(yè)界既定看法相悖的想法。

如何處理歐洲已經(jīng)開放的2000TB的全球氣象數(shù)據(jù)?愷峰首先選用了少量的數(shù)據(jù)作診斷性實(shí)驗(yàn),但與大部分氣象專家的看法相反,經(jīng)過試驗(yàn),他發(fā)現(xiàn)僅使用位勢、溫度、濕度、風(fēng)速四種狀態(tài)就可以很好地建模大氣的演變,同時(shí)垂直高度上的層數(shù)對精度的影響很校

此外,為了減少預(yù)測的系統(tǒng)誤差等大部分類似問題,之前都是用自回歸的方式來解決。但實(shí)踐表明,這一方式用來做氣象預(yù)測有巨大的弊端自回歸學(xué)到的結(jié)果不可避免的平滑,所有的極端天氣都被忽略了。

“我試了很多很多方法去解決這個(gè)問題,包括很多正則類方法,效果都不盡人意。最后解決這個(gè)問題的是一個(gè)非常簡單的小技巧:我把不同時(shí)間的預(yù)測模型分開了,用24小時(shí)的模型去做天級(jí)的預(yù)報(bào),6小時(shí),3小時(shí),1小時(shí)的模型去做更細(xì)致的預(yù)報(bào),這樣來盡可能地減少迭代次數(shù)。這也讓我們成為了唯一可以預(yù)測逐小時(shí)天氣的AI模型。”愷峰總結(jié)到。

此前的實(shí)習(xí),愷峰做的是純粹的科研,但這是讓他覺得可惜的事情:“兩篇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索相關(guān)的課題都離落地比較遠(yuǎn),所以比較缺乏成就感。記憶里非常多種idea,最終也沒有找到實(shí)際場景可以很好的運(yùn)用。當(dāng)時(shí)感覺‘人生中第一次做科研’,卻沒有很好的feedback。”

進(jìn)入華為之后的落地科研,讓愷峰懷抱著激情的同時(shí),真正了解到AI落地與AI科研之間的區(qū)別科研的時(shí)候只需要在“imagenet數(shù)據(jù)集”上精度高一兩個(gè)點(diǎn)就可以了,但是落地的場景很碎片化,數(shù)據(jù)標(biāo)注流程和質(zhì)量要自己控制,算法調(diào)優(yōu)周期要盡可能的短,樣本數(shù)目比較少但是場景特別多。不過,“落地場景一般做起來都比較快樂”,愷峰說到:“對我而言,更困難的地方是寫各種文字材料,還有就是場景很碎片化,我更想做一些‘價(jià)值更大’的問題。”

成為山

華為鼓勵(lì)博士、科研人員在一線做難事的同時(shí),也在他們身后擔(dān)當(dāng)起了靠山作用。對待科研,華為確實(shí)是慷慨大方的。愷峰說到,在進(jìn)行氣象大模型的訓(xùn)練中,他申請了兩個(gè)月的AI算力。在順利的過程推進(jìn)下,他們AI模型精度超過了全球最好的數(shù)值方法,例如,盤古對于臺(tái)風(fēng)路徑預(yù)測的準(zhǔn)確度比之前最好的歐洲中心預(yù)報(bào)還要高20%。

對內(nèi)慷慨,對外,華為希望共建一個(gè)大模型生態(tài)。其實(shí),這也是在推進(jìn)一線工作之后所要走完的最后一公里,讓大模型繼續(xù)下沉。

以云服務(wù)的方式提供騰AI算力,也解決了客戶自訓(xùn)練大模型的難題。畢竟大模型訓(xùn)練依賴極大算力消耗,由于高端GPU芯片出口限制等問題,大模型產(chǎn)業(yè)發(fā)展需要持續(xù)供應(yīng)、自主創(chuàng)新的AI算力。而騰AI云服務(wù),可以實(shí)現(xiàn)從算力、芯片使能(CANN算子庫)、AI框架(MindSpore AI計(jì)算框架)到AI平臺(tái)(AI 開發(fā)生產(chǎn)線ModelArts)的自主創(chuàng)新。

博士們沖在前線做難事、解難題,騰AI云服務(wù)的澎湃算力做靠山,華為遙遙領(lǐng)先的其實(shí)是走出科研,走回一線的實(shí)踐能力。

回頭看看,那些難以跨過的山巒,也在攀越起伏的決意中,漸行漸遠(yuǎn)。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港