封面新聞記者劉恪生
“嗒嗒嗒、嗒嗒嗒……”11月18日,在一片寬敞明亮的辦公區(qū)內(nèi),隨著鍵盤的敲擊聲,幾十名騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地的數(shù)據(jù)標(biāo)注員,正聚精會神地在做同一件事:運(yùn)用數(shù)據(jù)標(biāo)注平臺,對采集自全國的道路圖片進(jìn)行數(shù)據(jù)標(biāo)注,給人工智能大模型投喂數(shù)據(jù)。
自貢基地,是騰訊云、自貢市政府、百嘉數(shù)字三方聯(lián)合打造的一個(gè)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地。近年來,騰訊、百度、抖音等人工智能頭部企業(yè),相繼落戶自貢大安,打造人工智能產(chǎn)業(yè),開展產(chǎn)業(yè)人才培育,進(jìn)行企業(yè)孵化。
預(yù)計(jì)到2027年,自貢將打造超200個(gè)人工智能行業(yè)應(yīng)用場景,建成創(chuàng)新平臺50個(gè),培養(yǎng)專業(yè)人才1萬人,規(guī)上企業(yè)達(dá)到150戶,高企達(dá)到30戶。
“吞下”超2萬億次數(shù)據(jù)
人工智能大模型每天的學(xué)習(xí)量驚人
在大安區(qū)的騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地,這里有一間很“神秘”的封閉式房間:員工進(jìn)入須實(shí)名登記、嚴(yán)禁攜帶電子產(chǎn)品,每人一臺電腦,大家的工作就是對著電腦輸入各種指令。
騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地內(nèi),通過3D建模進(jìn)行數(shù)據(jù)可視化呈現(xiàn)
他們在干什么?這個(gè)“神秘”的工作場景,是數(shù)據(jù)整理及數(shù)據(jù)標(biāo)注的工作日常,為模型訓(xùn)練提供充足的數(shù)據(jù)支撐!澳P陀(xùn)練分兩個(gè)步驟,第一個(gè)步驟是預(yù)訓(xùn)練,在預(yù)訓(xùn)練階段,大模型使用大規(guī)模的無標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)!
基地負(fù)責(zé)人、四川百嘉數(shù)字科技有限公司副總經(jīng)理譚建介紹,這一階段,通過不斷地調(diào)整模型參數(shù),使模型能夠捕捉到文本中的統(tǒng)計(jì)規(guī)律和語義信息。目標(biāo)是讓模型具備強(qiáng)大的語言表示能力,為后續(xù)的任務(wù)提供基礎(chǔ)。
他說,第二步驟是微調(diào),在預(yù)訓(xùn)練完成后,大模型會根據(jù)特定的業(yè)務(wù)需求進(jìn)行微調(diào)。微調(diào)階段使用有標(biāo)注的數(shù)據(jù)對模型進(jìn)行進(jìn)一步訓(xùn)練,使模型在特定任務(wù)上的表現(xiàn)更加精準(zhǔn)。例如,在智能客服系統(tǒng)中,可以針對常見問題進(jìn)行微調(diào),提高模型的回答準(zhǔn)確率。
據(jù)了解,騰訊公司的大模型叫“混元大模型”,是騰訊自主研發(fā)的大語言模型,具有強(qiáng)大的中文創(chuàng)作能力、復(fù)雜語境下的邏輯推理能力以及可靠的任務(wù)執(zhí)行能力,在技術(shù)架構(gòu)上,采用基于Transformer的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),支持多輪對話、長文記憶,文生文,文生圖,圖生視頻等。
騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地的數(shù)據(jù)標(biāo)注員正對道路采集圖片進(jìn)行數(shù)據(jù)標(biāo)注
在訓(xùn)練數(shù)據(jù)上,主要利用騰訊豐富的互聯(lián)網(wǎng)數(shù)據(jù)資源進(jìn)行訓(xùn)練,包括社交媒體、新聞資訊等,確保了模型對中文語境的深度理解!盎煸竽P汀泵刻斓膶W(xué)習(xí)量驚人,據(jù)介紹,為“混元大模型”輸送的數(shù)據(jù),將總共超過2萬億次!
在運(yùn)營場景上,“混元大模型”將廣泛應(yīng)用于智能客服、智能助手、內(nèi)容創(chuàng)作等多個(gè)場景,特別是在企業(yè)服務(wù)和個(gè)性化推薦系統(tǒng)方面顯示出強(qiáng)大的應(yīng)用潛力。
自貢成為四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)
AI將成新質(zhì)生產(chǎn)力“主角”
自貢人工智能產(chǎn)值將超500億元
不僅如此,基地基于人工智能的業(yè)務(wù)還有兩大板塊:無人駕駛訓(xùn)練和平臺內(nèi)容審核。這些核心業(yè)務(wù),都離不開人工智能這個(gè)核心技術(shù)。
“無人駕駛訓(xùn)練是基于模型、算法等支持,對無人駕駛技術(shù)進(jìn)行數(shù)據(jù)采集后,開展人工智能化的訓(xùn)練,使其在車主使用時(shí)具有現(xiàn)實(shí)的指引意義!弊T建說,比如,行駛在道路上,人工智能要學(xué)會判斷錐形桶、行人等障礙物,以及復(fù)雜路況的精確判定等。
第三項(xiàng)業(yè)務(wù),是平臺內(nèi)容審核,也離不開人工智能技術(shù)的支撐。“公眾號、視頻號等,有許多關(guān)鍵詞需要識別,我們會讓人工智能進(jìn)行第一輪審核,之后還會有人工審核等流程!彼f,如果全部使用人工審核,就會造成效率低下、成本劇增等問題。
這只是自貢人工智能產(chǎn)業(yè)的冰山一角,在10月29日舉行的2024自貢新質(zhì)生產(chǎn)力創(chuàng)新發(fā)展大會上,自貢市科技局的業(yè)務(wù)骨干描繪了自貢人工智能制造發(fā)展的美好場景:智能駕駛汽車產(chǎn)業(yè)、無人機(jī)及通航產(chǎn)業(yè)、以智能仿真恐龍為特色的娛樂機(jī)器人、醫(yī)療康復(fù)機(jī)器人,以及兩個(gè)人工智能產(chǎn)業(yè)基礎(chǔ)方向,人工智能零售算力零售服務(wù)、人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)。
最終,自貢的人工智能產(chǎn)業(yè)將涵蓋制造、文旅、醫(yī)養(yǎng)、應(yīng)急安全、社會治理等方方面面,形成自貢特色“6+1”產(chǎn)業(yè)體系,計(jì)劃2027年實(shí)現(xiàn)人工智能產(chǎn)業(yè)產(chǎn)值超過500億元。
當(dāng)自貢彩燈插上人工智能的“翅膀”,會發(fā)生什么?
人工智能有望與自貢文旅發(fā)展相融合
人工智能有望與自貢文旅發(fā)展相融合
頭部企業(yè)相繼落戶
獲批四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)
為何選擇落戶自貢?譚建認(rèn)為,自貢地處成渝地區(qū)雙城經(jīng)濟(jì)圈南翼,其地理位置是一個(gè)重要支點(diǎn)!耙宰载暈橹c(diǎn),周邊有很多產(chǎn)業(yè)可以和人工智能相融合。比如自貢的文旅,未來就可以和人工智能相結(jié)合,生產(chǎn)出更令人驚艷的作品,這里面的想象空間其實(shí)還挺大的。”
他介紹,其次是營商環(huán)境,當(dāng)?shù)卣谑掷m(xù)辦理、稅收減免、住宿交通等方面,提供了非常好的服務(wù)。“還有高校資源,政府在周邊為我們對接了大量高校合作資源,取得了很好的效果,讓企業(yè)能專注發(fā)展。”
大安區(qū),是近年來自貢打造人工智能產(chǎn)業(yè)的“橋頭堡”。該區(qū)加速布局人工智能未來產(chǎn)業(yè),推動人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)聚集成勢,吸引百度、騰訊、字節(jié)跳動(抖音)三大互聯(lián)網(wǎng)巨頭相繼簽約落戶。
其中,百度阿波羅基地主要業(yè)務(wù)為高精地圖、車道級地圖、俯視圖、AOI、POI等業(yè)務(wù),企業(yè)用戶包括吉利、特斯拉等,力爭實(shí)現(xiàn)車道級導(dǎo)航產(chǎn)品“自貢造、全國用”。騰訊云基地主要業(yè)務(wù)為地圖標(biāo)注、混元大模型訓(xùn)練等,將打造騰訊云(自貢)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)基地、人才培育中心、企業(yè)孵化中心和數(shù)據(jù)交付中心;鹕揭婊仡A(yù)計(jì)11月實(shí)現(xiàn)投產(chǎn)運(yùn)營。
百度阿波羅基地外景
目前,基地已聚集相關(guān)企業(yè)20戶,員工940人(百度670人、騰訊270人),累計(jì)實(shí)現(xiàn)產(chǎn)值6917萬元(百度2617萬元、騰訊4300萬元),繳納稅收210萬元(百度196萬元、騰訊14萬元)。入駐企業(yè)中,四川百嘉數(shù)字科技有限公司8月成功升規(guī)入統(tǒng),成為全市首家規(guī)模以上互聯(lián)網(wǎng)和相關(guān)服務(wù)業(yè)企業(yè),成功填補(bǔ)軟件信息技術(shù)行業(yè)空白。
“近年來,以數(shù)據(jù)標(biāo)注為突破口,自貢成功切入人工智能‘?dāng)?shù)據(jù)、算法、算力’三大產(chǎn)業(yè)的數(shù)據(jù)產(chǎn)業(yè)。重點(diǎn)引進(jìn)百度、騰訊、抖音等人工智能頭部企業(yè),以龍頭帶動生態(tài)的方式,聚集數(shù)據(jù)標(biāo)注相關(guān)企業(yè)20戶,員工1000余人!
自貢市經(jīng)信局相關(guān)負(fù)責(zé)人介紹,同時(shí),還成立人工智能協(xié)會,培育省級“智改數(shù)轉(zhuǎn)”供應(yīng)商1戶(滕洋智能)、市級“智改數(shù)轉(zhuǎn)”服務(wù)商12戶,引進(jìn)華為云、騰訊云等外地優(yōu)秀服務(wù)商11戶。依托優(yōu)質(zhì)服務(wù)商資源積極為企業(yè)搭建供需交流平臺,推介專業(yè)服務(wù)商通過培訓(xùn)、咨詢、診斷等方式,緊緊圍繞技術(shù)支撐服務(wù)、技術(shù)項(xiàng)目轉(zhuǎn)化等方面助力企業(yè)智能制造水平能力提升;推薦優(yōu)秀服務(wù)產(chǎn)品,助力自貢企業(yè)轉(zhuǎn)型發(fā)展。
近年來,自貢緊扣發(fā)展培育新質(zhì)生產(chǎn)力決策部署,貫徹落實(shí)人工智能全省“1號創(chuàng)新工程”要求,堅(jiān)持小切口、快節(jié)奏前瞻布局人工智能未來產(chǎn)業(yè),超常規(guī)推進(jìn)“一區(qū)三園”產(chǎn)業(yè)體系建設(shè),引進(jìn)落地一批龍頭企業(yè),全力推動“6+1”產(chǎn)業(yè)初步起勢見效。2024年,自貢已獲批四川省首批人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū),取得了顯著的成效。