展會信息港展會大全

專訪騰訊杰出科學(xué)家劉杉:技術(shù)服務(wù)產(chǎn)品,回饋用戶和社會
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-05-20 13:41:22   瀏覽:7429次  

導(dǎo)讀:從大方向來講,人工智能未來可期。騰訊科學(xué)家劉杉對這一結(jié)論篤定認(rèn)可。但同時她說自己從來不是追逐潮流的人,所以,我覺得要盡量避免過熱,很多事情還是要想清楚,一步一個腳印把它做好,回歸技術(shù)本身,以及讓技術(shù)造福人類本身。 劉杉 5月17日,騰訊控股(00...

從大方向來講,人工智能未來可期。騰訊科學(xué)家劉杉對這一結(jié)論篤定認(rèn)可。但同時她說自己從來不是追逐潮流的人,所以,“我覺得要盡量避免過熱,很多事情還是要想清楚,一步一個腳印把它做好,回歸技術(shù)本身,以及讓技術(shù)造福人類本身。”

劉杉

5月17日,騰訊控股(00700.HK)發(fā)布2023年一季報,其營業(yè)收入1499.86億元,同比增長11%,凈利潤(Non-IFRS)325.38億元,同比增長27%。在科研領(lǐng)域,一季度騰訊研發(fā)開支達(dá)152億元人民幣,保持歷史高位。

據(jù)悉,2018年至今,騰訊研發(fā)投入已經(jīng)超2200億元。截至2022年底,騰訊在全球主要國家和地區(qū)專利申請公開總數(shù)超過6.2萬件,騰訊發(fā)明專利授權(quán)量位列全國民營企業(yè)第二。

今年4月26日,第23個世界知識產(chǎn)權(quán)日,騰訊發(fā)布“鵝廠女性發(fā)明人專利數(shù)”:超2.2萬件,占專利申請總數(shù)35%以上,且有多位女性發(fā)明人的全球?qū)@暾埩砍^百件。

在騰訊內(nèi)部,有一個經(jīng)常被提起的女性發(fā)明人劉杉博士,她是騰訊多媒體實驗室的負(fù)責(zé)人,也是國際著名多媒體專家、IEEE Fellow(美國電子電氣工程師學(xué)會最高級別成員),擁有數(shù)百件全球已授權(quán)專利。

騰訊多媒體實驗室是做什么的?

在今年3月底的博鰲亞洲論壇2023年年會上,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生在“下一代互聯(lián)網(wǎng)”分論壇上提出:“AI驅(qū)動一切”是下一代互聯(lián)網(wǎng)核心,“過去,互聯(lián)網(wǎng)內(nèi)容和服務(wù)的生產(chǎn)者,都是圍繞人展開;未來,機(jī)器也會成為內(nèi)容甚至服務(wù)的供給者。”

而這一切都離不開底層技術(shù)的支持,如:音視頻編解碼、網(wǎng)絡(luò)傳輸和實時通信,多媒體內(nèi)容的處理、理解、智能化生產(chǎn)和應(yīng)用、沉浸式媒體壓縮、建模,以及傳輸系統(tǒng)和端到端解決方案等。

這些“底層技術(shù)”正是騰訊多媒體實驗室的主攻領(lǐng)域。

近日,澎湃科技與騰訊多媒體實驗室的“掌舵人”劉杉博士隔著太平洋,通過“騰訊會議”認(rèn)認(rèn)真真地聊了聊,意外地發(fā)現(xiàn),劉杉是一個內(nèi)心住著工程師的科學(xué)家:她擁抱一切不可知,但在執(zhí)行落地時,她既是“計劃控”,也是“效率控”。

劉杉對人工智能是未來可期的大方向篤信不疑。對目前大火的ChatGPT,她說:“新技術(shù)和產(chǎn)品被使用和討論是非常有意義的事情,但同時應(yīng)盡量避免過熱,要想清楚,一步一個腳印把它做好。我希望所有的新技術(shù)最終都能為人類造福。”

除了人工智能,劉杉認(rèn)為團(tuán)隊目前正在探索的機(jī)器視覺及其應(yīng)用前景廣闊。何謂機(jī)器視覺?簡單理解就是機(jī)器上面加上視覺能力,用機(jī)器輔助人眼來做測量和判斷。

2020年,劉杉成為面向機(jī)器視覺的視頻編碼技術(shù)國際標(biāo)準(zhǔn)專題組的聯(lián)合組長,這是一個“全世界都從零開始”的新項目,騰訊是重要參與方和貢獻(xiàn)方。

劉杉

“標(biāo)準(zhǔn)圈”的“老資格”

劉杉本科畢業(yè)于清華大學(xué)電子工程系,2002年,從美國南加州大學(xué)電機(jī)工程系取得博士學(xué)位。她從2006年起開始從事“國際標(biāo)準(zhǔn)”工作,曾先后在多家全球500強(qiáng)和國際知名企業(yè)擔(dān)任高級技術(shù)和管理職務(wù)。2017年加入騰訊。

劉杉入行的時候,視頻編解碼國際標(biāo)準(zhǔn)還是H.263/AVC,今天已是2020年批準(zhǔn)的H.266/VVC。

“標(biāo)準(zhǔn)”是什么?劉杉盡可能通俗地解釋道,“每一代標(biāo)準(zhǔn)比起上一代標(biāo)準(zhǔn)的特點,簡單直接的指標(biāo)就是壓縮效率提升一倍?瓷先ネ瑯拥囊曨l畫質(zhì),本來帶寬是2M,現(xiàn)在變成1M,節(jié)省了很多帶寬。重要的是,這些標(biāo)準(zhǔn)不是指導(dǎo)性的,是必要性的,即全球行業(yè)內(nèi)生產(chǎn)廠家都必須遵循。”

她舉了一個更直觀的例子:“比如咱倆現(xiàn)在用騰訊會議進(jìn)行視頻通話,我用的是一個品牌的手機(jī)或電腦,你用的是另一個品牌的手機(jī)或電腦,他們要使用同一套標(biāo)準(zhǔn),如果你我二人有一方的手機(jī)不是用這個標(biāo)準(zhǔn),我們就沒辦法通話,也沒辦法看到對方。”

“標(biāo)準(zhǔn)”就是這么“有原則”。這也解釋了騰訊為什么要積極參與國際通行標(biāo)準(zhǔn)的制定,以及劉杉的價值,而標(biāo)準(zhǔn)制定蘊含著巨大的商業(yè)價值和社會價值,包括騰訊在內(nèi)的全球公司(百家)每一次都不敢懈擔(dān)

標(biāo)準(zhǔn)會議每年定期召開幾次。全球?qū)<揖奂惶脦砀髯缘念I(lǐng)先技術(shù)進(jìn)行熱烈的討論,有時候是激烈的辯論。討論一般要持續(xù)十天,“我記得一月的日內(nèi)瓦冬天很冷,每天天沒亮,我們踏著雪步行去會常每天正常的結(jié)束時間是晚上九十點鐘,凌晨三四點鐘也有過。”劉杉回憶。

劉杉說,“沒有一定的熱情和體力,不太容易撐下來。”

“搶修隊長”

劉杉的工作不止“標(biāo)準(zhǔn)”這一項。

她把手頭的工作分為三個臺階:最底層是前沿技術(shù)探索和研究,包括標(biāo)準(zhǔn)制定;第二層是將基礎(chǔ)研究,比如標(biāo)準(zhǔn)制定后,把其產(chǎn)品化、工程化,比如無線投屏、騰訊會議使用的屏幕內(nèi)容編碼;還有一項是每天都在進(jìn)行的工作,比如騰訊視頻、騰訊云等現(xiàn)有產(chǎn)品的持續(xù)優(yōu)化,保證業(yè)務(wù)穩(wěn)定性,隨時接收業(yè)務(wù)反饋有來自行業(yè)的,也有來自用戶的,比如大家比較關(guān)心的怎么修復(fù)各種Bug。

要不是隔著“騰訊會議”,劉杉說可以把自己的日程表給澎湃科技記者看,“雖然現(xiàn)在已是電子信息時代,但我還是會用紙質(zhì)的本子和筆去記錄每天的安排,感覺這樣更有質(zhì)感。”

劉杉的父母都是老師。在她記憶中,從很小時侯父母開始交給她帶日歷的記事本。劉杉自此養(yǎng)成了用記事本做規(guī)劃的習(xí)慣。

“我會定期規(guī)劃。年底的時候想一下明年做些什么,坐飛機(jī)的時候會想一下未來半年、三個月、一個月,我和我的團(tuán)隊、項目怎么規(guī)劃。具體到每天,我每天睡前會把第二天要做的事情寫下來,第二天按照計劃,一件一件事去完成。”

騰訊多媒體實驗室在中國和美國都有團(tuán)隊,新冠大流行之前,劉杉在兩邊的時間基本對半,還有20%左右的時間會在全球跑,出席各種國際會議。隨著疫情的退潮,今年春節(jié)過后,劉杉已回國一次。

劉杉似乎很享受兩邊團(tuán)隊能夠接力干活的狀態(tài),仿佛自己“偷”到了時間,她很興奮地告訴澎湃科技記者,“我記得突擊趕一些產(chǎn)品時間點時,給兩地工程師排班,國內(nèi)同事下班的時候,美國同事正好起來,雙方交接好,美國晚上正好是國內(nèi)早上上班時間,美國同事繼續(xù)開發(fā)。”

那是2018年年底,劉杉帶領(lǐng)團(tuán)隊做無線投屏產(chǎn)品的研發(fā),后來,無線投屏升級為騰訊會議。一年后,2019年的圣誕節(jié),騰訊會議正式發(fā)布。

“一發(fā)布就疫情了,用戶量一下子就上來了,帶來很多挑戰(zhàn)。”劉杉說。

騰訊的很多產(chǎn)品,不僅騰訊會議,在線教育類的產(chǎn)品,所有用戶都要同時占用計算資源,包括騰訊云底層的容器能力等,都面臨很大的挑戰(zhàn)。“當(dāng)然,不止騰訊,國內(nèi)外的互聯(lián)網(wǎng)科技公司,都面臨這樣的挑戰(zhàn)。但挑戰(zhàn)和機(jī)遇并存,原來規(guī)劃中要挑戰(zhàn)的DAU(日活躍用戶數(shù)量),疫情一來,DAU即達(dá)到歷史新高。”

在騰訊內(nèi)部,人人都是自家產(chǎn)品的體驗官,包括馬化騰。

從某種意義上說,劉杉的團(tuán)隊在騰訊內(nèi)部有點像“搶修隊”,劉杉就是“搶修隊長”。

“不管是騰訊會議還是騰訊視頻,底層技術(shù)一個重要組成部分都是音視頻技術(shù)。”過去的2022年,劉杉團(tuán)隊的工作重點之一是降本增效,說白了,就是怎么樣把帶寬成本壓下來,但同時不影響用戶體驗。一輪輪測試、評估、測試,直到找到那個最優(yōu)平衡點。

AI未來可期

劉杉2017年加入騰訊,即開始“標(biāo)準(zhǔn)布局”,2018年下半年又開始做編解碼工程的實現(xiàn),包括屏幕內(nèi)容編碼、實時音視頻,這些技術(shù)不僅支持騰訊會議,騰訊云、全民K歌、云游戲、QQ等騰訊眾多業(yè)務(wù)線都在使用這些底層技術(shù)。

與此同時,劉杉已看到沉浸式媒體的未來,包括虛擬現(xiàn)實 (VR)、增強(qiáng)現(xiàn)實(AR)和混合現(xiàn)實(MR),也包括全真互聯(lián)網(wǎng)。“我在2018年說,一定要做這件事。當(dāng)時整個行業(yè)都持觀望態(tài)度。”

2018年夏天,劉杉招了第一個工程師,開始搭建VR系統(tǒng),2019年進(jìn)入下一階段:6DoF(6向自由度),一種更沉浸式的體驗。比如:體育賽事里精確毫秒級同步拍攝選手運動狀態(tài)下的多角度轉(zhuǎn)瞬即逝的精彩畫面;在線教育時提供舞蹈、游泳、球類等在線學(xué)習(xí)新形式。

2019年除了全面鋪開沉浸式媒體,劉杉又提出現(xiàn)在大火的AIGC(又稱生成式AI,意為人工智能生成內(nèi)容),“當(dāng)時業(yè)界還沒有這4個字母的縮寫,我跟團(tuán)隊說要開始做智能內(nèi)容生產(chǎn)。”劉杉說,半年后她向公司高層做了這方面的匯報和展示,得到領(lǐng)導(dǎo)的認(rèn)可和支持。

從大方向來講,人工智能未來可期。劉杉對這一結(jié)論篤定認(rèn)可。但同時她說自己從來不是追逐潮流的人,所以,“我覺得要盡量避免過熱,很多事情還是要想清楚,一步一個腳印把它做好,回歸技術(shù)本身,以及讓技術(shù)造福人類本身。”

去年12月的一次國際會議上,劉杉主持過一場關(guān)于元宇宙的討論,參與討論的有來自谷歌、英偉達(dá)等業(yè)界的高管、科學(xué)家。劉杉發(fā)現(xiàn),大家對元宇宙都沒有非常清晰的定義,都是發(fā)散性思維,感覺什么都可以包含進(jìn)去。所以劉杉更愿意退回一步討論“全真互聯(lián)”,或者VR/AR等具體技術(shù)帶給大家的沉浸體驗,以及這些技術(shù)怎樣實現(xiàn)產(chǎn)品化,為文化傳承服務(wù),比如她的團(tuán)隊與故宮研究院、敦煌研究院的技術(shù)合作。

一些正在進(jìn)行中的項目可能不太方便透露,劉杉只舉了一個例子,即面向機(jī)器視覺的視頻編解碼技術(shù)。“2019年開始探索,隨著國際標(biāo)準(zhǔn)組織正式立項,我2020年開始擔(dān)任國際標(biāo)準(zhǔn)專題組的聯(lián)合組織,這是一個全世界都從零開始的探索。如果說,之前的音視頻技術(shù)解決的是人和人的關(guān)系,我們現(xiàn)在要開始探索人和機(jī)器、機(jī)器和機(jī)器的關(guān)系。”

劉杉曾在接受媒體采訪時說,“感謝公司給予我‘科學(xué)家’的稱號,不過在我的內(nèi)心里也一直住著一個‘工程師’。”

科學(xué)研究是開放的、不確定的,研究的成果往往和最初的預(yù)想不一樣,但做產(chǎn)品是反推的邏輯,需要更多確定性和規(guī)劃。

“二者沒有孰優(yōu)孰劣,每個人都要找到自己的熱情所在。就我個人的經(jīng)歷,我喜歡嘗試新東西并樂于擁抱變化。”劉杉說,她很喜歡喬布斯的一句話:“生命里的每一個點,最終都會連成線。”她的工作經(jīng)歷中有過算法研究也有過產(chǎn)品開發(fā),她堅信,“所有的工作,只要你認(rèn)真投入過,都不是浪費時間,都將是你的積累和財富。”

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港