展會信息港展會大全

感知AI機器人、聚焦大模型本質(zhì),圖靈獎得主和清華教授心中未來的AI長啥樣?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-07-14 19:25:11   瀏覽:14790次  

導(dǎo)讀:智東西(公眾號:zhidxcom) 編譯 | 銘滟 編輯 | 徐珊 WAIC 2023世界人工智能大會最近在上海圓滿落幕。在這場國內(nèi)最高規(guī)格人工智能領(lǐng)域峰會上,11位重磅嘉賓從不同角度分享了對中國人工智能領(lǐng)域的觀察與判斷。 在大會的巔峰對話環(huán)節(jié)中,商湯科技董事長兼CEO...

智東西(公眾號:zhidxcom)

編譯| 銘滟

編輯 | 徐珊

WAIC 2023世界人工智能大會最近在上海圓滿落幕。在這場國內(nèi)最高規(guī)格人工智能領(lǐng)域峰會上,11位重磅嘉賓從不同角度分享了對中國人工智能領(lǐng)域的觀察與判斷。

在大會的巔峰對話環(huán)節(jié)中,商湯科技董事長兼CEO徐立與圖靈獎得主、上海期智研究院院長姚期智、清華大學(xué)交叉信息研究院助理教授袁洋、清華大學(xué)交叉信息研究院助理教授、Moonshot AI創(chuàng)始人楊植麟、DragGAN第一作者、南洋理工大學(xué)計算機科學(xué)與工程學(xué)院助理教授潘新鋼,就人工智能的發(fā)展與突破,進(jìn)行了精彩的探討,包括大模型核心理論研究突破、多模態(tài)對大模型的優(yōu)化、安全可控的算法進(jìn)路以及對比分析已有案例等。

一、姚期智:中國科學(xué)家助力人工智能強化學(xué)習(xí)

圖靈獎得主、上海期智研究院院長姚期智表示,中國的科學(xué)家在AI的發(fā)展上做了很多突破性貢獻(xiàn)。清華大學(xué)交叉信息研究院助理教授高陽在一年多前做出了非常重要的算法突破貢獻(xiàn),使得強化學(xué)習(xí)的時間進(jìn)程加快數(shù)百倍。他的研究不僅是一項應(yīng)用進(jìn)步,也為算法研究作出了理論貢獻(xiàn)。因此,他的研究受到了國際廣泛關(guān)注。

他認(rèn)為在ChatGPT之后,人工智能研究的下一個重要目標(biāo)就是擁有視覺、聽覺等多種感知能力的機器人,并能在不同的環(huán)境中自主學(xué)習(xí)各種新技能。而高陽的技術(shù)突破,則是將機器人的學(xué)習(xí)速度提高了數(shù)百倍,使機器人在幾個小時內(nèi)就能做到。

這不單單解決了機器人學(xué)習(xí)的實用問題,也是理論貢獻(xiàn)。姚期智表示,在過去六七年內(nèi),人工智能的高層研究者曾就人工智能強化學(xué)習(xí)路線是否正確的議題展開爭論。而高陽的研究突破,則是將這個天平傾向了另一邊。我們對人工智能的完善,還有很長的路要走。

二、袁洋:對多模態(tài)的理解應(yīng)基于解決具體行業(yè)的具體問題

在交叉學(xué)科的大模型應(yīng)用方面,清華大學(xué)交叉信息研究院助理教授袁洋表示,對多模態(tài)的理解應(yīng)當(dāng)基于解決具體行業(yè)的具體問題。例如文本到圖片的生成,生成的圖片不是用戶想要的表現(xiàn),用戶需要用鼠標(biāo)對其進(jìn)行修改。而這個鼠標(biāo)的拖動,就是新的模態(tài)。用戶在用新的輸入把自己想要表達(dá)的內(nèi)容告訴大模型,并讓它能夠理解。這種多模態(tài)的輸入在應(yīng)用中非常重要。

所以在具體行業(yè)內(nèi),大模型的訓(xùn)練應(yīng)當(dāng)聚焦于行業(yè)內(nèi)最核心的問題,找到解決核心問題所需的數(shù)據(jù)。這就是模態(tài)的補全。在此基礎(chǔ)上,做好模態(tài)對齊與模態(tài)補齊后,袁洋認(rèn)為,大模型可以有更強大的能力,來解決更核心的交叉領(lǐng)域的問題。

三、楊植麟:對通用大模型問題的解決應(yīng)回歸更本質(zhì)的層面

清華大學(xué)交叉信息研究院助理教授、Moonshot AI創(chuàng)始人楊植麟則表示,現(xiàn)有大模型還有很多未解決的問題,比如,安全性,可控性,避免產(chǎn)生幻覺和編造不存在的問題,以及大模型無法像科學(xué)家一樣創(chuàng)造。他認(rèn)為,當(dāng)針對通用模型思考這些問題時,不應(yīng)當(dāng)頭痛醫(yī)頭,而應(yīng)當(dāng)舉一反三,思考這些問題底層的共通問題是什么,回歸更本質(zhì)的層面來解決。

四、潘新鋼:Moonshot和GAN未來或可優(yōu)勢互補

DragGAN第一作者、南洋理工大學(xué)計算機科學(xué)與工程學(xué)院助理教授潘新鋼則基于生成模型的框架以及優(yōu)化目標(biāo)的不同,比較了兩個AI繪圖軟件Moonshot和GAN的差異。第一是性能與效率,在生成過程中,擴散模型迭代式計算需要的更多的訓(xùn)練時間和更大的計算開銷。所以,圖像生成性能更高。潘新鋼認(rèn)為擴散模型的上限高于GAN,質(zhì)量優(yōu)勢更明顯,應(yīng)用前景更廣。但對于性能和計算開銷有限制的特定情形下,GAN仍是妥協(xié)的選擇。

第二是GAN和擴散模型的映射,擴散模型對于圖像內(nèi)容的影響表現(xiàn)為較為隨機,不具有結(jié)構(gòu)化,GAN可以有效編輯圖像中的屬性,例如動物姿態(tài)等。在這一方面,后續(xù)如何拓展擴散模型的問題也值得探索。

第三是生成空間的連續(xù)性,設(shè)計時擴散模型的圖像空間較為不連續(xù),GAN的圖像控件則比較流暢自然。未來將這兩個模型進(jìn)行優(yōu)勢互補是非常有趣的研究話題。

五、未來大語言模型的領(lǐng)域方向

關(guān)于大模型在垂直領(lǐng)域的發(fā)展,姚期智認(rèn)為,基于大模型的語言能力,未來可以將更多的文書工作交給機器來完成。袁洋則基于其專業(yè)背景和大模型基于預(yù)訓(xùn)練范式的判斷,認(rèn)為大模型在醫(yī)療關(guān)系中可能會比人類和機器做得更好,表示更看好智能醫(yī)療方向。楊植麟則傾向于個人使用方向。比如人可以給AI提供上下文,人看到的所有東西AI通過錄屏也可以看到等。潘新鋼認(rèn)為今后視頻和三維內(nèi)容生成前景很大,可以幫助創(chuàng)意工作者等創(chuàng)造更高質(zhì)量的內(nèi)容。

以上是巔峰對話內(nèi)容的完整整理,除此之外,本屆WAIC 2023世界人工智能大會期間,特斯拉創(chuàng)始人、CEO埃隆馬斯克(Elon Musk)、香港中文大學(xué)教授湯曉鷗,華為輪值董事長胡厚,微軟全球資深副總裁、微軟大中華區(qū)董事長兼首席執(zhí)行官侯陽博士,圖靈獎2018年得主、Meta AI基礎(chǔ)人工智能研究(FAIR)團隊首席AI科學(xué)家楊立昆(Yann LeCun),地平線創(chuàng)始人兼CEO余凱分別分享了對人工智能領(lǐng)域的觀察與思考。

結(jié)語:人工智能領(lǐng)域的未來將向“人腦”方向發(fā)展

此次WAIC帶來的不僅是各家大模型的集會,也是人工智能研究領(lǐng)域新老血液的交匯。人工智能領(lǐng)域的研究涵蓋了多個學(xué)科,包括計算機科學(xué)、數(shù)據(jù)分析與統(tǒng)計、硬件和軟件工程、語言學(xué)、神經(jīng)科學(xué),甚至哲學(xué)和心理學(xué)。因此目前對于人工智能未來發(fā)展方向的探討并未形成統(tǒng)一觀點。

但無論是通用人工智能,還是機器人人工智能,各個人工智能概念或?qū)⑾?ldquo;人腦”甚至“人類”的方向發(fā)展。這意味著人工智能的目標(biāo)不僅是模仿人類的行為,更要真正理解人類思維、情感和行為等復(fù)雜抽象概念。對于這些復(fù)雜抽象概念的分析,除了計算機科學(xué)和數(shù)據(jù)分析之外,或許還會涉及到腦科學(xué)領(lǐng)域,以及更深層的哲學(xué)與心理學(xué)等問題。

贊助本站

人工智能實驗室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港