展會(huì)信息港展會(huì)大全

5天就能做出刷屏的《流浪地球3》預(yù)告片,AI還會(huì)顛覆哪些場(chǎng)景?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-20 09:49:08   瀏覽:4422次  

導(dǎo)讀:這一年來(lái),被稱(chēng)為生成式人工智能的革命性技術(shù),激發(fā)了全球科技界把所有軟件和硬件重做一遍的沖動(dòng),很多爆紅應(yīng)用進(jìn)入大眾視線(xiàn),典型的代表是AI繪畫(huà)板塊的StableDiffusion和MidJourney大大壓縮了繪畫(huà)的時(shí)間成本,也有用戶(hù)使用視頻生成軟件RunWay在5天時(shí)間內(nèi)做...

這一年來(lái),被稱(chēng)為“生成式人工智能”的革命性技術(shù),激發(fā)了全球科技界“把所有軟件和硬件重做一遍”的沖動(dòng),很多爆紅應(yīng)用進(jìn)入大眾視線(xiàn),典型的代表是AI繪畫(huà)板塊的StableDiffusion和MidJourney大大壓縮了繪畫(huà)的時(shí)間成本,也有用戶(hù)使用視頻生成軟件RunWay在5天時(shí)間內(nèi)做出一支《流浪地球3》預(yù)告片。

AI在哪些行業(yè)獲得了實(shí)際應(yīng)用?AI領(lǐng)域的“殺手級(jí)應(yīng)用”更有可能出現(xiàn)在ToB還是ToC板塊?生成式AI發(fā)展還需要突破哪些難點(diǎn)?在主題為“智能涌現(xiàn)數(shù)開(kāi)萬(wàn)物”的科技新聞HiTechDay暨2023數(shù)字開(kāi)物大會(huì)上,科技新聞創(chuàng)作者胡竣昆仲資本投資副總裁陳希、清華大學(xué)交叉信息學(xué)院助理教授袁洋、木牛機(jī)器人CEO郭林、科技新聞創(chuàng)作者/互聯(lián)網(wǎng)基金公司AI業(yè)務(wù)負(fù)責(zé)人張仁杰,從投資、學(xué)術(shù)、創(chuàng)意等角度解讀最先被AI改變的應(yīng)用場(chǎng)景。

陳希認(rèn)為雖然投資人很關(guān)心AI應(yīng)用和落地,但目前很多AI項(xiàng)目的估值存在高溢價(jià),下半年投資人變得更加冷靜,同時(shí)對(duì)于爆款應(yīng)用的態(tài)度也保持謹(jǐn)慎,陳希表示從投資角度看,KillerAPP需要解決真正重要的需求,具有可擴(kuò)展性,并產(chǎn)生商業(yè)價(jià)值。即使C端產(chǎn)品可以帶來(lái)爆發(fā)式增長(zhǎng),但從長(zhǎng)遠(yuǎn)來(lái)看,這些產(chǎn)品最終需要找到B端的應(yīng)用場(chǎng)景。

在袁洋看來(lái),大多數(shù)大模型目前都停留在System1階段,即直覺(jué)性的思考階段。如果能在System2階段,即深思熟慮后再給出答案,那么這些模型的能力會(huì)大大增強(qiáng)。在醫(yī)療、教育和法律等領(lǐng)域的價(jià)值也會(huì)進(jìn)一步凸顯。

郭林看到AI和機(jī)器人的結(jié)合為行業(yè)帶來(lái)的顛覆性的機(jī)會(huì),把時(shí)間拉長(zhǎng)來(lái)看,算法和算力資源對(duì)于所有AI機(jī)器人公司都是平等和透明的,大量積累可以被訓(xùn)練的高質(zhì)量數(shù)據(jù)是當(dāng)前初創(chuàng)企業(yè)唯一值得立即開(kāi)始且持續(xù)投入的關(guān)鍵點(diǎn)。

張仁杰認(rèn)為,AI不僅僅能提高效率,它已經(jīng)顛覆了創(chuàng)作方式,以前不可能的事,現(xiàn)在能做到,以前能做的事,現(xiàn)在效率提高了10倍。

以下為對(duì)話(huà)實(shí)錄精華版:

胡。簾o(wú)論AI到底是什么,都一定要先應(yīng)用起來(lái),今天我們有幸邀請(qǐng)到幾位重量級(jí)嘉賓,既有投資人的代表,也有創(chuàng)意企業(yè)和學(xué)術(shù)的代表。

陳希:我是昆仲資本的陳希,人工智能是下一代產(chǎn)業(yè)賦能和革新的技術(shù),所以從2016年上一波AI起來(lái)的時(shí)候,我們就一直專(zhuān)注地圍繞AI+各個(gè)重點(diǎn)領(lǐng)域去做投資布局。隨著AI底層技術(shù)的不斷發(fā)展,從深度學(xué)習(xí)向CNN、RNN到后來(lái)的Transformer,我們也在尋找大模型以及AIGC帶來(lái)的新的創(chuàng)業(yè)機(jī)會(huì)。

袁洋:我是清華的袁洋,自己做的科研主要是大模型技術(shù)理論,跟著學(xué)院院長(zhǎng)一起開(kāi)展人工智能、大模型的常識(shí)推理和數(shù)學(xué)題的研究,我的主要方向是做大模型的醫(yī)療,即智慧中醫(yī),打算辦一個(gè)智慧診所。

郭林:我是木牛機(jī)器人的郭林,主要從事AI技術(shù)在工業(yè)方向和傳統(tǒng)機(jī)器人的結(jié)合,從而創(chuàng)造一些創(chuàng)新性的產(chǎn)品。通過(guò)機(jī)器人底層系統(tǒng)賦能很多產(chǎn)業(yè)應(yīng)用,主力服務(wù)智能物流和物流搬運(yùn),主要是在生產(chǎn)制造的重載搬運(yùn)場(chǎng)景。

張仁杰:以前我是做用戶(hù)體驗(yàn)設(shè)計(jì)出身,現(xiàn)在是在一家互聯(lián)網(wǎng)基金平臺(tái)公司擔(dān)任設(shè)計(jì)總監(jiān),今年2月開(kāi)始選擇去做AI自媒體。我自己對(duì)AI很感興趣,業(yè)余也一直在玩GPT、AI繪圖、AI視頻、AI聲音類(lèi)應(yīng)用。大家認(rèn)識(shí)我是在8月,那個(gè)時(shí)候我做了一個(gè)AI預(yù)告片叫做《流浪地球III》,稍微火了一點(diǎn)。

胡。和顿Y人現(xiàn)在怎么看待AI?你們投資這些項(xiàng)目的思考決策邏輯是怎樣的?

陳希:最近,大家都注意到AI尤其是大型模型在上半年和下半年表現(xiàn)出明顯的變化。上半年非;馃,我們看到了大量的融資,但下半年投資人變得更加冷靜和謹(jǐn)慎。Gartner最近發(fā)布的報(bào)告顯示,GenerativeAI現(xiàn)在處于期望過(guò)高階段。市場(chǎng)上很多項(xiàng)目的估值存在高溢價(jià)。

從行業(yè)構(gòu)造來(lái)看,AI分為三層:基礎(chǔ)大模型層、中間層和應(yīng)用層。其中,基礎(chǔ)大模型層是競(jìng)爭(zhēng)最激烈的。上半年的投資主要集中在這一層。中間層類(lèi)似于云計(jì)算時(shí)代的PaaS,也是一個(gè)比較熱門(mén)的領(lǐng)域。而最上層的應(yīng)用層則是最有發(fā)展機(jī)會(huì)的,能夠結(jié)合數(shù)據(jù)集以及對(duì)各個(gè)垂直行業(yè)的Knowhow,在大模型基礎(chǔ)上做FineTurning,創(chuàng)造實(shí)際的商業(yè)價(jià)值。雖然當(dāng)前估值普遍較高,投資人仍期待新的商業(yè)機(jī)會(huì)和前景。

胡。和顿Y人特別關(guān)心的是AI的實(shí)際應(yīng)用和落地。袁老師,作為教育界的專(zhuān)家,您如何看待AI的快速發(fā)展和學(xué)生對(duì)此的態(tài)度?

袁洋:學(xué)生們對(duì)大模型的態(tài)度各不相同。有的很想深入了解并嘗試,有的則更傾向于做科研。我認(rèn)為,不管是哪個(gè)領(lǐng)域,都應(yīng)該擁抱大模型。不過(guò),我注意到大多數(shù)大模型目前都停留在System1階段,即直覺(jué)性的思考。如果能在System2階段,即深思熟慮后再給出答案,那么這些模型的能力會(huì)大大增強(qiáng)。在醫(yī)療、教育和法律等領(lǐng)域,這樣的模型將非常有價(jià)值。

我們自己還提出了CommunicativeReasoning,對(duì)解決醫(yī)療、教育和法律上的復(fù)雜性問(wèn)題具備很高的價(jià)值,可以讓AI經(jīng)過(guò)深思熟慮發(fā)揮更大作用。

在我看來(lái),大模型需要把思維流程變成像工業(yè)流水線(xiàn)一樣的一個(gè)一個(gè)小步驟,然后將這些步驟有機(jī)結(jié)合起來(lái),在這個(gè)過(guò)程中可以選擇不同的岔路、找到一個(gè)最好的方案。

胡。汗偅J(rèn)為這次AI的變革在整體發(fā)展上會(huì)有什么不同?

郭林:AI和機(jī)器人的結(jié)合為行業(yè)帶來(lái)了顛覆性的機(jī)會(huì)。但實(shí)際應(yīng)用中,企業(yè)最頭疼的是無(wú)盡的CornerCase,這是所有創(chuàng)業(yè)公司都面對(duì)的最大、最頭疼的問(wèn)題。行業(yè)里有一個(gè)笑話(huà)買(mǎi)機(jī)器人送工程師,基本上指的就是這樣的狀態(tài)。

很多數(shù)據(jù)的結(jié)合,將有機(jī)會(huì)解決各種各樣的CornerCase成本結(jié)構(gòu),真正走到場(chǎng)景落地的時(shí)候,我們不寄希望于AI解決所有問(wèn)題,但我們希望AI能解決關(guān)鍵節(jié)點(diǎn)的問(wèn)題,我們承擔(dān)得起相應(yīng)的成本提升。這些關(guān)鍵問(wèn)題外的其它問(wèn)題,可以通過(guò)工程化和數(shù)學(xué)手段解決。這種思路將為企業(yè)帶來(lái)新的落地策略。

胡俊:卡茲克,你嘗試過(guò)多少種AI應(yīng)用?有沒(méi)有讓你特別驚艷的?

張仁杰:很難具體統(tǒng)計(jì),但我基本上用過(guò)市面上所有火熱的AI相關(guān)應(yīng)用。去年10月到現(xiàn)在,我的閾值變高了。ChatGPT不用多說(shuō),國(guó)內(nèi)外的類(lèi)似產(chǎn)品我都試過(guò)。但難以重現(xiàn)ChatGPT初次給我的震撼。最近有個(gè)KimiChat讓我重新驚艷,它處理20萬(wàn)字文檔不衰減,GPT-4和Claude雖然支持幾十萬(wàn)Token,但用戶(hù)扔進(jìn)去的文檔的后半部分常常“消失”,而KimiChat卻能精確處理文檔后半部分的內(nèi)容。

在AI繪圖板塊,如StableDiffusion和MidJourney,也讓我非常驚艷。

其它AI產(chǎn)品是偏功能性的,包括AI擴(kuò)圖或?qū)崟r(shí)會(huì)畫(huà)。此外,今年5月我還嘗試了AI聲音技術(shù),像11Labs用5分鐘不到的時(shí)間就能將短音頻擴(kuò)展成29國(guó)語(yǔ)言。還有AI視頻,像Runway和《流浪地球III》的預(yù)告片,都讓我印象深刻。

胡俊:AI應(yīng)用是否提高了你們的創(chuàng)作效率?

張仁杰:不僅僅是提高效率,它已經(jīng)顛覆了創(chuàng)作方式。以前不可能的事,現(xiàn)在能做到,以前能做的事,現(xiàn)在效率提高了10倍。比如我制作的《三體》AI預(yù)告片,包含了各種AI生成的視頻和李雪健老師的聲音模型,以前需要半年以上的時(shí)間,現(xiàn)在我只用了五個(gè)晚上。

胡。簞(chuàng)作視頻時(shí)的挑戰(zhàn)很大。你們發(fā)現(xiàn)了什么殺手級(jí)的應(yīng)用嗎?在ToB和ToC領(lǐng)域,哪個(gè)更可能出現(xiàn)殺手級(jí)應(yīng)用?

陳希:對(duì)于AIGC產(chǎn)品,ToB和ToC之間的界限并不清晰。像ChatGPT和StableDiffusion這樣的產(chǎn)品既吸引C端用戶(hù),也在B端產(chǎn)生價(jià)值。但從投資角度看,KillerAPP需要解決真正重要的需求,具有可擴(kuò)展性,并產(chǎn)生商業(yè)價(jià)值。即使C端產(chǎn)品可以帶來(lái)爆發(fā)式增長(zhǎng),但從長(zhǎng)遠(yuǎn)來(lái)看,這些產(chǎn)品最終需要找到B端的應(yīng)用場(chǎng)景。在中國(guó),C端用戶(hù)不太愿意付費(fèi),所以AIGC時(shí)代的KillerAPP應(yīng)該是能夠吸引C端用戶(hù)同時(shí)在B端場(chǎng)景中商業(yè)化的產(chǎn)品。

胡俊:不論是ToC還是其他形式,核心商業(yè)模式必須成立。袁老師,從基礎(chǔ)科研的角度來(lái)看,您認(rèn)為解決什么樣的問(wèn)題可能會(huì)產(chǎn)生殺手級(jí)應(yīng)用?

袁洋:我對(duì)殺手級(jí)應(yīng)用的了解不多,但在使用大模型的過(guò)程中,我發(fā)現(xiàn)它們?cè)赟ystem1和System2方面仍存在缺陷。不論是繪畫(huà)、寫(xiě)作還是編程,經(jīng)常會(huì)出現(xiàn)錯(cuò)誤。例如,我想在畫(huà)中修改兔子的尾巴,但這并不容易。這背后的原因是模型主要依賴(lài)直覺(jué)反應(yīng)。如果模型能像真人一樣與用戶(hù)交互并多次反饋,就能更好地調(diào)整到用戶(hù)滿(mǎn)意的程度。比如在數(shù)學(xué)競(jìng)賽中,模型的表現(xiàn)還遠(yuǎn)未達(dá)到極限,

如果能進(jìn)行多次交互,我相信它們能做得更好。如此一來(lái),這些模型就可以廣泛應(yīng)用于教育和醫(yī)療行業(yè),如教育中輔助學(xué)生解決問(wèn)題,醫(yī)療中考慮更多因素進(jìn)行診斷。

胡。篈I是否有能力解決人類(lèi)無(wú)法解決的數(shù)學(xué)問(wèn)題?是否有可能讓AI獲得未來(lái)的大獎(jiǎng)?

袁洋:許多人正在嘗試這方面的工作,但目前我們還未達(dá)到那個(gè)水平。例如,早期GPT-3在數(shù)學(xué)方面的表現(xiàn)只能獲得5分,但現(xiàn)在已經(jīng)可以達(dá)到70到80分,未來(lái)可能達(dá)到90到100分,即國(guó)際金牌的水平。我預(yù)計(jì)未來(lái)數(shù)學(xué)家至少需要與AI合作。我個(gè)人在學(xué)習(xí)新數(shù)學(xué)領(lǐng)域時(shí),經(jīng)常依賴(lài)GPT來(lái)了解核心概念和關(guān)系,這使我的學(xué)習(xí)速度比自己閱讀快得多。

郭林:我們所在的行業(yè)與硬件緊密相關(guān),很難在短期內(nèi)產(chǎn)生顛覆性應(yīng)用。一個(gè)重要的因素是數(shù)據(jù)質(zhì)量和數(shù)據(jù)量。許多人關(guān)注模型本身,但實(shí)際上模型對(duì)大多數(shù)人而言是公共資源。真正重要的是我們向模型提供什么樣的輸入。在硬件交互和真實(shí)物理反饋方面,技術(shù)還有很長(zhǎng)的路要走。從應(yīng)用的角度來(lái)看,要考慮我們希望AI實(shí)現(xiàn)的是確定性結(jié)果還是開(kāi)放性結(jié)果,開(kāi)放性結(jié)果更容易產(chǎn)生產(chǎn)品。但從產(chǎn)品視角來(lái)看,技術(shù)進(jìn)步并不總是導(dǎo)致爆發(fā)式增長(zhǎng),更多的是新供給方式解決了困難的問(wèn)題。例如,作為一個(gè)創(chuàng)業(yè)者,我每天都忙于處理各種事務(wù),如寫(xiě)PPT、審閱合同等。如果有模型能高效處理這些任務(wù),那就可能成為爆款應(yīng)用。此外,我們還要考慮人類(lèi)學(xué)習(xí)的關(guān)鍵要素如何變化,如何將AI的變化趨勢(shì)與孩子的教育結(jié)合起來(lái),這可能會(huì)產(chǎn)生新的需求和供給形式。

胡。嚎ㄆ澘耍惆l(fā)現(xiàn)了什么殺手級(jí)的應(yīng)用嗎?哪個(gè)領(lǐng)域可能出現(xiàn)這樣的應(yīng)用?

張仁杰:殺手級(jí)應(yīng)用應(yīng)該是用戶(hù)使用后留存度高的,不僅僅是曇花一現(xiàn)。根據(jù)我朋友在Twitter上統(tǒng)計(jì)的全球AI應(yīng)用流量,ChatGPT是首屈一指的,其月PV達(dá)到14億。Character.AI也不錯(cuò),但流量下滑到2億。全球產(chǎn)品PV分析顯示,大多數(shù)前排的是對(duì)話(huà)式應(yīng)用,如Claude和ChatGPT。國(guó)內(nèi)情況則較為慘淡,HeyGen和PIKA1.0等曾短暫熱門(mén),但迅速墜落。目前國(guó)內(nèi)沒(méi)有真正的殺手級(jí)應(yīng)用,可能跟國(guó)內(nèi)的文化調(diào)性有關(guān)。國(guó)內(nèi)AI定義還是以提高效率為主,而C端用戶(hù)更多需要生活?yuàn)蕵?lè)類(lèi)應(yīng)用。最近圖片處理類(lèi)應(yīng)用流量暴增,如MasterGo、及時(shí)設(shè)計(jì),美圖秀秀也有所增長(zhǎng)。圖像處理可能是C端用戶(hù)需求的方向,未來(lái)可能出現(xiàn)第一個(gè)爆款應(yīng)用。

胡。汗偅J(rèn)為AI的發(fā)展是否可能導(dǎo)致產(chǎn)品、行業(yè)甚至您所在行業(yè)的顛覆?哪怕是小進(jìn)步也可能有大影響嗎?

郭林:非常有可能。關(guān)鍵是跨越“恐怖谷”,雖然還遙遠(yuǎn),但在有基礎(chǔ)的產(chǎn)業(yè)中是可行的。比如AI視頻制作的新興技術(shù),可能會(huì)大幅顛覆影視行業(yè)。自動(dòng)駕駛技術(shù)的發(fā)展,如特斯拉的案例,表明這不是遙不可及。干線(xiàn)物流的自動(dòng)駕駛一旦實(shí)現(xiàn),將影響大量貨車(chē)司機(jī)。按我們的看法,重復(fù)性、沒(méi)有異常處理邏輯的工作將被快速替代,而創(chuàng)造性、有認(rèn)知層面的工作則難以被AI取代。

胡俊:近期中國(guó)發(fā)布了一系列大模型,但似乎沒(méi)有實(shí)現(xiàn)爆發(fā)性增長(zhǎng)。中國(guó)如何利用大模型創(chuàng)造更大的商業(yè)價(jià)值?

陳希:需要耐心。AI的發(fā)展速度已經(jīng)非?,但像蘋(píng)果的APPStore也花了幾年時(shí)間才產(chǎn)生商業(yè)價(jià)值。AI行業(yè)正在尋找應(yīng)用,不僅是技術(shù)上的挑戰(zhàn),也需要人們對(duì)新技術(shù)的認(rèn)可和信任。長(zhǎng)期來(lái)看,我們預(yù)期會(huì)有更多創(chuàng)新和突破。

胡。簳r(shí)間會(huì)證明一切,只要有價(jià)值。

袁洋:大模型只是AI的一面。商業(yè)不僅僅是技術(shù),還有外包裝的重要性。比如汽車(chē),不僅賣(mài)發(fā)動(dòng)機(jī),還有品牌和設(shè)計(jì)。同樣,AI模型如果僅作為API,價(jià)值有限。但如果應(yīng)用到特定場(chǎng)景,如醫(yī)療服務(wù),價(jià)值就能極大提升。

郭林:從企業(yè)角度來(lái)看,我們更重視確定性,避免冒險(xiǎn)。大模型的本質(zhì)是解決復(fù)雜問(wèn)題的新方法。對(duì)企業(yè)而言,關(guān)鍵在于算力、算法和數(shù)據(jù)。我們專(zhuān)注于數(shù)據(jù)的收集和應(yīng)用,為未來(lái)技術(shù)成熟時(shí)做準(zhǔn)備。

胡俊:郭總,您的見(jiàn)解總是很深刻。物流領(lǐng)域的數(shù)據(jù)收集,如重載叉車(chē)、輪胎磨損等,預(yù)示著物流行業(yè)的光明未來(lái)。卡茲克,您對(duì)這些問(wèn)題有何看法?

張仁杰:我認(rèn)為關(guān)鍵在于資源和需求。無(wú)論是國(guó)內(nèi)外的Meta或微軟,還是國(guó)內(nèi)巨頭,算力和資源都是瓶頸,導(dǎo)致C端用戶(hù)體驗(yàn)差和價(jià)格高,所以AI領(lǐng)域要想實(shí)現(xiàn)未來(lái)大面積商業(yè)化或誕生爆款應(yīng)用,至少要解決資源部分的問(wèn)題。

我也非?春眠吘売(jì)算,邊緣計(jì)算的發(fā)展可能降低AI應(yīng)用的算力需求,我相信Google和小米所做的東西會(huì)讓未來(lái)的算力需求大幅度下降。未來(lái)在資源端,人們根本不需要大模型,需要的是基于大模型的、真正能讓用戶(hù)傻瓜式使用的應(yīng)用,而不僅僅是大模型本身。我們可能更需要把底層視頻大模型包裝成很強(qiáng)的應(yīng)用,包括一些文本大模型、聲音大模型,需要被包裝出來(lái)變成大家用得上的,加上用戶(hù)對(duì)算力需求的降低、成本的降低,綜合運(yùn)轉(zhuǎn)起來(lái)才有助于AI進(jìn)入真正的下一個(gè)時(shí)代。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港