當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > 5天就能做出刷屏的《流浪地球3》預(yù)告片，AI還會(huì)顛覆哪些場(chǎng)景？

5天就能做出刷屏的《流浪地球3》預(yù)告片，AI還會(huì)顛覆哪些場(chǎng)景？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2023-12-20 09:49:08 瀏覽：4422次

導(dǎo)讀：這一年來(lái)，被稱(chēng)為生成式人工智能的革命性技術(shù)，激發(fā)了全球科技界把所有軟件和硬件重做一遍的沖動(dòng)，很多爆紅應(yīng)用進(jìn)入大眾視線(xiàn)，典型的代表是AI繪畫(huà)板塊的StableDiffusion和MidJourney大大壓縮了繪畫(huà)的時(shí)間成本，也有用戶(hù)使用視頻生成軟件RunWay在5天時(shí)間內(nèi)做...

這一年來(lái)，被稱(chēng)為“生成式人工智能”的革命性技術(shù)，激發(fā)了全球科技界“把所有軟件和硬件重做一遍”的沖動(dòng)，很多爆紅應(yīng)用進(jìn)入大眾視線(xiàn)，典型的代表是AI繪畫(huà)板塊的StableDiffusion和MidJourney大大壓縮了繪畫(huà)的時(shí)間成本，也有用戶(hù)使用視頻生成軟件RunWay在5天時(shí)間內(nèi)做出一支《流浪地球3》預(yù)告片。

AI在哪些行業(yè)獲得了實(shí)際應(yīng)用？AI領(lǐng)域的“殺手級(jí)應(yīng)用”更有可能出現(xiàn)在ToB還是ToC板塊？生成式AI發(fā)展還需要突破哪些難點(diǎn)？在主題為“智能涌現(xiàn)數(shù)開(kāi)萬(wàn)物”的科技新聞HiTechDay暨2023數(shù)字開(kāi)物大會(huì)上，科技新聞創(chuàng)作者胡竣昆仲資本投資副總裁陳希、清華大學(xué)交叉信息學(xué)院助理教授袁洋、木牛機(jī)器人CEO郭林、科技新聞創(chuàng)作者/互聯(lián)網(wǎng)基金公司AI業(yè)務(wù)負(fù)責(zé)人張仁杰，從投資、學(xué)術(shù)、創(chuàng)意等角度解讀最先被AI改變的應(yīng)用場(chǎng)景。

陳希認(rèn)為雖然投資人很關(guān)心AI應(yīng)用和落地，但目前很多AI項(xiàng)目的估值存在高溢價(jià)，下半年投資人變得更加冷靜，同時(shí)對(duì)于爆款應(yīng)用的態(tài)度也保持謹(jǐn)慎，陳希表示從投資角度看，KillerAPP需要解決真正重要的需求，具有可擴(kuò)展性，并產(chǎn)生商業(yè)價(jià)值。即使C端產(chǎn)品可以帶來(lái)爆發(fā)式增長(zhǎng)，但從長(zhǎng)遠(yuǎn)來(lái)看，這些產(chǎn)品最終需要找到B端的應(yīng)用場(chǎng)景。

在袁洋看來(lái)，大多數(shù)大模型目前都停留在System1階段，即直覺(jué)性的思考階段。如果能在System2階段，即深思熟慮后再給出答案，那么這些模型的能力會(huì)大大增強(qiáng)。在醫(yī)療、教育和法律等領(lǐng)域的價(jià)值也會(huì)進(jìn)一步凸顯。

郭林看到AI和機(jī)器人的結(jié)合為行業(yè)帶來(lái)的顛覆性的機(jī)會(huì)，把時(shí)間拉長(zhǎng)來(lái)看，算法和算力資源對(duì)于所有AI機(jī)器人公司都是平等和透明的，大量積累可以被訓(xùn)練的高質(zhì)量數(shù)據(jù)是當(dāng)前初創(chuàng)企業(yè)唯一值得立即開(kāi)始且持續(xù)投入的關(guān)鍵點(diǎn)。

張仁杰認(rèn)為，AI不僅僅能提高效率，它已經(jīng)顛覆了創(chuàng)作方式，以前不可能的事，現(xiàn)在能做到，以前能做的事，現(xiàn)在效率提高了10倍。

以下為對(duì)話(huà)實(shí)錄精華版：

胡�。簾o(wú)論AI到底是什么，都一定要先應(yīng)用起來(lái)，今天我們有幸邀請(qǐng)到幾位重量級(jí)嘉賓，既有投資人的代表，也有創(chuàng)意企業(yè)和學(xué)術(shù)的代表。

陳希：我是昆仲資本的陳希，人工智能是下一代產(chǎn)業(yè)賦能和革新的技術(shù)，所以從2016年上一波AI起來(lái)的時(shí)候，我們就一直專(zhuān)注地圍繞AI+各個(gè)重點(diǎn)領(lǐng)域去做投資布局。隨著AI底層技術(shù)的不斷發(fā)展，從深度學(xué)習(xí)向CNN、RNN到后來(lái)的Transformer，我們也在尋找大模型以及AIGC帶來(lái)的新的創(chuàng)業(yè)機(jī)會(huì)。

袁洋：我是清華的袁洋，自己做的科研主要是大模型技術(shù)理論，跟著學(xué)院院長(zhǎng)一起開(kāi)展人工智能、大模型的常識(shí)推理和數(shù)學(xué)題的研究，我的主要方向是做大模型的醫(yī)療，即智慧中醫(yī)，打算辦一個(gè)智慧診所。

郭林：我是木牛機(jī)器人的郭林，主要從事AI技術(shù)在工業(yè)方向和傳統(tǒng)機(jī)器人的結(jié)合，從而創(chuàng)造一些創(chuàng)新性的產(chǎn)品。通過(guò)機(jī)器人底層系統(tǒng)賦能很多產(chǎn)業(yè)應(yīng)用，主力服務(wù)智能物流和物流搬運(yùn)，主要是在生產(chǎn)制造的重載搬運(yùn)場(chǎng)景。

張仁杰：以前我是做用戶(hù)體驗(yàn)設(shè)計(jì)出身，現(xiàn)在是在一家互聯(lián)網(wǎng)基金平臺(tái)公司擔(dān)任設(shè)計(jì)總監(jiān)，今年2月開(kāi)始選擇去做AI自媒體。我自己對(duì)AI很感興趣，業(yè)余也一直在玩GPT、AI繪圖、AI視頻、AI聲音類(lèi)應(yīng)用。大家認(rèn)識(shí)我是在8月，那個(gè)時(shí)候我做了一個(gè)AI預(yù)告片叫做《流浪地球III》，稍微火了一點(diǎn)。

胡�。和顿Y人現(xiàn)在怎么看待AI？你們投資這些項(xiàng)目的思考決策邏輯是怎樣的？

陳希：最近，大家都注意到AI尤其是大型模型在上半年和下半年表現(xiàn)出明顯的變化。上半年非�；馃�，我們看到了大量的融資，但下半年投資人變得更加冷靜和謹(jǐn)慎。Gartner最近發(fā)布的報(bào)告顯示，GenerativeAI現(xiàn)在處于期望過(guò)高階段。市場(chǎng)上很多項(xiàng)目的估值存在高溢價(jià)。

從行業(yè)構(gòu)造來(lái)看，AI分為三層：基礎(chǔ)大模型層、中間層和應(yīng)用層。其中，基礎(chǔ)大模型層是競(jìng)爭(zhēng)最激烈的。上半年的投資主要集中在這一層。中間層類(lèi)似于云計(jì)算時(shí)代的PaaS，也是一個(gè)比較熱門(mén)的領(lǐng)域。而最上層的應(yīng)用層則是最有發(fā)展機(jī)會(huì)的，能夠結(jié)合數(shù)據(jù)集以及對(duì)各個(gè)垂直行業(yè)的Knowhow，在大模型基礎(chǔ)上做FineTurning，創(chuàng)造實(shí)際的商業(yè)價(jià)值。雖然當(dāng)前估值普遍較高，投資人仍期待新的商業(yè)機(jī)會(huì)和前景。

胡�。和顿Y人特別關(guān)心的是AI的實(shí)際應(yīng)用和落地。袁老師，作為教育界的專(zhuān)家，您如何看待AI的快速發(fā)展和學(xué)生對(duì)此的態(tài)度？

袁洋：學(xué)生們對(duì)大模型的態(tài)度各不相同。有的很想深入了解并嘗試，有的則更傾向于做科研。我認(rèn)為，不管是哪個(gè)領(lǐng)域，都應(yīng)該擁抱大模型。不過(guò)，我注意到大多數(shù)大模型目前都停留在System1階段，即直覺(jué)性的思考。如果能在System2階段，即深思熟慮后再給出答案，那么這些模型的能力會(huì)大大增強(qiáng)。在醫(yī)療、教育和法律等領(lǐng)域，這樣的模型將非常有價(jià)值。

我們自己還提出了CommunicativeReasoning，對(duì)解決醫(yī)療、教育和法律上的復(fù)雜性問(wèn)題具備很高的價(jià)值，可以讓AI經(jīng)過(guò)深思熟慮發(fā)揮更大作用。

在我看來(lái)，大模型需要把思維流程變成像工業(yè)流水線(xiàn)一樣的一個(gè)一個(gè)小步驟，然后將這些步驟有機(jī)結(jié)合起來(lái)，在這個(gè)過(guò)程中可以選擇不同的岔路、找到一個(gè)最好的方案。

胡�。汗偅J(rèn)為這次AI的變革在整體發(fā)展上會(huì)有什么不同？

郭林：AI和機(jī)器人的結(jié)合為行業(yè)帶來(lái)了顛覆性的機(jī)會(huì)。但實(shí)際應(yīng)用中，企業(yè)最頭疼的是無(wú)盡的CornerCase，這是所有創(chuàng)業(yè)公司都面對(duì)的最大、最頭疼的問(wèn)題。行業(yè)里有一個(gè)笑話(huà)買(mǎi)機(jī)器人送工程師，基本上指的就是這樣的狀態(tài)。

很多數(shù)據(jù)的結(jié)合，將有機(jī)會(huì)解決各種各樣的CornerCase成本結(jié)構(gòu)，真正走到場(chǎng)景落地的時(shí)候，我們不寄希望于AI解決所有問(wèn)題，但我們希望AI能解決關(guān)鍵節(jié)點(diǎn)的問(wèn)題，我們承擔(dān)得起相應(yīng)的成本提升。這些關(guān)鍵問(wèn)題外的其它問(wèn)題，可以通過(guò)工程化和數(shù)學(xué)手段解決。這種思路將為企業(yè)帶來(lái)新的落地策略。

胡俊：卡茲克，你嘗試過(guò)多少種AI應(yīng)用？有沒(méi)有讓你特別驚艷的？

張仁杰：很難具體統(tǒng)計(jì)，但我基本上用過(guò)市面上所有火熱的AI相關(guān)應(yīng)用。去年10月到現(xiàn)在，我的閾值變高了。ChatGPT不用多說(shuō)，國(guó)內(nèi)外的類(lèi)似產(chǎn)品我都試過(guò)。但難以重現(xiàn)ChatGPT初次給我的震撼。最近有個(gè)KimiChat讓我重新驚艷，它處理20萬(wàn)字文檔不衰減，GPT-4和Claude雖然支持幾十萬(wàn)Token，但用戶(hù)扔進(jìn)去的文檔的后半部分常常“消失”，而KimiChat卻能精確處理文檔后半部分的內(nèi)容。

在AI繪圖板塊，如StableDiffusion和MidJourney，也讓我非常驚艷。

其它AI產(chǎn)品是偏功能性的，包括AI擴(kuò)圖或?qū)崟r(shí)會(huì)畫(huà)。此外，今年5月我還嘗試了AI聲音技術(shù)，像11Labs用5分鐘不到的時(shí)間就能將短音頻擴(kuò)展成29國(guó)語(yǔ)言。還有AI視頻，像Runway和《流浪地球III》的預(yù)告片，都讓我印象深刻。

胡俊：AI應(yīng)用是否提高了你們的創(chuàng)作效率？

張仁杰：不僅僅是提高效率，它已經(jīng)顛覆了創(chuàng)作方式。以前不可能的事，現(xiàn)在能做到，以前能做的事，現(xiàn)在效率提高了10倍。比如我制作的《三體》AI預(yù)告片，包含了各種AI生成的視頻和李雪健老師的聲音模型，以前需要半年以上的時(shí)間，現(xiàn)在我只用了五個(gè)晚上。

胡�。簞�(chuàng)作視頻時(shí)的挑戰(zhàn)很大。你們發(fā)現(xiàn)了什么殺手級(jí)的應(yīng)用嗎？在ToB和ToC領(lǐng)域，哪個(gè)更可能出現(xiàn)殺手級(jí)應(yīng)用？

陳希：對(duì)于AIGC產(chǎn)品，ToB和ToC之間的界限并不清晰。像ChatGPT和StableDiffusion這樣的產(chǎn)品既吸引C端用戶(hù)，也在B端產(chǎn)生價(jià)值。但從投資角度看，KillerAPP需要解決真正重要的需求，具有可擴(kuò)展性，并產(chǎn)生商業(yè)價(jià)值。即使C端產(chǎn)品可以帶來(lái)爆發(fā)式增長(zhǎng)，但從長(zhǎng)遠(yuǎn)來(lái)看，這些產(chǎn)品最終需要找到B端的應(yīng)用場(chǎng)景。在中國(guó)，C端用戶(hù)不太愿意付費(fèi)，所以AIGC時(shí)代的KillerAPP應(yīng)該是能夠吸引C端用戶(hù)同時(shí)在B端場(chǎng)景中商業(yè)化的產(chǎn)品。

胡俊：不論是ToC還是其他形式，核心商業(yè)模式必須成立。袁老師，從基礎(chǔ)科研的角度來(lái)看，您認(rèn)為解決什么樣的問(wèn)題可能會(huì)產(chǎn)生殺手級(jí)應(yīng)用？

袁洋：我對(duì)殺手級(jí)應(yīng)用的了解不多，但在使用大模型的過(guò)程中，我發(fā)現(xiàn)它們?cè)赟ystem1和System2方面仍存在缺陷。不論是繪畫(huà)、寫(xiě)作還是編程，經(jīng)常會(huì)出現(xiàn)錯(cuò)誤。例如，我想在畫(huà)中修改兔子的尾巴，但這并不容易。這背后的原因是模型主要依賴(lài)直覺(jué)反應(yīng)。如果模型能像真人一樣與用戶(hù)交互并多次反饋，就能更好地調(diào)整到用戶(hù)滿(mǎn)意的程度。比如在數(shù)學(xué)競(jìng)賽中，模型的表現(xiàn)還遠(yuǎn)未達(dá)到極限，

如果能進(jìn)行多次交互，我相信它們能做得更好。如此一來(lái)，這些模型就可以廣泛應(yīng)用于教育和醫(yī)療行業(yè)，如教育中輔助學(xué)生解決問(wèn)題，醫(yī)療中考慮更多因素進(jìn)行診斷。

胡�。篈I是否有能力解決人類(lèi)無(wú)法解決的數(shù)學(xué)問(wèn)題？是否有可能讓AI獲得未來(lái)的大獎(jiǎng)？

袁洋：許多人正在嘗試這方面的工作，但目前我們還未達(dá)到那個(gè)水平。例如，早期GPT-3在數(shù)學(xué)方面的表現(xiàn)只能獲得5分，但現(xiàn)在已經(jīng)可以達(dá)到70到80分，未來(lái)可能達(dá)到90到100分，即國(guó)際金牌的水平。我預(yù)計(jì)未來(lái)數(shù)學(xué)家至少需要與AI合作。我個(gè)人在學(xué)習(xí)新數(shù)學(xué)領(lǐng)域時(shí)，經(jīng)常依賴(lài)GPT來(lái)了解核心概念和關(guān)系，這使我的學(xué)習(xí)速度比自己閱讀快得多。

郭林：我們所在的行業(yè)與硬件緊密相關(guān)，很難在短期內(nèi)產(chǎn)生顛覆性應(yīng)用。一個(gè)重要的因素是數(shù)據(jù)質(zhì)量和數(shù)據(jù)量。許多人關(guān)注模型本身，但實(shí)際上模型對(duì)大多數(shù)人而言是公共資源。真正重要的是我們向模型提供什么樣的輸入。在硬件交互和真實(shí)物理反饋方面，技術(shù)還有很長(zhǎng)的路要走。從應(yīng)用的角度來(lái)看，要考慮我們希望AI實(shí)現(xiàn)的是確定性結(jié)果還是開(kāi)放性結(jié)果，開(kāi)放性結(jié)果更容易產(chǎn)生產(chǎn)品。但從產(chǎn)品視角來(lái)看，技術(shù)進(jìn)步并不總是導(dǎo)致爆發(fā)式增長(zhǎng)，更多的是新供給方式解決了困難的問(wèn)題。例如，作為一個(gè)創(chuàng)業(yè)者，我每天都忙于處理各種事務(wù)，如寫(xiě)PPT、審閱合同等。如果有模型能高效處理這些任務(wù)，那就可能成為爆款應(yīng)用。此外，我們還要考慮人類(lèi)學(xué)習(xí)的關(guān)鍵要素如何變化，如何將AI的變化趨勢(shì)與孩子的教育結(jié)合起來(lái)，這可能會(huì)產(chǎn)生新的需求和供給形式。

胡�。嚎ㄆ澘耍惆l(fā)現(xiàn)了什么殺手級(jí)的應(yīng)用嗎？哪個(gè)領(lǐng)域可能出現(xiàn)這樣的應(yīng)用？

張仁杰：殺手級(jí)應(yīng)用應(yīng)該是用戶(hù)使用后留存度高的，不僅僅是曇花一現(xiàn)。根據(jù)我朋友在Twitter上統(tǒng)計(jì)的全球AI應(yīng)用流量，ChatGPT是首屈一指的，其月PV達(dá)到14億。Character.AI也不錯(cuò)，但流量下滑到2億。全球產(chǎn)品PV分析顯示，大多數(shù)前排的是對(duì)話(huà)式應(yīng)用，如Claude和ChatGPT。國(guó)內(nèi)情況則較為慘淡，HeyGen和PIKA1.0等曾短暫熱門(mén)，但迅速墜落。目前國(guó)內(nèi)沒(méi)有真正的殺手級(jí)應(yīng)用，可能跟國(guó)內(nèi)的文化調(diào)性有關(guān)。國(guó)內(nèi)AI定義還是以提高效率為主，而C端用戶(hù)更多需要生活?yuàn)蕵?lè)類(lèi)應(yīng)用。最近圖片處理類(lèi)應(yīng)用流量暴增，如MasterGo、及時(shí)設(shè)計(jì)，美圖秀秀也有所增長(zhǎng)。圖像處理可能是C端用戶(hù)需求的方向，未來(lái)可能出現(xiàn)第一個(gè)爆款應(yīng)用。

胡�。汗偅J(rèn)為AI的發(fā)展是否可能導(dǎo)致產(chǎn)品、行業(yè)甚至您所在行業(yè)的顛覆？哪怕是小進(jìn)步也可能有大影響嗎？

郭林：非常有可能。關(guān)鍵是跨越“恐怖谷”，雖然還遙遠(yuǎn)，但在有基礎(chǔ)的產(chǎn)業(yè)中是可行的。比如AI視頻制作的新興技術(shù)，可能會(huì)大幅顛覆影視行業(yè)。自動(dòng)駕駛技術(shù)的發(fā)展，如特斯拉的案例，表明這不是遙不可及。干線(xiàn)物流的自動(dòng)駕駛一旦實(shí)現(xiàn)，將影響大量貨車(chē)司機(jī)。按我們的看法，重復(fù)性、沒(méi)有異常處理邏輯的工作將被快速替代，而創(chuàng)造性、有認(rèn)知層面的工作則難以被AI取代。

胡俊：近期中國(guó)發(fā)布了一系列大模型，但似乎沒(méi)有實(shí)現(xiàn)爆發(fā)性增長(zhǎng)。中國(guó)如何利用大模型創(chuàng)造更大的商業(yè)價(jià)值？

陳希：需要耐心。AI的發(fā)展速度已經(jīng)非�？�，但像蘋(píng)果的APPStore也花了幾年時(shí)間才產(chǎn)生商業(yè)價(jià)值。AI行業(yè)正在尋找應(yīng)用，不僅是技術(shù)上的挑戰(zhàn)，也需要人們對(duì)新技術(shù)的認(rèn)可和信任。長(zhǎng)期來(lái)看，我們預(yù)期會(huì)有更多創(chuàng)新和突破。

胡�。簳r(shí)間會(huì)證明一切，只要有價(jià)值。

袁洋：大模型只是AI的一面。商業(yè)不僅僅是技術(shù)，還有外包裝的重要性。比如汽車(chē)，不僅賣(mài)發(fā)動(dòng)機(jī)，還有品牌和設(shè)計(jì)。同樣，AI模型如果僅作為API，價(jià)值有限。但如果應(yīng)用到特定場(chǎng)景，如醫(yī)療服務(wù)，價(jià)值就能極大提升。

郭林：從企業(yè)角度來(lái)看，我們更重視確定性，避免冒險(xiǎn)。大模型的本質(zhì)是解決復(fù)雜問(wèn)題的新方法。對(duì)企業(yè)而言，關(guān)鍵在于算力、算法和數(shù)據(jù)。我們專(zhuān)注于數(shù)據(jù)的收集和應(yīng)用，為未來(lái)技術(shù)成熟時(shí)做準(zhǔn)備。

胡俊：郭總，您的見(jiàn)解總是很深刻。物流領(lǐng)域的數(shù)據(jù)收集，如重載叉車(chē)、輪胎磨損等，預(yù)示著物流行業(yè)的光明未來(lái)。卡茲克，您對(duì)這些問(wèn)題有何看法？

張仁杰：我認(rèn)為關(guān)鍵在于資源和需求。無(wú)論是國(guó)內(nèi)外的Meta或微軟，還是國(guó)內(nèi)巨頭，算力和資源都是瓶頸，導(dǎo)致C端用戶(hù)體驗(yàn)差和價(jià)格高，所以AI領(lǐng)域要想實(shí)現(xiàn)未來(lái)大面積商業(yè)化或誕生爆款應(yīng)用，至少要解決資源部分的問(wèn)題。

我也非�？春眠吘売�(jì)算，邊緣計(jì)算的發(fā)展可能降低AI應(yīng)用的算力需求，我相信Google和小米所做的東西會(huì)讓未來(lái)的算力需求大幅度下降。未來(lái)在資源端，人們根本不需要大模型，需要的是基于大模型的、真正能讓用戶(hù)傻瓜式使用的應(yīng)用，而不僅僅是大模型本身。我們可能更需要把底層視頻大模型包裝成很強(qiáng)的應(yīng)用，包括一些文本大模型、聲音大模型，需要被包裝出來(lái)變成大家用得上的，加上用戶(hù)對(duì)算力需求的降低、成本的降低，綜合運(yùn)轉(zhuǎn)起來(lái)才有助于AI進(jìn)入真正的下一個(gè)時(shí)代。