展會信息港展會大全

離AGI更近一步! OpenAI首個視頻生成模型Sora“比想象中來得更快”
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-17 08:38:48   瀏覽:4131次  

導(dǎo)讀:每經(jīng)記者:熊嘉楠 可楊每經(jīng)編輯:楊夏 2022年末,OpenAI聊天機器人ChatGPT的面世無疑成為了引領(lǐng)人工智能浪潮的標(biāo)志性事件,宣告了新一輪科技革命的到來。無論是聊天娛樂、教育學(xué)習(xí),還是工作生產(chǎn)、醫(yī)療健康等領(lǐng)域,人工智能正以前所未有的速度滲透到我們生活...

每經(jīng)記者:熊嘉楠 可楊每經(jīng)編輯:楊夏

2022年末,OpenAI聊天機器人ChatGPT的面世無疑成為了引領(lǐng)人工智能浪潮的標(biāo)志性事件,宣告了新一輪科技革命的到來。無論是聊天娛樂、教育學(xué)習(xí),還是工作生產(chǎn)、醫(yī)療健康等領(lǐng)域,人工智能正以前所未有的速度滲透到我們生活的方方面面。

而就在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。據(jù)了解,通過文本指令,Sora可以直接輸出長達(dá)60秒的視頻,并且包含高度細(xì)致的背景、復(fù)雜的多角度鏡頭,以及富有情感的多個角色。

這意味著,繼文本、圖像之后,OpenAI將其先進的AI技術(shù)拓展到了視頻領(lǐng)域。OpenAI亦表示,Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ),這一能力將是實現(xiàn)AGI(通用人工智能)的重要里程碑。

對于OpenAI視頻生成模型的出現(xiàn),業(yè)內(nèi)其實早有預(yù)期,但仍有人評價稱“比想象中來得更快”,亦有人振奮地表示“我們真的看到新工業(yè)革命來臨”。

2月16日,業(yè)內(nèi)分析人士對《每日經(jīng)濟新聞》記者表示,Sora無疑是人工智能領(lǐng)域的一次重大突破,該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的先進能力,而且對內(nèi)容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機遇。

Sora根據(jù)提示詞生成的視頻畫面截圖。 圖片來源:OpenAI官網(wǎng)

內(nèi)容創(chuàng)作領(lǐng)域開啟新紀(jì)元,確保內(nèi)容真實透明成重要問題

2021年初和2022年末,OpenAI分別推出了圖像生成系統(tǒng)DALLE和聊天機器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具,也正逐漸改變?nèi)藗儗ξ磥砉ぷ鞯目捶ā?/p>

據(jù)介紹,Sora是基于過去對DALLE和GPT的研究基礎(chǔ)構(gòu)建,利用DALLE 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好的遵循文本指令。

Sora能夠生成具有多個角色、特定類型的運動以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景。不僅了解用戶在提示中要求的內(nèi)容,還了解這些東西在物理世界中的存在方式。同時,該模型對語言有深刻的理解,使其能夠準(zhǔn)確地解釋提示并生成表達(dá)生動情感的引人注目的角色。

運用Sora也可以生成高清圖像。 圖片來源:OpenAI官網(wǎng)

對于Sora的面世,工信部信息通信經(jīng)濟專家委員會委員、數(shù)字經(jīng)濟專家劉興亮稱,這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個新紀(jì)元。“通過簡短的文本提示或一張靜態(tài)圖片,Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻,涵蓋多個角色、不同類型的動作和背景細(xì)節(jié)等,幾乎達(dá)到了電影級別的逼真場景。這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實,而且為觀眾帶來了更豐富和多樣化的視覺體驗。技術(shù)創(chuàng)新的這一巨大飛躍,預(yù)示著AI在未來人類生活的各個方面都將發(fā)揮更加重要的作用。”劉興亮表示。

而Sora以文字為核心的提示,將能夠形成更加符合人類觀念的連續(xù)視頻,該模型的出現(xiàn)無疑將會對人們現(xiàn)有工作方式進行再一次迭代,同時也會對傳統(tǒng)行業(yè)轉(zhuǎn)型提出新的挑戰(zhàn)。

生成式AI過去已積累了不少圖像、聲音等素材,并通過不斷學(xué)習(xí)形成了更為成熟的算法。因此,若是可以通過AI在計算機中創(chuàng)建視頻素材,或許將對影視行業(yè)產(chǎn)生重大影響。

劉興亮稱,AI生成的視頻可能減少了對人類演員、導(dǎo)演和其他創(chuàng)意角色的需求,從而影響到這個行業(yè)的就業(yè)。此外,隨著AI技術(shù)的進步,傳統(tǒng)的影視制作流程和商業(yè)模式也可能面臨重塑。

不過,劉興亮指出,這種轉(zhuǎn)型并不意味著傳統(tǒng)影視行業(yè)的消亡,而是需要與AI技術(shù)融合,探索新的藝術(shù)形式和表達(dá)方式。

實際上,自生成式AI出現(xiàn)以來,該技術(shù)一直在大肆“入侵”影視制作的全流程,由人工智能產(chǎn)出的內(nèi)容也越來越普遍。

去年由哈里森福特主演的《奪寶奇兵》第五部中,就利用AI技術(shù)讓觀眾看到40年前青年時的福特;Netflix網(wǎng)飛也在同年推出了由AIGC參與制作的動畫短片《犬與少年》。

劉興亮同時提到,隨著AI生成內(nèi)容與現(xiàn)實之間的界限變得越來越模糊,如何確保內(nèi)容的真實性和透明性成為了一個重要問題。此外,版權(quán)、隱私和數(shù)據(jù)安全等問題也需要得到妥善解決。社會必須面對這些挑戰(zhàn),通過制定相關(guān)政策、法律和倫理準(zhǔn)則來確保技術(shù)的健康發(fā)展,同時保護個人和社會的利益不受侵害。

拉大產(chǎn)業(yè)競爭差距,AI生成視頻技術(shù)或?qū)⑦M入爆發(fā)期

正如劉興亮所說,AI視頻技術(shù)的誕生面臨著一系列的問題。而除了對現(xiàn)實世界的影響,作為剛剛面世的全新技術(shù),Sora也存在不足之處。

對于Sora當(dāng)前存在的弱點,OpenAI指出它可能難以準(zhǔn)確模擬復(fù)雜場景的物理原理,并且可能無法理解因果關(guān)系。該模型還可能混淆提示的空間細(xì)節(jié),例如混淆左右,并且可能難以精確描述隨著時間推移發(fā)生的事件,例如遵循特定的相機軌跡。

圖片來源:OpenAI官網(wǎng)

Sora生成的視頻中可能會出現(xiàn)不符合物理原理的場景,比如這個人正在反向跑步。

以此次發(fā)布的DEMO“與中國龍一起慶祝農(nóng)歷新年的視頻”為例,Sora無法準(zhǔn)確生成視頻畫面中的中文受到了網(wǎng)友的關(guān)注。有相關(guān)人士對此調(diào)侃道:“莫非是中文太難了?”

但是任何事件的發(fā)生都是從無到有,再從有到精的過程。據(jù)悉,Sora如今正面向部分用戶開放,以評估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險。同時,OpenAI也邀請了一批視覺藝術(shù)家、設(shè)計師和電影制作人加入,期望獲得寶貴反饋,以推動模型進步,更好地助力創(chuàng)意工作者。OpenAI提前分享研究進展,旨在與OpenAI以外的人士合作并獲取反饋,讓公眾了解即將到來的AI技術(shù)新篇章。

OpenAI表示,他們正在教AI理解和模擬運動中的物理世界,目標(biāo)是訓(xùn)練模型來幫助人們解決需要現(xiàn)實世界交互的問題。

而相比于其自身缺陷,該技術(shù)的廣泛前景更為外界所關(guān)注。

近兩年,由于人工智能發(fā)展迅速,以至于很多企業(yè)紛紛加大了對人工智能的投入?萍紕(chuàng)業(yè)公司研究機構(gòu)PitchBook估計,2023年全球生成式AI的市場規(guī)模將達(dá)426億美元,2026年則將達(dá)到981億美元,未來增長動能可期。

隨著生成式人工智能的市場潛力不斷地被挖掘,大大小小的競爭對手開始浮出水面。

當(dāng)前,參與該賽道的企業(yè)不乏亞馬遜、微軟、谷歌、百度、阿里等眾多互聯(lián)網(wǎng)巨頭,也包括Runway等初創(chuàng)企業(yè)。

有行業(yè)人士指出,隨著Sora的發(fā)布,OpenAI在行業(yè)的領(lǐng)先程度立即加大,會將大家緊追的距離再度拉開一大截。未來,解決了人物一致性問題之后,AI生成視頻將大踏步前進,AI視頻或進入大爆發(fā)期。

每日經(jīng)濟新聞

贊助本站

人工智能實驗室

相關(guān)熱詞: AGI 一步 OpenAI 首個 視頻 生成 模型 Sora

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港