展會信息港展會大全
導(dǎo)讀:《投資者網(wǎng)》葉芯 近日,OpenAI的文生視頻模型Sora刷屏了。 2月16日,OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹,該模型可以生成長達(dá)一分鐘的視頻,同時(shí)保持視覺品質(zhì)并遵循用戶提示。 作為OpenAI首推的文本轉(zhuǎn)視頻模型,Sora的問世,宣告了新一輪科技革命...

《投資者網(wǎng)》葉芯

近日,OpenAI的文生視頻模型Sora刷屏了。

2月16日,OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹,該模型可以生成長達(dá)一分鐘的視頻,同時(shí)保持視覺品質(zhì)并遵循用戶提示。

作為OpenAI首推的文本轉(zhuǎn)視頻模型,Sora的問世,宣告了新一輪科技革命的到來。Sora驚艷炸裂的效果,沖擊著當(dāng)前的AI行業(yè)。Sora橫空出世后,又將帶來怎樣的變革?資本市場哪些上市公司將受益?

Sora面世

Sora作為OpenAI首推的文本轉(zhuǎn)視頻模型,能夠嚴(yán)格根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像,生成長達(dá)1分鐘的視頻,保持較高的視覺質(zhì)量,其中包含精細(xì)復(fù)雜的場景、生動的角色表情以及復(fù)雜的鏡頭運(yùn)動。同時(shí)也接受現(xiàn)有視頻擴(kuò)展或填補(bǔ)缺失的鄭

OpenAI表示,Sora能夠生成復(fù)雜的場景,不僅包括多個(gè)角色,還有特定的動作類型,以及對對象和背景的準(zhǔn)確細(xì)節(jié)描繪。除此之外,Sora還可以將靜態(tài)圖像制作成動畫。文本指令和靜態(tài)圖像均能生成準(zhǔn)確反映用戶提示的視頻。

國泰君安研報(bào)指出,Sora具有三大突出亮點(diǎn),一是60秒長視頻,Sora可以保持視頻主體與背景的高度流暢性與穩(wěn)定性。二是單視頻多角度鏡頭,Sora在一個(gè)視頻內(nèi)實(shí)現(xiàn)多角度鏡頭,分鏡切換符合邏輯且十分流暢。三是理解真實(shí)世界的能力,Sora對于光影反射、運(yùn)動方式、鏡頭移動等細(xì)節(jié)處理得十分優(yōu)秀,極大地提升了真實(shí)感。

與目前AI視頻賽道同行相比,Sora每條提示60秒的視頻長度,遠(yuǎn)高于Pika Labs的3秒、Meta Emu Video的4秒和Runway公司Gen-2的18秒的視頻時(shí)長。

此外,從官方發(fā)布的演示來看,無論從視頻流暢度還是細(xì)節(jié)表現(xiàn)能力上,Sora的效果都相當(dāng)驚艷。

不過,目前Sora仍在開發(fā)中,OpenAI承認(rèn)該模型可能會混淆提示的空間細(xì)節(jié),例如混淆左右,并且難以精確描述隨著時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。同時(shí),OpenAI還稱,可擴(kuò)展的視頻生成模型,是構(gòu)建物理世界通用模擬器的一條可能的路徑。

Sora的面世,意味著AI視頻生成能力實(shí)現(xiàn)了跨越式發(fā)展。該模型可以深度模擬真實(shí)物理世界,標(biāo)志著人工智能在理解真實(shí)世界場景并與之互動的能力方面實(shí)現(xiàn)了重大飛躍。

應(yīng)用前景廣闊

近年來,OpenAI領(lǐng)跑AI賽道。2021年初和2022年末,OpenAI分別推出了圖像生成系統(tǒng)DALLE和聊天機(jī)器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具,也正逐漸改變?nèi)藗儗ξ磥砉ぷ鞯目捶ā?/p>

如今,Sora模型能夠生成一分鐘的高保真視頻。視頻格式既可以是橫屏1920*1080視頻,豎屏1080*1920視頻,以及之間的所有內(nèi)容。這使得Sora可以兼容不同的視頻播放設(shè)備,根據(jù)特定的縱橫比來生成視頻內(nèi)容,這也會大大影響視頻創(chuàng)作領(lǐng)域,包括電影制作、電視內(nèi)容、自媒體等。

國盛證券認(rèn)為,文生視頻大模型Sora橫空出世,其能夠理解并呈現(xiàn)物理定律,影視動畫行業(yè)的顛覆性時(shí)刻到來。

據(jù)介紹,Sora是基于過去對DALLE和GPT的研究基礎(chǔ)構(gòu)建,利用DALLE 3的重述提示詞技術(shù),為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注,因此模型能更好的遵循文本指令。

對此,360集團(tuán)創(chuàng)始人周鴻表示,Sora的技術(shù)思路完全不一樣。之前我們做視頻做圖用的都是Diffusion,是多個(gè)真實(shí)圖片的組合,這次OpenAI利用它的大語言模型優(yōu)勢,把LLM和Diffusion結(jié)合起來訓(xùn)練,讓Sora實(shí)現(xiàn)了對現(xiàn)實(shí)世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實(shí)的,才能跳出2D的范圍模擬真實(shí)的物理世界。

“這都是大模型的功勞。OpenAI訓(xùn)練這個(gè)模型應(yīng)該會閱讀大量視頻。一幅圖勝過千言萬語,而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過一幅圖,這就離AGI(通用人工智能)不遠(yuǎn)了,不是10年20年的問題,可能一兩年很快就可以實(shí)現(xiàn)。”周鴻稱。

周鴻表示,這也代表未來的方向。有強(qiáng)勁的大模型做底子,基于對人類語言的理解,對人類知識和世界模型的了解,再疊加很多其他的技術(shù),就可以創(chuàng)造各個(gè)領(lǐng)域的超級工具,比如生物醫(yī)學(xué)、蛋白質(zhì)和基因研究,包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上,大模型都會發(fā)揮作用。這次Sora對物理世界的模擬,至少將會對機(jī)器人具身智能和自動駕駛帶來巨大的影響。

國盛證券也持有相同的觀點(diǎn)。其認(rèn)為文生視頻大模型Sora橫空出世,其能夠理解并呈現(xiàn)物理定律,影視動畫行業(yè)的顛覆性時(shí)刻到來。

對于Sora的面世,工信部信息通信經(jīng)濟(jì)專家委員會委員、數(shù)字經(jīng)濟(jì)專家劉興亮稱,這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元。

“Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻,涵蓋多個(gè)角色、不同類型的動作和背景細(xì)節(jié)等,幾乎達(dá)到了電影級別的逼真場景。這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具,使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實(shí),而且為觀眾帶來了更豐富和多樣化的視覺體驗(yàn)。技術(shù)創(chuàng)新的這一巨大飛躍,預(yù)示著AI在未來人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。”劉興亮表示。

AI基礎(chǔ)設(shè)施需求旺盛

市場觀點(diǎn)認(rèn)為,2022年是影像之年,2023是聲波之年,而2024是視頻之年。

OpenAI表示,Sora是構(gòu)建世界模型的基礎(chǔ),未來將向?qū)崿F(xiàn)AGI繼續(xù)邁進(jìn)。

對于Sora的發(fā)展,算力需求旺盛。國泰君安指出,Sora模型推動AI多模態(tài)領(lǐng)域飛躍式發(fā)展,AI創(chuàng)作等相關(guān)領(lǐng)域?qū)⒂瓉砩疃茸兏,AI賦能范圍進(jìn)一步擴(kuò)大,多模態(tài)相關(guān)的訓(xùn)練及推理應(yīng)用也將進(jìn)一步提升對算力基礎(chǔ)設(shè)施的相關(guān)需求。

無獨(dú)有偶,國盛證券也持有相同的觀點(diǎn),其認(rèn)為,Sora依舊符合AI縮尺律(Scaling Law)OpenAI在技術(shù)文檔中說明,隨著訓(xùn)練計(jì)算量的增加,樣本質(zhì)量明顯提高,進(jìn)一步佐證了多模態(tài)時(shí)代,算力需求將成為最核心的瓶頸之一。

多模態(tài)大模型拉動全球算力需求快速增長,國產(chǎn)AI算力迎來機(jī)會。根據(jù)南方財(cái)富網(wǎng)趨勢選股系統(tǒng)數(shù)據(jù)統(tǒng)計(jì),A股國產(chǎn)AI算力相關(guān)上市企業(yè)目前數(shù)量有52家,如國產(chǎn)AI算力產(chǎn)業(yè)鏈包含AI服務(wù)器零部件、服務(wù)器整機(jī)、算力租賃、數(shù)據(jù)中心等環(huán)節(jié)。AI服務(wù)器零部件公司主要包括海光信息、寒武紀(jì)、龍芯中科、景嘉微等;服務(wù)器整機(jī)公司主要包括高新發(fā)展、神州數(shù)碼、拓維信息、廣電運(yùn)通、烽火通信、同方股份等;算力租賃公司主要包括恒潤股份、云賽智聯(lián)、鴻博股份等;數(shù)據(jù)中心公司主要包括奧飛數(shù)據(jù)、光環(huán)新網(wǎng)、寶信軟件、數(shù)據(jù)港等。

此外,多家巨頭謀劃布局AI基礎(chǔ)設(shè)施。舉例來看,主營視頻創(chuàng)意、繪圖創(chuàng)意類軟件產(chǎn)品的萬興科技近日在互動平臺表示,公司旗下視頻創(chuàng)意產(chǎn)品萬興喵影/Filmora可用于各類視頻的創(chuàng)作和剪輯,“天幕”大模型是以視頻創(chuàng)意類AI技術(shù)為核心的多媒體大模型,涵蓋音頻、圖像、視頻等多模態(tài)能力。

昆侖萬維旗下Star Group和Opera都具備做短視頻的土壤,其中Opera在海外已經(jīng)推出了短視頻功能。此外,昆侖萬維天工大模型在騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)開展的多模態(tài)大語言模型測評中,綜合得分排名第一。

專業(yè)智能視頻解決方案與視頻云服務(wù)提供商當(dāng)虹科技擁有自研的AIGC工具集,于去年上半年發(fā)布以靜態(tài)照片生成三維體積視頻的方案。

當(dāng)虹科技1月5日互動平臺表示,公司擁有自研的AIGC工具集,發(fā)布了以靜態(tài)照片生成三維體積視頻的方案,并且通過點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺無損壓縮,實(shí)現(xiàn)不同模態(tài)之間相互切換。

因賽集團(tuán)旗下InsightGPT目前可生成20秒以上的視頻,能夠結(jié)合圖像、視頻大模型,融合摳圖等多種算法,再結(jié)合音頻模型,整體渲染后最終合成完整視頻。

據(jù)不完全統(tǒng)計(jì),包括萬興科技、博匯科技、易點(diǎn)天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國信、神思電子、因賽集團(tuán)、拓爾思、國脈文化、佳都科技在內(nèi)的超10家A股上市公司近三個(gè)月以來在互動平臺披露視頻生成模型領(lǐng)域的業(yè)務(wù)情況。(思維財(cái)經(jīng)出品)■

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: Sora 刷屏 哪些 上市公司 受益

相關(guān)內(nèi)容
AiLab云推薦
最新資訊
本月熱點(diǎn)
熱門排行
馬斯克的xAI連發(fā)兩款新模型,有進(jìn)步但還談不上領(lǐng)先

閱讀量:68266

Meta Llama 3.1-405B AI模型多項(xiàng)跑分超越 OpenAI GPT-4o

閱讀量:25588

《2024年AI Agent行業(yè)報(bào)告》|甲子光年智庫

閱讀量:18058

從現(xiàn)在起,GitHub上超1億開發(fā)者可直接訪問全球頂級大模型,構(gòu)建AI應(yīng)用

閱讀量:17455

IMF:對人工智能造成大規(guī)模失業(yè)、不平等加劇的可能性深感擔(dān)憂

閱讀量:14672

AI創(chuàng)投的那些荒誕故事

閱讀量:14659

推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港