當(dāng)前位置：人工智能實(shí)驗(yàn)室> 企業(yè)新聞 > Sora刷屏！哪些A股上市公司或?qū)⑹芤妫?/a>

Sora刷屏！哪些A股上市公司或?qū)⑹芤妫?div id="yaifhzr" class="p"> 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-02-18 14:19:14 瀏覽：6283次

導(dǎo)讀：《投資者網(wǎng)》葉芯近日，OpenAI的文生視頻模型Sora刷屏了。 2月16日，OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹，該模型可以生成長達(dá)一分鐘的視頻，同時(shí)保持視覺品質(zhì)并遵循用戶提示。作為OpenAI首推的文本轉(zhuǎn)視頻模型，Sora的問世，宣告了新一輪科技革命...

《投資者網(wǎng)》葉芯

近日，OpenAI的文生視頻模型Sora刷屏了。

2月16日，OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹，該模型可以生成長達(dá)一分鐘的視頻，同時(shí)保持視覺品質(zhì)并遵循用戶提示。

作為OpenAI首推的文本轉(zhuǎn)視頻模型，Sora的問世，宣告了新一輪科技革命的到來。Sora驚艷炸裂的效果，沖擊著當(dāng)前的AI行業(yè)。Sora橫空出世后，又將帶來怎樣的變革？資本市場哪些上市公司將受益？

Sora面世

Sora作為OpenAI首推的文本轉(zhuǎn)視頻模型，能夠嚴(yán)格根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像，生成長達(dá)1分鐘的視頻，保持較高的視覺質(zhì)量，其中包含精細(xì)復(fù)雜的場景、生動的角色表情以及復(fù)雜的鏡頭運(yùn)動。同時(shí)也接受現(xiàn)有視頻擴(kuò)展或填補(bǔ)缺失的鄭

OpenAI表示，Sora能夠生成復(fù)雜的場景，不僅包括多個(gè)角色，還有特定的動作類型，以及對對象和背景的準(zhǔn)確細(xì)節(jié)描繪。除此之外，Sora還可以將靜態(tài)圖像制作成動畫。文本指令和靜態(tài)圖像均能生成準(zhǔn)確反映用戶提示的視頻。

國泰君安研報(bào)指出，Sora具有三大突出亮點(diǎn)，一是60秒長視頻，Sora可以保持視頻主體與背景的高度流暢性與穩(wěn)定性。二是單視頻多角度鏡頭，Sora在一個(gè)視頻內(nèi)實(shí)現(xiàn)多角度鏡頭，分鏡切換符合邏輯且十分流暢。三是理解真實(shí)世界的能力，Sora對于光影反射、運(yùn)動方式、鏡頭移動等細(xì)節(jié)處理得十分優(yōu)秀，極大地提升了真實(shí)感。

與目前AI視頻賽道同行相比，Sora每條提示60秒的視頻長度，遠(yuǎn)高于Pika Labs的3秒、Meta Emu Video的4秒和Runway公司Gen-2的18秒的視頻時(shí)長。

此外，從官方發(fā)布的演示來看，無論從視頻流暢度還是細(xì)節(jié)表現(xiàn)能力上，Sora的效果都相當(dāng)驚艷。

不過，目前Sora仍在開發(fā)中，OpenAI承認(rèn)該模型可能會混淆提示的空間細(xì)節(jié)，例如混淆左右，并且難以精確描述隨著時(shí)間推移發(fā)生的事件，例如遵循特定的相機(jī)軌跡。同時(shí)，OpenAI還稱，可擴(kuò)展的視頻生成模型，是構(gòu)建物理世界通用模擬器的一條可能的路徑。

Sora的面世，意味著AI視頻生成能力實(shí)現(xiàn)了跨越式發(fā)展。該模型可以深度模擬真實(shí)物理世界，標(biāo)志著人工智能在理解真實(shí)世界場景并與之互動的能力方面實(shí)現(xiàn)了重大飛躍。

應(yīng)用前景廣闊

近年來，OpenAI領(lǐng)跑AI賽道。2021年初和2022年末，OpenAI分別推出了圖像生成系統(tǒng)DALLE和聊天機(jī)器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具，也正逐漸改變?nèi)藗儗ξ磥砉ぷ鞯目捶ā?/p>

如今，Sora模型能夠生成一分鐘的高保真視頻。視頻格式既可以是橫屏1920*1080視頻，豎屏1080*1920視頻，以及之間的所有內(nèi)容。這使得Sora可以兼容不同的視頻播放設(shè)備，根據(jù)特定的縱橫比來生成視頻內(nèi)容，這也會大大影響視頻創(chuàng)作領(lǐng)域，包括電影制作、電視內(nèi)容、自媒體等。

國盛證券認(rèn)為，文生視頻大模型Sora橫空出世，其能夠理解并呈現(xiàn)物理定律，影視動畫行業(yè)的顛覆性時(shí)刻到來。

據(jù)介紹，Sora是基于過去對DALLE和GPT的研究基礎(chǔ)構(gòu)建，利用DALLE 3的重述提示詞技術(shù)，為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注，因此模型能更好的遵循文本指令。

對此，360集團(tuán)創(chuàng)始人周鴻表示，Sora的技術(shù)思路完全不一樣。之前我們做視頻做圖用的都是Diffusion，是多個(gè)真實(shí)圖片的組合，這次OpenAI利用它的大語言模型優(yōu)勢，把LLM和Diffusion結(jié)合起來訓(xùn)練，讓Sora實(shí)現(xiàn)了對現(xiàn)實(shí)世界的理解和對世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實(shí)的，才能跳出2D的范圍模擬真實(shí)的物理世界。

“這都是大模型的功勞。OpenAI訓(xùn)練這個(gè)模型應(yīng)該會閱讀大量視頻。一幅圖勝過千言萬語，而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過一幅圖，這就離AGI（通用人工智能）不遠(yuǎn)了，不是10年20年的問題，可能一兩年很快就可以實(shí)現(xiàn)。”周鴻稱。

周鴻表示，這也代表未來的方向。有強(qiáng)勁的大模型做底子，基于對人類語言的理解，對人類知識和世界模型的了解，再疊加很多其他的技術(shù)，就可以創(chuàng)造各個(gè)領(lǐng)域的超級工具，比如生物醫(yī)學(xué)、蛋白質(zhì)和基因研究，包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上，大模型都會發(fā)揮作用。這次Sora對物理世界的模擬，至少將會對機(jī)器人具身智能和自動駕駛帶來巨大的影響。

國盛證券也持有相同的觀點(diǎn)。其認(rèn)為文生視頻大模型Sora橫空出世，其能夠理解并呈現(xiàn)物理定律，影視動畫行業(yè)的顛覆性時(shí)刻到來。

對于Sora的面世，工信部信息通信經(jīng)濟(jì)專家委員會委員、數(shù)字經(jīng)濟(jì)專家劉興亮稱，這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元。

“Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻，涵蓋多個(gè)角色、不同類型的動作和背景細(xì)節(jié)等，幾乎達(dá)到了電影級別的逼真場景。這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具，使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實(shí)，而且為觀眾帶來了更豐富和多樣化的視覺體驗(yàn)。技術(shù)創(chuàng)新的這一巨大飛躍，預(yù)示著AI在未來人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。”劉興亮表示。

AI基礎(chǔ)設(shè)施需求旺盛

市場觀點(diǎn)認(rèn)為，2022年是影像之年，2023是聲波之年，而2024是視頻之年。

OpenAI表示，Sora是構(gòu)建世界模型的基礎(chǔ)，未來將向?qū)崿F(xiàn)AGI繼續(xù)邁進(jìn)。

對于Sora的發(fā)展，算力需求旺盛。國泰君安指出，Sora模型推動AI多模態(tài)領(lǐng)域飛躍式發(fā)展，AI創(chuàng)作等相關(guān)領(lǐng)域?qū)⒂瓉砩疃茸兏�，AI賦能范圍進(jìn)一步擴(kuò)大，多模態(tài)相關(guān)的訓(xùn)練及推理應(yīng)用也將進(jìn)一步提升對算力基礎(chǔ)設(shè)施的相關(guān)需求。

無獨(dú)有偶，國盛證券也持有相同的觀點(diǎn)，其認(rèn)為，Sora依舊符合AI縮尺律（Scaling Law）OpenAI在技術(shù)文檔中說明，隨著訓(xùn)練計(jì)算量的增加，樣本質(zhì)量明顯提高，進(jìn)一步佐證了多模態(tài)時(shí)代，算力需求將成為最核心的瓶頸之一。

多模態(tài)大模型拉動全球算力需求快速增長，國產(chǎn)AI算力迎來機(jī)會。根據(jù)南方財(cái)富網(wǎng)趨勢選股系統(tǒng)數(shù)據(jù)統(tǒng)計(jì)，A股國產(chǎn)AI算力相關(guān)上市企業(yè)目前數(shù)量有52家，如國產(chǎn)AI算力產(chǎn)業(yè)鏈包含AI服務(wù)器零部件、服務(wù)器整機(jī)、算力租賃、數(shù)據(jù)中心等環(huán)節(jié)。AI服務(wù)器零部件公司主要包括海光信息、寒武紀(jì)、龍芯中科、景嘉微等；服務(wù)器整機(jī)公司主要包括高新發(fā)展、神州數(shù)碼、拓維信息、廣電運(yùn)通、烽火通信、同方股份等；算力租賃公司主要包括恒潤股份、云賽智聯(lián)、鴻博股份等；數(shù)據(jù)中心公司主要包括奧飛數(shù)據(jù)、光環(huán)新網(wǎng)、寶信軟件、數(shù)據(jù)港等。

此外，多家巨頭謀劃布局AI基礎(chǔ)設(shè)施。舉例來看，主營視頻創(chuàng)意、繪圖創(chuàng)意類軟件產(chǎn)品的萬興科技近日在互動平臺表示，公司旗下視頻創(chuàng)意產(chǎn)品萬興喵影/Filmora可用于各類視頻的創(chuàng)作和剪輯，“天幕”大模型是以視頻創(chuàng)意類AI技術(shù)為核心的多媒體大模型，涵蓋音頻、圖像、視頻等多模態(tài)能力。

昆侖萬維旗下Star Group和Opera都具備做短視頻的土壤，其中Opera在海外已經(jīng)推出了短視頻功能。此外，昆侖萬維天工大模型在騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)開展的多模態(tài)大語言模型測評中，綜合得分排名第一。

專業(yè)智能視頻解決方案與視頻云服務(wù)提供商當(dāng)虹科技擁有自研的AIGC工具集，于去年上半年發(fā)布以靜態(tài)照片生成三維體積視頻的方案。

當(dāng)虹科技1月5日互動平臺表示，公司擁有自研的AIGC工具集，發(fā)布了以靜態(tài)照片生成三維體積視頻的方案，并且通過點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺無損壓縮，實(shí)現(xiàn)不同模態(tài)之間相互切換。

因賽集團(tuán)旗下InsightGPT目前可生成20秒以上的視頻，能夠結(jié)合圖像、視頻大模型，融合摳圖等多種算法，再結(jié)合音頻模型，整體渲染后最終合成完整視頻。

據(jù)不完全統(tǒng)計(jì)，包括萬興科技、博匯科技、易點(diǎn)天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國信、神思電子、因賽集團(tuán)、拓爾思、國脈文化、佳都科技在內(nèi)的超10家A股上市公司近三個(gè)月以來在互動平臺披露視頻生成模型領(lǐng)域的業(yè)務(wù)情況。（思維財(cái)經(jīng)出品）■

相關(guān)熱詞： Sora 刷屏哪些上市公司受益

上一篇：SpaceX從西海岸發(fā)射139批星鏈發(fā)射，24小時(shí)內(nèi)三次發(fā)射

下一篇：經(jīng)濟(jì)日報(bào)：科學(xué)劃定腦機(jī)接口紅線和底線

Sora刷屏！哪些A股上市公司或?qū)⑹芤妫?div id="yaifhzr" class="p"> 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-02-18 14:19:14 瀏覽：6283次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明