當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > Sora再度顛覆AI視頻行業(yè)，A股哪些公司有相關(guān)布局？

Sora再度顛覆AI視頻行業(yè)，A股哪些公司有相關(guān)布局？
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-02-19 15:56:20 瀏覽：3430次

導(dǎo)讀：人工智能（AI）巨頭OpenAI又出王炸，其最新推出的文生視頻大模型Sora因其逼真和富有想象力被廣泛贊譽(yù)，其生成視頻可達(dá)60秒也顛覆了傳統(tǒng)視頻生成領(lǐng)域平均只有4秒的視頻生成長度。 OpenAI官網(wǎng)介紹，Sora是一種擴(kuò)散模型，它從看起來像靜態(tài)噪聲的視頻開始生成視...

人工智能（AI）巨頭OpenAI又出王炸，其最新推出的文生視頻大模型Sora因其“逼真”和“富有想象力”被廣泛贊譽(yù)，其生成視頻可達(dá)60秒也顛覆了傳統(tǒng)視頻生成領(lǐng)域平均只有4秒的視頻生成長度。

OpenAI官網(wǎng)介紹，Sora是一種擴(kuò)散模型，它從看起來像靜態(tài)噪聲的視頻開始生成視頻，然后通過多個(gè)步驟消除噪聲來逐漸對其進(jìn)行轉(zhuǎn)換生成視頻。Sora能夠一次生成整個(gè)視頻或擴(kuò)展生成的視頻以使其更長。通過一次為模型提供多個(gè)幀的預(yù)見，OpenAI解決了一個(gè)具有挑戰(zhàn)性的問題，即確保主題即使暫時(shí)離開視野也保持不變。

與GPT模型類似，Sora使用Transformer架構(gòu)。Sora建立在過去對DALLE和GPT模型的研究之上。它使用DALLE 3的重述技術(shù)，該技術(shù)涉及為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題。因此，該模型能夠更精準(zhǔn)遵循生成用戶的文本指令。

OpenAI表示，Sora是能夠理解和模擬現(xiàn)實(shí)世界的模型基礎(chǔ)，相信這一功能將成為實(shí)現(xiàn)AGI（通用人工智能）的重要里程碑。

券商建議關(guān)注多模態(tài)技術(shù)

Sora視頻一出，立刻震驚業(yè)界。360集團(tuán)創(chuàng)始人、董事長周鴻2月16日在微博發(fā)文表示，這意味著AGI實(shí)現(xiàn)將從10年縮短到1年。

其實(shí)，Sora出現(xiàn)之前，也有其他類似的AI視頻模型。比如，谷歌在去年12月21日發(fā)布一個(gè)全新的視頻生成模型VideoPoet，能夠執(zhí)行包括文本到視頻、圖像到視頻、視頻風(fēng)格化等操作。Meta則有名為Emu的模型。此前一夜爆紅的文生視頻軟件Pika更掀起了AI視頻應(yīng)用熱潮。

浙商證券認(rèn)為，短期內(nèi)，Sora及同類產(chǎn)品可大幅提升圖像和短視頻的制作效率，改變創(chuàng)意生產(chǎn)及營銷工作流，提升短視頻產(chǎn)品生產(chǎn)力，對于業(yè)態(tài)更加復(fù)雜的長視頻和游戲，受限于模型目前還無法很好理解因果關(guān)系，和其他技術(shù)難點(diǎn)，現(xiàn)階段或以提供美術(shù)靈感支持為主。中長期來看，Sora及同類產(chǎn)品將參與到改變信息生產(chǎn)和分發(fā)兩大環(huán)節(jié)的進(jìn)程中，PGC（專業(yè)生產(chǎn)內(nèi)容）將廣泛采用AI工具輔助生產(chǎn)，UGC（用戶生產(chǎn)內(nèi)容）將借助AI工具逐步替代PGC。此間，AI生成視頻工具的商業(yè)化將提速，目前Sora還未公布收費(fèi)標(biāo)準(zhǔn)，參照之前Runway等文生視頻工具收費(fèi)情況，定價(jià)相對較高。鑒于Sora采用的世界模擬器技術(shù)路徑，邊際成本或有降低的可能。

浙商證券列出的下游應(yīng)用側(cè)，從相關(guān)受益細(xì)分行業(yè)來看，包括但不限于視頻美化、廣告營銷、短劇、游戲、辦公軟件等。具體到投資標(biāo)的，建議關(guān)注美圖公司（1357：HK）（視覺大模型+大DAU圖像應(yīng)用）、中文在線（300364）（短劇出海+IP）、閱文集團(tuán)（0772：HK）（IP）、金山軟件（3888:HK）、三人行（605168）等；上游增加需求來看，推薦關(guān)注英偉達(dá)等算法、算力方面標(biāo)的。

東方證券早前的報(bào)告認(rèn)為，從技術(shù)突破的角度來看，下一階段的重點(diǎn)攻克方向必然會(huì)是多模態(tài)技術(shù)。能夠真正處理和應(yīng)用好多模態(tài)AI能力，才能真正打通物理世界和數(shù)字世界的障壁，用最基礎(chǔ)的感知世界能力直接生成操作，實(shí)現(xiàn)與物理世界最自然的交互。因此，基于多模態(tài)的應(yīng)用場景仍需不斷探索，AI視頻生成僅僅是多模態(tài)技術(shù)路徑中的一個(gè)小方向，多模態(tài)領(lǐng)域的ChatGPT時(shí)刻還未到來。

東方證券建議關(guān)注�？低暎�002415）、大華股份（002236）、螢石網(wǎng)絡(luò)（688475）、中科創(chuàng)達(dá)（300496）、虹軟科技（688088）、科大訊飛（002230）、萬興科技（300624）等公司。

中泰證券研報(bào)指出，跨時(shí)代文生視頻模型，有望推動(dòng)硬件需求進(jìn)一步提升。Sora基于圖片做長視頻生成，再基于生成視頻做extend，其所需token（文本處理最小單位）數(shù)量相較于文本及圖片模型的推理，有望成數(shù)量級增長，判斷Sora將刺激推理算力需求將持續(xù)上升。此外，推理端token增加、算力需求的增長，也對顯存及帶寬提出更高要求，預(yù)計(jì)將拉升400G光通信技術(shù)在以太網(wǎng)中的應(yīng)用，并有望推動(dòng)800G乃至1.6T光通信技術(shù)的應(yīng)用。

哪些A股公司有布局？

據(jù)不完全統(tǒng)計(jì)，已有十多家A股上市公司之前已經(jīng)布局多模態(tài)大模型或?qū)I視頻相關(guān)研發(fā)。

�？低暎�002415）在去年4月20日回復(fù)投資者提問時(shí)披露，公司從幾年前就開始研發(fā)視覺大模型，現(xiàn)在已經(jīng)到了多模態(tài)大模型的研發(fā)階段，包括視覺、語音、文本等多模態(tài)信號的融合訓(xùn)練及處理。

大華股份（002236）于2023年10月發(fā)布“星漢大模型”，該模型融合點(diǎn)云、語音、圖像等輸入，構(gòu)建了多模態(tài)融合的行業(yè)視覺大模型。

大華股份在1月15日在投資者問答中介紹，公司多模態(tài)融合的行業(yè)視覺大模型（大華星漢大模型），是基于公司過去豐富的行業(yè)和細(xì)分場景的業(yè)務(wù)經(jīng)驗(yàn)，面向以視覺為核心的智慧物聯(lián)領(lǐng)域，通過融合圖像、點(diǎn)云、文本、語音等多模態(tài)數(shù)據(jù)所搭建的，大幅提升了視覺解析能力，該模型為解析式大模型，與市面上的ChatGPT等生成式大模型有明顯差異。

萬興科技（300624）此前發(fā)布音視頻多媒體大模型萬興“天幕”。據(jù)了解，萬興“天幕”是一個(gè)以音視頻生成式AI技術(shù)為基礎(chǔ)的多媒體創(chuàng)作垂類大模型，由視頻大模型、音頻大模型、圖片大模型、語言大模型組成，聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景。

2月2日，萬興科技在互動(dòng)平臺表示，天幕大模型主要基于公司在數(shù)字創(chuàng)意領(lǐng)域二十年的產(chǎn)品開發(fā)與運(yùn)營經(jīng)驗(yàn)而打造的音視頻多媒體大模型，具備多媒體、垂直解決方案、算力數(shù)據(jù)及應(yīng)用本土化等特色，以更智能、更沉浸的功能效果和產(chǎn)品體驗(yàn)賦能全球內(nèi)容創(chuàng)作者的創(chuàng)意表達(dá)。

博匯科技（688004）1月9日在回復(fù)投資者提問時(shí)表示，公司通過運(yùn)用人工智能、大數(shù)據(jù)等技術(shù)，對采集到的數(shù)據(jù)進(jìn)行分析、特征學(xué)習(xí)和樣本訓(xùn)練，構(gòu)建智慧監(jiān)管模型，提升了對文本、圖片、音頻、視頻等多模態(tài)數(shù)據(jù)的處理分析能力，進(jìn)一步強(qiáng)化核心技術(shù)優(yōu)勢，提高產(chǎn)品競爭力。

易點(diǎn)天下（301171）在2月4日在投資者互動(dòng)平臺表示，公司旗下AIGC創(chuàng)作平臺KreadoAI可以幫助企業(yè)實(shí)現(xiàn)從腳本撰寫、語音克壟個(gè)性化數(shù)字人選擇到輸出口播視頻的內(nèi)容生產(chǎn)AI化全鏈路閉環(huán)。

數(shù)碼視訊（300079）1月4日互動(dòng)平合表示，公司多年來積極自主研發(fā)積累AI技術(shù)，龍其是在視頻內(nèi)容生產(chǎn)領(lǐng)域，持續(xù)不斷探素AIGC生成式技術(shù)，并配合智能審核技術(shù)、多模態(tài)智能搜索等實(shí)現(xiàn)全媒體行業(yè)的媒資管理，構(gòu)建全新視音頻服務(wù)。

漢王科技（002362）2023年12月31日互動(dòng)平臺表示，公司在文本、圖像、視頻、生物特征、語音等多欖態(tài)識別、文本理解和利用等技術(shù)上耕耘多年，并形成智能終端產(chǎn)品和行業(yè)解決方案。目前正在研發(fā)的AI模型尚屬于新生技術(shù)，在文本生成、生成內(nèi)容的控制與審核等方面的技術(shù)細(xì)節(jié)尚在進(jìn)一步完善。

當(dāng)虹科技（688039）1月5日互動(dòng)平臺表示，公司擁有自研的AIGC工具集，發(fā)布了以靜態(tài)照片生成三維體積視頻的方案，并且通過點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺無損壓縮，實(shí)現(xiàn)不同模態(tài)之間相互切換。公司AIGC視頻內(nèi)容智能生成系統(tǒng)融合了大模型技術(shù)，能助力用戶在新聞傳播、視頻內(nèi)容創(chuàng)作等多項(xiàng)領(lǐng)域中創(chuàng)作出優(yōu)質(zhì)視頻內(nèi)容。

東方國信（300166）去年12月27日互動(dòng)平臺表示，在AI多模態(tài)方面，公司在文本、語音、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)類型的AI分析上，均有應(yīng)用產(chǎn)品和落地案例。視覺類有基于Stable Diffusion的圖像生成能力，其他視覺類大模型應(yīng)用還在探索技術(shù)路徑和應(yīng)用場景。

神思電子（300479）2023年12月26日在互動(dòng)平臺表示，公司經(jīng)過多年人工智能領(lǐng)域積累，已突破了遠(yuǎn)距離全天候復(fù)雜場景激光熱成像聯(lián)動(dòng)入侵檢測技術(shù)，掌握了基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理、視頻分析、語音對話、知識管理以及云平臺技術(shù)。公司正在對于文生圖、圖生文、視頻生文、文生視頻等多模態(tài)數(shù)據(jù)互相跳轉(zhuǎn)的收斂性質(zhì)進(jìn)行研究，支撐培訓(xùn)、檢索、推薦、目標(biāo)追蹤等多個(gè)場景的生成式大模型應(yīng)用。

因賽集團(tuán)（300781）2023年12月25日在互動(dòng)平臺表示，公司InsightGPT具備文生文、視頻智能剪輯、圖生視頻等功能，目前正在開發(fā)文生視頻功能。在現(xiàn)有圖生視頻等技術(shù)框架下，InsightGPT目前可生成20秒以上的視頻。在目前文生視頻的邏輯流程中，InsighGPT先結(jié)合圖像、視頻大模型，融合摳圖等多種算法，再結(jié)合音頻模型，整體渲染后最終合成完整視頻。

拓爾思（300229）2023年12月14日在互動(dòng)平臺表示，公司在Transformer架構(gòu)方面積極跟蹤業(yè)內(nèi)最新技術(shù)，未來將根據(jù)技術(shù)研發(fā)和業(yè)務(wù)需求的實(shí)際情況，適時(shí)采用類似架構(gòu)。

國脈文化（600640）去年12月12日在互動(dòng)平臺表示，公司在文生視頻方面，已內(nèi)部開發(fā)基于大模型的AIGC數(shù)字內(nèi)容生成平臺，平臺利用多模態(tài)技術(shù)，使用自有的版權(quán)內(nèi)容，生成文字、音頻、圖片、視頻等影視素材，進(jìn)行內(nèi)容的創(chuàng)作生產(chǎn)，正在內(nèi)部試用中。

佳都科技（600728）在2023年12月11日在互動(dòng)平臺表示，公司TransCorc-M多模態(tài)大模型能夠理解立本、圖像、視頻等多種模態(tài)的信息，并且按照用戶需求將其進(jìn)行描述、提示或轉(zhuǎn)化為指令代碼，是個(gè)非常“聰明”的交通信息小助手。