展會(huì)信息港展會(huì)大全

Sora再度顛覆AI視頻行業(yè),A股哪些公司有相關(guān)布局?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-19 15:56:20   瀏覽:3430次  

導(dǎo)讀:人工智能(AI)巨頭OpenAI又出王炸,其最新推出的文生視頻大模型Sora因其逼真和富有想象力被廣泛贊譽(yù),其生成視頻可達(dá)60秒也顛覆了傳統(tǒng)視頻生成領(lǐng)域平均只有4秒的視頻生成長度。 OpenAI官網(wǎng)介紹,Sora是一種擴(kuò)散模型,它從看起來像靜態(tài)噪聲的視頻開始生成視...

人工智能(AI)巨頭OpenAI又出王炸,其最新推出的文生視頻大模型Sora因其“逼真”和“富有想象力”被廣泛贊譽(yù),其生成視頻可達(dá)60秒也顛覆了傳統(tǒng)視頻生成領(lǐng)域平均只有4秒的視頻生成長度。

OpenAI官網(wǎng)介紹,Sora是一種擴(kuò)散模型,它從看起來像靜態(tài)噪聲的視頻開始生成視頻,然后通過多個(gè)步驟消除噪聲來逐漸對其進(jìn)行轉(zhuǎn)換生成視頻。Sora能夠一次生成整個(gè)視頻或擴(kuò)展生成的視頻以使其更長。通過一次為模型提供多個(gè)幀的預(yù)見,OpenAI解決了一個(gè)具有挑戰(zhàn)性的問題,即確保主題即使暫時(shí)離開視野也保持不變。

與GPT模型類似,Sora使用Transformer架構(gòu)。Sora建立在過去對DALLE和GPT模型的研究之上。 它使用DALLE 3的重述技術(shù),該技術(shù)涉及為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題。因此,該模型能夠更精準(zhǔn)遵循生成用戶的文本指令。

OpenAI表示,Sora是能夠理解和模擬現(xiàn)實(shí)世界的模型基礎(chǔ),相信這一功能將成為實(shí)現(xiàn)AGI(通用人工智能)的重要里程碑。

券商建議關(guān)注多模態(tài)技術(shù)

Sora視頻一出,立刻震驚業(yè)界。360集團(tuán)創(chuàng)始人、董事長周鴻2月16日在微博發(fā)文表示,這意味著AGI實(shí)現(xiàn)將從10年縮短到1年。

其實(shí),Sora出現(xiàn)之前,也有其他類似的AI視頻模型。比如,谷歌在去年12月21日發(fā)布一個(gè)全新的視頻生成模型VideoPoet,能夠執(zhí)行包括文本到視頻、圖像到視頻、視頻風(fēng)格化等操作。Meta則有名為Emu的模型。此前一夜爆紅的文生視頻軟件Pika更掀起了AI視頻應(yīng)用熱潮。

浙商證券認(rèn)為,短期內(nèi),Sora及同類產(chǎn)品可大幅提升圖像和短視頻的制作效率,改變創(chuàng)意生產(chǎn)及營銷工作流,提升短視頻產(chǎn)品生產(chǎn)力,對于業(yè)態(tài)更加復(fù)雜的長視頻和游戲,受限于模型目前還無法很好理解因果關(guān)系,和其他技術(shù)難點(diǎn),現(xiàn)階段或以提供美術(shù)靈感支持為主。中長期來看,Sora及同類產(chǎn)品將參與到改變信息生產(chǎn)和分發(fā)兩大環(huán)節(jié)的進(jìn)程中,PGC(專業(yè)生產(chǎn)內(nèi)容)將廣泛采用AI工具輔助生產(chǎn),UGC(用戶生產(chǎn)內(nèi)容)將借助AI工具逐步替代PGC。此間,AI生成視頻工具的商業(yè)化將提速,目前Sora還未公布收費(fèi)標(biāo)準(zhǔn),參照之前Runway等文生視頻工具收費(fèi)情況,定價(jià)相對較高。鑒于Sora采用的世界模擬器技術(shù)路徑,邊際成本或有降低的可能。

浙商證券列出的下游應(yīng)用側(cè),從相關(guān)受益細(xì)分行業(yè)來看,包括但不限于視頻美化、廣告營銷、短劇、游戲、辦公軟件等。具體到投資標(biāo)的,建議關(guān)注美圖公司(1357:HK)(視覺大模型+大DAU圖像應(yīng)用)、中文在線(300364)(短劇出海+IP)、閱文集團(tuán)(0772:HK)(IP)、金山軟件(3888:HK)、三人行(605168)等;上游增加需求來看,推薦關(guān)注英偉達(dá)等算法、算力方面標(biāo)的。

東方證券早前的報(bào)告認(rèn)為,從技術(shù)突破的角度來看,下一階段的重點(diǎn)攻克方向必然會(huì)是多模態(tài)技術(shù)。能夠真正處理和應(yīng)用好多模態(tài)AI能力,才能真正打通物理世界和數(shù)字世界的障壁,用最基礎(chǔ)的感知世界能力直接生成操作,實(shí)現(xiàn)與物理世界最自然的交互。因此,基于多模態(tài)的應(yīng)用場景仍需不斷探索,AI視頻生成僅僅是多模態(tài)技術(shù)路徑中的一個(gè)小方向,多模態(tài)領(lǐng)域的ChatGPT時(shí)刻還未到來。

東方證券建議關(guān)注?低暎002415)、大華股份(002236)、螢石網(wǎng)絡(luò)(688475)、中科創(chuàng)達(dá)(300496)、虹軟科技(688088)、科大訊飛(002230)、萬興科技(300624)等公司。

中泰證券研報(bào)指出,跨時(shí)代文生視頻模型,有望推動(dòng)硬件需求進(jìn)一步提升。Sora基于圖片做長視頻生成,再基于生成視頻做extend,其所需token(文本處理最小單位)數(shù)量相較于文本及圖片模型的推理,有望成數(shù)量級增長,判斷Sora將刺激推理算力需求將持續(xù)上升。此外,推理端token增加、算力需求的增長,也對顯存及帶寬提出更高要求,預(yù)計(jì)將拉升400G光通信技術(shù)在以太網(wǎng)中的應(yīng)用,并有望推動(dòng)800G乃至1.6T光通信技術(shù)的應(yīng)用。

哪些A股公司有布局?

據(jù)不完全統(tǒng)計(jì),已有十多家A股上市公司之前已經(jīng)布局多模態(tài)大模型或?qū)I視頻相關(guān)研發(fā)。

?低暎002415)在去年4月20日回復(fù)投資者提問時(shí)披露,公司從幾年前就開始研發(fā)視覺大模型,現(xiàn)在已經(jīng)到了多模態(tài)大模型的研發(fā)階段,包括視覺、語音、文本等多模態(tài)信號的融合訓(xùn)練及處理。

大華股份(002236)于2023年10月發(fā)布“星漢大模型”,該模型融合點(diǎn)云、語音、圖像等輸入,構(gòu)建了多模態(tài)融合的行業(yè)視覺大模型。

大華股份在1月15日在投資者問答中介紹,公司多模態(tài)融合的行業(yè)視覺大模型(大華星漢大模型),是基于公司過去豐富的行業(yè)和細(xì)分場景的業(yè)務(wù)經(jīng)驗(yàn),面向以視覺為核心的智慧物聯(lián)領(lǐng)域,通過融合圖像、點(diǎn)云、文本、語音等多模態(tài)數(shù)據(jù)所搭建的,大幅提升了視覺解析能力,該模型為解析式大模型,與市面上的ChatGPT等生成式大模型有明顯差異。

萬興科技(300624)此前發(fā)布音視頻多媒體大模型萬興“天幕”。據(jù)了解,萬興“天幕”是一個(gè)以音視頻生成式AI技術(shù)為基礎(chǔ)的多媒體創(chuàng)作垂類大模型,由視頻大模型、音頻大模型、圖片大模型、語言大模型組成,聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景。

2月2日,萬興科技在互動(dòng)平臺表示,天幕大模型主要基于公司在數(shù)字創(chuàng)意領(lǐng)域二十年的產(chǎn)品開發(fā)與運(yùn)營經(jīng)驗(yàn)而打造的音視頻多媒體大模型,具備多媒體、垂直解決方案、算力數(shù)據(jù)及應(yīng)用本土化等特色,以更智能、更沉浸的功能效果和產(chǎn)品體驗(yàn)賦能全球內(nèi)容創(chuàng)作者的創(chuàng)意表達(dá)。

博匯科技(688004)1月9日在回復(fù)投資者提問時(shí)表示,公司通過運(yùn)用人工智能、大數(shù)據(jù)等技術(shù),對采集到的數(shù)據(jù)進(jìn)行分析、特征學(xué)習(xí)和樣本訓(xùn)練,構(gòu)建智慧監(jiān)管模型,提升了對文本、圖片、音頻、視頻等多模態(tài)數(shù)據(jù)的處理分析能力,進(jìn)一步強(qiáng)化核心技術(shù)優(yōu)勢,提高產(chǎn)品競爭力。

易點(diǎn)天下(301171)在2月4日在投資者互動(dòng)平臺表示,公司旗下AIGC創(chuàng)作平臺KreadoAI可以幫助企業(yè)實(shí)現(xiàn)從腳本撰寫、語音克壟個(gè)性化數(shù)字人選擇到輸出口播視頻的內(nèi)容生產(chǎn)AI化全鏈路閉環(huán)。

數(shù)碼視訊(300079)1月4日互動(dòng)平合表示,公司多年來積極自主研發(fā)積累AI技術(shù),龍其是在視頻內(nèi)容生產(chǎn)領(lǐng)域,持續(xù)不斷探素AIGC生成式技術(shù),并配合智能審核技術(shù)、多模態(tài)智能搜索等實(shí)現(xiàn)全媒體行業(yè)的媒資管理,構(gòu)建全新視音頻服務(wù)。

漢王科技(002362)2023年12月31日互動(dòng)平臺表示,公司在文本、圖像、視頻、生物特征、語音等多欖態(tài)識別、文本理解和利用等技術(shù)上耕耘多年,并形成智能終端產(chǎn)品和行業(yè)解決方案。目前正在研發(fā)的AI模型尚屬于新生技術(shù),在文本生成、生成內(nèi)容的控制與審核等方面的技術(shù)細(xì)節(jié)尚在進(jìn)一步完善。

當(dāng)虹科技(688039)1月5日互動(dòng)平臺表示,公司擁有自研的AIGC工具集,發(fā)布了以靜態(tài)照片生成三維體積視頻的方案,并且通過點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺無損壓縮,實(shí)現(xiàn)不同模態(tài)之間相互切換。公司AIGC視頻內(nèi)容智能生成系統(tǒng)融合了大模型技術(shù),能助力用戶在新聞傳播、視頻內(nèi)容創(chuàng)作等多項(xiàng)領(lǐng)域中創(chuàng)作出優(yōu)質(zhì)視頻內(nèi)容。

東方國信(300166)去年12月27日互動(dòng)平臺表示,在AI多模態(tài)方面,公司在文本、語音、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)類型的AI分析上,均有應(yīng)用產(chǎn)品和落地案例。視覺類有基于Stable Diffusion的圖像生成能力,其他視覺類大模型應(yīng)用還在探索技術(shù)路徑和應(yīng)用場景。

神思電子(300479)2023年12月26日在互動(dòng)平臺表示,公司經(jīng)過多年人工智能領(lǐng)域積累,已突破了遠(yuǎn)距離全天候復(fù)雜場景激光熱成像聯(lián)動(dòng)入侵檢測技術(shù),掌握了基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理、視頻分析、語音對話、知識管理以及云平臺技術(shù)。公司正在對于文生圖、圖生文、視頻生文、文生視頻等多模態(tài)數(shù)據(jù)互相跳轉(zhuǎn)的收斂性質(zhì)進(jìn)行研究,支撐培訓(xùn)、檢索、推薦、目標(biāo)追蹤等多個(gè)場景的生成式大模型應(yīng)用。

因賽集團(tuán)(300781)2023年12月25日在互動(dòng)平臺表示,公司InsightGPT具備文生文、視頻智能剪輯、圖生視頻等功能,目前正在開發(fā)文生視頻功能。在現(xiàn)有圖生視頻等技術(shù)框架下,InsightGPT目前可生成20秒以上的視頻。在目前文生視頻的邏輯流程中,InsighGPT先結(jié)合圖像、視頻大模型,融合摳圖等多種算法,再結(jié)合音頻模型,整體渲染后最終合成完整視頻。

拓爾思(300229)2023年12月14日在互動(dòng)平臺表示,公司在Transformer架構(gòu)方面積極跟蹤業(yè)內(nèi)最新技術(shù),未來將根據(jù)技術(shù)研發(fā)和業(yè)務(wù)需求的實(shí)際情況,適時(shí)采用類似架構(gòu)。

國脈文化(600640)去年12月12日在互動(dòng)平臺表示,公司在文生視頻方面,已內(nèi)部開發(fā)基于大模型的AIGC數(shù)字內(nèi)容生成平臺,平臺利用多模態(tài)技術(shù),使用自有的版權(quán)內(nèi)容,生成文字、音頻、圖片、視頻等影視素材,進(jìn)行內(nèi)容的創(chuàng)作生產(chǎn),正在內(nèi)部試用中。

佳都科技(600728)在2023年12月11日在互動(dòng)平臺表示,公司TransCorc-M多模態(tài)大模型能夠理解立本、圖像、視頻等多種模態(tài)的信息,并且按照用戶需求將其進(jìn)行描述、提示或轉(zhuǎn)化為指令代碼,是個(gè)非常“聰明”的交通信息小助手。

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港