展會(huì)信息港展會(huì)大全

Sora登場(chǎng)對(duì)AICG意味著什么?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-02-19 16:02:22   瀏覽:8215次  

導(dǎo)讀:OpenAI2月16日凌晨發(fā)布王炸文生視頻大模型Sora,再次引爆科技圈。在OpenAI官網(wǎng)分享的演示視頻中,Sora可以直接輸出有多個(gè)角色、多種場(chǎng)景和運(yùn)鏡的畫面。這對(duì)比一年前 AI 生成的視頻,簡(jiǎn)直是天差地別,其視頻長(zhǎng)度方面就碾壓同行。 方正證券分析師鄭震湘領(lǐng)導(dǎo)的...

OpenAI2月16日凌晨發(fā)布“王炸”文生視頻大模型Sora,再次引爆科技圈。在OpenAI官網(wǎng)分享的演示視頻中,Sora可以直接輸出有多個(gè)角色、多種場(chǎng)景和運(yùn)鏡的畫面。這對(duì)比一年前 AI 生成的視頻,簡(jiǎn)直是天差地別,其視頻長(zhǎng)度方面就“碾壓”同行。

方正證券分析師鄭震湘領(lǐng)導(dǎo)的團(tuán)隊(duì)在題為《AI巨輪滾滾向前》報(bào)告中直言,文生視頻大模型Sora震撼登場(chǎng),AIGC新時(shí)代已至。Sora完美繼承DALLE 3的畫質(zhì)和遵循指令能力,并利用了GPT擴(kuò)寫,具備超長(zhǎng)生成時(shí)間(60s)、單視頻多角度鏡頭、理解物理世界三大突出優(yōu)勢(shì):

模型對(duì)物理世界的理解愈加接近現(xiàn)實(shí),已具備商業(yè)化落地價(jià)值,創(chuàng)作內(nèi)容產(chǎn)業(yè)革命來臨,AIGC新時(shí)代到來了。

方正證券在報(bào)告中指出,英偉達(dá)正式發(fā)布Chat With RTX,AI加速普及,通用人工智能時(shí)代也正加速來臨。在高性能AI處理器的加持下,AI+N類終端的時(shí)代浪潮已至,AI改變的不只是 PC 與手機(jī),科技賦能將全方位滲透,消費(fèi)電子也將迎來全新的增長(zhǎng)機(jī)遇

我們認(rèn)為MR是AI最佳落地終端,泛社交、B端應(yīng)用拓展也擁有想象空間。

報(bào)告稱,核心公司業(yè)務(wù)進(jìn)展近況進(jìn)一步印證了現(xiàn)階段塊發(fā)展兩個(gè)核心要素:AI方向的持續(xù)產(chǎn)品迭代、龐大的國(guó)產(chǎn)化算力需求。預(yù)計(jì)在AI 算力需求高景氣的背景下,國(guó)內(nèi)AI算力產(chǎn)業(yè)鏈將在2024年迎來更加快速的發(fā)展。

AIGC 新時(shí)代已至

方正證券在報(bào)告中指出,從Runway、Pika 到 Sora,文生視頻大模型頻出,視頻長(zhǎng)度從表情包長(zhǎng)度的3s、4s 到主流短視頻長(zhǎng)度的60s,模型對(duì)物理世界的理解愈加接近現(xiàn)實(shí),已具備強(qiáng)大的商業(yè)化落地價(jià)值,創(chuàng)作內(nèi)容產(chǎn)業(yè)革命來臨,AIGC 新時(shí)代已至

在算力需求大、高質(zhì)量數(shù)據(jù)集短缺、可控性較差等挑戰(zhàn)下,文生視頻是AIGC的高地,除Runway、Pika之外,Stability AI 也發(fā)布了 Stable Video Diffusion 視頻模型,用戶可根據(jù)需要調(diào)整各種參數(shù),如迭代步數(shù)、重繪幅度等,以協(xié)助創(chuàng)作者精確掌控畫面生成過程,Meta推出了兩項(xiàng)基于AI的視頻編輯新功能;在開源上,AnimateDiff、MAKEAVIDEO、MagicAnimate 等也在布局 AI 視頻生成賽道。

報(bào)告稱,Sora震撼效果的原因主要有:1)訓(xùn)練端:基于 Transformer 架構(gòu)的擴(kuò)散模型,降維并通過Patche 進(jìn)行訓(xùn)練;采樣的靈活性與獨(dú)特的訓(xùn)練路徑(原始 尺寸、時(shí)長(zhǎng)訓(xùn)練);利用DALLE 3 re-captioning 功能,給訓(xùn)練用的視頻素材都加上高質(zhì)量文本描述;2)輸入端:利用 GPT 先將用戶輸入的提示詞精準(zhǔn)詳盡擴(kuò)寫,再將擴(kuò)寫后的提示詞交給 Sora

Sora 是一種擴(kuò)散模型,可在學(xué)習(xí)大量先作的時(shí)候,學(xué)會(huì)圖像內(nèi)涵與圖像之間的關(guān)系,采用 Transformer 架構(gòu)(主流視頻生成擴(kuò)散模型較多采用 U-Net 架構(gòu)),OpenAI 認(rèn)為 之前在大語言模型上的成功得益于 Token,Token 可以把代碼、數(shù)學(xué)以及各種不 同的自然語言進(jìn)行統(tǒng)一,進(jìn)而方便規(guī)模巨大的訓(xùn)練,因此 OpenAI 創(chuàng)造了對(duì)應(yīng) Token 的 Patche,用于訓(xùn)練 Sora。

為減少 Transformer 帶來的計(jì)算量壓力,OpenAI 開發(fā)了一個(gè)視頻壓縮網(wǎng)絡(luò),把視頻先降維到潛空間(latent,用更少的信息去表 達(dá)信息的本質(zhì)),然后再去拿這些壓縮過的視頻數(shù)據(jù)去生成 Patche,這樣就能使輸入的信息變少。

方正證券認(rèn)為,AI大模型的發(fā)展正不斷加速AGI通用人工智能的到來,縱觀整個(gè)AI產(chǎn)業(yè)鏈,硬件和軟件的配合才能更好地實(shí)現(xiàn)多種終端應(yīng)用的價(jià)值化落地,可以預(yù)見的是,未來的 AI 時(shí)代又是生產(chǎn)力的爆發(fā)式革命:

其中上游的基礎(chǔ)層包括AI模型生產(chǎn)工具(AI 算法框架+AI 開發(fā)平臺(tái)+AI 開放平臺(tái)+預(yù)訓(xùn)練大模型)、AI 算力基礎(chǔ) (AI 芯片+服務(wù)器+智算中心+云服務(wù))、AI 數(shù)據(jù)資源(AI 基礎(chǔ)數(shù)據(jù)服務(wù)+數(shù)據(jù)治 理);

中游的技術(shù)層包括計(jì)算機(jī)視覺、智能語音、自然語言處理、知識(shí)圖譜和機(jī)器學(xué)習(xí);

下游的應(yīng)用層則是百花齊放,以 AI+泛安防/泛互聯(lián)網(wǎng)/媒體/金融/醫(yī)療/工 業(yè)/零售/政務(wù)為代表,還包括對(duì)話式 AI、機(jī)器人、自動(dòng)駕駛、無人機(jī)等。

“AI+終端”智能化加速

方正證券認(rèn)為,手機(jī)、MR、機(jī)器人等新品迭出,諸多新品亮相,AI終端時(shí)代來臨。英偉達(dá)、AMD、高通分別推出GeForceRTX 40 SUPER 系列、銳龍8000G 系列、驍龍XR2+ Gen 2 等高性能處理器,性能水平實(shí)現(xiàn)躍升,助力AI加速滲透PC、汽車、智能家居等終端場(chǎng)景:

我們看到,三星大力布局人車互聯(lián)生態(tài);英特爾在發(fā)布AI PC 平臺(tái)的同時(shí),推出SDV SoC 賦能AI+汽車;戴爾靈越系列搭載英特爾酷睿Ultra 7,AI 能效再度提升;聯(lián)想十余款A(yù)I PC 產(chǎn)品發(fā)布,規(guī)模化落地逐步推進(jìn)。華碩搭載酷睿Ultra 9,各系列產(chǎn)品針對(duì)不同的目標(biāo)客戶進(jìn)行性能或配置上的優(yōu)化,滿足差異化需求。

我們認(rèn)為,在高性能AI 處理器的加持下,AI+N 類終端的時(shí)代浪潮已至,AI 改變的不只是PC 與手機(jī),科技賦能將全方位滲透,消費(fèi)電子也將迎來全新的增長(zhǎng)機(jī)遇。

報(bào)告指出,MR為AI最佳落地終端,高度賦能MR 內(nèi)容與硬件,泛社交、B 端應(yīng)用拓展也擁有想象空間:

1)辦公場(chǎng)景: Workrooms 是一個(gè)身臨其境的虛擬辦公室,無論是戴著 Meta Quest 頭戴式耳 機(jī),還是從 2D 屏幕上加入,都可以在這里與隊(duì)友會(huì)面、集思廣益、分享演示文 稿并完成工作。同時(shí),Workrooms 還支持 Zoom,讓連接更方便。

2)政府服務(wù): 首爾市政府正式開展元宇宙服務(wù),建立涵蓋經(jīng)濟(jì)、教育、稅務(wù)和行政等領(lǐng)域的行 政服務(wù)平臺(tái)。該市還打算在接下來的五年里陸續(xù)推出更多涉及政府、商業(yè)、旅游和文化的服務(wù)。

3)金融服務(wù): 中國(guó)工商銀行虛擬營(yíng)業(yè)廳率先構(gòu)建 “VR 智能眼鏡+元宇宙+智慧金融”場(chǎng)景。在 虛擬營(yíng)業(yè)廳中,用戶仿佛置身于真實(shí)的全景環(huán)境,不僅能體驗(yàn)行走的空間感、縱 深感,對(duì)網(wǎng)點(diǎn)的格局、設(shè)施、產(chǎn)品展示、展品細(xì)節(jié)、空間的大小也都能一目了然。

4)醫(yī)療場(chǎng)景: 內(nèi)置 AI 醫(yī)療系統(tǒng)的 AR 眼鏡可以用于病情診斷、遠(yuǎn)程會(huì)診和醫(yī)療教學(xué)。

AI驅(qū)動(dòng)全球算力硬件環(huán)節(jié)創(chuàng)新與需求共振

方正證券認(rèn)為,英偉達(dá)以及AMD等核心公司的業(yè)務(wù)進(jìn)展近況進(jìn)一步印證了現(xiàn)階段板塊發(fā)展兩個(gè)核心要素:AI方向的持續(xù)產(chǎn)品迭代、龐大的算力需求

首先從英偉達(dá)來看:H200 出貨在即,B100 在路上。2023年11月13日,英偉達(dá)發(fā)布首款搭載HBM3e 的GPU H200,借助HBM3e,H200 能以每秒4.8 TB 的速度提供141GB 內(nèi)存,與NVIDIA A100 相比,容量幾乎翻倍,帶寬增加2.4倍。搭載HBM3e 的H200 在處理700 億參數(shù)的大模型時(shí),推理速度較H100 快了整整一倍,能耗降低了一半。受HBM3E 供應(yīng)限制,預(yù)計(jì)H200 將于24Q2 實(shí)現(xiàn)出貨。

英偉達(dá)B100原計(jì)劃發(fā)布時(shí)間為2024Q4,但由于AI 需求的火爆,已經(jīng)提前至2024Q2,目前已經(jīng)進(jìn)入供應(yīng)鏈認(rèn)證階段,B100 將能夠輕松應(yīng)對(duì)1730 億參數(shù)的大語言模型,比當(dāng)前型號(hào)H200 的兩倍還要強(qiáng)大。

此外,B100 將采用更高級(jí)的HBM 高帶寬內(nèi)存規(guī)格,有望在堆疊容量和帶寬上繼續(xù)突破,超越現(xiàn)有的4.8TB/s。根據(jù)英偉達(dá)產(chǎn)品路線圖,預(yù)計(jì)2025 年將推出X100,進(jìn)一步豐富GPU 產(chǎn)品矩陣,鞏固英偉達(dá)AI 芯片龍頭地位。

與此同時(shí),英偉達(dá)進(jìn)軍定制AI芯片領(lǐng)域。根據(jù) CNBC,英偉達(dá)目前正在策劃建立全新部門旨 在為云計(jì)算企業(yè)和其企業(yè)提供定制化芯片業(yè)務(wù)。根據(jù) CNBC,定制化芯片或?qū)W?于滿足特定設(shè)備或者系統(tǒng)的性能和功耗要求,其中或?qū)囟ǖ奶幚韱卧,?感器集成、專用硬件加速器,以滿足特定領(lǐng)域的需求。

從AMD來看:MI300 正式發(fā)布,2024 年銷售收入上調(diào)。CoWoS+SoIC 賦能3.5D 封裝。2023 年12 月6 日,AMD 在Advancing AI 活動(dòng)上宣布推出Instinct MI300X,采用了AMD CDNA3架構(gòu),搭載了8 塊HBM3,容量達(dá)192GB。與MI250X 相比,計(jì)算單元增加了約40%、內(nèi)存容量增加1.5 倍、峰值理論內(nèi)存帶寬3 增加1.7 倍。在某些工作環(huán)境中,性能可達(dá)H100的1.3 倍。

MI300X 采用3.5D 封裝,即通過混合鍵合技術(shù)實(shí)現(xiàn)XCD、I/Odie 的3D 堆疊,其次在硅中介層上實(shí)現(xiàn)與HBM 的集成,從而實(shí)現(xiàn)了超過1500 億個(gè)晶體管的高密度封裝。該封裝方案由臺(tái)積電提供,搭配SoIC 技術(shù)與CoWoS 技術(shù)共同實(shí)現(xiàn)。

報(bào)告稱,AI浪潮也在推動(dòng)光模塊、交換機(jī)配套升級(jí) :

Coherent:800G產(chǎn)品環(huán)比持續(xù)高增,2025 年順應(yīng)AI 發(fā)展推進(jìn)1.6T 商業(yè)化。2023Q4Coherent 實(shí)現(xiàn)收入11.31 億美元,高于指引中值,yoy-17.45%,qoq+7.41%。受益于人工智能的蓬勃發(fā)展, AI/ML 相關(guān)數(shù)據(jù)收發(fā)器連續(xù)第三季獲得強(qiáng)勁訂單,800G 產(chǎn)品季度收入突破1 億美元,環(huán)比增長(zhǎng)超100%,800G出貨量持續(xù)強(qiáng)勁增長(zhǎng),F(xiàn)Y2024 公司預(yù)計(jì)超50%的數(shù)據(jù)通信收發(fā)器收入將來自人工智能相關(guān)應(yīng)用,2025 年向1.6T 產(chǎn)品商業(yè)化發(fā)展前進(jìn)以順應(yīng)AI 發(fā)展。

Arista:云、AI 和數(shù)據(jù)中心核心業(yè)務(wù)發(fā)展勢(shì)頭迅猛。Arista 在2023 年的核心業(yè)務(wù)由云、Al 和數(shù)據(jù)中心產(chǎn)品組成,建立在高度差異化的Arista 可擴(kuò)展操作軟件系統(tǒng)堆棧上,部署了10G、25G、100G、200G 和400G 的速度。

Arista 云網(wǎng)絡(luò)產(chǎn)品提供了節(jié)能、高可用的區(qū)域,而不會(huì)增加冗余成本,因?yàn)閿?shù)據(jù)中心對(duì)前端、后端存儲(chǔ)和計(jì)算集群的帶寬容量和網(wǎng)絡(luò)速度都有很高需求。Arista 預(yù)計(jì)400 和800 千兆以太網(wǎng)將成為Al 后端GPU 集群的重要試點(diǎn),預(yù)計(jì)2025 年實(shí)現(xiàn)Al 網(wǎng)絡(luò)收入至少7.5 億美元。

贊助本站

人工智能實(shí)驗(yàn)室

相關(guān)熱詞: Sora 登場(chǎng) AICG 意味著 什么 OpenAI2 16

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港