樱花草视频在线观看高清版mv,无码中文字幕在线

OpenAI首席技術官最新透露：Sora預計將在今年發(fā)布，計劃加入語音功能，還有這些“干貨”

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-15 09:26:43 瀏覽：7528次

導讀：每經(jīng)編輯：杜宇 OpenAI似乎已經(jīng)在為Sora降世預熱了。當?shù)貢r間3月13日周三，OpenAI首席技術官米拉穆拉蒂（Mira Murati）接受了《華盛頓郵報》的視頻專訪。穆拉蒂在接受采訪時透露，目前利用Sora生成視頻的成本非常高，團隊正在優(yōu)化技術，預計將在今年正式...

每經(jīng)編輯：杜宇

OpenAI似乎已經(jīng)在為Sora降世預熱了。

當?shù)貢r間3月13日周三，OpenAI首席技術官米拉穆拉蒂（Mira Murati）接受了《華盛頓郵報》的視頻專訪。

穆拉蒂在接受采訪時透露，目前利用Sora生成視頻的成本非常高，團隊正在優(yōu)化技術，預計將在今年正式發(fā)布。

穆拉蒂透露，OpenAI人工智能文生視頻大模型Sora即將于今年晚些時候正式向公眾發(fā)布，OpenAI計劃最終加入音頻功能，以使場景更為真實，同時還將允許用戶編輯Sora生成的視頻內容。

除此之外，穆拉蒂還回答了Sora的特別之處、如何修正瑕疵、是否會包含音頻、訓練數(shù)據(jù)來自哪里等若干問題。給出的答案有的籠統(tǒng)，有的不乏誠意。

Sora如何“化文字為神奇”？請你想象一幕場景：“一條美人魚和她的螃蟹伙伴，正在一起瀏覽智能手機……”

作為這場媒體采訪的“福利”，主持人獲得了讓Sora將其提供的多組文本提示，轉化為視頻圖像的機會，而以上的這一幕，便是Sora提供的視頻中的一鄭

圖片來源：視頻截圖

Sora究竟是如何實現(xiàn)這一轉換的呢？穆拉蒂表示，盡管解釋美人魚的進化可能都要比解釋“擴散模型”(diffusion models)的內部運作容易得多，但簡而言之便是：人工智能模型分析了大量視頻，學會了識別物體和動作。然后，當你給它一個文字提示時，它就會勾勒出整個場景，然后填充每一鄭

在被問及OpenAI為Sora使用了哪些訓練數(shù)據(jù)時，穆拉蒂指出，“我們使用了公開數(shù)據(jù)和授權數(shù)據(jù)”。

在另外一段視頻里，主持人要求Sora制作一段她更為符合這場采訪的內容：“兩位30多歲、有著棕色頭發(fā)的職業(yè)女性，在一個光線充足的演播室里坐下來接受新聞采訪。”

圖片來源：視頻截圖

最終，在Sora交出的“作業(yè)”里，無論是兩位女性嘴型和頭發(fā)的動捕，還是皮夾克上的細節(jié)，一切看起來都那么真實。Murati指出，這段20秒的720p分辨率短片，Sora花了幾分鐘才制作完成，但目前還未能支持配備音效。

但穆拉蒂已承諾，他們計劃最終會添加聲音。

Murati還表示，當前Sora生成視頻的成本遠高于該公司的圖像生成器Dall-E。不過，在未來向公眾正式發(fā)布時，OpenAI將進行優(yōu)化，以降低對算力的需求。

北京時間2月16日，OpenAI發(fā)布文生視頻模型Sora，效果驚艷，引爆全球。此時距離OpenAI推出ChatGPT，開啟生成式AI時代，僅僅過去了14個月時間，AI的進化速度令人震驚。

在Sora生成的視頻里，女士身著黑色皮衣、紅色裙子在霓虹街頭行走，不僅主體連貫穩(wěn)定，還有多鏡頭，包括從大街景慢慢切入到對女士的臉部表情的特寫，以及潮濕的街道地面反射霓虹燈的光影效果。

圖片來源：視頻截圖

Sora的研究結果表明，擴展視頻生成模型是構建物理世界通用模擬器一條極具前景的途徑，它使人工智能理解和模擬運動中的物理世界邁向了一個新的高度。

有業(yè)內人士預言，通用人工智能（AGI）將比預期更早到來，產(chǎn)業(yè)差距將拉大。此外，文生視頻所帶來的顛覆性影響引發(fā)了人們的擔憂，亦有遠慮者就真實與虛擬間模糊的邊界反復預警。但少有爭議的一點是，Sora被認為有望推動AI應用加速落地。

與此同時，Sora的誕生引發(fā)了人們對于AI未來發(fā)展的更多展望。隨著技術的不斷進步，AI將在更多領域發(fā)揮更大的作用。無論是工業(yè)生產(chǎn)、教育培訓還是娛樂休閑等領域，AI都將為人類帶來更多的驚喜和可能性。

2月16日，360創(chuàng)始人周鴻發(fā)布微博提到自己對Sora的看法，周鴻認為，Sora的誕生意味著AGI（通用人工智能）實現(xiàn)可能從10年縮短至一兩年。

談到Sora最大的優(yōu)勢，周鴻表示，以往文生視頻軟件都是在2D平面上對圖形元素進行操作，可以把視頻看成是多個真實圖片的組合，并沒有真正掌握這個世界的知識。但Sora產(chǎn)生的視頻里，它能像人一樣理解坦克是有巨大沖擊力的，坦克能撞毀汽車，而不會出現(xiàn)汽車撞毀坦克這樣的情況，“這次OpenAI利用它的大語言模型優(yōu)勢，讓Sora實現(xiàn)了對現(xiàn)實世界的理解和對世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實的，才能跳出2D的范圍模擬真實的物理世界。”

周鴻提到，有了大模型技術作為基礎，再加上人類知識的引導，可以創(chuàng)造各個領域的超級工具，例如在生物醫(yī)學、蛋白質、基因研究，包括物理、化學、數(shù)學的學科研究上，大模型都會發(fā)揮作用。

“一旦人工智能接上攝像頭，把所有的電影都看一遍，把YouTube上和TikTok的視頻都看一遍，對世界的理解將遠遠超過文字學習，一幅圖勝過千言萬語，這就離AGI真的就不遠了，不是10年20年的問題，可能一兩年很快就可以實現(xiàn)。”周鴻感慨。

每日經(jīng)濟新聞綜合OpenAI官網(wǎng)、每日經(jīng)濟新聞、公開資料

每日經(jīng)濟新聞

相關熱詞： OpenAI 首席技術最新透露 Sora 預計今年

OpenAI首席技術官最新透露：Sora預計將在今年發(fā)布，計劃加入語音功能，還有這些“干貨”
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-15 09:26:43 瀏覽：7528次

相關內容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內容

在線客服

熱門欄目HotCates

關于我們

版權聲明

OpenAI首席技術官最新透露：Sora預計將在今年發(fā)布，計劃加入語音功能，還有這些“干貨” 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-15 09:26:43 瀏覽：7528次

相關內容

AiLab云推薦

最新資訊

本月熱點

熱門排行

推薦內容

在線客服

熱門欄目HotCates

關于我們

版權聲明

OpenAI首席技術官最新透露：Sora預計將在今年發(fā)布，計劃加入語音功能，還有這些“干貨”
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-03-15 09:26:43 瀏覽：7528次