展會(huì)信息港展會(huì)大全

“元年”之后,生成式AI又將走向何方:多模態(tài)、開源化、強(qiáng)監(jiān)管成關(guān)鍵詞
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-12-28 18:52:05   瀏覽:6938次  

導(dǎo)讀:每經(jīng)記者:李孟林 一年多以前,如果有人告訴你,他可以用一句話就能在數(shù)秒之間生成一首詩,一幅畫,甚至一部電影,你肯定覺得是天方夜譚,腦洞開得太大。然而,隨著ChatGPT的出現(xiàn),這樣的想象步入了現(xiàn)實(shí)。 2023年,毫無疑問是AI的一年。在這一年里,以ChatGP...

每經(jīng)記者:李孟林

一年多以前,如果有人告訴你,他可以用一句話就能在數(shù)秒之間生成一首詩,一幅畫,甚至一部電影,你肯定覺得是天方夜譚,腦洞開得太大。然而,隨著ChatGPT的出現(xiàn),這樣的想象步入了現(xiàn)實(shí)。

2023年,毫無疑問是AI的一年。在這一年里,以ChatGPT為首的生成式AI技術(shù)在全球點(diǎn)燃研發(fā)浪潮,各大科技公司競(jìng)相入局,從文本到圖像,從音樂到視頻,從游戲到教育,無一領(lǐng)域不在大力推動(dòng)AI技術(shù)的應(yīng)用,呈現(xiàn)出“百花齊放”的生動(dòng)局面。

生成式AI企業(yè)也獲得了前所未有的關(guān)注和投資,“盤活”了創(chuàng)投行業(yè)。據(jù)AI投資者 Nathan Benaich 和 Air Street Capital 團(tuán)隊(duì)制作的《2023年AI現(xiàn)狀》報(bào)告,截至2023年10月2日,專注研發(fā)生成式AI應(yīng)用的初創(chuàng)企業(yè)今年累計(jì)獲得了近180億美元的風(fēng)投資金,較2022年整年增長超360%。

圖片來源:《2023年AI現(xiàn)狀》報(bào)告截圖

然而,這一年也出現(xiàn)了一些戲劇性事件,如AI大佬聯(lián)名發(fā)表呼吁暫停研究的公開信以及OpenAI“宮斗”,引發(fā)人們對(duì)生成式AI的質(zhì)疑和擔(dān)憂。這些事件讓外界看到了生成式AI的另一面,意識(shí)到了生成式AI的復(fù)雜性和監(jiān)管的必要性。

進(jìn)入2024年,AI注定仍將成為全球關(guān)注的焦點(diǎn)。CNBC技術(shù)執(zhí)行委員會(huì)于今年11月底及12月初對(duì) 22 名頂級(jí)技術(shù)官員進(jìn)行的抽樣調(diào)查顯示,沒有一名受訪者表示他們不會(huì)在2024年進(jìn)行新的AI投資。其中,超過一半(59%)的受訪者明確稱,其所在公司正在加速對(duì)AI相關(guān)能力的新投資。其余受訪者稱正在評(píng)估AI領(lǐng)域的新投資,不過態(tài)度相對(duì)更謹(jǐn)慎。

從具體的方向看,多位業(yè)界專家在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)認(rèn)為,多模態(tài)模型與視頻生成能力、開源閉源之爭和AI智能體將最受關(guān)注,同時(shí)AI的安全性與監(jiān)管問題將繼續(xù)成為熱點(diǎn)話題。

狂飆突進(jìn)的AI:全球AI獨(dú)角獸超470個(gè),企業(yè)總價(jià)值達(dá)7.5萬億美元

2023年最令我吃驚的事情是,研究界的東西轉(zhuǎn)化為商業(yè)產(chǎn)品的速度太快了:Adobe的Firefly、百度的文心一言、谷歌的Bard、微軟的Copilot等等。我們正在探索這些東西的更多用處,而對(duì)終端用戶而言,這些工具可以協(xié)助完成機(jī)械性的任務(wù)、快速地綜合信息等,”馬里蘭大學(xué)計(jì)算機(jī)科學(xué)教授、微軟資深首席研究員哈爾道梅三世(Hal Daumé III)對(duì)《每日經(jīng)濟(jì)新聞》記者表示。

《2023年AI現(xiàn)狀》報(bào)告數(shù)據(jù)顯示,截至2023年9月19日,全球AI獨(dú)角獸數(shù)量達(dá)473個(gè),其中美國有315個(gè),中國有70個(gè),英國有27個(gè),全球AI獨(dú)角獸企業(yè)的總價(jià)值達(dá)7.5萬億美元,其中美國AI獨(dú)角獸企業(yè)總價(jià)值達(dá)5.9萬億美元,中國AI獨(dú)角獸企業(yè)總價(jià)值為1.3萬億美元,英國AI獨(dú)角獸企業(yè)總價(jià)值為1550億美元。

圖片來源:《2023年AI現(xiàn)狀》報(bào)告截圖

2023年,OpenAI仍然保持著行業(yè)領(lǐng)頭羊和風(fēng)向標(biāo)的地位,3月發(fā)布多模態(tài)大模型GPT-4后,又將重心放在商業(yè)化嘗試和生態(tài)建設(shè)上,11月,OpenAI召開了第一次開發(fā)者大會(huì),展露出打造生態(tài)的野心。

傳統(tǒng)的科技巨頭也各顯神通,試圖在這一風(fēng)口領(lǐng)域拿下更多話語權(quán)。

圖片來源:每經(jīng)編輯 蘭素英制圖

微軟1月份就快速宣布將向OpenAI投資100億美元,希望進(jìn)一步“拴緊”合作關(guān)系,同時(shí)也在加緊自家AI工具的發(fā)布和升級(jí),陸續(xù)推出了AI賦能的Bing Chat,新的Edge瀏覽器,以及辦公軟件的Copilot套件。

谷歌在AI上頗有“起了個(gè)大早,趕了個(gè)晚集”的焦慮。2月,谷歌匆忙推出ChatGPT對(duì)手Bard,卻在演示過程中出現(xiàn)錯(cuò)誤而導(dǎo)致股價(jià)一日大跌8%。為了加快速度,谷歌4月份將旗下兩個(gè)主要的人工智能研究部門GoogleBrain和DeepMind合并為Google DeepMind。12月,谷歌推出了GPT-4的對(duì)標(biāo)大模型Gemini,并自稱在多個(gè)測(cè)試上性能優(yōu)于前者。

Facebook母公司Meta則重點(diǎn)強(qiáng)調(diào)自家大模型的開源特性。7月,Meta發(fā)布大語言模型Llama 2,宣布向所有開發(fā)和商用開源,與谷歌和OpenAI展開錯(cuò)位競(jìng)爭。在AI上聲量略小的亞馬遜,則重注押寶Anthropic,9月份宣布向后者投資40億美元。

站在一線從業(yè)者的角度,Lightning AI的首席AI教育官塞巴斯蒂安拉什卡(Sebastian Raschka)對(duì)《每日經(jīng)濟(jì)新聞》記者總結(jié)了2023年AI的發(fā)展,“2023年可以說是大語言模型之年,似乎所有人的注意力都在這上面。這一年,我們看到了各類提升大模型效率和適配性的方法;微調(diào)大模型方法和連接網(wǎng)絡(luò)內(nèi)容的‘檢索增強(qiáng)生成’技術(shù);以Stable Video Diffusion和Pika 1.0為代表的文字生成視頻技術(shù)的熱潮等。”

生成式AI技術(shù)的發(fā)展不僅創(chuàng)造了新的機(jī)遇,也改變了各行各業(yè)的工作模式,以及企業(yè)為客戶提供價(jià)值的方式,提高了生產(chǎn)力。

2024年,AI發(fā)展將呈現(xiàn)三大趨勢(shì)

精彩紛呈的2023年被普遍視為生成式AI的元年,科技產(chǎn)業(yè)的圖景已經(jīng)被深刻改變。2024年,AI行業(yè)必將迎來巨大的變革。

12月25日,OpenAI CEO阿爾特曼向網(wǎng)友征集對(duì)OpenAI 2024年的期望,下一代多模態(tài)大模型GPT-5、更好的GPTs應(yīng)用、視頻和開源等內(nèi)容成為最常見的答案。實(shí)際上,多模態(tài)模型、視頻生成、AI智能體(Agents)也是業(yè)內(nèi)人士展望2024年時(shí)的高頻詞。而隨著AI前所未有的發(fā)展態(tài)勢(shì)以及在各大領(lǐng)域的滲透,如何保障和監(jiān)管其可持續(xù)、負(fù)責(zé)任的發(fā)展也是接下來的重大課題之一。

趨勢(shì)一:視頻生成和智能體

2024年,我們會(huì)越來越依賴多模態(tài)模型,”艾倫人工智能研究院創(chuàng)始CEO奧倫伊奇奧尼對(duì)《每日經(jīng)濟(jì)新聞》記者表示。

這也是《福布斯》所展望的2024年AI領(lǐng)域的發(fā)展趨勢(shì)之一。該雜志指出,AI領(lǐng)域一個(gè)關(guān)鍵性的創(chuàng)新是多模態(tài)生成式AI,此類系統(tǒng)能處理文本、聲音、旋律和視覺信號(hào)等各種輸入信息,并將其融合起來進(jìn)行綜合理解。隨著多模態(tài)技術(shù)的不斷發(fā)展,AI模型將迎接更加復(fù)雜多樣化的交互場(chǎng)景,有望在智能家居、智慧城市、醫(yī)療診斷、自動(dòng)駕駛等領(lǐng)域打開全新的應(yīng)用空間。

視頻生成也是2024年值得關(guān)注的熱點(diǎn)。塞巴斯蒂安拉什卡告訴記者,“StableVideoDiffusion和Pika1.0這類文本生成視頻工具的發(fā)布意味著擴(kuò)散模型又回來了。”

這類產(chǎn)品的“出圈”勢(shì)必會(huì)將加速視頻生成領(lǐng)域的迭代。除AI初創(chuàng)企業(yè)外,谷歌也在這一領(lǐng)域迅速跟進(jìn),先是與美國國家工程院院士、斯坦福大學(xué)教授李飛飛及其團(tuán)隊(duì)合作推出AI視頻生成模型W.A.L.T,后又發(fā)布了一個(gè)全新的視頻生成模型VideoPoet,而且無需特定數(shù)據(jù)便可生成視頻。

雖然生成式AI沿著生成文字、圖像再到視頻不斷升級(jí),但它與人類互動(dòng)還停留在輸入和輸出內(nèi)容的階段,而還無法真正幫人類在現(xiàn)實(shí)生活中做出行動(dòng),比如預(yù)定餐廳、購買物品等。

“2024年,我們將看到更加復(fù)雜的AI智能體,它們能代替用戶做出行動(dòng)。”奧倫伊奇奧尼對(duì)《每日經(jīng)濟(jì)新聞》記者預(yù)測(cè)道。

實(shí)際上,OpenAI在開發(fā)者大會(huì)上推出的定制GPTs和一系列輔助開發(fā)工具被視為打造AI智能體的先行部署。比爾蓋茨11月也曾撰文指出,AI智能體將在未來五年里徹底改變我們使用計(jì)算機(jī)的方式。在他的暢想中,用戶只需用自然語言告知自己的需求,計(jì)算機(jī)就會(huì)自動(dòng)跨越不同軟件程序完成任務(wù),AI智能體將成為每個(gè)人都能擁有的“遠(yuǎn)遠(yuǎn)超出當(dāng)今技術(shù)的AI驅(qū)動(dòng)個(gè)人助理”。

趨勢(shì)二:開源或?qū)⒊綄S心P?/strong>

12月中旬,Meta 首席 AI 科學(xué)家、圖靈獎(jiǎng)獲得者 Yann LeCun援引方舟投資研究團(tuán)隊(duì)的一張2024年AI趨勢(shì)圖表感嘆稱,“開源人工智能模型正走在超越專有模型的路上。”

圖片來源:X.com

開源與專有模型的路線之爭頗有當(dāng)年安卓與iOS的感覺。12月,Meta和IBM領(lǐng)頭成立了“AI聯(lián)盟”,成員包括40多家企業(yè)和學(xué)術(shù)機(jī)構(gòu),致力于推動(dòng)發(fā)展AI的開放路線,在2023年風(fēng)頭正勁的OpenAI、微軟、谷歌和英偉達(dá)則不在其中。

方舟投資(Ark Invest)的團(tuán)隊(duì)認(rèn)為,開源大模型在性能上落后閉源大模型6到8個(gè)月,但正在逐步縮小差距,隨著谷歌和OpenAI等公司越來越少地公布其模型的最新信息,開源大模型將對(duì)其商業(yè)模式構(gòu)成挑戰(zhàn)。如上圖所示,開源模型的性能在不斷追趕專有模型。這可能意味著在不久的將來,開源模型有望在性能上與專有模型平起平坐,甚至超越。

不過,哈爾道梅三世在采訪中對(duì)《每日經(jīng)濟(jì)新聞》記者表示,現(xiàn)在自稱開源的大模型只在限制性許可下公布了模型權(quán)重和代碼等內(nèi)容,實(shí)際上離真正的開源還有距離。“我們需要的是開放的數(shù)據(jù)集、基礎(chǔ)設(shè)施和使用許可,我希望AI聯(lián)盟能往這個(gè)方向發(fā)展,但也并不是每家機(jī)構(gòu)會(huì)認(rèn)可這種做法。只要我們有很好的開放模型,人們可以自由選擇,剩下的就交給市場(chǎng)力量來發(fā)揮作用吧。”

以開源大模型結(jié)合內(nèi)部數(shù)據(jù)打造定制化的AI應(yīng)用,也是AI走向落地的重要方向之一。Meta 的開源大模型 LLaMA 系列就因其快速迭代、可定制性和隱私性的特點(diǎn)而備受青睞。在AI應(yīng)用開發(fā)中結(jié)合內(nèi)部數(shù)據(jù),可在很大程度上解決通用大模型產(chǎn)生的不準(zhǔn)確或不合理回答的問題。

在科學(xué)研究領(lǐng)域,比如地球和大氣科學(xué)、天文學(xué)和高能物理學(xué),我們有大量的數(shù)據(jù)。我認(rèn)為在這些領(lǐng)域可能會(huì)有很多動(dòng)作。此外,數(shù)據(jù)中間商也有收集和出售很多個(gè)人數(shù)據(jù),雖然我們可能不會(huì)看到這些數(shù)據(jù)被公開用來訓(xùn)練模型,但可能將產(chǎn)生很多商業(yè)案例,其中會(huì)有好的應(yīng)用,比如像英偉達(dá)那樣用聊天機(jī)器人來管理公司文件,也可能會(huì)有壞的應(yīng)用,比如追蹤員工的郵件。”

趨勢(shì)三:AI監(jiān)管將加強(qiáng)

在AI技術(shù)高歌猛進(jìn)的同時(shí),科技圈也發(fā)生了一些戲劇性的事件:前有上千名科技大佬和AI專家聯(lián)名簽署公開信,呼吁暫停比GPT-4更強(qiáng)大的AI系統(tǒng)訓(xùn)練之后,后有震驚業(yè)界的因安全和道德之爭而引發(fā)的OpenAI“宮斗”事件。

知名AI專家李飛飛表示,2023年是AI發(fā)展的“拐點(diǎn)”,這一年AI帶來了深刻改變,公眾對(duì)AI的認(rèn)知度也上升了,但這一年“也顯示出這項(xiàng)技術(shù)有多么混亂”。

正如歷史上所有的顛覆性技術(shù)一樣,人類需要時(shí)間探索如何與AI相處。AI的安全性和監(jiān)管框架必將成為2024年的熱點(diǎn)話題。

斯坦福大學(xué)以人為本AI中心副主任詹姆斯藍(lán)迪(James Landay)認(rèn)為,由于AI視頻生成技術(shù)進(jìn)一步提高,“我們將看到人們‘說’一些他們根本沒說過的話的視頻廣泛傳播,消費(fèi)者需要認(rèn)識(shí)到這一點(diǎn),投票人也需要認(rèn)識(shí)到這一點(diǎn)。”

尤為值得注意的是,2024年美國將舉行大選,如何應(yīng)對(duì)生成式AI帶來的虛假信息沖擊,將是一個(gè)重要看點(diǎn)。

實(shí)際上,截至2023年底,我們已經(jīng)看到AI監(jiān)管有了不少行動(dòng)。阿爾特曼重返OpenAI之后,第一個(gè)大動(dòng)作就是發(fā)布最新安全指南,賦予董事會(huì)推翻公司領(lǐng)導(dǎo)層發(fā)布AI系統(tǒng)的否決權(quán)。12月,歐盟制定了《人工智能法案》,開始全面監(jiān)管AI。

“我想美國明年應(yīng)該有比較大的監(jiān)管出臺(tái),這一領(lǐng)域的監(jiān)管會(huì)越來越嚴(yán),”曾參加拜登的AI業(yè)界面談的奧倫伊奇奧尼對(duì)《每日經(jīng)濟(jì)新聞》記者表示。美國總統(tǒng)拜登曾召集各大科技公司首腦,讓行業(yè)承諾自發(fā)約束AI,后在10月又簽署了一份關(guān)于AI的總統(tǒng)行政令,但缺乏相關(guān)國會(huì)立法。

每日經(jīng)濟(jì)新聞

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港