展會信息港展會大全

2024 年人工智能的下一步是什么
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-01-07 18:28:51   瀏覽:10220次  

導(dǎo)讀:編者按:MIT 技術(shù)評論 (MIT Technology Review) 的WhatsNext in Tech系列報告給讀者提供對未來產(chǎn)業(yè)技術(shù)發(fā)展趨勢的預(yù)測,近期,該期刊兩位作者MelissaHeikkilWillDouglas Heaven聯(lián)合發(fā)布了Whats Next系列最新報告Whats next for AI in2024《2024 年人工智能的...

編者按:MIT 技術(shù)評論 (MIT Technology Review) 的“What'sNext in Tech”系列報告給讀者提供對未來產(chǎn)業(yè)技術(shù)發(fā)展趨勢的預(yù)測,近期,該期刊兩位作者MelissaHeikkil&WillDouglas Heaven聯(lián)合發(fā)布了“What's Next”系列最新報告“What’s next for AI in2024”《2024 年人工智能的下一步發(fā)展趨勢》。文章回顧了去年的預(yù)測,并強調(diào)了對2024年的幾個關(guān)鍵趨勢進行觀察。首先,生成式人工智能在智能聊天機器人領(lǐng)域的應(yīng)用將變得更為個性化,用戶可定制強大語言模型以滿足特定需求。其次,生成式人工智能將進入視頻領(lǐng)域的第二波浪潮,為影視制作、特效和廣告帶來新的可能性。此外,文章強調(diào)了人工智能生成的選舉虛假信息的傳播,對輿論和選民的影響引發(fā)了深刻的擔(dān)憂。最后,機器人學(xué)家正利用生成式人工智能技術(shù),構(gòu)建更通用、多任務(wù)處理的機器人,為各個領(lǐng)域帶來革命性的改變?傮w而言,文章揭示了生成式人工智能在多個領(lǐng)域的持續(xù)演進,以及相關(guān)技術(shù)對社會、產(chǎn)業(yè)和文化的深遠影響。這些趨勢將塑造未來數(shù)年的科技發(fā)展格局,同時也提出了許多值得思考的問題和挑戰(zhàn)。我們特將該文章編譯出來和各位客戶、合作伙伴朋友分享

就在去年的這個時候,我們做了一些魯莽的事情。在一個一切都在不斷變化的行業(yè)里,我們試圖預(yù)測未來。

我們的表現(xiàn)如何呢?我們對2023年的四個大膽預(yù)測是:聊天機器人的下一個大趨勢將是多模態(tài)的(驗證:目前最強大的大型語言模型,OpenAI的GPT-4和GoogleDeepMind的Gemini,支持文本、圖像和音頻);決策者將制定嚴格的新法規(guī)(驗證:拜登的行政命令于十月發(fā)布,歐洲聯(lián)盟的人工智能法案在十二月終于達成一致);大科技公司將受到開源初創(chuàng)公司的壓力(半對:開源激增,但像OpenAI和Google DeepMind這樣的人工智能公司仍然搶盡風(fēng)頭);人工智能將徹底改變大型制藥行業(yè)(還為時過早:在藥物發(fā)現(xiàn)領(lǐng)域,人工智能革命仍在全力進行,但首批使用人工智能開發(fā)的藥物距離上市還需要一些年時間)。

現(xiàn)在,我們又要來一次。

我們決定忽略那些顯而易見的事實。我們知道大型語言模型將繼續(xù)占據(jù)主導(dǎo)地位。監(jiān)管機構(gòu)將變得更加大膽。從偏見到版權(quán)再到悲觀主義,人工智能的問題將塑造未來幾年內(nèi)研究人員、監(jiān)管機構(gòu)和公眾的議程,不僅僅是在2024年。

相反,我們選擇了一些更具體的趨勢。以下是2024年需要關(guān)注的事項。(明年回來看看我們的表現(xiàn)如何吧。)

01

定制聊天機器人

你有一個聊天機器人!你也有一個聊天機器人!在2024年,那些大舉投資生成式人工智能的科技公司將面臨壓力,需要證明他們可以通過產(chǎn)品盈利。為了做到這一點,人工智能巨頭Google和OpenAI正在大力 s發(fā)展用戶友好的平臺,允許人們定制強大的語言模型并制作符合其特定需求的迷你聊天機器人無需編碼技能。兩者都推出了基于Web的工具,允許任何人成為生成式人工智能應(yīng)用開發(fā)者。

在2024年,生成式人工智能可能會真正對普通非技術(shù)人員有所用處,我們將看到更多人擺弄著數(shù)百萬個小型人工智能模型。最先進的人工智能模型,如GPT-4和Gemini,是多模態(tài)的,意味著它們不僅可以處理文本,還可以處理圖像甚至視頻。這一新的功能可能會解鎖許多新的應(yīng)用。例如,房地產(chǎn)經(jīng)紀人可以上傳先前列表的文本,微調(diào)一個強大的模型,只需點擊按鈕即可生成類似的文本,上傳新列表的視頻和照片,然后簡單地要求定制的人工智能生成房產(chǎn)描述。

但當(dāng)然,這個計劃的成功取決于這些模型是否能可靠工作。語言模型經(jīng)常會編造東西,生成模型充滿偏見。它們也很容易被黑客攻擊,尤其是如果允許它們?yōu)g覽網(wǎng)絡(luò)的話?萍脊旧形唇鉀Q這些問題。當(dāng)新奇感消失時,它們將不得不為客戶提供解決這些問題的方法。

MelissaHeikkil

02

生成式人工智能的第二波將是視頻

令人驚奇的是,奇妙的東西變得如此熟悉的速度。第一批能夠生成逼真圖像的生成式模型在2022年爆紅,并迅速變得司空見慣。諸如OpenAI的DALL-E、Stability AI的StableDiffusion和Adobe的Firefly等工具充斥著互聯(lián)網(wǎng),展示了從教皇穿著巴黎世家到獲獎藝術(shù)品等各種令人驚嘆的圖像。但并非所有都是有趣的:對于每個揮舞著啦啦隊旗的哈巴狗,就有另一個仿制品幻想藝術(shù)或性別刻板印象的作品。

新的前沿是文本轉(zhuǎn)視頻。預(yù)計它將繼續(xù)發(fā)揚文本轉(zhuǎn)圖像的一切優(yōu)點、缺點或丑陋,并加以升級。

一年前,我們首次看到當(dāng)生成式模型被訓(xùn)練用于將多個靜止圖像拼接成幾秒鐘長的視頻剪輯時,它們能做到什么程度。結(jié)果是扭曲而顫動的。但技術(shù)已經(jīng)迅速改善。

Runway是一家制造生成式視頻模型的初創(chuàng)公司(也是共同創(chuàng)造了Stable Diffusion的公司),每隔幾個月就發(fā)布其工具的新版本。其最新模型名為Gen-2,仍然生成僅有幾秒鐘的視頻,但質(zhì)量非常出色。最好的片段幾乎可以與Pixar發(fā)布的相媲美。

Runway成立了一年一度的人工智能電影節(jié),展示了使用各種人工智能工具制作的實驗電影。今年的電影節(jié)獎金總額為60,000美元,最佳的10部電影將在紐約和洛杉磯上映。

頂級制片公司關(guān)注此事并不奇怪。包括派拉蒙和迪士尼在內(nèi)的電影巨頭現(xiàn)在正在探索在整個制作流程中使用生成式人工智能。該技術(shù)被用于將演員的表演與多種外語配音同步。它正在重新定義特效的可能性。在2023年,電影《印第安納瓊斯與命運之輪》中,主演是一位被年輕化的深度偽造哈里森福特。這只是開始。

遠離大屏幕,深度偽造技術(shù)在營銷或培訓(xùn)領(lǐng)域也在蓬勃發(fā)展。例如,總部位于英國的Synthesia制造的工具可以將演員的一次表演轉(zhuǎn)化為無休止的深度偽造頭像流,只需按下按鈕,它們就能朗讀你提供的任何劇本。據(jù)該公司稱,其技術(shù)現(xiàn)在被Fortune 100公司中的44%使用。

這種用微不足道的東西做很多事情的能力引發(fā)了對演員的嚴重問題。對于制片公司對人工智能的使用和濫用的擔(dān)憂成為了去年SAG-AFTRA罷工的核心問題。但該技術(shù)的真正影響才剛剛顯現(xiàn)出來。“電影制作的工藝正在從根本上改變,”獨立電影制片人、Bell & Whistle創(chuàng)意技術(shù)咨詢公司的聯(lián)合創(chuàng)始人Souki Mehdaoui表示。

WillDouglas Heaven

03

人工智能生成的選舉虛假信息將無處不在

如果最近的選舉有什么值得參考的,那么人工智能生成的選舉虛假信息和深度偽造將在2024年創(chuàng)下創(chuàng)紀錄的選民走向投票站的人數(shù)中成為一個巨大的問題。我們已經(jīng)看到政客正在將這些工具武器化。在阿根廷,兩位總統(tǒng)候選人制作了對手的人工智能生成的圖像和視頻,以攻擊對手。在斯洛伐克,自由主義的親歐洲黨領(lǐng)袖的深度偽造視頻傳播如火如荼,威脅要提高啤酒價格并開玩笑涉及兒童色情,這發(fā)生在該國的選舉期間。而在美國,唐納德特朗普則為一個使用人工智能生成帶有種族主義和性別歧視陳詞濫調(diào)的模因的團體喝彩。

雖然很難說這些例子對選舉結(jié)果產(chǎn)生了多大的影響,但它們的大量出現(xiàn)是一個令人擔(dān)憂的趨勢。要辨認在線上的真實情況將變得比以往任何時候都更加困難。在已經(jīng)處于熾熱和兩極分化的政治氛圍中,這可能會帶來嚴重后果。

僅僅幾年前,制作深度偽造視頻需要高級技術(shù)技能,但生成式人工智能使其變得極其簡單和可訪問,而且輸出的結(jié)果看起來越來越逼真。即使是權(quán)威來源也可能被人工智能生成的內(nèi)容所欺騙。例如,聲稱描繪以色列-加沙危機的用戶提交的人工智能生成的圖像已經(jīng)涌入像Adobe這樣的股票圖像市常

即將到來的一年將對那些抵制此類內(nèi)容傳播的人來說至關(guān)重要。追蹤和緩解此類內(nèi)容的技術(shù)仍處于早期開發(fā)階段。水印技術(shù),如Google DeepMind的SynthID,仍然大多是自愿的,而且并非完全防不勝防。社交媒體平臺以拆除虛假信息而著稱的速度明顯較慢。為迎接一場大規(guī)模的實時實驗,以揭穿人工智能生成的虛假新聞,做好準備吧。

MelissaHeikkil

04

多任務(wù)處理的機器人

受到生成式人工智能當(dāng)前繁榮背后的一些核心技術(shù)的啟發(fā),機器人學(xué)家開始構(gòu)建更通用的機器人,能夠執(zhí)行更廣泛的任務(wù)。

在過去幾年的人工智能領(lǐng)域,已經(jīng)出現(xiàn)了從使用多個小型模型,每個模型都經(jīng)過訓(xùn)練以執(zhí)行不同的任務(wù)(識別圖像、繪制圖像、為圖像加標題等),轉(zhuǎn)向訓(xùn)練單一、整體性模型以執(zhí)行所有這些任務(wù)及更多任務(wù)的趨勢。通過向OpenAI的GPT-3展示一些額外的例子(稱為微調(diào)),研究人員可以訓(xùn)練它解決編碼問題、撰寫電影劇本、通過高中生物考試等任務(wù)。多模態(tài)模型,如GPT-4和Google DeepMind的Gemini,既可以解決視覺任務(wù),也可以解決語言任務(wù)。

相同的方法也可以應(yīng)用于機器人,因此不需要訓(xùn)練一個機器人翻煎餅,另一個機器人開門:一個通用模型可以使機器人具備多任務(wù)處理的能力。2023年出現(xiàn)了該領(lǐng)域的幾個工作示例。

在六月,DeepMind發(fā)布了Robocat(去年Gato的更新版本),它通過反復(fù)嘗試生成自己的數(shù)據(jù),以學(xué)習(xí)如何控制許多不同的機器人手臂(而不是一種特定的手臂,這更為典型)。

在十月,該公司推出了另一款機器人通用模型RT-X,以及一個與33個大學(xué)實驗室合作的大型通用訓(xùn)練數(shù)據(jù)集。其他頂級研究團隊,如加利福尼亞大學(xué)伯克利分校的RAIL(機器人人工智能和學(xué)習(xí))團隊,也在研究類似的技術(shù)。

問題在于缺乏數(shù)據(jù)。生成式人工智能依賴于互聯(lián)網(wǎng)規(guī)模的文本和圖像數(shù)據(jù)集。相比之下,機器人幾乎沒有好的數(shù)據(jù)來源,幫助它們學(xué)習(xí)執(zhí)行我們想要它們執(zhí)行的許多工業(yè)或家庭任務(wù)。

紐約大學(xué)的Lerrel Pinto領(lǐng)導(dǎo)著一個致力解決這個問題的團隊。他和他的同事們正在開發(fā)通過反復(fù)試錯讓機器人學(xué)習(xí)的技術(shù),他們在此過程中產(chǎn)生自己的訓(xùn)練數(shù)據(jù)。在一個更為低調(diào)的項目中,Pinto已經(jīng)招募了志愿者,使用iPhone相機安裝在撿垃圾的工具上,收集他們家中周圍的視頻數(shù)據(jù)。大公司在過去幾年中也開始發(fā)布大型機器人訓(xùn)練數(shù)據(jù)集,例如Meta的Ego4D。

這種方法在無人駕駛汽車領(lǐng)域已經(jīng)顯示出了希望。Wayve、Waabo和Ghost等初創(chuàng)公司正在引領(lǐng)一波新的自動駕駛?cè)斯ぶ悄芾顺保褂脝我淮笮湍P蛠砜刂栖囕v,而不是使用多個較小的模型來控制特定的駕駛?cè)蝿?wù)。這使得小型公司能夠迎頭趕上Cruise和Waymo等巨頭。Wayve現(xiàn)在正在倫敦狹窄繁忙的街道上測試其無人駕駛汽車。到處都有機器人將迎來類似的提升。

WillDouglas Heaven

源于硅谷、扎根中國,上海殷泊信息科技有限公司 (MoPaaS) 是中國領(lǐng)先的人工智能(AI)平臺和服務(wù)提供商,為用戶的數(shù)字轉(zhuǎn)型、智能升級和融合創(chuàng)新直接賦能。針對中國AI應(yīng)用和工程市場的需求,基于自主的智能云平臺專利技術(shù),MoPaaS 在業(yè)界率先推出新一代開放的AI平臺為加速客戶AI技術(shù)創(chuàng)新和應(yīng)用落地提供高效的算力優(yōu)化和規(guī)模化AI模型開發(fā)、部署和運維 (ModelOps) 能力和服務(wù);特別是針對企業(yè)應(yīng)用場景,提供包括大模型遷移適配、提示工程以及部署推理的端到端 LLMOps方案。MoPaaS AI平臺已經(jīng)服務(wù)在工業(yè)制造、能源交通、互聯(lián)網(wǎng)、醫(yī)療衛(wèi)生、金融技術(shù)、教學(xué)科研、政府等行業(yè)超過300家國內(nèi)外滿意的客戶的AI技術(shù)研發(fā)、人才培養(yǎng)和應(yīng)用落地工程需求。MoPaaS致力打造全方位開放的AI技術(shù)和應(yīng)用生態(tài)。MoPaaS 被Forrester評為中國企業(yè)級云平臺市場的卓越表現(xiàn)者 (Strong Performer)。

贊助本站

人工智能實驗室

相關(guān)熱詞: 2024 人工智能 下一步 是什么

AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港