劃重點(diǎn)
01RTE2024第十屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)上,AI企業(yè)創(chuàng)始人熱議AI的6000億美元難題,從基礎(chǔ)設(shè)施到商業(yè)化落地。
02Lepton AI創(chuàng)始人兼首席執(zhí)行官賈揚(yáng)清表示,同等尺寸的模型能力會(huì)越來(lái)越強(qiáng),開(kāi)源架構(gòu)的應(yīng)用會(huì)越來(lái)越普遍。
03然而,大模型訓(xùn)練和推理的成本問(wèn)題仍備受關(guān)注,面壁智能聯(lián)合創(chuàng)始人曾國(guó)洋認(rèn)為,算力成本優(yōu)化會(huì)最終轉(zhuǎn)化為訓(xùn)練更強(qiáng)大的模型。
04此外,AI安全和倫理問(wèn)題引發(fā)討論,OpenAI解散其聚集于AI安全研究的“AGI Readiness”團(tuán)隊(duì)。
05聲網(wǎng)宣布與MiniMax正在打磨中國(guó)第一個(gè)Realtime API,音視頻多模態(tài)模型在實(shí)際應(yīng)用潛力受到關(guān)注。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
新京報(bào)貝殼財(cái)經(jīng)訊(記者白金蕾 陳維城)10月25日至26日,由RTE開(kāi)發(fā)者社區(qū)和聲網(wǎng)聯(lián)合主辦的RTE2024第十屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在京舉行。會(huì)上一場(chǎng)由Lepton AI創(chuàng)始人兼首席執(zhí)行官賈揚(yáng)清,MiniMax合伙人魏偉,面壁智能聯(lián)合創(chuàng)始人、首席技術(shù)官曾國(guó)洋,Hugging Face工程師王鐵震等組成的針對(duì)“AI的6000億美元難題 :從基礎(chǔ)設(shè)施到商業(yè)化落地”的圓桌論壇,引發(fā)業(yè)界關(guān)注。
“AI的6000億美元難題”起源于紅杉資本的合伙人 David Cahn(大衛(wèi)卡恩)的文章,他認(rèn)為:AI(人工智能)基礎(chǔ)設(shè)施的巨額投資和實(shí)際收入之間差距過(guò)大,人工智能將要到達(dá)泡沫的臨界點(diǎn);AI可能是下一個(gè)變革性的技術(shù)浪潮,GPU(圖形處理器)計(jì)算價(jià)格的下降,實(shí)際上對(duì)長(zhǎng)期創(chuàng)新和初創(chuàng)公司是有利的,而投資者會(huì)受損。
RTE2024第十屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)。圖|受訪者供圖
針對(duì)AI的基礎(chǔ)設(shè)施建設(shè),賈揚(yáng)清分享了兩個(gè)核心觀點(diǎn):同等尺寸的模型,能力會(huì)越來(lái)越強(qiáng),尤其是通過(guò)蒸餾、壓縮等技術(shù),現(xiàn)在的LLama 3.2 3B模型甚至可以和以前的LLama 70B模型能力相近;除了極少數(shù)頭部公司之外,越來(lái)越多的企業(yè)會(huì)采用“開(kāi)源+精調(diào)”來(lái)做下一代模型,因此開(kāi)源架構(gòu)的應(yīng)用會(huì)越來(lái)越普遍。
“開(kāi)源模型的優(yōu)勢(shì)是生態(tài)和社區(qū),從實(shí)際應(yīng)用角度,很多人找個(gè)開(kāi)源模型然后微調(diào)是可以用的,但用開(kāi)源模型解決所有問(wèn)題是不夠的。”王鐵震說(shuō),“我們將在未來(lái)看到越來(lái)越多Infra(基礎(chǔ)設(shè)施)和Realtime(實(shí)時(shí)處理) 的工作,大家不僅需要關(guān)注開(kāi)源模型本身,還需要重視開(kāi)源模型的基礎(chǔ)設(shè)施和數(shù)據(jù)閉環(huán),才能把開(kāi)源模型跑得更好、更快。Realtime 需要TTS(文本到語(yǔ)音),也需要大模型,如果能夠通過(guò)一些方式放在一起,放在邊緣側(cè)、離用戶更近的地方,才能產(chǎn)生非常好的效果。”
應(yīng)該如何看到大模型訓(xùn)練和推理的成本問(wèn)題?曾國(guó)洋分享到,“隨著技術(shù)的前進(jìn),算力一定會(huì)越來(lái)越便宜,相同能力的模型規(guī)模也會(huì)越來(lái)越小,但算力成本優(yōu)化會(huì)最終轉(zhuǎn)化為訓(xùn)練更強(qiáng)大的模型。真正達(dá)到 AGI (通用人工智能)水平之前,我們只能感受到模型在變得越來(lái)越強(qiáng),很難感受到成本的變化。”他還提到,由于面壁智能是做端側(cè)模型的,所以很關(guān)注如何讓模型在端上跑得更快,在實(shí)際部署過(guò)程中,他們會(huì)用各種量化壓縮甚至是稀疏化方法去優(yōu)化實(shí)際部署的開(kāi)銷。
賈揚(yáng)清也指出成本不是一個(gè)考量因素。他判斷,推理成本一年內(nèi)會(huì)降到現(xiàn)在的十分之一,創(chuàng)業(yè)者在構(gòu)建應(yīng)用時(shí)可以按照做一個(gè)應(yīng)用成本是目前十分之一來(lái)進(jìn)行成本核算,看能不能做,包括模型、硬件和應(yīng)用在上量后,也都是可以降低成本的。
近期有報(bào)道稱,OpenAI正在解散其聚集于AI安全研究的“AGI Readiness”團(tuán)隊(duì)。在場(chǎng)的AI企業(yè)創(chuàng)始人是如何看待AI安全和倫理問(wèn)題的?賈揚(yáng)清舉例稱,目前的飛機(jī)有很多安全需求,但造火箭就被給予了更多靈活性。所以他猜測(cè),OpenAI可能是為了更好地先期發(fā)展,也可能是覺(jué)得AI安全沒(méi)有跳出傳統(tǒng)的安全范疇,傳統(tǒng)的數(shù)據(jù)安全、云安全已經(jīng)足夠保障了。
王鐵震表示,現(xiàn)在擔(dān)心AI取代人類是比較早的,但是AI已經(jīng)對(duì)一些行業(yè)產(chǎn)生了不好影響,比如視頻以假亂真的影響,包括對(duì)青少年心理的影響,而這里創(chuàng)業(yè)的機(jī)會(huì)也是非常多的。
活動(dòng)現(xiàn)場(chǎng),聲網(wǎng)宣布與MiniMax正在打磨中國(guó)第一個(gè)Realtime API (實(shí)時(shí)處理應(yīng)用程序接口)。那么,應(yīng)該如何看待音視頻多模態(tài)模型的實(shí)際應(yīng)用潛力?魏偉表示,隨著多模態(tài)的出現(xiàn),生成式人工智能的邊界一定會(huì)被繼續(xù)拓展,并加速這一產(chǎn)業(yè)的變革。從產(chǎn)品和用戶服務(wù)過(guò)程中魏偉發(fā)現(xiàn),文本、語(yǔ)音、音樂(lè)、視頻這些模型可以很好地幫助藝術(shù)、影視、音樂(lè)等領(lǐng)域的創(chuàng)作者極大地提高效率,并為他們提供新的思路和方法。
王鐵震也認(rèn)為,如果視頻生成的效果,能超過(guò)電影級(jí)別的效果,而且不需要多次生成,哪怕價(jià)格高,也有人愿意嘗試。
校對(duì) 劉軍