劃重點
01零一萬物發(fā)布了全新SOTA旗艦模型Yi-Lightning,超越GPT-4o,位居世界第一梯隊大模型公司之列。
02Yi-Lightning在中文子榜單上排名世界第二,與o1-mini等模型并列。
03為此,零一萬物采用Mixture of Experts(MoE)混合專家模型架構,多階段訓練模式和混合注意力機制,降低訓推成本。
04同時,零一萬物與阿里云、360等頭部企業(yè)達成合作,推進toB業(yè)務。
05除此之外,零一萬物推出AI 2.0數(shù)字人,提供動作訓練、表情生成等能力,以及AI 2.0門店短視頻解決方案。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
預訓練成本太高,一些公司快要扛不住了;內(nèi)卷得越來越厲害,各家廠商都是賠錢賺吆喝……在最近國內(nèi)大模型行業(yè)暗流涌動的時候,零一萬物發(fā)布了全新 SOTA 旗艦模型亮相,中國大模型中首度超越 GPT-4o,正面辟謠瘋傳的流言:絕不放棄預訓練,而且做得又快又好。關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察超越 GPT-4o,追平 Grok,國內(nèi)大模型的第一次在對大模型的測評中,LMSYS Org 發(fā)布的 Chatbot Arena,以「盲測」機制著稱,是最能反映用戶體驗的測評標準之一。這一次,零一萬物的 Yi-Lightning,排名世界第六,中國第一,穩(wěn)居世界第一梯隊大模型公司之列。其中,在中文子榜單上,Yi-Lightning 超越了 xAI 發(fā)布的 Grok-2-08-13、智譜發(fā)布的 GLM-4-Plus 等國內(nèi)外優(yōu)質模型,與 o1-mini 等模型并列排名世界第二。
在零一萬物召開的線上發(fā)布會中,李開復展示了一段不同模型對莎士比亞作品《李爾王》的翻譯。Yi-Lightning 在結合上下文、轉譯微妙的語義方面格外突出,展現(xiàn)了出色的中英互通能力。而這些,恰恰與之前的風傳相反:預訓練功不可沒。上周國內(nèi)的大模型行業(yè)傳出風聲:國內(nèi)部分模型公司,打算放棄成本高昂的預訓練,不再和國外大廠硬拼零一萬物是被猜測是其中打算放棄的公司之一!高@個事情我們就正式辟謠,這個理解是錯誤的!估铋_復在發(fā)布會上說。他表示,GPT 新發(fā)布 o1 之后,的確帶來了新靈感,「一年半以前大家覺得大模型最厲害的地方就是預訓練,一年以后發(fā)現(xiàn) Post train 也是同樣重要,這感謝 OpenAI 點醒我們這一點!共贿^,后訓練的重要性變高,不代表要徹底放棄預訓練。
在 Yi-Lightning 的訓練過程中,采用 Mixture of Experts(MoE)混合專家模型架構,同時改進了單階段訓練,使用了多階段的訓練模式,并且采用了混合注意力機制(Hybrid Attention)。在保持模型性能接近最優(yōu)的同時,盡可能減少激活參數(shù)的數(shù)量以降低訓推成本,提高推理速度!钢袊牧掖竽P凸,只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的!估铋_復說!负芏嗳藛栔袊念A訓練是否落后美國?我們也坦誠中國是落后美國,但有人說落后十年、二十年,今天我們可以用非常精確的數(shù)字來算:GPT4o 在 5 月做出來的模型,我們在 10 月的今天已經(jīng)把它打敗了。如果真的算中國趕超美國有多遠的距離,至少,零一萬物離 OpenAI 的模型,只差五個月!
在低價面前,一定是對性能的保證看得出來,在對于模型訓練的規(guī)劃上,零一萬物仍然在「;步ā沟膽(zhàn)略路徑上穩(wěn)定前進。有所變化的,是對商業(yè)化的理解。自從五個月前發(fā)布千億參數(shù)模型 Yi-Large 之后,零一萬物相繼和阿里云、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業(yè)達成合作,toB 的路子越走越寬。「SaaS 在國內(nèi),還是一直有很大的問題!估铋_復解釋道,SaaS 自身有很多不同的模式,比如計量,比如訂閱,比如分成,都很可持續(xù),但在國內(nèi)并沒有一個普遍被接受的 SaaS 模式!甘滓蝿站褪且獙ふ疑贁(shù)能夠按使用情況收費的方法,而不是項目定制的方法,能得到比較高利潤率的訂單再去做!估铋_復說。零一萬物對 toB 和 toC 的業(yè)務,有了更明確的側重。針對國內(nèi)的環(huán)境,比如明顯遙遙領先的零售、電商行業(yè),這次推出了「AI 2.0」數(shù)字人,提供了動作訓練、表情生成等能力,并配備 AI 2.0 門店短視頻解決方案。
而 toC 的探索則主要放在國外,「我們嘗試了一些產(chǎn)品,有些表現(xiàn)很好,有些沒有那么好。在國內(nèi),也在觀察什么時候適合在國內(nèi)做什么樣的產(chǎn)品。」這是考慮到國內(nèi)的用戶獲取的流量成本,已經(jīng)被一卷再卷得很高,且無法控制流失率。相比之下,獲客成本較低而且營利方式更多元成熟!脯F(xiàn)在當下最大的理由還是說國外做 to C 的產(chǎn)品,我們變現(xiàn)能力和消耗用戶增長的成本算賬可以算得過來,以后再關注國內(nèi)有什么機會可以推出!巩斎,無論是 toB 還是 toC,對于模型的追求都是一以貫之的:性能越強越好,價格越低越好。目前 Yi-Lightning 已上線 Yi 大模型開放平臺,每百萬 token 僅需 0.99 元,直逼行業(yè)最低價,讓人不禁要問,零一萬物也來卷價格戰(zhàn)了?「我們還是有利潤空間,所以歡迎大家使用,不用擔心我們被你用垮了!估铋_復解釋道,0.99/百萬 token 的價格看似卷起來了,但實際應用中,調用量累積下來還是很大,因此需要把價格平衡在一個適當?shù)膮^(qū)間,「不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤」,以保證開發(fā)者能在用上優(yōu)秀模型的前提下,再去挑最便宜的。放眼望去,中國大模型產(chǎn)業(yè)進入到了「耐力賽」階段,如何讓大模型賦能千行百業(yè),提升企業(yè)新質生產(chǎn)力是一個重要的命題。這不僅將牽涉到大模型在各個具體行業(yè)里的未來發(fā)展方向,甚至會影響世界的創(chuàng)新版圖。