劃重點
01零一萬物發(fā)布新旗艦模型Yi-Lightning,在國際權威盲測榜單LMSYS上超越OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。
02創(chuàng)始人李開復表示,Yi-Lightning是「頂級模型白菜價」,成本線上加一點點小小的利潤,每百萬token僅需0.99元。
03除此之外,零一萬物首度公布全新ToB戰(zhàn)略下的首發(fā)行業(yè)應用產品AI 2.0數(shù)字人,聚焦零售和電商等場景。
04李開復認為,逐步放棄模型預訓練可能會成為行業(yè)整體趨勢,但中國的六家大模型公司只要有夠好的人才和融資額,做預訓練的決心,應該沒有問題。
以上內容由騰訊混元大模型生成,僅供參考
大模型發(fā)展到現(xiàn)在,我們應該關注什么?
像 OpenAI o1 這樣的技術新范式是其一;像 canvas、NotebookLM 這樣的產品新思路也是;還包括用戶、客戶營收這樣的商業(yè)化指標。
目標多元,但資源有限。
進入 10 月,國內的大模型創(chuàng)業(yè)公司「六小虎」(月之暗面、Minimax、百川智能、智譜 AI、零一萬物、階躍星辰)開始在不同的道路上做出選擇。
Minimax 被傳年營收預計 7000 萬美金,同一時間流出的信息,還包括海螺 AI 由于視頻大模型的推出訪問量激增;
智譜清言 AI 搜索、月之暗面 Kimi 探索版,則相繼推出了主打具備深度推理能力的 AI 搜索;
百川智能和階躍星辰尚未釋放進一步動作;
零一萬物選擇公布了最新模型進展,力破停止預訓練等傳言。
10 月 16 日,繼千億參數(shù)模型 Yi-Large 之后,零一萬物正式對外發(fā)布新旗艦模型 Yi-Lightning,在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。
在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中國第一。|圖片來源:零一萬物
對此,零一萬物創(chuàng)始人李開復稱 Yi-Lightning 是「頂級模型白菜價」,這是當前 AI 領域最需要的。他表示,「Yi-Lightning 和馬斯克的 xAI Grok 打平,并列第六名;同時也是全球第三的中國大模型企業(yè),排在零一萬物之前的模型基本只有 OpenAI 和 Google」,這是中國大模型首度實現(xiàn)的最佳成績。在推理速度和價格上,Yi-Lightning 的最高生成速度提速近四成,每百萬 token 僅需 0.99 元,且該定價仍有利潤。
李開復透露,這次預訓練只用 2000 張 GPU 訓練一個半月,只花了 300 多萬美金,做出來的預訓練模型跟 Grok 打平,只花它的 1% 或 2% 的成本。
進入 2024 年,鮮少有發(fā)布會只展示模型能力本身,AI 落地的產品、場景、客戶案例等都成為外界關注的重點。會上,零一萬物也首度公布了全新 ToB 戰(zhàn)略下的首發(fā)行業(yè)應用產品 AI 2.0 數(shù)字人,聚焦零售和電商等場景。
對于 ToC 產品及海外進展,本次發(fā)布會上未作披露。今年 5 月 Yi-Large 的發(fā)布會上,零一萬物預計今年營收預計可達 1 億人民幣。
李開復在朋友圈辟謠|圖片來源:網絡
早在 5 天前,李開復已在朋友圈回應了停止預訓練的傳言,并在知乎上談到了他對大模型接下來將如何洗牌的思考。今天 Yi-Lightning 的發(fā)布進一步回擊了傳言,李開復也進一步聊到了當前大模型競賽中的幾大爭議。以下是他的思考,經極客公園整理:
01 六小虎分野之 01 萬物的牌面:「頂級模型白菜價」
問:模型做到「世界第六,中國第一」,同時以較低的價格推向市場,如何實現(xiàn)的?
李開復:零一萬物在 Yi-Lightning 的定價上并沒有虧本。
成立第一天起,零一萬物同時啟動了模型訓練、AI Infra、AI 應用三大團隊,三個團隊成熟后,再對接到一起。零一萬物將這一模式總結為;步、模應一體兩大戰(zhàn)略。AI Infra 助力模型訓練和推理,以更低的訓練成本,訓練出性能領先的模型,以更低的推理成本支撐應用層的探索。
我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤,就得到了今天 0.99 元/百萬 token 的價格。
挑選模型 API 最重要的一點,是模型性能一定要優(yōu)秀,在這個前提之下才去挑最便宜的,我相信,綜合 Yi-Lightning 的模型質量和價格來看,Yi-Lightning 很可能是很多開發(fā)者最認可、最高性價比的模型。
問:零一萬物首次公布 ToB 相關矩陣,未來會進一步在 ToB 方向深耕嗎?
李開復:在國內,大模型 ToB 相對于 AI 1.0 時代有不同的打法,首要任務就是要尋找少數(shù)能夠按使用情況收費的方法,而不是項目定制的方法。能得到比較高利潤率的訂單再去做。
今天零一萬物推出的 AI 2.0 數(shù)字人解決方案不是做一單賠一單的做法,它專注到用戶重大的痛點需求和盈利點,也就是一個店長或 KOL 平時做一次直播浪費最重要的資源他的時間。這個時間就算做一小時直播能賺到一千塊錢,也就是這一千塊錢,但如果用數(shù)字人直播就不是一小時了,可能可以做一千個小時(直播),哪怕每一個小時只能賺一半的錢,一千個小時還是可以賺五百倍的錢,這樣賬就很好算了。
如果真的能把數(shù)字人做到端到端,只要輸入公司內部的東西,選一個形象、聲音按一個鈕就開始直播,等于賣給這個企業(yè)一個印鈔機,印鈔機要收租賃費就可行。除了直播以外,我們的 AI 2.0 數(shù)字人解決方案已經跑通了更多業(yè)務場景,比如 AI 伴侶、IP 形象、辦公會議等等。
整體來看,零一萬物 ToB 整體解決方案會采雀一橫一縱」的打法。先將單個行業(yè)做深做透,進而以自身技術能力和行業(yè)積累為基礎,凝練出標準化的 ToB 解決方案,為各行各業(yè)的企業(yè)客戶將本提效。
問:除了數(shù)字人解決方案,零一萬物是否還有其他 ToB 解決方案?
李開復:除了我們已經發(fā)布的 AI 2.0 數(shù)字人、API 之外,零一萬物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業(yè)務,我們會在近期正式對外發(fā)布,敬請期待。
問:零一萬物在海外推出 ToC 產品,國內陸續(xù)推出 ToB 產品,當前在 B 端、C 端的產品現(xiàn)狀如何?
李開復:一個大模型公司同時做 ToB 和 ToC 很辛苦,銷售方法、利潤的比例、需要多少投放才會有收入等評估體系完全不同。也需要多元化的管理方式,因為兩個團隊的基因不一樣,做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個領域有經驗,也在試著做,但也絕對不能什么都做。
ToB 上,零一選擇做國內市場,是因為找到了一些破局的空間,比如用數(shù)字人來做零售、餐飲等,能做一個完整的解決方案。另外還有兩三個領域開始在做,現(xiàn)在還不方便披露。ToB 不做海外市場,是因為全世界的范疇里,ToB 供應商基本都是當?shù)氐。選擇在國內做 ToB,還要選擇有利潤的解決方案做,而不只是賣模型、不只是做項目制,這是我們 ToB 的做法。
ToC 我們主要布局海外。當我們開始做零一萬物時,國內還沒有合適的中文模型,只有在國外先嘗試,迭代了一個、兩個、三個產品,這些產品現(xiàn)在表現(xiàn)有些很好,有些沒有那么好,在不斷地調整中。
我們也在觀察什么時候適合在國內市場做什么樣的產品,目前做 ToC 產品面臨一個很大的問題流量成本越來越高。我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當?shù)牧魇В?/strong>在這樣一個環(huán)境里,我們會非常謹慎,先不推出中國本土新的 ToC 應用,同時已有的產品還會繼續(xù)維護,但更多的精力會在海外的土壤用更低的成本買到非常高質量的用戶,或者能直接把 App 賣出去,讓用戶來訂閱收費,那邊訂閱習慣相對成熟。
換句話說,現(xiàn)在現(xiàn)狀選擇在海外做 ToC 產品,變現(xiàn)能力和消耗用戶增長的成本算賬可以算得過來,以后再關注國內有什么機會可以推出。
02一輪預訓練已降至 300 萬美金,「六小虎」都可以 cover
問:此前有消息稱 AI 方面的六小虎,某幾家放棄了預訓練。站在行業(yè)的角度,逐步放棄模型預訓練會成為行業(yè)整體趨勢嗎?
李開復:做好預訓練模型是一個技術活,而且要非常多有才華的人在一起工作,慢工出細活。需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人、很好的算法同學,一起做出來。
如果一個公司能有幸擁有這么多優(yōu)秀的人才,能夠跨領域的合作,我相信中國絕對可以做出世界排名前十的預訓練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以后有可能會越來越少的大模型公司做預訓練。
不過據(jù)我所知,這六家公司融資額度都是夠的,我們做預訓練的 production run,訓練一次三四百萬美金,這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。
03 AGI 的上限:o1 開啟推理層面的新范式,OpenAI 還藏著技術
問:今年 5 月份,Yi-Large 把中美頂尖模型的時間差縮短到六個月,這次 Yi-Lightning 發(fā)布直接擊敗了 GPT-4o,把時間差甚至縮短到了五個月,零一萬物如何能繼續(xù)追趕縮短這個時間差?
李開復:縮短時間差非常困難,我不預測我們可以縮短這個時間差。因為畢竟人家是用十萬張 GPU 訓練出來,我們用的是兩千張 GPU 訓練出來。
Yi-Lightning 的效果是因為團隊和社區(qū)大家都熱心聰明去使用,去理解對方做出來的東西,再加上我們自己每家的研發(fā)有特色,比如數(shù)據(jù)處理、訓推優(yōu)化等等,現(xiàn)在這一套方法論在零一萬物已經成熟了,我們有信心把自己的創(chuàng)新加上我們的一些特長,在關注 OpenAI 和其他公司發(fā)布的新技術,盡快地去能夠了解這些技術的核心重要性,然后把它的能力在我們自己的產品里面發(fā)揮出來。
我覺得這套方法保持在六個月左右,就已經是很好的結果了。如果期待破局,可能需要一個前所未有的算法才有機會。我們千萬不要認為落后六個月是一個很羞恥的事情,或者一定是要追趕的事情,因為我很多海外朋友都認為中國會遠遠落后,人家十萬張 GPU 等,我們要被甩掉三年、五年甚至十年都有可能,現(xiàn)在零一萬物證明了不會落后這么多,而且這次 LMSYS 的榜單上也有其他兩家中國公司表現(xiàn)不錯。
問:OpenAI 的 o1 發(fā)布后,從技術上帶來在推理側的 Scaling 新范式,你怎么看?對初創(chuàng)公司會有哪些影響?
李開復:OpenAI 真的是很厲害的公司,在他們的員工交流時,他們說OpenAI 內部還有一些好東西,但是不急拿出來,因為他們領先行業(yè)足夠多。這次他們把 o1 拿出來主要是因為 GPT-5 訓練不順利,而他們需要融資,就先把 o1 公開,這是他們能做而別人不能做的。
OpenAI o1 雖然隱藏了所有中間的思考狀態(tài),但是很多人還是在網上開始猜它怎么做,我們認為有一些揣測還是比較靠譜,所以當你發(fā)了一個新技術,這個技術被很多聰明人使用、揣測,我覺得五個月以后,應該也有不少類似 o1 模型的能力出現(xiàn)在各個模型公司,包括零一萬物。
o1 的思考模式是把之前只在預訓練中 scaling 的趨勢擴展到了推理,這件事情對行業(yè)是最大的認知的改變。過去大家覺得誰預訓練做好就夠了,慢慢大家發(fā)現(xiàn)后訓練 SFT 和強化訓練都是非常重要。
所以零一萬物的團隊剛開始做的主要是專注預訓練,之后又有很多很厲害的人加入,幫我們把后訓練也做出來,現(xiàn)在看來推理也很重要,感謝 OpenAI 點醒我們這一點,相信現(xiàn)在很多中美公司都在往 o1 方向狂奔。
*頭圖來源:視覺中國
本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO