文 | 李智勇
在OpenAI 開(kāi)源了個(gè)Swarm演示Multi-Agent后,微軟則開(kāi)源了magentic-one。雖然演示的功能不太一樣,前者關(guān)于業(yè)務(wù)邏輯處理,后者關(guān)注文件訪問(wèn)這些基本操作,但這也是個(gè)Multi-Agent的例子。橫向比較,微軟的比OpenAI的略好,可以解決實(shí)際問(wèn)題,真能用。但關(guān)鍵卻不在這里,而是當(dāng)你把兩個(gè)項(xiàng)目放在一起做比較的時(shí)候,你就會(huì)發(fā)現(xiàn)一種無(wú)聲的競(jìng)爭(zhēng)已經(jīng)開(kāi)始。
我們有理由相信,隨著Multi-Agent的智能原生程序變的越來(lái)越關(guān)鍵,這種競(jìng)爭(zhēng)也會(huì)變得越來(lái)越激烈。
很多做戰(zhàn)略分析的同學(xué)未必愿意讀代碼,愿意讀代碼的同學(xué)未必愿意花心思發(fā)現(xiàn)這種競(jìng)爭(zhēng)的導(dǎo)火索,所以我在這里挑個(gè)事,還是把這事再說(shuō)說(shuō)。
AI的兵家必爭(zhēng)之地
什么是AI產(chǎn)業(yè)的兵家必爭(zhēng)之地?
備受關(guān)注的大模型其實(shí)基本不是,除非只有一家一騎絕塵,別人的模型水平是1,你是10。
如果大模型是競(jìng)爭(zhēng)最關(guān)鍵的地兒,那其實(shí)OpenAI Swarm基于GPT-4o,微軟magentic-one也是基于GPT-4o,大家沒(méi)什么沖突。你做好模型,我用好模型,你好我好,根本沒(méi)啥沖突的事。
關(guān)鍵就在于如果你預(yù)期的是超級(jí)應(yīng)用,我預(yù)期的也是超級(jí)應(yīng)用,那就隨著超級(jí)應(yīng)用的價(jià)值變大,那超級(jí)應(yīng)用全鏈條的關(guān)鍵控制點(diǎn)上就會(huì)有你死我活的競(jìng)爭(zhēng)。
OpenAI和微軟之間暗搓搓沖突的根源倒不是在于某個(gè)應(yīng)用,而在于誰(shuí)對(duì)AI的基礎(chǔ)設(shè)施有控制力。
那什么是未來(lái)各種超級(jí)應(yīng)用的關(guān)鍵控制點(diǎn)?找出這個(gè)控制點(diǎn)就找到了AI的兵家必爭(zhēng)之地。
OpenAI和微軟的潛在沖突和下面這個(gè)被我隨手畫(huà)的簡(jiǎn)圖有關(guān):
因?yàn)槲覀冊(cè)谡f(shuō)微軟,所以我們拿LLM based OS和過(guò)去的Windows做類比。
比如我們常用的Windows里面也封裝有很多算法,但不管我們?cè)赪indows上寫(xiě)多少程序,也不會(huì)直接使用里面封裝的算法,而是要通過(guò)Windows對(duì)外提供的接口。這些算法對(duì)你是透明的。誰(shuí)知道Windows里面封裝了多少了算法呢?
為什么這樣呢,因?yàn)閃indows里面不止有算法這些功能,還有賬戶管理、消息機(jī)制等把功能鏈接起來(lái)的部分。
上面兩張圖中,核心差異就是這個(gè):
左側(cè)的圖仍然有系統(tǒng)的概念存在,而在右側(cè)的圖里,系統(tǒng)的概念消失了,模型不單履行邏輯判斷的能力,也還取代了系統(tǒng)。
為什么這會(huì)導(dǎo)致劇烈沖突和競(jìng)爭(zhēng)呢?
多大池子養(yǎng)多大魚(yú)
智能原生應(yīng)用因?yàn)閿?shù)據(jù)所有權(quán)不同,所以注定有多個(gè),但LLM based OS和LLM不是的。
這種基礎(chǔ)設(shè)施是個(gè)超級(jí)大的大池子,但理論上在一個(gè)聯(lián)通的市場(chǎng)空間里最后可能就剩下少數(shù)幾個(gè),并且Top1的占據(jù)50%以上的市場(chǎng)份額。
誰(shuí)在AI時(shí)代干成這事,誰(shuí)就是新時(shí)代的巨頭。
OpenAI需要這個(gè),而微軟顯然不會(huì)放過(guò)這個(gè)。
可左側(cè)的構(gòu)圖里面有微軟的位置,右側(cè)的沒(méi)有。
如果世界最終選擇了右側(cè)的圖,那模型即系統(tǒng),微軟公司在AI這塊地兒的基礎(chǔ)設(shè)施上就沒(méi)有位置!
一切剛剛開(kāi)始
上面其實(shí)是一些猜想,這個(gè)猜想有個(gè)大前提:智能原生(AI Native)的應(yīng)用會(huì)席卷各個(gè)應(yīng)用場(chǎng)景。這還需要點(diǎn)時(shí)間,所以上面說(shuō)的深層矛盾也就在開(kāi)源項(xiàng)目上漏出一點(diǎn)端倪。
但數(shù)字的事最違反人類常規(guī)感知的點(diǎn)就是速度,假如說(shuō)人類進(jìn)化的速度是1,制度文化進(jìn)化的速度是100,那數(shù)字的進(jìn)化速度至少是100萬(wàn)甚至更高。
一兩年前大家不知道智能原生到底是什么,但現(xiàn)在上述兩個(gè)開(kāi)源項(xiàng)目,每個(gè)都是智能原生的。
所以這種潛在沖突也可能在某個(gè)瞬間一下爆發(fā)出來(lái),關(guān)鍵節(jié)點(diǎn)應(yīng)該是智能原生應(yīng)用的收入規(guī)模。
后續(xù)的走勢(shì)
當(dāng)前這類競(jìng)爭(zhēng)會(huì)在無(wú)聲狀態(tài)開(kāi)始,短期誰(shuí)占優(yōu)由用戶的選擇決定,但模型如果不繼續(xù)迭代幾次,應(yīng)用的范圍就還是會(huì)比較窄。微軟這次開(kāi)源項(xiàng)目附帶的說(shuō)明很直接道出了當(dāng)前的狀態(tài)。
1、 2、3、4、5、6如果用一句話來(lái)簡(jiǎn)單概括就是你要把它放沙盒里面,然后人類看著點(diǎn)免得造成不可預(yù)計(jì)的損失。
具體來(lái)說(shuō)就是下面這個(gè)任務(wù)在跑的時(shí)候沒(méi)準(zhǔn)就執(zhí)行了別的什么,比如把系統(tǒng)搞宕機(jī)這種事是可能發(fā)生的。
https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one
在這樣一種前提下,這種新的智能原生模式不是不能用,而是范圍會(huì)被限制的比較窄,你也不敢讓它負(fù)責(zé)出錯(cuò)后代價(jià)特別大的事,比如直接做診療。
好消息是這種精度問(wèn)題確定可解決,眼下不知道的是在通用的大模型上到底什么時(shí)候解決。
如果有足夠的錢其實(shí)可以在比較垂直的領(lǐng)域走特斯拉 FSD12走過(guò)的路,如果沒(méi)有那就必須等待通用大模型的升級(jí),這二者其實(shí)等價(jià)。
理論上如果通用大模型足夠強(qiáng)大,那專門訓(xùn)練一個(gè)E-To-E的模型和直接把數(shù)據(jù)扔給通用的模型其實(shí)并沒(méi)有區(qū)別。
通用模型哪有什么智能邊界!
終點(diǎn)上應(yīng)用的邊界其實(shí)是數(shù)據(jù)的邊界。
不管怎么樣,這里需要個(gè)拐點(diǎn)。否則我們上面說(shuō)的就只有影子,而不會(huì)漏出真身。
這個(gè)拐點(diǎn)在技術(shù)上是通用大模型的進(jìn)步,在商業(yè)上是出現(xiàn)一個(gè)Top的智能原生應(yīng)用公司。互聯(lián)網(wǎng)為什么變得如火如荼?本質(zhì)是因?yàn)楫?dāng)年的BAT啊,BAT的那個(gè)收入量級(jí)確實(shí)足以啟動(dòng)一個(gè)時(shí)代。
這個(gè)臨界點(diǎn),我看美國(guó)人要到了。Tesla的FSD12就不說(shuō)了,Glean的ARR一年翻4倍,5500萬(wàn)美金也不算少了。
小結(jié)
更有趣的事情并不是老美怎么樣,而是米國(guó)和我國(guó)的AI顯然會(huì)分成兩套很難聯(lián)通的生態(tài)系,那國(guó)內(nèi)的情況如何?走到最后米國(guó)和我國(guó)的生態(tài)系最終又會(huì)如何競(jìng)爭(zhēng)、共存?互聯(lián)網(wǎng)用了20幾年來(lái)把這類問(wèn)題交出答卷。從現(xiàn)在開(kāi)始算,AI可能也需要這么多時(shí)間。所以潛在的小時(shí)代可能要過(guò)去了。