展會(huì)信息港展會(huì)大全

Stability AI:AI開(kāi)源商業(yè)化試驗(yàn)田,Killer Model能成長(zhǎng)為Killer App嗎?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2023-06-03 17:55:54   瀏覽:4168次  

導(dǎo)讀:作者:Cage、haina 編輯:penny 排版:Mengxi Stability AI 早期通過(guò)計(jì)算資源和研究經(jīng)費(fèi),與眾多 AI 開(kāi)源科學(xué)家團(tuán)隊(duì)建立了深度合作。Stable Diffusion 就在他們的支持和推廣下成為了文生圖領(lǐng)域的開(kāi)源模型標(biāo)準(zhǔn),營(yíng)造了優(yōu)秀的下游技術(shù)和應(yīng)用生態(tài) LoRA、Control...

作者:Cage、haina

編輯:penny

排版:Mengxi

Stability AI 早期通過(guò)計(jì)算資源和研究經(jīng)費(fèi),與眾多 AI 開(kāi)源科學(xué)家團(tuán)隊(duì)建立了深度合作。Stable Diffusion 就在他們的支持和推廣下成為了文生圖領(lǐng)域的開(kāi)源模型標(biāo)準(zhǔn),營(yíng)造了優(yōu)秀的下游技術(shù)和應(yīng)用生態(tài) LoRA、ControlNet 等可控生成技術(shù)得以普及,蘋果 M 系列芯片提供了支持,基于 Diffusion Model 的創(chuàng)業(yè)公司開(kāi)始涌現(xiàn)。

而語(yǔ)言模型 LLM 領(lǐng)域都在等待著這樣一個(gè) “Stable Diffusion 時(shí)刻”的出現(xiàn)成為標(biāo)準(zhǔn)、統(tǒng)一可商用的開(kāi)源模型,因此 Stability AI 成為了我們關(guān)注和研究的重要公司。

與開(kāi)源生態(tài)的成功相比,當(dāng)前 Stability AI的商業(yè)化探索似乎并不順利。Stable Diffusion 的模型特性不需要很大的參數(shù)量,因此部署和使用的難度都比較輕量,加上活躍的開(kāi)源社區(qū)使客戶使用的時(shí)候門檻不高,較難設(shè)計(jì)商業(yè)化付費(fèi)點(diǎn)。而開(kāi)源的模式使其無(wú)法實(shí)現(xiàn)閉環(huán)的數(shù)據(jù)飛輪并優(yōu)化模型,Stable Diffusion 目前的數(shù)據(jù)量和 Midjourney 不在一個(gè)量級(jí),DreamBooth 直接使用的效果漸漸被 MidJourney 拉開(kāi)了一定差距;不過(guò)圖片領(lǐng)域,數(shù)據(jù)數(shù)量或許沒(méi)有這么重要,夠用即可,差距的原因是是否將重點(diǎn)放于風(fēng)格化處理。

隨著 StableLM 的發(fā)布正式宣告其進(jìn)軍 LLM 領(lǐng)域,Emad 稱,Stability 的商業(yè)模式重心除了開(kāi)源廠商常見(jiàn)的 B 端客戶,還會(huì)為發(fā)展中國(guó)家的 G 端提供服務(wù)。其創(chuàng)始人 Emad 多次提到 Open model + Private Data 的方式會(huì)比 OpenAI 類 Close model + Public Data 更容易獲得客戶的信任,尤其在印度、中東、非洲等國(guó)家都有本地語(yǔ)言模型的需求,能極大的改變當(dāng)?shù)氐慕逃蜕鐣?huì)分工。

大模型時(shí)代的 AI 模型研發(fā),需要很強(qiáng)的團(tuán)隊(duì)組織力和科學(xué)前瞻性,而創(chuàng)始人 Emad Mostaque喊單、投資和 PR 為主的領(lǐng)導(dǎo)方式可能與此有所背離。Stability AI 的管理風(fēng)格去中心化且自治,自由度可以讓卓越的科學(xué)家擁有更大的發(fā)揮空間,但也會(huì)因?yàn)槿狈σ?guī)劃導(dǎo)致團(tuán)隊(duì)的凝聚力下降和較大的財(cái)務(wù)壓力。

綜上,團(tuán)隊(duì)內(nèi)科學(xué)家與外部開(kāi)源團(tuán)隊(duì)的合作機(jī)制,管理團(tuán)隊(duì)對(duì)未來(lái)研究重心和商業(yè)模式的規(guī)劃,都將是 Stability AI 目前需要解決的問(wèn)題。當(dāng)然,OpenAI 用了 7 年時(shí)間才證明自己所下注模式的成功,我們也應(yīng)對(duì) Stability AI 開(kāi)拓 AI 開(kāi)源的商業(yè)模式保有耐心。

以下為本文目錄,建議結(jié)合要點(diǎn)進(jìn)行針對(duì)性閱讀。

01 為什么要關(guān)注 Stability AI?

02 團(tuán)隊(duì)及創(chuàng)業(yè)愿景

03 技術(shù)模型 & 產(chǎn)品圖譜

04 商業(yè)化與競(jìng)爭(zhēng)

05 開(kāi)源社區(qū)及關(guān)系

06 收購(gòu)與合作

07 成功要素與風(fēng)險(xiǎn)

08 結(jié)論

01.

為什么要關(guān)注

Stability AI?

以 Stable Diffusion 搭建了最好的開(kāi)源生態(tài)

隨著 LLM 領(lǐng)域的開(kāi)源模型開(kāi)始涌現(xiàn),Llama、Alpaca、Vicuna 都有不錯(cuò)的表現(xiàn),甚至谷歌內(nèi)部開(kāi)始討論:We Have No Moat, And Neither Does OpenAI。有一個(gè)問(wèn)題經(jīng)常出現(xiàn):誰(shuí)能成為大語(yǔ)言模型領(lǐng)域的 Stable Diffusion?這個(gè)問(wèn)題意味著,Stable Diffusion 成為了文生圖領(lǐng)域開(kāi)源模型的統(tǒng)一標(biāo)準(zhǔn),而 LLM 領(lǐng)域還沒(méi)有這樣的標(biāo)準(zhǔn)。

Stable Diffusion 之所以能成為標(biāo)準(zhǔn),有這樣幾個(gè)重要特點(diǎn):使用門檻低、模型調(diào)優(yōu)靈活度高、生成效果好,加上 Stability AI 出色的運(yùn)營(yíng)能力,Stable Diffusion 成為了第一個(gè)擁有極強(qiáng)生態(tài)的開(kāi)源模型。

Stable Diffusion 的生態(tài)包括付費(fèi)應(yīng)用 DreamStudio、全球開(kāi)發(fā)者開(kāi)源模型分享社區(qū) civitai、Stable Diffusion 模型圖片合集網(wǎng)站 Lexica、以及在 Replicate / Huggingface / Google Colab 上都有 Stable Diffusion 上手即用的模型。因?yàn)?Stable Diffusion 可以在任意硬件設(shè)備上運(yùn)行,手機(jī)硬件端也有應(yīng)用程序 Make AI Art、DRAI,以及將 Stable Diffusion 下載到 Apple 本地運(yùn)行的 Drawthings、DiffusionBee。

Github Star 和 Hugging Face 的下載量也能很好的反應(yīng) Stable Diffusion 的開(kāi)源生態(tài)搭建。在 Github 中,Stable Diffusion web UI 獲得了 69.9k star,而 Hugging Face 中 RunwayML / Stable-Diffusion-V1-5 更是獲得了 1.81M 的下載量。目前官宣和 Stability AI 圍繞 Stable Diffusion 密切合作的企業(yè)包括 AWS、Krikey AI,Clipdrop 則被 Stability AI 收購(gòu),具體細(xì)節(jié)會(huì)在后文詳細(xì)展開(kāi)。

Hugging Face 上的 Stable Diffusion 相關(guān)模型

戰(zhàn)略性新產(chǎn)品 Stable Diffusion XL 暫未開(kāi)源,早期社區(qū)成員表示似乎與原模型的模型設(shè)計(jì)、使用效果并沒(méi)有很大差別;但近日社區(qū)涌現(xiàn)了更多積極的反饋,并且期待能夠早日下載、finetune 該模型;團(tuán)隊(duì)表示該模型最終會(huì)開(kāi)源,并提供 API。

社區(qū)用戶評(píng)價(jià)

團(tuán)隊(duì)回復(fù)

開(kāi)源模型中的營(yíng)銷專家

Stability AI 的營(yíng)銷能力有目共睹。創(chuàng)始人 Emad Mostaque 沒(méi)有 AI 技術(shù)背景,也沒(méi)有科技創(chuàng)業(yè)經(jīng)驗(yàn),但 Stability AI 卻獲得了極高的關(guān)注度,并快速發(fā)展。Stability AI 在 A 輪籌款時(shí)沒(méi)有宣布任何專有的人工模型,ToC 的產(chǎn)品也僅有訪問(wèn)其核心產(chǎn)品 API 的 DreamStudio。

泄露的 A 輪融資 deck

Stable Diffusion 由開(kāi)源社區(qū)、Stability AI 及 Runway 研究員合作完成,Stability AI 并不獨(dú)立擁有該模型的知識(shí)產(chǎn)權(quán),但在 Emad 的強(qiáng)大宣發(fā)下被打上了 Stability AI 所擁有的印象;而其開(kāi)源語(yǔ)言模型 StableLM 似乎又是一個(gè)營(yíng)銷勝于實(shí)際工作的例子:與其他開(kāi)源模型相比結(jié)果很平庸,使用 ShareAlike 許可證,需要在相同的許可下共享修改后的模型權(quán)重,在實(shí)際使用中并不比 LLaMa 更方便。但是其每一次產(chǎn)品宣發(fā)都很強(qiáng)勢(shì),在社區(qū)和媒體引起轟動(dòng)。

Stability AI 與開(kāi)源社區(qū)的關(guān)系也很有趣,最初只是提供算力支持。但憑借著開(kāi)源社區(qū)、“Stable Diffusion”背后的公司完成了 1 億美元的融資后,Stability AI 再通過(guò)為開(kāi)源社區(qū)提供更多的算力,收編開(kāi)源研究團(tuán)隊(duì)等方式,進(jìn)一步密切與開(kāi)源社區(qū)的關(guān)系,撬動(dòng)更大的杠桿。

開(kāi)源商業(yè)模式探索的試驗(yàn)田

目前 Stability AI 的核心商業(yè)化邏輯是“模型即服務(wù)”,將基礎(chǔ)模型開(kāi)源,憑借專業(yè)的團(tuán)隊(duì)為企業(yè)提供定制化服務(wù)咨詢服務(wù)。該領(lǐng)域競(jìng)爭(zhēng)十分激烈,除了大型科技公司(OpenAI、Anthropic),Hugging Face,以及歐洲公司 Aleph Alpha 和 Silo AI 也在提供類似的服務(wù)。

根據(jù)近期訪談中傳達(dá)的使命和目標(biāo),Stability 與其他 to B 的模型公司差異在于,Emad 表示其客戶很多會(huì)來(lái)自發(fā)展中國(guó)家的政府,例如印度政府、非洲、中東、日本等都是他們積極布局的領(lǐng)域。Open model + Private Data 的方式會(huì)比 OpenAI 類 Close model + Public Data 更容易獲得當(dāng)?shù)氐男湃危绕湓谟《、中東、非洲等國(guó)家都有本地語(yǔ)言模型的需求,能極大的改變當(dāng)?shù)氐慕逃蜕鐣?huì)分工。例如印度大量的外包開(kāi)發(fā)行業(yè),可能會(huì)被當(dāng)?shù)氐拈_(kāi)源大模型所顛覆。

Stability AI 對(duì)于開(kāi)源模型如何進(jìn)行商業(yè)化的探索對(duì)未來(lái) AI 的發(fā)展意義重大。盡管未來(lái)預(yù)訓(xùn)練模型很可能 commoditize 趨同,但是模型的 alignment 都將隨著民族、文化、行業(yè)有顯著的差異,開(kāi)源模型的高自由度很可能在這一趨勢(shì)中扮演重要角色。

02.

團(tuán)隊(duì)及創(chuàng)業(yè)愿景

CEO 及核心成員

Emad 是印度人,在約旦出生、童年在孟加拉長(zhǎng)大,7 歲時(shí)跟隨父親來(lái)到英國(guó),直到 22 年 10 月才第一次來(lái)硅谷。和他居所一樣多變的,是他的職業(yè)生涯。在成立 Stability 之前,他做過(guò)程序員、VC 分析師、電影評(píng)論家、對(duì)沖基金經(jīng)理。20 多歲的時(shí)候,他的兒子被診斷為自閉癥患者,這讓他離開(kāi)對(duì)沖基金開(kāi)始追求更有意義的事。

他開(kāi)始對(duì)慈善事業(yè)及幫助他人充滿熱情,2019 年,為降低貧困人群的智能手機(jī)、互聯(lián)網(wǎng)使用成本創(chuàng)立了 Symmitree;2020 因?yàn)閷?duì) AI 的癡迷及開(kāi)源 AI 社區(qū)缺乏組織,創(chuàng)建了 Stability AI。

目前,Linkedin 上顯示公司有 110 位員工。很多員工加入 Stability AI 的路徑都是先在社區(qū)做貢獻(xiàn),之后以全職的身份加入。Emad 采用 “分布式” 的公司管理方法,員工分散在世界各地,給予極大的自由。對(duì)這樣的工作模式,觀點(diǎn)是比較兩極分化的,根據(jù) The Information 文章,有內(nèi)部人士認(rèn)為管理模式 “很混亂”,這增加了成本,減緩了產(chǎn)品開(kāi)發(fā);但也有研究員表示,該模式使得 AI 科學(xué)家們能夠自由地選擇自己感興趣的主題進(jìn)行研究。

其他核心成員及研究員如下:

公司愿景

2020 年 Emad Mostaque 建立了 Stability AI,開(kāi)展聯(lián)合國(guó)支持的新冠項(xiàng)目 CAIAC (以集體和增強(qiáng)智能應(yīng)對(duì)新冠肺炎),這是他第一次真正接觸到大模型,但該項(xiàng)目后續(xù)遇到了官僚主義等問(wèn)題。為了繼續(xù)促進(jìn) AI 模型開(kāi)源,Emad 自掏腰包購(gòu)買芯片,為 Eleuther 和 LAION 等社區(qū)提供算力支持。

一個(gè)月后,團(tuán)隊(duì)意識(shí)到擴(kuò)大開(kāi)源模型的觸達(dá)規(guī)模,發(fā)展商業(yè)化服務(wù)才是促進(jìn)模型的普惠的關(guān)鍵,也是 Stability AI 合理的商業(yè)路徑;Stable Diffusion 是第一個(gè)足夠好、足夠快、足夠便宜,任何人都可以運(yùn)行的模型,所以 Stability AI 將 Stable Diffusion 作為突破口,為客戶提供擴(kuò)展和定制服務(wù)。Stability AI 成功圍繞 Stable Diffusion 搭建了文生圖生態(tài)和商業(yè)版圖,在 EleutherAI 研究基礎(chǔ)上發(fā)布了 StableLM,同 Harmonai 合作開(kāi)發(fā)音頻生成模型,在 Stable Diffusion 的基礎(chǔ)上進(jìn)行視頻、動(dòng)畫(huà)生成研究,進(jìn)軍其他 AI 模型領(lǐng)域。

Stability 不把 AGI 作為最終目標(biāo),將“AI for the people by the people”作為標(biāo)語(yǔ),在產(chǎn)品、模型開(kāi)發(fā)上追求低門檻和通用性。Emad 認(rèn)為“有人需要開(kāi)放并分享引擎蓋下發(fā)生的事情,確保完全合規(guī),它們不能是黑箱,政府也不會(huì)在黑箱上運(yùn)行。”開(kāi)源模型與私有數(shù)據(jù)的結(jié)合將遠(yuǎn)遠(yuǎn)大于閉源通用模型的價(jià)值,因?yàn)殚]源會(huì)受到更多監(jiān)管、數(shù)據(jù)隱私等因素的影響。Stability AI 的使命是為激活人類的潛力建立基礎(chǔ),而 Stability 的模型是樂(lè)高。

Emad 認(rèn)為人工智能的影響可能比工業(yè)革命還要大。人工智能可能會(huì)導(dǎo)致一大批人被 AI 取代,人類需要控制 AI 的發(fā)展方向,創(chuàng)造出更好的工作,“生產(chǎn)力的提高最終會(huì)趨于平衡”,人類可以專注“使我們成為人類”的事情。但 Emad 也認(rèn)為這一輪人工智能的泡沫比以往的泡沫都大。類似 .com 的泡沫,資本和機(jī)會(huì)的數(shù)量是完全錯(cuò)位的,很多商業(yè)性為零的項(xiàng)目都將得到超額資助。長(zhǎng)期來(lái)看這將不利于 AI 的發(fā)展:引發(fā)軍備競(jìng)賽,每個(gè)人都試圖建立自己的模型,導(dǎo)致大量的經(jīng)濟(jì)浪費(fèi)。而 AI 模型是國(guó)家的基礎(chǔ)設(shè)施,比 5G 更重要,真正需要做的是國(guó)家內(nèi)部的模型標(biāo)準(zhǔn)化,給模型提供更好的數(shù)據(jù):不應(yīng)該是更多的網(wǎng)絡(luò)腳本數(shù)據(jù),而是國(guó)家數(shù)據(jù)集。

Emad 始終對(duì) AI 未來(lái)的發(fā)展保持謹(jǐn)慎態(tài)度:“如果未來(lái)出現(xiàn)比人類更有能力的 AI Agent,不受人類控制,在互聯(lián)網(wǎng)上自由行動(dòng),最壞的情況就是它們擴(kuò)散并控制了人類。”一如 Sam 在國(guó)會(huì)聽(tīng)證會(huì)上反復(fù)強(qiáng)調(diào)的,Emad 也認(rèn)為政府需要制定監(jiān)督政策,防止巨頭利用模型控制人類。他參與了馬斯克等人暫停 GPT5 的呼吁。一方面是出于風(fēng)險(xiǎn)的考慮,希望 AI 的研究開(kāi)發(fā)應(yīng)更加專注于準(zhǔn)確、安全、可解釋和透明,另一方面也有陽(yáng)謀的因素,想獲得追趕上 OpenAI 的時(shí)間。

他表示 Stability AI 的下一步就是與跨國(guó)合作伙伴、多國(guó)政府合作,建立框架,讓好的數(shù)據(jù)為模型服務(wù),推動(dòng)模型的本地化。他認(rèn)為在三到五年內(nèi),世界上只會(huì)有五到六家基礎(chǔ)模型公司,將是 Nvidia、Google、Microsoft、OpenAI 以及 Apple。Stability AI 不準(zhǔn)備、也沒(méi)有必要去做基礎(chǔ)模型的提供商。

03.

技術(shù)模型 & 產(chǎn)品圖譜

Gen AI 生成模型

Stable Diffusion

Stable Diffusion 模型技術(shù)來(lái)源是發(fā)表在 CVPR 2022 的論文 High-Resolution Image Synthesis with Latent Diffusion Models,5 位作者分別來(lái)自慕尼黑大學(xué)、海德堡大學(xué)、Stability AI 和 Runway。其中 Robin Rombach 來(lái)自 Stability AI,Patrick Esser 來(lái)自 Runway ML。

在此論文的基礎(chǔ)上,Stable Diffusion 被訓(xùn)練出來(lái),研究團(tuán)隊(duì)用了 4000 個(gè) A100 Ezra-1 AI 超大集群,并使用了非營(yíng)利組織 LAION 提供的數(shù)據(jù)集(LAION-5B 的一個(gè)大子集),Stability AI 是算力提供者。在 GitHub 項(xiàng)目的描述中,Stability AI 和 Runway 的貢獻(xiàn)是平等的,Stability AI 并不是 Stable Diffusion 的所有者。且 Stable Diffusion 生成的作品版權(quán)遵循 CC0 協(xié)議,不歸屬于任何個(gè)人和公司,但可以用于商業(yè)用途。

在 Stable Diffusion 的基礎(chǔ)上,Stability AI 開(kāi)發(fā)出了付費(fèi)版產(chǎn)品 DreamStudio 及供開(kāi)發(fā)者使用的 API,以及暫未開(kāi)源的 Stable Diffusion。

基于 Stable Diffusion 走紅的可控生成技術(shù):ControlNet 和 Lora

原生的 Stable Diffusion 模型中有幾個(gè)影響可用性的缺陷,都隨著開(kāi)源社區(qū)的合力貢獻(xiàn)得到了優(yōu)化:

1. LoRA,更可控、靈活的微調(diào)方法

初始版本中的繪畫(huà)主題并不可控,也就是說(shuō)不能保證連續(xù)多張繪畫(huà)的主人公是同一個(gè)人物、同一種風(fēng)格。而 LoRA 的存在完美的解決了這個(gè)問(wèn)題。在微軟研究院的相關(guān)論文中,這一方法最早的提出是為了語(yǔ)言模型的可控微調(diào),而在 Stable Diffusion 的社區(qū)中因?yàn)槌錾男Ч透咝У奈⒄{(diào)出圈。例如以下是 Civit AI 上比較有名的深底色攝像風(fēng)格,生成出的圖片風(fēng)格高度一致:

這個(gè)方法就像上圖左側(cè)的漢堡,如果想要使?jié)h堡的有蛋黃醬的味道,在不改變其他用料的情況下向漢堡中加入一層蛋黃醬即可。LoRA 的微調(diào)方式就是保證了原本模型網(wǎng)絡(luò)不變的情況下,通過(guò)一個(gè) LoRA 小模型將需要的人物或風(fēng)格加入模型外接,高效的實(shí)現(xiàn)想要得到的效果。

2. ControlNet,對(duì)圖片結(jié)構(gòu)的深入控制

如果說(shuō) LoRA 是一個(gè)把已有方法放到文生圖領(lǐng)域煥發(fā)光采的方法,ControlNet 是一個(gè)完全基于 Stable Diffusion 開(kāi)發(fā)出的重要方法。這個(gè)方法允許設(shè)計(jì)師可以根據(jù)設(shè)想中的構(gòu)圖,對(duì)圖片進(jìn)行高自由度的學(xué)習(xí)和生成。例如在下圖中,ControlNet 可以先識(shí)別出圖片的邊緣,再用其作為骨架,注入 prompt 實(shí)現(xiàn)新的生成效果。

這個(gè)方法通過(guò)將模型網(wǎng)絡(luò)分解為可訓(xùn)練和鎖定兩部分,可訓(xùn)練的部分可以隨著學(xué)習(xí)進(jìn)行更新,而 locked 部分則作為前置條件被保留在每一次生成中,作為前置條件。例如當(dāng)我們想創(chuàng)作一個(gè)連環(huán)漫畫(huà)時(shí),其中的主要核心人物和線稿圖的風(fēng)格就能通過(guò)這一方式,在圖像中一貫地保留下來(lái)。

DeepFloyd IF

DeepFloyd AI Research 是 Stability AI 旗下的獨(dú)立研發(fā)團(tuán)隊(duì),團(tuán)隊(duì)成員為 Stability AI 的雇員。Stability AI 為其發(fā)放工資和提供研究資助基金。該團(tuán)隊(duì)近期發(fā)布了的全新開(kāi)源模型 DeepFloyd IF,解決了文生圖的兩大難題:準(zhǔn)確繪制文字、準(zhǔn)確理解空間關(guān)系。DeepFloyd IF 第一次使得目前已經(jīng)獲得了 5.1k 星。

工作原理

準(zhǔn)確繪制文字對(duì)文生圖的商業(yè)化應(yīng)用有很大價(jià)值:在此之前,文生圖模型無(wú)法準(zhǔn)確生成文字,但運(yùn)用 DeepFloyd IF 可以將想要的文字放置在畫(huà)面的任何地方,進(jìn)一步打通了海報(bào)、插圖、服裝等渲染圖的工作流。

DeepFloyd IF demo

Stable Animation

Stability AI 發(fā)布的 Stable Animation SDK 是基于文生圖模型的動(dòng)畫(huà)領(lǐng)域嘗試,使得用戶可以實(shí)現(xiàn) prompt、prompt + 圖像、prompt + 視頻三種方式生成動(dòng)畫(huà),該模型目前僅能通過(guò) SDK 和付費(fèi) API 使用。

但用戶表示,Stable Animation 的生成的動(dòng)畫(huà)效果欠佳,仍不能達(dá)到 Runway 的標(biāo)準(zhǔn),且門檻更高,SDK 及 API 必須通過(guò) Python 腳本調(diào)用。

StableStudio

StableStudio 是付費(fèi)應(yīng)用 DreamStudio 的開(kāi)源版本,此舉進(jìn)一步表現(xiàn)了其開(kāi)源的決心,但在產(chǎn)品維度并沒(méi)有顯著的創(chuàng)新。

而其在公告中提到的即將推出的聊天界面,與幾天前發(fā)布的 StableViccua 所提到的界面一致。

LLM 底座模型

StableLM

Stability AI 4 月 20 日發(fā)布了可商用開(kāi)源語(yǔ)言大模型 StableLM,目前包括 3B 和 7B 參數(shù)版本,接下來(lái)將推出 15B、65B 參數(shù)的版本。在 CC BY-SA-4.0 許可條款的約束下,開(kāi)發(fā)者可以自由查看、使用、調(diào)整基礎(chǔ)模型,用于商業(yè)或研究目的。

StableLM 基礎(chǔ)模型建立在 EleutherAI 開(kāi)源早期語(yǔ)言模型 GPT-J、GPT-NeoX 和 Pythia 套件的經(jīng)驗(yàn)之上,基于 The Pile 構(gòu)建了 1.5 萬(wàn)億 token 的新數(shù)據(jù)集進(jìn)行訓(xùn)練。團(tuán)隊(duì)稱這個(gè)數(shù)據(jù)集使 StableLM 在會(huì)話和編碼任務(wù)方面具有驚人的高性能。未來(lái)還將發(fā)布經(jīng)過(guò)指令微調(diào)的模型,使用的數(shù)據(jù)集包括 Alpaca、GPT4All、Dolly、ShareGPT 及 HH,僅供研究使用。

但 StableLM 看起來(lái)又是一個(gè)營(yíng)銷勝于實(shí)際工作的例子。根據(jù)用戶測(cè)評(píng),與其他開(kāi)源模型相比結(jié)果相當(dāng)平庸,與 GPT 也相差甚遠(yuǎn),其輸出的真值幾乎不存在:

stablelm-base-alpha-3b 平均準(zhǔn)確率為 25.6%;

flan-t5-xl(3B) 平均準(zhǔn)確率為 49.3%;

flan-t5-small(80M) 平均準(zhǔn)確率為 29.4%。

該模型明顯缺乏對(duì)某些敏感內(nèi)容的保護(hù);而且在實(shí)際使用中,Stability 發(fā)布的模型中并不比 LLaMa 更開(kāi)源:StableLM 的許可證實(shí)際上是 ShareAlike 許可證,需要在相同的許可下共享修改后的模型權(quán)重。模型還遇到了過(guò)度擬合的問(wèn)題,可能是由于他們數(shù)據(jù)集中存在重復(fù)數(shù)據(jù)。

用戶表示“很多這樣的開(kāi)源項(xiàng)目似乎只是試圖追隨和(糟糕地)重現(xiàn) OpenAI 的突破,而不是試圖超越它們。”

StableVicuna

Stability AI 近日又發(fā)布了 StableVicuna, 是旗下開(kāi)源團(tuán)隊(duì) CarperAI 的研究成果。CarperAI 專注人類偏好學(xué)習(xí)研究,從 EleutherAI 孵化并獨(dú)立出來(lái)。團(tuán)隊(duì)聲稱 StableVicuna 是第一個(gè)開(kāi)源的基于人類反饋的增強(qiáng)學(xué)習(xí)(RLHF)LLM Chatbot。AI Chat 模型的成功得益于兩種訓(xùn)練范式:指令微調(diào)和通過(guò)人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。但因?yàn)?RLHF 的復(fù)雜性,在大多數(shù)模型中指令微調(diào)是在沒(méi)有 RLHF 訓(xùn)練的情況下應(yīng)用的。StableVicuna 是 Vicuna v0 13b(指令微調(diào)的 LLaMA 13b 模型)的進(jìn)一步指令微調(diào)和 RLHF 訓(xùn)練的版本。

Stability AI 在公告中也發(fā)布了未來(lái)的產(chǎn)品界面:

04.

商業(yè)化與競(jìng)爭(zhēng)

類似于 MongoDB 和 Red Hat 的模式,根據(jù) Emad 的 Twitter 表示,“Stable models 是基于公開(kāi)數(shù)據(jù)的每一種模型的基準(zhǔn)開(kāi)源版本。Stability AI 會(huì)通過(guò)合作伙伴(如 AWS) 為客戶的私有數(shù)據(jù)提供部門/商業(yè)許可的模型;也為大型公司、政府建立定制化模型。”

Emad 表示 Stability AI 有一個(gè)很快會(huì)產(chǎn)生巨大利潤(rùn)的商業(yè)模式,和美國(guó)以外的其他國(guó)家政府合作。但是他沒(méi)有給出更多的細(xì)節(jié),但他表示 Stability AI 不需要在硅谷,因?yàn)樗麑鸭夹g(shù)帶到整個(gè)世界:所有的國(guó)家廣播公司、世界各地的家庭辦公室。

具體的收入和成本拆分如下:

收入

1. 服務(wù)大公司,提供定制模型和咨詢服務(wù)

類似 Huggingface/Adobe,Stability AI的核心業(yè)務(wù)是為大公司建立專門的團(tuán)隊(duì),形成合作伙伴關(guān)系,出售模型(擴(kuò)展和定制 Stable Diffusion 或其他大型生成模型,每個(gè)模型的報(bào)價(jià)約幾千萬(wàn)美元),并為企業(yè)提供咨詢服務(wù),幫助大型公司和政府對(duì) AI 模型的采用。

團(tuán)隊(duì)早期表示尤其聚焦于創(chuàng)意產(chǎn)業(yè),為內(nèi)容生產(chǎn)公司定制專屬模型,這也與團(tuán)隊(duì)技術(shù)背景以及 Stable Diffusion 的適用場(chǎng)景緊密聯(lián)系。Emad 在最近的采訪中表示,正在為世界上最大的資產(chǎn)管理公司建立它們的專有模型。他表示,“最大的人工智能公司將是為大型企業(yè)提供大模型服務(wù)的公司。”

2. 付費(fèi)應(yīng)用

孵化社區(qū)生態(tài)中的技術(shù)與應(yīng)用,推出商業(yè)化版本,如以 Stable Diffusion 為基礎(chǔ)的 DreamStudio,上線第一個(gè)月,收入就達(dá)到數(shù)百萬(wàn)美金,用戶數(shù)量達(dá)到 180 萬(wàn)。

3. API

通過(guò)提供開(kāi)源模型的 API 收費(fèi),并提供增值服務(wù)。團(tuán)隊(duì)自己的具體嘗試包括 Photoshop 插件,使用戶可以在 Photoshop 中使用 Stable Diffusion 生成和編輯圖像;以及 Blender Plugin,可以生成紋理,從渲染圖中生成 AI 視頻等等。

4 月 13 日,Stability AI 發(fā)布 Stabile Diffusion XL(SDXL),通過(guò) API 提供服務(wù),為企業(yè)客戶構(gòu)建,擅長(zhǎng)照片寫(xiě)實(shí)主義。團(tuán)隊(duì)表示 XL 版本使用了 23 億個(gè)參數(shù),遠(yuǎn)遠(yuǎn)超過(guò) SD V2.1 的 9 億個(gè)參數(shù),所以生成的圖像和構(gòu)圖細(xì)節(jié)處理更好。不過(guò)也有用戶表示 XL 與原模型的模型設(shè)計(jì)、使用效果并沒(méi)有明顯差別。

成本

1. 一方面,Stability AI 作為開(kāi)源生態(tài)的基礎(chǔ)設(shè)施,為開(kāi)源社區(qū)提供算力及資金支持是一筆極大的開(kāi)支。

據(jù)說(shuō)目前 Stability AI 擁有在 AWS 運(yùn)行的、由 4000 多個(gè) Nvidia A100 GPU 組成的集群,用于訓(xùn)練包括 Stable Diffusion 的 AI 系統(tǒng),導(dǎo)致其運(yùn)營(yíng)和云服務(wù)方面的支出超過(guò)了 5000 萬(wàn)美元。

2. 另一方面,Stability AI 在全世界招募頂尖團(tuán)隊(duì),并且給予其極高的自由,這使得養(yǎng)團(tuán)隊(duì)的成本也不容小覷。

競(jìng)爭(zhēng)

1. Hugging Face:開(kāi)源模型的流量入口

首先,Stability AI 和 Hugging Face 設(shè)想的商業(yè)化路徑都是把開(kāi)源模型定制化部署到企業(yè),但開(kāi)源模型目前均依賴 Hugging Face 做 demo,是獲取開(kāi)源模型的必經(jīng)之處,Stability AI 繞不開(kāi)的場(chǎng)景。由于開(kāi)源模型的特性,Hugging Face 也可以為企業(yè)提供基于 Stable Diffusion 的定制化服務(wù)。

而且 Hugging Face 上有更多符合各類企業(yè)定制化需求的模型,其豐富度也是 Stability 暫時(shí)無(wú)法企及的。因此在很長(zhǎng)的一段時(shí)間里,Stability AI 都將與 Hugging Face 處于競(jìng)合的關(guān)系,由于其對(duì) Private Model Private Data 市場(chǎng)的相同切入點(diǎn),Hugging Face 也有著很完善的 Diffuser 庫(kù)和 app 產(chǎn)品,將成為 Stability 開(kāi)源 AI 基建的主要競(jìng)爭(zhēng)對(duì)手。

2. MidJourney:Gen AI 領(lǐng)域數(shù)據(jù)飛輪最強(qiáng)的產(chǎn)品

圖像依然是 Stability AI 的主戰(zhàn)場(chǎng),因?yàn)殚_(kāi)源模型最適合的場(chǎng)景還是類似 Stable Diffusion 等圖像生成的中小模型,大模型開(kāi)源的意義并不大。Midjourney 作為目前最成功的閉源模型-產(chǎn)品-社區(qū)一體化公司對(duì) Stable Diffusion 形成了強(qiáng)烈的競(jìng)爭(zhēng)關(guān)系。

普遍的觀點(diǎn)是,Midjourney 的進(jìn)化之快得益于其出色的產(chǎn)品設(shè)計(jì)和閉源屬性帶來(lái)的的數(shù)據(jù)飛輪。相比之下 Stable Diffusion 中大量的數(shù)據(jù)反饋由于其開(kāi)源屬性無(wú)法形成優(yōu)化模型的反饋回路,SD 更多的體現(xiàn)在開(kāi)源生態(tài)中的創(chuàng)新,如 Lora/ControlNet,但 Midjourney 同步受益于這些技術(shù)創(chuàng)新。

具體內(nèi)容可見(jiàn)我們之前關(guān)于 Midjourney 的研究。

但近期研究表明,LLM 領(lǐng)域使用精挑細(xì)選的數(shù)據(jù)做 fine-tune,比 blindly 的選更有用,在圖片領(lǐng)域數(shù)據(jù)量級(jí)的重要程度也沒(méi)這么高,夠用即可。Stable Diffusion 2.1 之前的版本,只做了最基礎(chǔ)的美學(xué)工作,沒(méi)做風(fēng)格化,XL 之后才開(kāi)始加入風(fēng)格;更注重通用性,MJ 做了較強(qiáng)的風(fēng)格化處理,使得 to C 用戶體感更好,但是我們注意到,SD 開(kāi)源社區(qū)的 Finetune、Alignment 模型風(fēng)格化后也能達(dá)到較好的效果,所以不排除 Stability AI 也有能力做到,只是重心不同。

05.

開(kāi)源社區(qū)及關(guān)系

開(kāi)源社區(qū)

目前,Stability AI 官網(wǎng)上包括 Harmon.ai、CarperAI、OpenBioML、MedARC、DeepFloyd 等開(kāi)源社區(qū)及產(chǎn)品 Clipdrop,刪除了 EleutherAI 和 LAION 這兩個(gè)核心社區(qū),但 Stability AI 與這兩個(gè)社區(qū)仍有較為密切的合作關(guān)系。

開(kāi)源社區(qū)簡(jiǎn)介及合作模式如下:

關(guān)系與組織的邊界

團(tuán)隊(duì)表示 Stability AI 是社區(qū)里面成長(zhǎng)出來(lái)的公司,是開(kāi)發(fā)者社區(qū)的一員,并驅(qū)動(dòng)、賦能整個(gè)開(kāi)發(fā)者社區(qū)更好的成長(zhǎng),但不是管理開(kāi)發(fā)者社區(qū),更不是從屬關(guān)系。Stability AI 支持這些社區(qū),比如說(shuō) Laion, Clip ViT-H 使用了 Stability AI 提供的算力進(jìn)行訓(xùn)練,訓(xùn)練完成后開(kāi)源,成為 Stable Diffusion 2.0 的基礎(chǔ)編碼器,Stability AI 再將 Stable Diffusion 進(jìn)行商業(yè)化,所以是共生的關(guān)系。

開(kāi)源與閉源

其實(shí)不同機(jī)構(gòu)之間的 AI 研究并沒(méi)有完全閉源,只有開(kāi)源程度的區(qū)別:Stability AI 所理解的開(kāi)源是完全暴露權(quán)重、底層架構(gòu)、在用戶可以在自己的消費(fèi)級(jí) GPU 上面去運(yùn)行。但 Meta、Google、OpenAI 也并不是完全的閉源,也通過(guò)發(fā)論文,開(kāi)源部分小模型的方式來(lái)促進(jìn) AI 研究的發(fā)展,這些論文的方法部分會(huì)被社區(qū)吸收使用,推動(dòng) AI 行業(yè)的進(jìn)步。不過(guò)近期,OpenAI、Google 等大公司呈現(xiàn)出更加閉源的趨勢(shì)。

推進(jìn) AI 行業(yè)發(fā)展的維度來(lái)看:不同于大語(yǔ)言模型,小模型尤其是文生圖領(lǐng)域,整體發(fā)展似乎是基于開(kāi)源模型的發(fā)展速度向前推進(jìn),現(xiàn)有的模型都不會(huì)和開(kāi)源社區(qū)的內(nèi)容有太大的差距,這也是開(kāi)源的魅力。

安全的維度來(lái)看:或許發(fā)布開(kāi)源模型可能被用于不光彩的事情,如釣魚(yú)郵件或惡意攻擊,但 Stability AI認(rèn)為,將模型開(kāi)源,可以提高透明度和培養(yǎng)信任。研究人員可以對(duì)模型進(jìn)行開(kāi)放的、細(xì)顆粒度的訪問(wèn),充分的驗(yàn)證模型性能,研究可解釋性技術(shù),識(shí)別潛在風(fēng)險(xiǎn),并幫助開(kāi)發(fā)保障措施,這是封閉模型無(wú)法做到的。

公司發(fā)展維度來(lái)看:開(kāi)源和閉源的選擇也取決于團(tuán)隊(duì)的特質(zhì),當(dāng)創(chuàng)始人對(duì)未來(lái)發(fā)展有非常明確認(rèn)知的時(shí)候,閉源是更高效的,比如 OpenAI;但是 Emad 沒(méi)有技術(shù)背景,對(duì)未來(lái)沒(méi)有明晰的認(rèn)知,所以開(kāi)源是 Stability AI 合理的戰(zhàn)略選擇。

06.

收購(gòu)與合作

收購(gòu) Clipdrop

2023 年 3 月,Stability AI 官宣收購(gòu) Init ML 的 Clipdrop。Clipdrop 是成像應(yīng)用套件,可以進(jìn)行背景去除、光線調(diào)整、圖像擴(kuò)展等編輯。累計(jì)用戶超過(guò) 1500 萬(wàn),適用于 iOS、Android、macOS、Windows 等平臺(tái),曾六次獲得 Product Hunt 的 “每日最佳產(chǎn)品” 獎(jiǎng)。Clipdrop 目前作為 Stability AI 的全資子公司獨(dú)立運(yùn)營(yíng)。

目前 Clipdrop 集成了 Stable Diffusion XL(基于模型做產(chǎn)品包裝),并且發(fā)布了新產(chǎn)品 Stable Diffusion Reimagine,允許用戶無(wú)限制地生成一張圖片的多種變化。原理是用圖像編碼器取代了原有的文本編碼器,不是根據(jù)文本輸入來(lái)生成圖像,而是從圖像中生成圖像。

集成 Stable Diffusion XL

Stable Diffusion Reimagine

可以生成不同視角、不同風(fēng)格元素

與 Krikey AI 合作

2023 年 2 月,Stability AI 與 Krikey AI 合作推出了 Text-to-Animation 的 AI 工具,使用戶能夠在幾分鐘內(nèi)通過(guò)輸入文本短語(yǔ)生成動(dòng)畫(huà),并把動(dòng)畫(huà)作為視頻文件或 fbx 文件輸出到社交媒體賬戶、3D 游戲引擎或電影編輯軟件,還允許用戶定制三維頭像并生成 AI 動(dòng)畫(huà)。該生成 AI 動(dòng)畫(huà)工具結(jié)合了人工智能、計(jì)算機(jī)視覺(jué)和 ML 模型。

近期 Youtube 視頻效果

Krikey AI 的開(kāi)發(fā)者工具還包括定制 3D 頭像工具、AR 移動(dòng)應(yīng)用工具包等,使創(chuàng)作者能夠生成動(dòng)畫(huà),帶入任何平臺(tái)進(jìn)行 3D 內(nèi)容創(chuàng)作。Krikey AI 已與 Snapchat、T-Mobile、Google Maps, The Ellen DeGeneres Wildlife Foundation, Sony Pictures Entertainment 和 the National Audubon Society 合作,為品牌合作伙伴建立了定制的 AR 游戲,達(dá)到 500 多萬(wàn)用戶。

Krikey AI CTO Ketaki Shriram 認(rèn)為“這是關(guān)于如何創(chuàng)建 3D 內(nèi)容的革命的開(kāi)始。”生成性 AI 動(dòng)畫(huà)在電影、游戲、Metaverse 化身、社交媒體和云計(jì)算等行業(yè)中都有豐富的應(yīng)用場(chǎng)景,AI 動(dòng)畫(huà)可能是下一個(gè)創(chuàng)造者經(jīng)濟(jì)的基矗但是雖然目前 Krikey AI 的 Twitter 保持了持續(xù)更新,但幾乎沒(méi)有用戶關(guān)注,Product hunt 等平臺(tái)上也找不到產(chǎn)品 Review,產(chǎn)品效果與市面上常見(jiàn)的 Text-to-Code 產(chǎn)品并沒(méi)有明顯優(yōu)勢(shì)。

與 Amazon 合作

Stability AI 與 Amazon 的合作包括 AWS、SageMaker 及 Bedrock 等幾個(gè)方面。

在算力層面:

Stability AI 選擇 AWS 作為首選云供應(yīng)商,使用其云服務(wù)來(lái)建立和擴(kuò)展其圖像、語(yǔ)言、音頻、視頻和 3D 內(nèi)容生成的 AI 模型。使用 Amazon SageMaker(端到端機(jī)器學(xué)習(xí)服務(wù)),Stability AI 在擁有數(shù)千個(gè) GPU 或 AWS Trainium 芯片的計(jì)算集群上建立、訓(xùn)練 AI 模型,將訓(xùn)練時(shí)間和成本降低 58%。

Stability AI 與 AWS 的合作使世界各地的學(xué)生、研究人員、初創(chuàng)公司和企業(yè)都可以使用其開(kāi)源工具和模型。據(jù)稱,Stability AI 獲得了來(lái)自亞馬遜的超過(guò) 4000 個(gè)英偉達(dá) A100,以 50% 的 margin 與 AWS 合作,為計(jì)算密集型模型提供服務(wù)。在此之前,Stability AI 計(jì)算資源來(lái)自創(chuàng)始人自己購(gòu)買的 32 個(gè) GPU。

在模型層面:

Stability AI 宣布與 Amazon 的 Bedrock AI 平臺(tái)結(jié)成戰(zhàn)略商業(yè)聯(lián)盟,使 Stability AI 的模型在該平臺(tái)上可用。Bedrock 為 Stability AI 的客戶提供了靈活、可擴(kuò)展的平臺(tái),并可以使用大量的工具。

除此之外,Stability AI 還與擁有 1.2 萬(wàn)部的電影資料庫(kù)的印度的投資機(jī)構(gòu) Eros Investments(愛(ài)神投資)成立了合資企業(yè);與 Peter Gabriel 合作推出名為 #DiffuseTogether 的系列 AI 動(dòng)畫(huà)挑戰(zhàn)賽# 等等。

07.

成功要素與風(fēng)險(xiǎn)

成功要素

1. 為開(kāi)源模型的商業(yè)模式能否跑通

目前我們無(wú)從得知 Stability AI 的定制化商業(yè)模型及付費(fèi)版本產(chǎn)品及 API 的盈利情況如何,但傳言稱內(nèi)部創(chuàng)收緩慢。開(kāi)源商業(yè)模式始終飽受爭(zhēng)議,根本原因是開(kāi)源 AI 模型的商業(yè)化不閉環(huán),Stability AI 發(fā)展的最大難題還是開(kāi)源 AI 模型和商業(yè)化如何同時(shí)達(dá)成。目前還未看到合理的解決方案。

2. Stability AI 的獲客能力

獲客能力主要的影響因素來(lái)自于團(tuán)隊(duì)人脈及 BD 能力,以及公眾對(duì)團(tuán)隊(duì)技術(shù)實(shí)力的認(rèn)可。相比之下,目前 Hugging Face 獲得了更多的認(rèn)可,但 Stability AI 正在持續(xù)的收編團(tuán)隊(duì),加上創(chuàng)始人的影響力,仍具有發(fā)展的潛力。

3. 核心團(tuán)隊(duì)對(duì)于盈利的態(tài)度、行動(dòng),以及人員管理能否加強(qiáng)

目前 Stability AI 因 Emad 的管理風(fēng)格創(chuàng)收緩慢,資金告急。Emad 給 AI 研究員極度的獨(dú)立性,將服務(wù)器權(quán)限直接交給他們,不進(jìn)行任何監(jiān)督,這導(dǎo)致了大量的成本風(fēng)險(xiǎn),一些員工對(duì) Emad 的領(lǐng)導(dǎo)風(fēng)格失去信心。傳聞 Stability AI 可能正在尋找另一位真正專注于賺錢的高管。目前,Stability AI 已經(jīng)燒掉了去年底籌集的 1 億美元中的大部分資金,并在尋求估值 40 億美元的新一輪融資。若不及時(shí)加強(qiáng)內(nèi)部的監(jiān)督和完成新的一輪融資,Stability AI 會(huì)始終面臨著資金問(wèn)題和盈利困難,未來(lái)的領(lǐng)導(dǎo)風(fēng)格及人員管理對(duì) Stability AI 的發(fā)展至關(guān)重要。

風(fēng)險(xiǎn)

1. 沒(méi)有屬于自己的閉源產(chǎn)品和數(shù)據(jù)飛輪,壁壘相對(duì)較淺

不同于大語(yǔ)言模型領(lǐng)域的 OpenAI 和文生圖領(lǐng)域的 Midjourney,Stability AI 沒(méi)有獨(dú)屬于自己的閉源模型。Stable Diffusion 也是同 Runway 及社區(qū)共同開(kāi)發(fā)的。其提供的 API 和定制化模型在技術(shù)上并不存在壁壘,用戶沒(méi)有必須選擇它的服務(wù)的理由,雖然 Stability AI 也有自己運(yùn)營(yíng)的社區(qū)和開(kāi)源合作伙伴,但開(kāi)源使用的數(shù)據(jù)反饋也無(wú)法全部用于對(duì)模型的優(yōu)化上。

2. 沒(méi)有深度綁定的合作伙伴,承擔(dān)模型訓(xùn)練成本

不同于 OpenAI 與微軟的深度合作,Stability AI 與 AWS 的合作相對(duì)較淺,雖然也有 Revenue Share 機(jī)制,在不盈利的情況下難以負(fù)擔(dān)較高的模型訓(xùn)練成本,也就無(wú)法堆積算力訓(xùn)練模型,和 OpenAI 抗衡。其新推出的 StableLM 的效果欠佳就在側(cè)面反應(yīng)了這一點(diǎn)。

3. 面臨的監(jiān)管問(wèn)題:如 AI 繪畫(huà)涉嫌侵權(quán)被起訴

文生圖模型是否侵權(quán)一直是行業(yè)內(nèi)熱議的話題。三位藝術(shù)家指控他們?cè)谖唇?jīng)授權(quán)的情況下使用他們的藝術(shù)作品,使他們各自的人工智能圖像生成器能夠創(chuàng)造出相當(dāng)于侵權(quán)衍生作品的 "新 "圖像;目前Stability AI 已經(jīng)發(fā)布了駁回要求。不過(guò)這不會(huì)成為 Stability AI 發(fā)展的重要阻礙,AI 的發(fā)展是不可阻擋的趨勢(shì)。

08.

結(jié)論

發(fā)展預(yù)期

Stability AI以算力支持開(kāi)源社區(qū)起步,并通過(guò)融資拉到了一些有名的研究者,以開(kāi)源模型為基礎(chǔ)搭建自己的生態(tài)。但是無(wú)論是人才的密度還是長(zhǎng)期的愿景,距離 OpenAI 和 Deepmind 還有很遠(yuǎn)的距離。

Stability AI未來(lái)的發(fā)展有以下幾種可能的前景:

1. 成為 AI 領(lǐng)域的 MongoDB 和 Red Hat,以開(kāi)源模型為基礎(chǔ),為大型企業(yè)、政府提供定制化模型及咨詢服務(wù),實(shí)現(xiàn)了較好的商業(yè)化效果;并持續(xù)在 AI 模型的開(kāi)源、公平、安全領(lǐng)域做出貢獻(xiàn);

開(kāi)源軟件(如 Red Hat)的商業(yè)模式:

Service & Support:讓盡可能廣泛的用戶使用開(kāi)源軟件,社區(qū)用戶“為愛(ài)發(fā)電”,待軟件進(jìn)入生產(chǎn)環(huán)節(jié),便會(huì)出現(xiàn)愿意付費(fèi)的企業(yè)級(jí)客戶。(類似 redhat 的 Linux1992);

Open Core:把核心的內(nèi)容開(kāi)源,對(duì)于部分內(nèi)容,尤其是企業(yè)有關(guān)的 feature,變成需要收費(fèi)的閉源內(nèi)容。

2. 在開(kāi)源領(lǐng)域的競(jìng)爭(zhēng)中不及 Hugging Face 和 Replicate,無(wú)法實(shí)現(xiàn)有效盈利,最終成為了與社區(qū)共生的開(kāi)源非盈利組織。

不過(guò)目前 Stability AI 面臨的混亂和困境是情有可原的,僅僅以現(xiàn)狀去評(píng)判它的未來(lái)是草率且不負(fù)責(zé)任的。一方面開(kāi)源 AI 模式下的商業(yè)化探索本身就是一件全新的事情,開(kāi)源模式原本常見(jiàn)于小成本的軟件;另一方面 AI 領(lǐng)域的研究是長(zhǎng)期且艱難的過(guò)程,OpenAI 在成立最初也沒(méi)有獲得行業(yè)的認(rèn)可,在 7 年后才獲得了如今的成就。Stability AI 僅僅成立了兩年多的時(shí)間,就已經(jīng)獲得了極大的關(guān)注度和社區(qū)貢獻(xiàn),CEO 的影響力也有目共睹。如果其能度過(guò)目前成長(zhǎng)的陣痛,找到合適的路徑,未來(lái)的發(fā)展仍是可期的。

Reference

https://mp.weixin.qq.com/s/nmDgSq50iAB9iEhucmbXQg

https://www.thefashionlaw.com/stability-ai-looks-to-get-copyright-suit-over-ai-generator-tossed-out/

https://www.semafor.com/article/04/07/2023/stability-ai-is-on-shaky-ground-as-it-burns-through-cash

https://www.goldmansachs.com/insights/pages/stability-ai-ceo-says-ai-will-prove-more-disruptive-than-the-pandemic.html

https://www.webpronews.com/stability-ai-is-on-amazon-bedrock/

https://www.bbc.com/news/uk-politics-65582386

贊助本站

人工智能實(shí)驗(yàn)室
相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港