IT之家 6 月 13 日消息,Stability AI 發(fā)布了 Stable Diffusion 3 Medium(下文簡稱 SD3 Medium),官方聲稱是“迄今為止最先進(jìn)的開源模型”,其性能甚至超過了 Midjourney 6。
Stability AI 公司表示 SD3 Medium 可以根據(jù)用戶輸入的文本描述,重點(diǎn)克服了文生圖模型中手部和臉部的挑戰(zhàn),生成足以亂真的的圖像。
SD3 Medium 還利用其底層的 Diffusion Transformer 架構(gòu),高精度地整合了文字元素。
SD3 Medium 的另一個(gè)特點(diǎn)是易于使用。相比較一些資源密集型 AI 模型,SD3 Medium 可以在消費(fèi)級顯卡上運(yùn)行,可以加速普及適配。
Stability AI 在非商業(yè)許可下提供 SD3 Medium,供免費(fèi)使用。對于商業(yè)應(yīng)用,可為藝術(shù)家、設(shè)計(jì)師和開發(fā)人員提供創(chuàng)作者許可證;對于大型商業(yè)用戶,可以直接聯(lián)系 Stability AI 了解授權(quán)詳情。
Stability AI 還表示計(jì)劃在未來將其產(chǎn)品擴(kuò)展到視頻和音頻生成領(lǐng)域。提示詞如下:
A photograph of an 18-year-old Japanese woman hitchhiking,holding a cardboard sign that reads ' 京まで ' (To Tokyo Station).She is standing by the roadside with a hopeful expression,wearing casual clothing and a backpack. The background shows a bustling urban street with cars passing by and city buildings. The scene is lively and vibrant,capturing the energy of Tokyo. Cinematic composition,trending on artstation.
IT之家附上生成的相關(guān)圖片如下:
以上圖源:Yas@BizDev