与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验 -1

6月22日,Stability AI宣布推出SDXL 0.9,这是Stable Diffusion文本生成图像模型中最先进的版本。继4月发布Stable Diffusion XL 测试版后,SDXL 0.9 的图像和构图细节比之前版本有了显著改进。

尤其是在参数上,这次的SDXL 0.9具有35亿参数基础模型和66亿参数模型的集成管线。相比之下,Beta测试版仅用了单个31亿参数的模型。

为了生成更逼真的图像,以及更大的深度和更高的分辨率(1024×1024),SDXL 0.9使用了两个CLIP模型,包括迄今为止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。

不仅如此,SDXL 0.9在消费级显卡上就能运行。只需要Win10/11或Linux操作系统、16GB内存,以及具有8GB以上显存的英伟达RTX 20系显卡即可。

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验 -2

官方表示,SDXL系列还会提供一系列超越基本文本prompt的功能,包括:

  • 图像对图像的prompt:输入一个图像以获得该图像的变化;
  • 内画:重建图像的缺失部分;
  • 外画:构建一个现有图像的无缝扩展。

SDXL团队不久将发布一个研究博客,更详细地介绍这个模型的规格和测试。该模型今天可以通过ClipDrop访问,API即将推出。据Stability AI公布,将于 7 月中旬公开发布v1.0版本。

驱动力

SDXL 0.9在构图方面的进步的关键驱动力是其参数数量(模型训练的神经网络中所有权重和偏差的总和)相比beta版本有了显著增加。SDXL 0.9拥有开源图像模型中最大的参数数量之一,拥有35亿参数的基础模型和66亿参数的模型集成管道(最终输出是通过在两个模型上运行并聚合结果创建的)。管道的第二阶段模型用于为第一阶段生成的输出添加更细致的细节。

系统要求

尽管SDXL 0.9的输出强大且模型架构先进,但它能够在现代消费者GPU上运行,只需要Windows 10或11,或Linux操作系统,配备16GB RAM,Nvidia GeForce RTX 20图形卡(或同等或更高标准)配备至少8GB的VRAM。Linux用户也可以使用配备16GB VRAM的兼容AMD卡。

可用性

SDXL 0.9现在可以在Stability AI的Clipdrop平台上使用。Stability AI API和DreamStudio客户将能够在6月26日(星期一)访问该模型,以及其他领先的图像生成工具,如NightCafe。在有限的时间内,SDXL 0.9将仅供研究目的使用,以收集反馈并完全优化模型,然后进行公开发布。运行它的代码将在Github上公开。

官方示例:

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验 -3

Prompt:外星人在拉斯维加斯漫步

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验 -4

Prompt:优胜美地国家公园的一只狼

Negative prompt:3d 渲染,光滑,塑料,模糊,颗粒感,低分辨率,动漫,过度饱和

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验 -5

Prompt:手举咖啡

Negative prompt:3d 渲染,光滑,塑料,模糊,颗粒状,低分辨率,动漫

总结

Stability AI的SDXL 0.9是一个重大的进步,它在图像生成和构图细节上大大超越了其前身。尽管它的硬件需求相对较低,但其在生成超现实图像和设计应用方面的能力却非常强大。此外,它的参数数量也大大增加,使其成为开源图像模型中参数数量最大的一个。SDXL 0.9现已在Stability AI的Clipdrop平台上提供,而且很快就会有API推出。

与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验-MOHE素材库-设计行业的乐园,各类素材的矿山!
与Midjourney开战!Stable Diffusion XL 0.9重磅发布 [SDXL 0.9]模型 35亿+66亿双模型 开启新的开源AI文本转图像模型 图像生成未来 本地部署 抢先体验
此内容为付费资源,请付费后查看
58积分
付费资源
已售 12
© 版权声明
THE END
喜欢就支持一下吧
点赞22 分享
评论 抢沙发

请登录后发表评论

    请登录后查看评论内容