超强文生图模型Stable Diffusion 3.5重磅开源

最近StabilityAI公司宣布正式开源超强文生图模型Stable Diffusion 3.5,共有Medium、Large和Large Turbo三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求。

Stable Diffusion 3.5

Stable Diffusion 3.5三种版本介绍

1、Stable Diffusion 3.5 Large

Large版本共有80亿个参数,具有卓越的质量和快速响应,是Stable Diffusion家族中最强大的模型,非常适合100万像素分辨率的专业应用场景。

2、Stable Diffusion 3.5 Large Turbo

Large Turbo版本是Large的精简版,在出色地遵循提示词上,仅需4个步骤内生成高质量图像,且生成速度明显快于Large。

3、Stable Diffusion 3.5 Medium(将于10月29日发布)

该模型拥有25亿个参数,采用改进的MMDiT-X架构和训练方法,旨在能够在消费级硬件上“开箱即用”,平衡质量和易于定制,能够生成分辨率在25万到200万像素之间的照片。

在开发这些模型的过程中,Stability AI优先考虑了可定制性,提供了一个灵活的基础来构建。将Query-Key归一化集成到了变换器块中,这不仅稳定了模型训练过程,还简化了进一步的微调和开发。

为了支持这种下游的灵活性,Stability AI不得不做出一些权衡,例如,同一个提示使用不同种子可能会产生更大的输出变化,这是有意为之的,以帮助在基础模型中保留更广泛的知识库和多样化的风格。

在可定制性、高效的性能以及多样化的输出方面,Stable Diffusion 3.5同样表现地非常出色,使其成为市场上最可定制和最易访问的文生图像模型之一,同时在提示遵循性和图像质量方面保持了顶级性能。

行业动态

微软发布支持o1模型的10个AI Agent

2024-10-22 10:07:25

行业动态

OpenAI发布全新扩散模型sCM

2024-10-24 10:16:35

相关推荐