超强文生图模型Stable Diffusion 3.5重磅开源

行业动态
2024年10月23日
0
编辑

最近StabilityAI公司宣布正式开源超强文生图模型Stable Diffusion 3.5，共有Medium、Large和Large Turbo三种规模版本，旨在满足科学研究人员、爱好者、初创公司和企业的不同需求。

Stable Diffusion 3.5

Stable Diffusion 3.5三种版本介绍

1、Stable Diffusion 3.5 Large

Large版本共有80亿个参数，具有卓越的质量和快速响应，是Stable Diffusion家族中最强大的模型，非常适合100万像素分辨率的专业应用场景。

2、Stable Diffusion 3.5 Large Turbo

Large Turbo版本是Large的精简版，在出色地遵循提示词上，仅需4个步骤内生成高质量图像，且生成速度明显快于Large。

3、Stable Diffusion 3.5 Medium（将于10月29日发布）

该模型拥有25亿个参数，采用改进的MMDiT-X架构和训练方法，旨在能够在消费级硬件上“开箱即用”，平衡质量和易于定制，能够生成分辨率在25万到200万像素之间的照片。

在开发这些模型的过程中，Stability AI优先考虑了可定制性，提供了一个灵活的基础来构建。将Query-Key归一化集成到了变换器块中，这不仅稳定了模型训练过程，还简化了进一步的微调和开发。

为了支持这种下游的灵活性，Stability AI不得不做出一些权衡，例如，同一个提示使用不同种子可能会产生更大的输出变化，这是有意为之的，以帮助在基础模型中保留更广泛的知识库和多样化的风格。

在可定制性、高效的性能以及多样化的输出方面，Stable Diffusion 3.5同样表现地非常出色，使其成为市场上最可定制和最易访问的文生图像模型之一，同时在提示遵循性和图像质量方面保持了顶级性能。

微软发布支持o1模型的10个AI Agent

2024-10-22 10:07:25

OpenAI发布全新扩散模型sCM

2024-10-24 10:16:35

相关推荐

TOP1

2025年好用的控制面板软件合集
11小时前
TOP2

阿里云快速部署DeepSeek个人站点方案
16小时前
TOP3

域名抢注常见问题及答案
18小时前
腾讯云GPU云服务器部署满血版DeepSeek模型教程
2025年4月1日
OpenAI即将发布开放权重语言模型
2025年4月1日
ToDesk开启隐私屏幕需要申请吗
2025年3月31日