-
超强文生图模型Stable Diffusion 3.5重磅开源
最近StabilityAI公司宣布正式开源超强文生图模型Stable Diffusion 3.5,共有Medium、Large和Large Turbo三种规模版本,旨在满足科学研究人员、爱好者、初创公司和企业的不同需求。 Stable Diffusion 3.5三种版本介绍 1、Stable Diffusion 3.5 Large Large版本共有80亿个参数,具有卓越的质量和快速响应,是Sta…...- 0
- 23
-
Stable Diffusion 3即将在6月12日开源
6月3日,Stability AI的联合首席执行官在AMD的产品发布会宣布,文生图模型Stable Diffusion 3即将在6月12日正式开源。 此次开源的Stable Diffusion 3的Medium模型有20亿参数,在照片真实感、样式、图片质量、算力资源消耗等方面都进行了大幅度优化,将比前两代更好。同时Stable Diffusion 3也是对标闭源文生图产品Midjourney、DA…...- 0
- 47
-
Stable Diffusion 3来啦!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3。 该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。 Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移…...- 0
- 21
-
Stable Diffusion XL 1.0上线 生成图片更快、更稳定
7月11日,文本生成图片平台Stability AI宣布推出扩散模型Stable Diffusion XL 1.0版本,并且可以在discord上进行测试。据悉,Stable Diffusion XL 1.0可以通过文本直接生成风景、肖像、动物、物品等多种类型图片,与之前相比更快、更稳定,自由可控。 Stable Diffusion XL 1.0主要新功能如下: 多种控制和定制:用户可以根据自己的…...- 0
- 67
-
Stable Diffusion动画版上线 支持多种输入方式
当地时间5月11日,开源生成式AI公司Stable AI发布了一款全新的动画生成工具Stable Animation SDK。这是一款专为艺术家与开发人员设计的工具,旨在帮助艺术家和开发人员运用最先进的稳定扩散模型生成动画。借助Stable Animation SDK,使用者可以调用包括Stable Diffusion 2.0、Stable Diffusion XL在内的所有Stable Diff…...- 0
- 111
-
Stable Video 3D上线 单个图片生成高质量3D视频
3月19日,Stability AI继推出文生图Stable Diffusion、文生视频Stable Video Diffusion之后,上线了图像直接生成3D视频模型——Stable Video 3D。 该模型基于Stable Video Diffusion打造,能够显著提升3D生成的质量和多视角一致性,效果要优于之前Stability AI推出的Stable Zero123以及丰田研究院和哥…...- 0
- 16
-
Stable Audio亮相 文本直接生成20多种背景音乐
9月14日,著名开源平台Stability AI在官网发布了音频AIGC产品Stable Audio。用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。 目前,Stable Audio有免费和付费两个版本,免费版每月可生成20个音乐,最大时长45秒,不能用于商业;付费版每月11.99美元(约87元),可生成500个音乐,最大时长90秒,可用于…...- 0
- 36
-
Stable Doodle重磅发布 文本+草图直接生成3D图片
7月14日,Stability AI在官网宣布推出Stable Doodle。Stable Doodle是一款通过文本提示+草图可直接生成高精准图片的产品,现在免费对外开放。用户只需要登录平台官网,无需注册,绘制一个草图,接着输入描述,即可生成图片。如果想要图片精准度更高,还可以选择不同的图片样式,甚至可以直接选择3D样式。 免费在线体验地址:https://clipdrop.co/stable-…...- 0
- 100
-
Stability AI发布语言模型StableLM 与OpenAI正面交锋
最近,Stable Diffusion背后的公司Stability AI推出了一款名为StableLM的新产品,其功能类似于OpenAI AI聊天机器人ChatGPT。 据了解,该公司将提供两种型号的StableLM,较小的版本提供30亿个参数的复杂度,而“较大”的版本有70亿个参数。该公司表示,它计划发布15至650亿个参数的更复杂模型。今天发布的两个alpha版本均可用于商业和研究目的。 St…...- 0
- 57
-
谷歌推出全新图像生成器Imagen 3
最近谷歌宣布推出了Imagen 3,进一步增强了文本生成图片的技术能力。Imagen 3在文本语义还原、色彩搭配、文本嵌入、图像细节、光影效果等方面都比Imagen 2有了大幅度的提升。目前Imagen 3已经可以在美国地区使用,未来谷歌会持续扩大使用范围。 传统的扩散模型在处理高维复杂数据、图像质量和多样性以及训练稳定性方面有一些缺点,同时开发成本也比较高。在这种背景下谷歌推出了使用了潜空间扩散…...- 0
- 22
-
最强开源文生图模型FLUX.1发布
最近,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1有120亿参数,本次一共发布了三个版本:Pro版(通过API使用)、dev版(非商用的指导蒸馏模型,继承了Pro版多数性能)、schnell版(可以商用的开源模型)。 FLUX.1性能大幅度超过了DALL·E-3、Midjourney V6闭源模型,开源SD3系列的Ultra、Me…...- 0
- 61
-
阿里推出视频模型:AtomoVideo文本+图片生成视频
阿里巴巴集团的技术团队推出了文本+图片生成高保真视频模型——AtomoVideo。 用户通过AtomoVideo只需要提供高清图片和简单的文本提示,就能快速生成高清视频并保留逼真的细节。 根据评测数据显示,AtomoVideo生成的视频在动作连贯性、图片一致性、时序一致性、运动强度等方面超过了VideoCrafter、I2VGEN-XL、SVD开源模型,可媲美商业模型Gen-2和Pika。 论文地…...- 0
- 36