-
OpenAI推出最新文生图模型
近日,OpenAI对GPT-4o和Sora进行了重大更新,推出了全新的文生图模型。该模型不仅能够生成图像,还支持自定义操作、连续发问、风格转换以及制作图像PPT等多种实用功能。 它生成的图像非常逼真,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 OpenAI联合创始人兼首席执行官表示,新的文生图模型是一项令人难以置信…...- 0
- 11
-
谷歌推出全新图像生成器Imagen 3
最近谷歌宣布推出了Imagen 3,进一步增强了文本生成图片的技术能力。Imagen 3在文本语义还原、色彩搭配、文本嵌入、图像细节、光影效果等方面都比Imagen 2有了大幅度的提升。目前Imagen 3已经可以在美国地区使用,未来谷歌会持续扩大使用范围。 传统的扩散模型在处理高维复杂数据、图像质量和多样性以及训练稳定性方面有一些缺点,同时开发成本也比较高。在这种背景下谷歌推出了使用了潜空间扩散…...- 0
- 36
-
最强开源文生图模型FLUX.1发布
最近,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1有120亿参数,本次一共发布了三个版本:Pro版(通过API使用)、dev版(非商用的指导蒸馏模型,继承了Pro版多数性能)、schnell版(可以商用的开源模型)。 FLUX.1性能大幅度超过了DALL·E-3、Midjourney V6闭源模型,开源SD3系列的Ultra、Me…...- 0
- 84
-
Stable Diffusion 3即将在6月12日开源
6月3日,Stability AI的联合首席执行官在AMD的产品发布会宣布,文生图模型Stable Diffusion 3即将在6月12日正式开源。 此次开源的Stable Diffusion 3的Medium模型有20亿参数,在照片真实感、样式、图片质量、算力资源消耗等方面都进行了大幅度优化,将比前两代更好。同时Stable Diffusion 3也是对标闭源文生图产品Midjourney、DA…...- 0
- 60
-
Stable Diffusion 3来啦!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3。 该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。 Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移…...- 0
- 28
-
谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能
2月2日,谷歌在官网对生成式AI产品进行了大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像; 全新的文生音乐平台MusicFX;新的文生图像平台ImageFX;新的文本扩写平台TextFX;在谷歌地图中增加生成式AI功能,用文本提示快速查找路线、店铺等。 值得一提的是,这5大功能目前都是免费使用。其中,文生图像平台ImageFX的功能非常强悍,支持对文本提示中的“关键元素”进行…...- 0
- 51
-
ChatGPT正在测试原生文件分析功能 DALL·E3能P图啦!
10月29日,有部分用户在社交平台上分享,ChatGPT Plus正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的PDF等数据文件进行提问、搜索。 例如,上传一份50页的员工手册PDF文件,然后向ChatGPT提问,能帮我总结一下手册的5个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚? 其实,文件分析功能并不是最近才推出的,用户借助ChatGPT早期推出的第三方插件功能就能实…...- 0
- 30
-
ChatGPT可以使用DALL·E 3啦!OpenAI还开放了论文
10月20日凌晨,OpenAI在官网宣布,现在所有ChatGPT plus和企业版用户,可以使用最新的文生图模型DALL·E 3。 DALL·E 3是OpenAI在今年9月21日发布的最新产品,用户通过文本问答方式就能生成二次元、平面、创意、朋克、3D等多种类型的图片,例如,生成一个在火星奔跑的兔子,荒漠,废土风格,漫天风沙。 值得一提的是,DALL·E 3在语义理解、图片二次修改、大段文本输入等…...- 0
- 23
-
OpenAI计划进行重大更新 以更低的成本吸引开发者
OpenAI计划在下个月进行重磅更新,帮助开发人员以更低价格、更快的方式,通过其模型构建专属ChatGPT。更新主要包括,向使用AI模型的开发者工具中增加内存存储功能。理论上,这可以将应用程序的成本降低20倍左右。同时也解决了合作伙伴通过开发、销售AI软件建立业务时,需要支付ChatGPT模型高昂的成本问题。 OpenAI还计划推出新的视觉开发工具,使开发人员能够构建具有分析图像和描述图像能力的应…...- 0
- 22
-
Adobe全面开放生成式AI——Firefly
10月10日,全球多媒体软件领导者Adobe在官方宣布,在Photoshop、Illustrator、Adobe Express等产品中,正式发布生成式AI功能Firefly。Firefly是Adobe在今年3月发布的一款文本生图产品,用户通过文本就能生成3D、平面、素描等多种类型图片,与Midjourney的使用方法、功能类似。 目前,Adobe在全球的正版用户超过2000万,全面开放Firef…...- 0
- 76
-
微软在Windows 11推出Copilot 全民生成式AI办公时代降临
9月21日微软在美国纽约曼哈顿举办产品发布会,生成式AI成为重要主题之一。微软表示Copilot将于9月26日在Windows 11中推出;Microsoft 365 Copilot 将于11 月1日向企业客户全面推出;将OpenAI最新的文本生成图片产品DALL.E 3集成在Bing和设计平台Designer中等。总结来说几乎在微软所有产品矩阵中,大家都能看到Copilot智能助手的身影,全民生…...- 0
- 56
-
OpenAI将发布DALL·E 3 可在ChatGPT中使用
9月21日凌晨,OpenAI在官网宣布,在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E 3.这意味着ChatGPT在DALL·E 3加持下将开启久违的多模态输出模式,用户通过文本就能直接在ChatGPT中生成各种类型图片。 官网地址:https://openai.com/dall-e-3 例如,在ChatGPT中输入,生成一只可爱的米老鼠、…...- 0
- 123