近日OpenAI发布了全新扩散模型方法sCM,仅需两步即可生成高质量图片、3D模型等,速度提升约50倍。该模型以简化的连续时间一致性模型为基础,提供更高的训练稳定性和可扩展性。
sCM扩散模型核心原理是基于一致性模型思路,通过直接将噪声转换为无噪声样本来生成数据。与传统扩散模型不同,一致性模型可找到一条更直接的路径,在单步或少数几步内直接从噪声状态跳跃到数据状态。
sCM扩散模型的特点
1、采用连续时间框架
sCM采用了连续时间框架,使得模型在理论上可以在连续的时间轴上进行操作,从而避免了离散时间模型中的离散化误差。在连续时间于一致性模型中,模型的参数化、扩散过程和训练目标都被重新定义,以适应连续时间的设置。
2、引入改进的时间条件
改进的时间条件使得模型能够更准确地感知时间t的变化,从而在生成过程中做出更合理的决策。
3、引入自适应组归一化
自适应组归一化则有助于模型在训练过程中保持内部特征的稳定性,减少训练过程中的噪声干扰。
4、引入新的激活函数
新的激活函数被引入以增强模型的非线性表达能力,使得模型能够更好地学习复杂的数据分布。
5、引入自适应权重
自适应权重的引入允许模型根据训练数据的分布动态调整损失函数中的权重,从而减少了不同时间步长之间的损失方差。
研究人员为了评估sCM的性能,在CIFAR-10、ImageNet 64×64和ImageNet 512×512多个数据集上都对其进行了综合评测。结果显示,sCM成为目前最高效的扩散生成方法。
目前,OpenAI已经分享了该论文方法。