2025年stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别

编程基础 • 2025-02-10 21:27 • 阅读 235

stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别对于日常生成我们只要了解这样一个事实就行了如果只是生成 EMA 模型和标准模型的效果是一样的

在这里插入图片描述

https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script

在这里插入图片描述
对于 1.5 模型，其中可能包括四部分：标准模型、文本编码器、VAE模型、EMA模型。

标准模型：生成图片的核心模块，潜空间中的前向扩散和反向扩散就是通过它做的，对应到图中左侧的 U-Net。

文本编码器：将文本提示词转换为数学向量，然后用作生成图片的引导条件。全称是 Text Encoder，对应到图中的TE。

VAE模型：用于图像在像素空间和潜在空间的映射，生成图片时将图像从潜在空间转换为像素图片，目前大部分模型都自带VAE。

EMA模型：EMA是一种算法，用来稳定模型效果的。对于日常生成，我们只要了解这样一个事实就行了：如果只是生成，EMA模型和标准模型的效果是一样的。如果你要做二次训练，并且显卡够好，选择带EMA的模型可能更好，因为所有数据都在；当然选择去EMA的模型也能做二次训练。

https://mp.weixin.qq.com/s/Ka5lnzcyFv2zdifo-Q81HQ

编程小号

AI大模型探索之路-训练篇15：大语言模型预训练之全量参数微调

上一篇 2025-01-24 12:06

2025年相电压与线电压

下一篇 2025-09-23 10:01

AI大模型探索之路-训练篇15：大语言模型预训练之全量参数微调 1736367009
【YOLOv5改进系列(9)】高效涨点----使用CAM（上下文增强模块）替换掉yolov5中的SPPF模块 1736367006
2025年重装系统详细指南 1736367004
史上最详细的 Win10系统重装教程（纯净版） 1736367003
2025年Mac 电脑系统重装（详细流程，包含 Intel、Apple M系列） 1736366995
呼叫中心线路架构：打造高效沟通和卓越客户服务的关键 1736366986
深入解析与应对《十字军之王II》（CK2）常见的DLL错误问题 1736366981
OSI七层模型 1736366978
nfctools: 探索无限可能的NFC应用 1736366975
2025年相电压与线电压 1736367021
Kubernetes（k8s）之jeckins自动化构建docker镜像并部署到k8s集群 1736367031
oracle 合并多个不同结构的表_<136>同一个工作簿内的若干张工作表合并到一个工作表内（上下结构），会计也要写代码... 1736367036
线阵相机知识汇总 1736367038
2025年惠普战99移动工作站: 第十三代英特尔酷睿处理器和惠普一站式AI应用开发方案的完美融合 1736367045
网络安全等级保护2.0详解 1736367048
css子代选择器 1736367053
2025年我的世界服务器设置op显示,我的世界设置op权限 | 手游网游页游攻略大全 1736367060
2025年c语言计算1x2x3x4x5,1x2x3+2x3x4+3x4x5+…+10x11x12 1736367064

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/bian-cheng-ji-chu/105750.html