3.ComfyUI——文生图工作流
本帖最后由 糖逗 于 2026-3-10 08:55 编辑1. 目标
根据文本提示词,生成图片
2. 工作流
很简单的官方示例流程,没啥难度{:10_330:}
3. 前置准备
文生图模型,可以去https://www.liblib.art/等网站上下载,有免费的可用,一般搜索checkpoint,sd 就可以找到,然后再根据自己的需求下载即可。
4. K采样器
B站有一个up主讲得不错,可以直接看视频学习{:10_332:}
https://www.bilibili.com/video/BV1dC3uzPEqW/?share_source=copy_web&vd_source=792a2cb63a1882bff4ed856eadc41a71
5. 后续展望和想法
[*]K采样器不同参数的对比说明
[*]VAE模型原理学习
[*]想做一个agent能自动总结视频,解放双手(现在还是个菜鸟,继续学习研究,努力实现{:10_303:})
欢迎交流{:10_275:}
ComfyUI——文生图工作流
1. 目标
根据输入的文本提示词,生成对应的图片。
2. 工作流概述
这是一个非常基础的官方示例流程,结构简单清晰,易于上手和理解。
3. 前置准备
需要准备文生图模型(Checkpoint)。可以在 civitai.com 、 huggingface.co 等模型分享社区或网站进行下载。通常搜索“checkpoint”、“sd model”等关键词即可找到,请根据你的具体需求(如画风、人物等)选择合适的模型进行下载。
4. 关于K采样器
K采样器是工作流中的核心节点,负责控制图像的采样和生成过程。理解其参数(如采样器类型、调度器、步数等)对控制出图效果至关重要。建议通过以下方式深入学习:
[*]查阅 ComfyUI 的官方文档或Wiki。
[*]搜索相关的图文教程或技术博客文章。
[*]在视频平台(如B站、YouTube)搜索“ComfyUI KSampler”等关键词,有许多优质的中文视频教程可供学习。
5. 后续展望与想法
[*]K采样器参数对比: 计划系统性地测试和总结不同参数对最终生成图像的影响。
[*]VAE模型原理学习: 深入了解VAE(变分自编码器)在稳定扩散模型中的作用与原理。
[*]AI视频摘要Agent: 长远目标是开发一个能自动总结视频内容的智能体,这是一个很有挑战性的学习方向,一起加油!
欢迎大家一起交流讨论学习心得!
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 本帖最后由 糖逗 于 2026-3-10 08:55 编辑
我发现写中文提示词,这个模型不太能听懂,最后又换成了英文{:10_255:} 。
关于提示词的tip:https://comfyui-wiki.com/zh/tutorial/basic/stable-diffusion-prompt-basic 糖逗 发表于 2026-03-10 08:52
我发现写中文提示词,这个模型不太能听懂,最后又换成 ...
这是一个非常普遍且关键的问题,你的发现完全正确!这背后的原因和解决方法如下:
我发现写中文提示词,这个模型不太能听懂,最后又换成了英文{:10_319:}
核心原因:
绝大多数优秀的Stable Diffusion模型(Checkpoint)都是在海量的英文-图像配对数据集上训练的。模型学习的是英文词汇与视觉特征之间的直接关联。当你输入中文时,它无法直接理解,效果自然大打折扣。
解决方案:
1.使用翻译工具(最常用、最有效)
这是目前最主要的 workflow。先用中文构思你想要的画面,然后用翻译软件(如 DeepL、谷歌翻译)将其转化为地道的英文描述,再将英文提示词输入模型。
小技巧: 英文提示词中,用逗号分隔关键词,越靠前的词权重越高。例如:
中文构思:一只在樱花树下睡觉的橘猫,阳光透过花瓣,电影感,唯美
优化英文:a ginger cat sleeping under a cherry blossom tree, sunlight filtering through petals, cinematic, beautiful, masterpiece, best quality
2.寻找专门优化的中文模型
社区也出现了一些针对中文提示词进行过微调(finetune)的模型,或者集成了中英翻译能力的插件。你可以尝试搜索 “Chinese prompt”、“中文化”、“双语” 等关键词来寻找这类模型。
3.使用提示词翻译/优化节点(进阶)
在 ComfyUI 中,你可以安装一些自定义节点(Custom Nodes),它们能集成翻译 API,实现输入中文 -> 自动翻译 -> 生成图片的自动化流程。
4.利用 LoRA 或 Embedding 进行“概念训练”
如果你有特定、稳定的中文概念(比如一个原创角色名、一种特定风格),可以通过训练 LoRA 或 Textual Inversion embedding,将这个中文词汇与一组图像特征绑定。之后在提示词中使用这个中文词,模型就能理解了。但这需要一定的学习成本。
给你的直接建议:
对于初学者,强烈推荐采用 “第1种方法(翻译)+ 积累优质英文提示词”。你可以把常用的描述词(如“唯美的”、“宏大的”、“赛博朋克风格”)对应的地道英文表达积累下来,慢慢就能得心应手了。
这不是你的问题,而是目前开源生态的现状。先用好翻译工具,生成效果会立刻得到巨大提升!{:10_275:}
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 学习 不二如是 发表于 2026-3-10 11:02
学习
{:13_450:}
页:
[1]