3.ComfyUI——文生图工作流

糖逗 · 发表于 1 小时前

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由糖逗于 2026-3-10 08:55 编辑
1. 目标
根据文本提示词，生成图片

2. 工作流
很简单的官方示例流程，没啥难度

3. 前置准备
文生图模型，可以去https://www.liblib.art/ 等网站上下载，有免费的可用，一般搜索checkpoint，sd 就可以找到，然后再根据自己的需求下载即可。

4. K采样器
B站有一个up主讲得不错，可以直接看视频学习

5. 后续展望和想法

K采样器不同参数的对比说明
VAE模型原理学习
想做一个agent能自动总结视频，解放双手（现在还是个菜鸟，继续学习研究，努力实现）

欢迎交流

FishC · 发表于 1 小时前

ComfyUI——文生图工作流

1. 目标
根据输入的文本提示词，生成对应的图片。

2. 工作流概述
这是一个非常基础的官方示例流程，结构简单清晰，易于上手和理解。

3. 前置准备
需要准备文生图模型（Checkpoint）。可以在 civitai.com 、 huggingface.co 等模型分享社区或网站进行下载。通常搜索“checkpoint”、“sd model”等关键词即可找到，请根据你的具体需求（如画风、人物等）选择合适的模型进行下载。

4. 关于K采样器
K采样器是工作流中的核心节点，负责控制图像的采样和生成过程。理解其参数（如采样器类型、调度器、步数等）对控制出图效果至关重要。建议通过以下方式深入学习：

查阅 ComfyUI 的官方文档或Wiki。
搜索相关的图文教程或技术博客文章。
在视频平台（如B站、YouTube）搜索“ComfyUI KSampler”等关键词，有许多优质的中文视频教程可供学习。

5. 后续展望与想法

K采样器参数对比： 计划系统性地测试和总结不同参数对最终生成图像的影响。
VAE模型原理学习： 深入了解VAE（变分自编码器）在稳定扩散模型中的作用与原理。
AI视频摘要Agent： 长远目标是开发一个能自动总结视频内容的智能体，这是一个很有挑战性的学习方向，一起加油！

欢迎大家一起交流讨论学习心得！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

糖逗 · 发表于 1 小时前

本帖最后由糖逗于 2026-3-10 08:55 编辑

我发现写中文提示词，这个模型不太能听懂，最后又换成了英文

。

关于提示词的tip：https://comfyui-wiki.com/zh/tutorial/basic/stable-diffusion-prompt-basic

FishC · 发表于 1 小时前

糖逗发表于 2026-03-10 08:52
我发现写中文提示词，这个模型不太能听懂，最后又换成 ...

这是一个非常普遍且关键的问题，你的发现完全正确！这背后的原因和解决方法如下：

我发现写中文提示词，这个模型不太能听懂，最后又换成了英文

核心原因：
绝大多数优秀的Stable Diffusion模型（Checkpoint）都是在海量的英文-图像配对数据集上训练的。模型学习的是英文词汇与视觉特征之间的直接关联。当你输入中文时，它无法直接理解，效果自然大打折扣。

解决方案：

1.  使用翻译工具（最常用、最有效）
这是目前最主要的 workflow。先用中文构思你想要的画面，然后用翻译软件（如 DeepL、谷歌翻译）将其转化为地道的英文描述，再将英文提示词输入模型。
小技巧： 英文提示词中，用逗号分隔关键词，越靠前的词权重越高。例如：
中文构思：一只在樱花树下睡觉的橘猫，阳光透过花瓣，电影感，唯美
优化英文：a ginger cat sleeping under a cherry blossom tree, sunlight filtering through petals, cinematic, beautiful, masterpiece, best quality

2.  寻找专门优化的中文模型
社区也出现了一些针对中文提示词进行过微调（finetune）的模型，或者集成了中英翻译能力的插件。你可以尝试搜索 “Chinese prompt”、“中文化”、“双语” 等关键词来寻找这类模型。

3.  使用提示词翻译/优化节点（进阶）
在 ComfyUI 中，你可以安装一些自定义节点（Custom Nodes），它们能集成翻译 API，实现输入中文 -> 自动翻译 -> 生成图片的自动化流程。

4.  利用 LoRA 或 Embedding 进行“概念训练”
如果你有特定、稳定的中文概念（比如一个原创角色名、一种特定风格），可以通过训练 LoRA 或 Textual Inversion embedding，将这个中文词汇与一组图像特征绑定。之后在提示词中使用这个中文词，模型就能理解了。但这需要一定的学习成本。

给你的直接建议：
对于初学者，强烈推荐采用 “第1种方法（翻译）+ 积累优质英文提示词”。你可以把常用的描述词（如“唯美的”、“宏大的”、“赛博朋克风格”）对应的地道英文表达积累下来，慢慢就能得心应手了。

这不是你的问题，而是目前开源生态的现状。先用好翻译工具，生成效果会立刻得到巨大提升！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

账号		自动登录	找回密码
密码			立即注册

[AI工作流] 3.ComfyUI——文生图工作流

马上注册，结交更多好友，享用更多功能^_^

本帖被以下淘专辑推荐: