糖逗 发表于 2026-3-10 08:51:52

3.ComfyUI——文生图工作流

本帖最后由 糖逗 于 2026-3-10 08:55 编辑

1. 目标
根据文本提示词,生成图片

2. 工作流
很简单的官方示例流程,没啥难度{:10_330:}



3. 前置准备
文生图模型,可以去https://www.liblib.art/等网站上下载,有免费的可用,一般搜索checkpoint,sd 就可以找到,然后再根据自己的需求下载即可。


4. K采样器
B站有一个up主讲得不错,可以直接看视频学习{:10_332:}
https://www.bilibili.com/video/BV1dC3uzPEqW/?share_source=copy_web&vd_source=792a2cb63a1882bff4ed856eadc41a71



5. 后续展望和想法

[*]K采样器不同参数的对比说明
[*]VAE模型原理学习
[*]想做一个agent能自动总结视频,解放双手(现在还是个菜鸟,继续学习研究,努力实现{:10_303:})

欢迎交流{:10_275:}

FishC 发表于 2026-3-10 08:52:22

ComfyUI——文生图工作流

1. 目标
根据输入的文本提示词,生成对应的图片。

2. 工作流概述
这是一个非常基础的官方示例流程,结构简单清晰,易于上手和理解。

3. 前置准备
需要准备文生图模型(Checkpoint)。可以在 civitai.com 、 huggingface.co 等模型分享社区或网站进行下载。通常搜索“checkpoint”、“sd model”等关键词即可找到,请根据你的具体需求(如画风、人物等)选择合适的模型进行下载。

4. 关于K采样器
K采样器是工作流中的核心节点,负责控制图像的采样和生成过程。理解其参数(如采样器类型、调度器、步数等)对控制出图效果至关重要。建议通过以下方式深入学习:

[*]查阅 ComfyUI 的官方文档或Wiki。
[*]搜索相关的图文教程或技术博客文章。
[*]在视频平台(如B站、YouTube)搜索“ComfyUI KSampler”等关键词,有许多优质的中文视频教程可供学习。


5. 后续展望与想法

[*]K采样器参数对比: 计划系统性地测试和总结不同参数对最终生成图像的影响。
[*]VAE模型原理学习: 深入了解VAE(变分自编码器)在稳定扩散模型中的作用与原理。
[*]AI视频摘要Agent: 长远目标是开发一个能自动总结视频内容的智能体,这是一个很有挑战性的学习方向,一起加油!


欢迎大家一起交流讨论学习心得!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

糖逗 发表于 2026-3-10 08:52:35

本帖最后由 糖逗 于 2026-3-10 08:55 编辑

我发现写中文提示词,这个模型不太能听懂,最后又换成了英文{:10_255:} 。

关于提示词的tip:https://comfyui-wiki.com/zh/tutorial/basic/stable-diffusion-prompt-basic

FishC 发表于 2026-3-10 08:53:08

糖逗 发表于 2026-03-10 08:52
我发现写中文提示词,这个模型不太能听懂,最后又换成 ...

这是一个非常普遍且关键的问题,你的发现完全正确!这背后的原因和解决方法如下:


我发现写中文提示词,这个模型不太能听懂,最后又换成了英文{:10_319:}


核心原因:
绝大多数优秀的Stable Diffusion模型(Checkpoint)都是在海量的英文-图像配对数据集上训练的。模型学习的是英文词汇与视觉特征之间的直接关联。当你输入中文时,它无法直接理解,效果自然大打折扣。

解决方案:

1.使用翻译工具(最常用、最有效)
    这是目前最主要的 workflow。先用中文构思你想要的画面,然后用翻译软件(如 DeepL、谷歌翻译)将其转化为地道的英文描述,再将英文提示词输入模型。
    小技巧: 英文提示词中,用逗号分隔关键词,越靠前的词权重越高。例如:
    中文构思:一只在樱花树下睡觉的橘猫,阳光透过花瓣,电影感,唯美
    优化英文:a ginger cat sleeping under a cherry blossom tree, sunlight filtering through petals, cinematic, beautiful, masterpiece, best quality

2.寻找专门优化的中文模型
    社区也出现了一些针对中文提示词进行过微调(finetune)的模型,或者集成了中英翻译能力的插件。你可以尝试搜索 “Chinese prompt”、“中文化”、“双语” 等关键词来寻找这类模型。

3.使用提示词翻译/优化节点(进阶)
    在 ComfyUI 中,你可以安装一些自定义节点(Custom Nodes),它们能集成翻译 API,实现输入中文 -> 自动翻译 -> 生成图片的自动化流程。

4.利用 LoRA 或 Embedding 进行“概念训练”
    如果你有特定、稳定的中文概念(比如一个原创角色名、一种特定风格),可以通过训练 LoRA 或 Textual Inversion embedding,将这个中文词汇与一组图像特征绑定。之后在提示词中使用这个中文词,模型就能理解了。但这需要一定的学习成本。

给你的直接建议:
对于初学者,强烈推荐采用 “第1种方法(翻译)+ 积累优质英文提示词”。你可以把常用的描述词(如“唯美的”、“宏大的”、“赛博朋克风格”)对应的地道英文表达积累下来,慢慢就能得心应手了。

这不是你的问题,而是目前开源生态的现状。先用好翻译工具,生成效果会立刻得到巨大提升!{:10_275:}

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

不二如是 发表于 2026-3-10 11:02:10

学习

糖逗 发表于 2026-3-10 11:09:14

不二如是 发表于 2026-3-10 11:02
学习

{:13_450:}
页: [1]
查看完整版本: 3.ComfyUI——文生图工作流