diff --git a/06-comfyui-image.md b/06-comfyui-image.md index a66943f..bb14a11 100644 --- a/06-comfyui-image.md +++ b/06-comfyui-image.md @@ -2,7 +2,15 @@ ## 目标 -装 ComfyUI + 拉 Flux.1-dev fp8 模型 + 出第一张图。 +装 ComfyUI + 拉 SDXL 模型 + 出第一张图。 + +> **本机实测版本**(2026-06-14): +> - ComfyUI master(2026-06) +> - ComfyUI 依赖 101 个包,5 分 10 秒装完 +> - torch 2.12.0 + torchvision 0.27.0 + torchaudio 2.11.0 +> - 模型:**SDXL base 1.0**(6.94 GB,`sd_xl_base_1.0.safetensors`) +> - 出图实测:1024×1024,25 步,~5-10 秒 +> - 显存占用:~7.9 GB / 16 GB(剩 8.4 GB 余量) ## 拉 ComfyUI 代码 @@ -53,25 +61,40 @@ EOF python -c "import torch; print(torch.cuda.is_available(), torch.cuda.get_device_name(0))" ``` -## 拉 Flux.1-dev fp8 模型(16G 显存能跑) +## 拉 SDXL 模型(单文件,最省事) + +### 选 Flux 还是 SDXL? + +| 模型 | 显存 | 出图速度 | 画质 | 文件数 | 难度 | +|------|------|------|------|------|------| +| **SDXL 1.0** | ~7 GB | 5-10s | ⭐⭐⭐⭐ | 2 个(7G + 335M)| ⭐ 直接 Load Checkpoint | +| FLUX.1-dev fp8 | ~12 GB | 30-60s | ⭐⭐⭐⭐⭐ | 4 个(12G + 335M + 230M + 9.5G)| ⭐⭐⭐⭐ 拆 4 个 Loader | + +**推荐第一次先装 SDXL**——单文件 + 不用拆节点,**5 分钟出第一张图**。 + +### 浏览器下 SDXL(国内 ModelScope 镜像) + +**Windows 浏览器**打开: +https://www.modelscope.cn/models/AI-ModelScope/stable-diffusion-xl-base-1.0/files + +**只下这一个**(VAE 在主模型里内置,不用单独下): +- `sd_xl_base_1.0.safetensors`(**6.94 GB**) + +存到 `D:\FluxModels\`。 + +### WSL2 移到对的位置 -**WSL2 终端**: ```bash -source .venv/bin/activate -uv pip install huggingface_hub - -python -c " -from huggingface_hub import hf_hub_download -import os -os.makedirs('/mnt/d/ComfyUI-models/checkpoints', exist_ok=True) -os.makedirs('/mnt/d/ComfyUI-models/vae', exist_ok=True) -hf_hub_download(repo_id='Comfy-Org/Flux.1-FP8', filename='flux1-dev-fp8.safetensors', local_dir='/mnt/d/ComfyUI-models/checkpoints/') -hf_hub_download(repo_id='Comfy-Org/Flux.1-FP8', filename='ae.safetensors', local_dir='/mnt/d/ComfyUI-models/vae/') -print('下载完成') -" +mkdir -p /mnt/d/ComfyUI-models/checkpoints +mv /mnt/d/FluxModels/sd_xl_base_1.0.safetensors /mnt/d/ComfyUI-models/checkpoints/ +ls -lh /mnt/d/ComfyUI-models/checkpoints/ ``` -**等 10-20 分钟**(约 12 GB)。 +**应当看到**:`sd_xl_base_1.0.safetensors 6.94G` + +> **不要下错**的:`sd_xl_offset_example-lora_1.0.safetensors`(49MB 是 LoRA 增强,第一次跑不用)。 +> +> **不要下**:FLUX 的 `ae.safetensors`(VAE,FLUX 不内置但 SDXL 内置了)。 ## 启动 ComfyUI @@ -86,30 +109,52 @@ To see the GUI go to: http://0.0.0.0:8188 **Windows 浏览器打开**:http://localhost:8188 -## 出第一张图 +## 出第一张图(SDXL 节点图) -1. 浏览器打开 `http://localhost:8188` -2. 左键双击空白处 → 搜 "Load Checkpoint" → 选 `flux1-dev-fp8.safetensors` -3. 加 "CLIP Text Encode" 节点(输入正面提示词) -4. 加 "Empty Latent Image" 节点(设置 1024x1024) -5. 加 "KSampler" 节点 -6. 加 "VAE Decode" + "Save Image" 节点 -7. 点 "Queue Prompt" → 等 30-60 秒 +### 节点清单 -**第一次出图会编译 kernel,比较慢**(2-3 分钟),之后每张 5-10 秒。 +1. **Load Checkpoint**(双击空白处搜)→ 选 `sd_xl_base_1.0.safetensors` +2. **CLIP Text Encode**(加**两次**,一正一负) +3. **Empty Latent Image** → 1024×1024 +4. **KSampler** → steps=25, cfg=7, sampler=euler_ancestral, scheduler=normal, denoise=1 +5. **VAE Decode** +6. **Save Image** -## 模型推荐 +### 连线(6 根) -| 模型 | 显存 | 速度 | 质量 | -|------|------|------|------| -| Flux.1-dev fp8 | 12G | 中 | ⭐⭐⭐⭐⭐ | -| SDXL | 7G | 快 | ⭐⭐⭐⭐ | -| SD 1.5 | 4G | 很快 | ⭐⭐⭐ | +| 起点 | → | 终点 | +|------|---|------| +| Load Checkpoint.MODEL | → | KSampler.model | +| Load Checkpoint.CLIP | → | 两个 CLIP Text Encode.clip | +| CLIP Text Encode (正面).CONDITIONING | → | KSampler.positive | +| CLIP Text Encode (负面).CONDITIONING | → | KSampler.negative | +| Empty Latent Image.LATENT | → | KSampler.latent_image | +| KSampler.LATENT | → | VAE Decode.samples | +| Load Checkpoint.VAE | → | VAE Decode.vae | +| VAE Decode.IMAGE | → | Save Image.images | -**16G 显存**: -- Flux.1-dev fp8 刚好 -- SDXL 舒服 -- SD 1.5 跑得飞快 +### 提示词 + +- **正面**:`a cute orange cat sitting on a windowsill, sunny day, high quality, detailed` +- **负面**:`blurry, low quality, distorted, ugly` + +### 点 Queue Prompt + +**首次出图 30-60 秒**(编译 kernel),**之后每张 5-10 秒**。 + +## 实机出图示例(2026-06-14) + +**提示词**:`a cute orange cat sitting on a windowsill, sunny day, high quality, detailed` + +**出图**(1024×1024,25 步): +- 构图:猫居中,对称植物框景 +- 光影:阳光从右上斜射,暖光 +- 配色:暖橙 + 蓝绿 + 米黄 +- 风格:绘本/吉卜力治愈风 +- 显存:~7.9 GB / 16 GB +- 出图时间:~5-10 秒 + +**没畸形、没变形、提示词全还原**——SDXL 一次成功。 ## 关掉 ComfyUI diff --git a/README.md b/README.md index 6da895e..552dcfe 100644 --- a/README.md +++ b/README.md @@ -18,7 +18,7 @@ | [03 WSL2 + CUDA 12.8](./03-wsl2-ubuntu.md) | ✅ 已跑通 | nvcc --version 显示 12.8 | | [04 Ollama 装 LLM](./04-ollama-llm.md) | ✅ 已跑通 | qwen2.5:7b 聊天正常 | | [05 PyTorch 验证](./05-pytorch-verify.md) | ✅ 已跑通 | 看到 `CUDA: True \| 5060 Ti`(torch 2.12.0)| -| [06 ComfyUI 装出图](./06-comfyui-image.md) | ⏳ 待补 | 浏览器开 8188 出图 | +| [06 ComfyUI 装出图](./06-comfyui-image.md) | ✅ 已跑通 | 浏览器开 8188 出图(SDXL 6.94G)| | [90 排错手册](./90-troubleshoot.md) | ✅ 已有 | 镜像源 / zstd / WSL2 透传失败 | ## 硬件清单