本地部署 Stable Diffusion 畫動漫圖【快速版教學】

 


參考影片

💻 本地部署 Stable Diffusion 畫動漫圖【快速版教學】


第1步:檢查你的電腦

最低建議:

  • NVIDIA 顯卡(最好至少有 6GB VRAM)

  • Windows 10/11

  • 至少有 10GB 以上的磁碟空間

如果沒有NVIDIA,還是可以跑,但會慢很多(用CPU模式)。


第2步:安裝必要的東西

🔵 安裝 Python 3.10.x

  • 下載官方安裝檔:Python官網

  • 安裝時記得勾選Add Python to PATH」!

🔵 安裝 Git

  • 下載:Git官網

  • 用來下載Stable Diffusion的原始碼。


第3步:下載 Automatic1111 WebUI

這個是目前全球最流行的 Stable Diffusion 本地端介面!

打開命令提示字元(cmd)或者PowerShell,輸入:

bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

下載完成後,進到這個資料夾,例如:

bash
cd stable-diffusion-webui

第4步:放入動漫模型(Anything V5)

🔵 到 Hugging Face 或Civitai下載動漫風格模型:

  • 推薦模型andite/anything-v5

  • 或者直接用這個超人氣 LoRA 模型套件搭配細調。

🔵 把下載好的模型(通常是 .safetensors.ckpt 檔案) 放到 stable-diffusion-webui/models/Stable-diffusion/ 資料夾裡。


第5步:啟動服務

回到剛剛 stable-diffusion-webui 資料夾, 雙擊或執行命令:

bash
python launch.py

✅ 第一次會自動安裝需要的東西(大概要等個5~10分鐘)。

之後會自動打開你的瀏覽器,進入一個像這樣的網頁:

http://127.0.0.1:7860

這就是你的本地 Stable Diffusion 了!

第6步:開始畫動漫風圖!

在輸入框打提示詞,例如:

arduino
1girl, pink hair, blue eyes, school uniform, dynamic pose, anime style, detailed background

按下「Generate」就可以了!

你可以選擇解析度、數量、風格、甚至添加LoRA特化細節。

🏆 小叮嚀:

  • 如果想跑更快,可以改用xformers加速(一行指令加上 --xformers 啟動)。

  • 遇到問題如 "not enough VRAM" 可以調小尺寸(比如512x512)或batch size設1。

  • 想更動漫風?可以加動漫用的 LoRA 模型微調。



📦 安裝 Automatic1111 WebUI 需要的空間

項目大約大小
WebUI 主程式(Git clone後)約 3~4 GB
基礎模型(像 Anything V5 Anime模型)約 2~4 GB/個
Python虛擬環境+套件約 3~5 GB
其他附加插件(可選)約 500 MB~1 GB

總基本安裝空間建議

  • 最少準備 15 GB 空間

  • 如果想多裝幾個模型、擴充功能,建議有 30~50 GB以上 會比較順。


🔥 簡單舉例

如果你只裝最基本的:

  • Automatic1111主程式 ➔ 4GB

  • 一個動漫風模型(Anything V5) ➔ 3GB

  • Python虛擬環境 ➔ 4GB


大約就需要:11 GB左右,但最好多預留一些空間防止之後更新或加新模型。


🎯 小小建議

  • 安裝到 D槽或其他空間大的磁碟,不要塞爆系統C槽,不然跑模型時會卡。

  • **常用模型(例如Anything、Counterfeit、Dreamshaper)**一個模型就2~4GB,所以每多一個就要多留空間。

  • 生成圖片的時候,也會佔一些硬碟(圖片存檔)。


要不要我也順便幫你看一下,
如果你想同時安裝 動漫LoRA + 插件(像ControlNet),需要怎麼抓空間?
(可以一次規劃好,之後用起來超流暢!🚀)要的話回我「要」。✨


🗂️ 主要的存放位置:

模型類型存放路徑(從 WebUI 根目錄開始)說明
主模型(Stable Diffusion .safetensors / .ckpt)models/Stable-diffusion/主力生成的模型,比如 AnythingV5
LoRA 模型models/Lora/小型微調模型,可以套用特定風格或角色
VAE(視覺效果優化器)models/VAE/改善畫質、色彩飽和度用
Textual Inversion(嵌入詞庫)embeddings/自訂的新單字、風格微調
ControlNet 模型extensions/sd-webui-controlnet/models/讓你用草圖、姿勢圖來控制生成內容

🔥 舉個例子

假設你是照我前面教學,在 D:\stable-diffusion-webui 這個資料夾安裝WebUI的話:

  • 主模型(AnythingV5)就應該放在:

    pgsql
    D:\stable-diffusion-webui\models\Stable-diffusion\Anything-V5.safetensors
  • LoRA模型放在:

    makefile
    D:\stable-diffusion-webui\models\Lora\
  • ControlNet用的姿勢/深度圖模型則放在:

    makefile
    D:\stable-diffusion-webui\extensions\sd-webui-controlnet\models\

🛠️ 小提醒

  • 資料夾名字最好不要有中文或奇怪符號,避免WebUI讀取錯誤。

  • .safetensors.ckpt 格式安全(建議下載 .safetensors 版本)。

  • 放錯資料夾的話 WebUI 啟動時找不到模型,會空白或報錯!


🎯 快速小整理

如果你只想畫動漫,最常用的就是這個:

  • 下載動漫風模型(AnythingV5)放到 models/Stable-diffusion/

  • 之後在WebUI介面上選模型就可以用了

模型下載網頁 需註冊登入後再去找想要的模型下載


🎨 Anything V5 模型下載連結

  1. Anything V5 原始模型(.safetensors 格式)

  2. Anything V5 修剪版(PrtRE 版本)

  3. Anything V5 CoreML 版本(適用於 Apple Silicon 裝置)

    • 下載連結:​Hugging Face

    • 說明:​此版本已轉換為 CoreML 格式,適用於 Apple Silicon 裝置,如 MacBook M1/M2。


📂 如何使用下載的模型

  1. 將模型檔案放入指定資料夾

    • 將下載的 .safetensors 檔案放入 Stable Diffusion WebUI 的 models/Stable-diffusion/ 資料夾中。

  2. 啟動 WebUI 並選擇模型

    • 啟動 Stable Diffusion WebUI,然後在介面中選擇剛剛添加的 Anything V5 模型。

  3. 開始創作

    • 輸入提示詞(prompt),開始生成你想要的動漫風格圖像。


🎨 LoRA 模型下載資源

LoRA(Low-Rank Adaptation)模型 是一種輕量級的微調模型,能夠在不改變主模型的情況下,添加特定風格或角色特徵。以下是一些可靠的下載來源:

  1. Civitai

  2. ComfyUI Wiki

  3. Edmond Yip 的 Control LoRA 下載整理


🧩 ControlNet 模型下載資源

ControlNet 是一種擴充插件,能夠讓 Stable Diffusion 更精確地控制生成圖像的細節,如姿勢、邊緣、深度等。以下是一些可靠的下載來源:

  1. 官方 GitHub 倉庫

  2. Hugging Face - ControlNet 模型集合

  3. Edmond Yip 的 ControlNet 模型下載整理


📂 模型放置路徑建議

  • LoRA 模型:​請將下載的 .safetensors.pt 檔案放入 stable-diffusion-webui/models/Lora/ 資料夾中。

  • ControlNet 模型:​請將下載的 .pth.safetensors 檔案放入 stable-diffusion-webui/extensions/sd-webui-controlnet/models/ 資料夾中。


🎨 LoRA 模型下載網站

🔹 Civitai

  • 👉 最大的 LoRA 分享社群網站。

  • 可搜尋:動漫角色、風格、特定場景、3D、插畫等。

  • 🔍 搜尋「LoRA」+關鍵字(例如 "anime"、"girl"、"school uniform")。

📁 放到 Stable Diffusion WebUI 的:

bash
stable-diffusion-webui/models/Lora/


🧩 ControlNet 模型下載網站

🔹 Hugging Face - ControlNet 官方模型

  • 提供:

    • Canny (邊緣線條)

    • Depth (深度圖)

    • OpenPose (人體姿勢)

    • Scribble、Seg、Tile 等十多種模型

  • 每個模型大約 300~500 MB。

📁 放到 Stable Diffusion WebUI 的:

swift
stable-diffusion-webui/extensions/sd-webui-controlnet/models/


✅ 小建議

  • 建議先下載最常用的三個 ControlNet:

    1. control_sd15_canny.pth

    2. control_sd15_openpose.pth

    3. control_sd15_depth.pth

  • 然後搭配 LoRA 像是「Cute Girl LoRA」、「Anime Lineart LoRA」來產圖非常方便!


🎨 基本動漫畫風提示詞

plaintext
masterpiece, best quality, high resolution, anime style, highly detailed, dynamic lighting, colorful
  • 說明:這是最基本的「拉高畫質」常用組合。

  • 建議搭配:AnythingV5模型,或二次元 LoRA。


👩‍🎤 人物外觀設定

部位範例提示詞
髮型long hair, twin tails, bob cut, short messy hair, hair ornament
髮色silver hair, pink hair, blue gradient hair
眼睛big eyes, sparkling eyes, heterochromia (異色瞳)
服裝school uniform, maid outfit, gothic lolita dress, armor
配件glasses, headphones, cat ears, flower crown    


範例組合:

plaintext
1girl, long silver hair, blue eyes, school uniform, sitting under cherry blossom, gentle smile


🌸 場景背景設定

場景範例提示詞
自然cherry blossom, forest, night sky full of stars, ocean waves
城市cyberpunk city, traditional japanese street, neon lights, rainy night
奇幻floating islands, magic circles, ancient ruins, crystal cave

範例組合:

plaintext
standing on floating island, sunset background, flying birds, fantasy atmosphere

🧠 表情動作設定

類型範例提示詞
表情smiling, crying, embarrassed, confident
姿勢sitting, running, flying, dynamic pose, jumping
視角looking at viewer, side view, low angle, high angle

範例組合:

plaintext
dynamic pose, smiling, looking at viewer, low angle shot


🛡️ 防爆(避免畫崩)常加的負面提示詞(Negative Prompt)

plaintext
bad anatomy, lowres, blurry, worst quality, deformed, mutated hands, missing fingers
  • 負面提示詞就是告訴AI「不要出現這些問題」,超重要!

🔥 快速完整範例(可直接丟進 WebUI)

plaintext
(masterpiece, best quality, highres), 1girl, long silver hair, blue eyes, wearing gothic lolita dress, holding an umbrella, standing in a rainy city, neon lights, reflective street, dynamic lighting Negative prompt: bad anatomy, lowres, blurry, deformed Steps: 28, Sampler: DPM++ 2M Karras, CFG scale: 7

下載套件後的暫存檔清理

🧹 如何清乾淨 pip 快取

你也可以用 pip 指令清除:

bash
pip cache purge

這會幫你清除所有 pip 快取,更乾淨!



想把自己喜歡或創作的圖片風格「讓 AI 學起來」,讓它能產出一樣風格的圖?很棒的想法!這其實就是做一個 參考風格模型(風格化微調),以下是完整方法整理:


🧠 簡單理解:讓 AI 學你圖片風格的 3 種方法

方法難度特點適合誰
LoRA 模型訓練★★☆☆☆用少量圖片訓練出風格模型,搭配原模型使用想學習特定畫風/人物
Hypernetwork(舊)★★☆☆☆比 LoRA 更早,類似概念但較少人用了有特殊需求者
Textual Inversion(關鍵詞學習)★☆☆☆☆學習特定詞的外觀,例如你的畫風叫「MyStyle」想快速應用特定風格、物件
🔥 Dreambooth(個人專屬模型)★★★★☆自己整套模型,最完整但訓練較重想完全客製風格模型


🛠️ 最推薦方式:使用 LoRA 訓練風格模型

這是目前最簡單、效果也最好的方式之一。

✅ 需要準備什麼?

  1. 5~20 張同風格圖片(最好統一畫風、解析度)

  2. 安裝好 Stable Diffusion WebUI(如:Automatic1111)

  3. 安裝訓練工具(推薦:Kohya_ss GUI)


🧰 主要步驟(以 LoRA 為例):

🔧 1. 安裝訓練工具

📁 2. 整理資料集

  • 把圖片放在一個資料夾裡(例如 dataset/mystyle

  • .txt 檔標註提示詞,例如:

    css
    A girl in mystyle, looking at the viewer, smile

⚙️ 3. 設定訓練參數

  • learning_rate: 0.0001 ~ 0.0005

  • resolution: 建議統一 512x512 或 768x768

  • train_batch_size: 1~2 即可

  • 設定 LoRA 相關參數(rank 建議 4~16)

🚀 4. 開始訓練

  • 一般訓練時間:約 30 分鐘~2 小時(依圖片量與硬體)


📦 5. 使用自己的 LoRA

  • 訓練完成會輸出 .safetensors

  • 丟到 stable-diffusion-webui\models\Lora 資料夾

  • 使用時在 prompt 加入:

    text
    <lora:mystyle:1>

    然後提示詞加上你的關鍵描述,例如:

    text
    a girl, <lora:mystyle:1>, mystyle style, masterpiece


🌟 額外提示(提升效果)

  • 圖片背景盡量單純(避免讓模型學到太多雜訊)

  • 多用統一構圖或角色角度,提升穩定性

  • 如果是動漫風可以使用「Anything V5」當 base model

留言