如何安裝和使用Wan 2.1（成人動畫影片生成）

這是初學者指南，幫助您安裝 Wan 並實施所有可用的優化，以最大化視頻生成的速度。

現在，實現這一目標涉及質量的權衡，但如果您更願意優先考慮質量而非速度，您可以輕鬆禁用任何優化。

隨附的指南和工作流程是針對擁有 24GB 或更多 VRAM 的 GPU 量身定制的，通常在生成過程中使用 21-23GB。雖然可以使用少於 24GB 的 GPU，但您需要進行調整。例如，16GB 的 GPU 可以使用 FP8/Q8 模型，前提是您在提供的工作流程中增加 virtual_vram_gb 或區塊交換設置。我們稍後會討論這些。

如果您的 VRAM 少於 16GB，您可能希望使用低於 Q8 的量化模型，但請記住，使用較低的量化級別會降低輸出的質量。一般來說，您使用的量化級別越低，獲得的質量就越低。

/ldg/ Wan 2.1 安裝和優化指南

前置條件 - 首先安裝

ComfyUI 可攜版
 ComfyUI 管理器
 CUDA 12.6

選擇實現方式

Wan 2.1 可以通過兩種方法集成到 ComfyUI 中：原生支持或 Kijai 的包裝器。Kijai 的包裝器具有原生不具備的附加功能（flowedit、vid2vid 等），而原生則擁有 Kijai 版本中沒有的幾個優勢。這些優勢包括：對 gguf 模型的支持、自適應引導（以質量為代價加速生成的方法）以及 TorchCompile 兼容性，不僅支持 40XX 和 50XX GPU 系列，還支持 30XX 系列，這使得生成速度額外提高約 30%。因此，如果您使用的 VRAM 少於 24GB 和/或希望獲得最快的生成速度，原生可能是更好的選擇。

一旦您確定了方法及其相關工作流程，請繼續進行一般安裝步驟。

選項 1 - Kijai 的包裝器

下載這些修改過的 Kijai 默認工作流程版本。除了優化和一些額外功能外，它們使用 Alibaba 的默認設置作為基準。該工作流程輸出兩個視頻，原始 16 fps 和插值 32 fps 版本。您可以輕鬆調整這些以使用 720P 模型/設置。請參見在 720P 下生成。

/ldg/ KJ i2v 480p 工作流程： ldg_kj_i2v_14b_480p.json
(更新於 2025 年 3 月 17 日)

/ldg/ KJ t2v 480p 工作流程： ldg_kj_t2v_14b_480p.json
(更新於 2025 年 3 月 17 日)

確保 ComfyUI 更新到最新版本。（在 ComfyUI_windows_portable\update 中的 update_comfyui.bat）
下載這些模型。

請勿將 Comfy 模型文件與 KJ 的模型文件一起使用！您必須使用這些，否則會遇到問題！

Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors 放在 ComfyUI\models\diffusion_models\WanVideo
Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors 放在 ComfyUI\models\diffusion_models\WanVideo
Wan2_1-T2V-14B_fp8_e4m3fn.safetensors 放在 ComfyUI\models\diffusion_models\WanVideo
umt5-xxl-enc-bf16.safetensors 放在 ComfyUI\models\text_encoders
open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors 放在 ComfyUI\models\text_encoders
Wan2_1_VAE_bf16.safetensors 放在 ComfyUI_windows_portable\ComfyUI\models\vae\wanvideo

移至一般安裝步驟。

選項 2 - Comfy 原生

下載這些基於 /ldg/ 的修改過的 Comfy 工作流程版本。除了優化和一些額外功能外，它們使用 Alibaba 的默認設置作為基準。該工作流程輸出兩個視頻，原始 16 fps 和插值 32 fps 版本。您可以輕鬆調整這些以使用 720P 模型/設置。請參見在 720P 下生成。

/ldg/ Comfy i2v 480p 工作流程： ldg_cc_i2v_14b_480p.json
(更新於 2025 年 3 月 17 日)

/ldg/ Comfy t2v 480p 工作流程： ldg_cc_t2v_14b_480p.json
(更新於 2025 年 3 月 17 日)

確保 ComfyUI 更新到最新版本。（在 ComfyUI_windows_portable\update 中的 update_comfyui.bat）
下載這些模型。如果您的 VRAM 少於 24GB，您還可以將 Q8 模型替換為 Q6/Q5/Q4，儘管您會看到輸出質量隨著量化級別的降低而逐漸下降。

請勿將 Kijai 的文本編碼器文件與這些模型一起使用！您必須使用這些文本編碼器，否則在生成時會出現錯誤，顯示 Exception during processing !!! mat1 and mat2 shapes cannot be multiplied (77x768 and 4096x5120)

wan2.1-i2v-14b-480p-Q8_0.gguf 放在 ComfyUI\models\diffusion_models\
wan2.1-i2v-14b-720p-Q8_0.gguf 放在 ComfyUI\models\diffusion_models\
wan2.1-t2v-14b-Q8_0.gguf 放在 ComfyUI\models\diffusion_models\
umt5_xxl_fp16.safetensors 放在 ComfyUI\models\text_encoders
clip_vision_h.safetensors 放在 ComfyUI\models\clip_vision\
wan_2.1_vae.safetensors 放在 ComfyUI_windows_portable\ComfyUI\models\vae\

移至一般安裝步驟。

一般安裝步驟

下載並運行這個，按照指示自動安裝 Triton 和 Sage，這將大幅加快您的生成速度。
在 ComfyUI_windows_portable\ 中打開 cmd.exe 提示符，並運行以下命令。這將安裝最新的 pytorch nightly 版本以支持 CUDA 12.6，讓您使用 fp16 累加，這是一種減少生成時間的優化。..\python_embeded\python.exe -s -m pip install torch==2.7.0.dev20250306+cu126 torchvision torchaudio –index-url https://download.pytorch.org/whl/nightly/cu126 –force-reinstall
編輯 ComfyUI_windows_portable 中的 run_nvidia_gpu.bat，將第一行更改為：.\python_embeded\python.exe -s ComfyUI\main.py –windows-standalone-build –use-sage-attention –fast
運行 ComfyUI。查看 cmd.exe 控制台窗口，確保在啟動過程中顯示 pytorch version: 2.7.0.dev20250306+cu126。您還應該看到 Enabled fp16 accumulation 和 Using sage attention。

在更新擴展或重啟時，可能會出現一個錯誤，報告不正確的 pytorch 版本。如果發生這種情況，請關閉 Comfy 並重新啟動。如果您在更新擴展後使用 Comfy 的“重啟”按鈕，則最常發生此錯誤，因此請手動關閉並在更新擴展後手動啟動。這也可能在更新 Comfy 後發生。如果在第二次重啟後仍然不是 2.7.0dev，請再次執行步驟 5。

打開其中一個工作流程。打開管理器並安裝缺失的自定義節點。最後，安裝 ComfyUI-GGUF 擴展。

如果在安裝並重新啟動 Comfy 後仍然抱怨缺少節點，您可能需要手動安裝缺失的節點。如果在使用 KJ 的包裝器時發生此情況，請手動安裝包裝器從他的倉庫，並事先刪除自定義節點中的舊版本。如果它抱怨缺少 WanVideoEnhanceAVideoKJ，則同樣適用於 KJNodes。請確保遵循可攜版安裝的安裝說明。

對於視頻插值模型，請訪問這個倉庫，下載film_net_fp32.pt，並將其放在 ComfyUI\custom_nodes\comfyui-frame-interpolation\ckpts\film
確保每次啟動 Comfy 時，pytorch 版本顯示為 2.7.0dev，否則 fp16_fast / fp16 accumulation 將無法正常工作。
運行您的第一次生成。如果在模型加載期間出現“按任意鍵繼續”時凍結，您需要重新啟動計算機。如果在運行工作流程時出現此錯誤：ImportError: DLL load failed while importing cuda_utils: The specified module could not be found。請轉到 \users\username\ 並打開 .triton 目錄。刪除其中的 cache 子目錄。請不要刪除整個 .triton 目錄。

生成前的重要注意事項

您獲得的初始生成時間不準確。Teacache 在生成過程中啟動，並且如果您使用的是 Comfy 原生/核心，則在過程中途會啟動自適應引導。

當視頻生成完成後，您將在各自的 i2v 或 t2v 目錄及子目錄中獲得兩個文件。原始文件是 16 幀輸出，而 int 文件則插值為 32 幀，這使得運動更加平滑。

強烈建議您在生成過程中啟用預覽。如果您遵循了指南，您將擁有所需的擴展。轉到 ComfyUI 設置（左下角的齒輪圖標），搜索“在取樣時顯示動畫預覽”。啟用它。然後打開 Comfy 管理器，將預覽方法設置為 TAESD（慢）。到第 10 步時，輸出將變得更清晰，您將對構圖和運動有一般的感覺。這可以並且將節省您大量時間，因為如果您不喜歡它們的外觀，可以提前取消生成。

永遠不要在 480p 解析度下使用 720p i2v 模型，反之亦然。如果您使用 720p i2v 模型並將解析度設置為 832×480，例如，您獲得的輸出將比簡單使用 480p i2v 模型要差得多。您永遠不會通過在 720p 模型上生成 480p 來提高質量，因此不要這樣做。唯一允許您混合 480p 和 720p 解析度的模型是 t2v 14B。

支持的解析度

每個模型都是針對特定解析度進行訓練和微調的。理論上，偏離這些精確解析度可能會產生比堅持支持的解析度更差的結果，特別是對於 i2v。

然而，根據我的經驗，只要調整保持合理，我已成功使用非標準解析度進行 i2v，而沒有明顯的問題。例如，您應該避免對 480p 或 720p 進行劇烈偏離，並始終固定一個維度 - 要麼 480 用於 480p 模型，要麼 720 用於 720p 模型 - 同時將另一個維度向下縮放（絕不要向上縮放）以調整長寬比。這意味著一個維度應始終固定在 480 或 720，具體取決於模型，另一個維度根據需要調整為較低的值。您永遠不希望超過 480p 的最大設置值 832 和 720p 的 1280，因為這將大幅增加生成時間並超出模型開發者設置的解析度限制。

這些是 Wan 官方倉庫中列出的“支持的”解析度：

文本到視頻 - 1.3B	文本到視頻 - 14B	圖像到視頻 - 480p	圖像到視頻 - 720p
480*832	720*1280	832*480	1280*720
832*480	1280*720	480*832	720*1280
624*624	960*960
704*544	1088*832
544*704	832*1088
	480*832
	832*480
	624*624
	704*544
	544*704

在 720P 下生成

如果您想在 i2v 中使用 720p 模型或在 t2v 中使用 720p 解析度，您需要：

在 t2v 中，您需要將解析度提高到 720p (1280×720 / 720×1280)。單一的 14B t2v 模型支持 480p 和 720p。
當在 Wan 上使用 i2v 時，首先在模型加載器中選擇 i2v 720P 模型。接下來，將輸入圖像的寬度和高度設置為 1280×720 或 720×1280。此模型經過優化，在此精確解析度下性能最佳，但您可以稍微調整以適應不同的長寬比。為了獲得最佳結果，始終保持高度或寬度為 720，同時按比例將另一個維度縮小（例如，1152×720、1024×720 或 720×960）。您不希望在任何維度上超過 1280。
在 Comfy 原生中，將 Teacache 係數設置為 i2v_720。Kijai 的包裝器會自動選擇正確的係數。
將 Teacache 閾值設置為 0.2，這是中等設置。將其提高到 0.3 可在犧牲輸出質量的情況下加快生成速度。
根據您使用的實現方式，增加 virtual_vram_gb （Comfy 原生）或區塊交換（Kijai 的包裝器）。
在 24GB GPU 上，您希望增加到使用總共不到 23GB。您永遠不希望超過 23.5GB 的總使用量，否則生成時間將大幅增加。

優化

本指南中的幾個選項可以加快推理時間。它們是 fp16_fast（fp16 累加）、TeaCache、Torch Compile、自適應引導（僅限於 Comfy 原生）和 Sage Attention。如果您希望禁用它們以進行測試或在犧牲時間的情況下提高質量，請執行以下操作：

fp16_fast : 從 run_nvidia_gpu.bat 中刪除 –fast。如果您使用 KJ 的，還需要將 WanVideo 模型加載器的 base_precision 從 fp16_fast 設置為 fp16
Sage Attention : 從 run_nvidia_gpu.bat 中刪除 –use-sage-attention
自適應引導 : 將自適應引導節點的閾值設置為 1
Torch Compile : 右鍵單擊 TorchCompileModelWanVideo 節點並單擊旁路
TeaCache : 右鍵單擊 TeaCache 節點並單擊旁路