這是初學者指南,幫助您安裝 Wan 並實施所有可用的優化,以最大化視頻生成的速度。
現在,實現這一目標涉及質量的權衡,但如果您更願意優先考慮質量而非速度,您可以輕鬆禁用任何優化。
隨附的指南和工作流程是針對擁有 24GB 或更多 VRAM 的 GPU 量身定制的,通常在生成過程中使用 21-23GB。雖然可以使用少於 24GB 的 GPU,但您需要進行調整。例如,16GB 的 GPU 可以使用 FP8/Q8 模型,前提是您在提供的工作流程中增加 virtual_vram_gb 或區塊交換設置。我們稍後會討論這些。
如果您的 VRAM 少於 16GB,您可能希望使用低於 Q8 的量化模型,但請記住,使用較低的量化級別會降低輸出的質量。一般來說,您使用的量化級別越低,獲得的質量就越低。
/ldg/ Wan 2.1 安裝和優化指南
前置條件 - 首先安裝
選擇實現方式
選項 1 - Kijai 的包裝器
選項 2 - Comfy 原生
一般安裝步驟
生成前的重要注意事項
支持的解析度
在 720P 下生成
優化
前置條件 - 首先安裝
ComfyUI 可攜版 ComfyUI 管理器 CUDA 12.6
選擇實現方式
Wan 2.1 可以通過兩種方法集成到 ComfyUI 中:原生支持或 Kijai 的包裝器。Kijai 的包裝器具有原生不具備的附加功能(flowedit、vid2vid 等),而原生則擁有 Kijai 版本中沒有的幾個優勢。這些優勢包括:對 gguf 模型的支持、自適應引導(以質量為代價加速生成的方法)以及 TorchCompile 兼容性,不僅支持 40XX 和 50XX GPU 系列,還支持 30XX 系列,這使得生成速度額外提高約 30%。因此,如果您使用的 VRAM 少於 24GB 和/或希望獲得最快的生成速度,原生可能是更好的選擇。
一旦您確定了方法及其相關工作流程,請繼續進行一般安裝步驟。
選項 1 - Kijai 的包裝器
下載這些修改過的 Kijai 默認工作流程版本。除了優化和一些額外功能外,它們使用 Alibaba 的默認設置作為基準。該工作流程輸出兩個視頻,原始 16 fps 和插值 32 fps 版本。您可以輕鬆調整這些以使用 720P 模型/設置。請參見 在 720P 下生成。
/ldg/ KJ i2v 480p 工作流程: ldg_kj_i2v_14b_480p.json (更新於 2025 年 3 月 17 日)
/ldg/ KJ t2v 480p 工作流程: ldg_kj_t2v_14b_480p.json (更新於 2025 年 3 月 17 日)
確保 ComfyUI 更新到最新版本。(在 ComfyUI_windows_portable\update 中的 update_comfyui.bat)
下載這些模型。
請勿將 Comfy 模型文件與 KJ 的模型文件一起使用!您必須 使用這些,否則會遇到問題!
移至一般安裝步驟。
選項 2 - Comfy 原生
下載這些基於 /ldg/ 的修改過的 Comfy 工作流程版本。除了優化和一些額外功能外,它們使用 Alibaba 的默認設置作為基準。該工作流程輸出兩個視頻,原始 16 fps 和插值 32 fps 版本。您可以輕鬆調整這些以使用 720P 模型/設置。請參見 在 720P 下生成。
/ldg/ Comfy i2v 480p 工作流程: ldg_cc_i2v_14b_480p.json (更新於 2025 年 3 月 17 日)
/ldg/ Comfy t2v 480p 工作流程: ldg_cc_t2v_14b_480p.json (更新於 2025 年 3 月 17 日)
確保 ComfyUI 更新到最新版本。(在 ComfyUI_windows_portable\update 中的 update_comfyui.bat)
下載這些模型。如果您的 VRAM 少於 24GB,您還可以將 Q8 模型替換為 Q6/Q5/Q4,儘管您會看到輸出質量隨著量化級別的降低而逐漸下降。
請勿將 Kijai 的文本編碼器文件與這些模型一起使用!您必須 使用這些文本編碼器,否則在生成時會出現錯誤,顯示 Exception during processing !!! mat1 and mat2 shapes cannot be multiplied (77x768 and 4096x5120)
移至一般安裝步驟。
一般安裝步驟
下載並運行這個 ,按照指示自動安裝 Triton 和 Sage,這將大幅加快您的生成速度。
在 ComfyUI_windows_portable\ 中打開 cmd.exe 提示符,並運行以下命令。這將安裝最新的 pytorch nightly 版本以支持 CUDA 12.6,讓您使用 fp16 累加,這是一種減少生成時間的優化。..\python_embeded\python.exe -s -m pip install torch==2.7.0.dev20250306+cu126 torchvision torchaudio –index-url https://download.pytorch.org/whl/nightly/cu126 –force-reinstall
編輯 ComfyUI_windows_portable 中的 run_nvidia_gpu.bat,將第一行更改為:.\python_embeded\python.exe -s ComfyUI\main.py –windows-standalone-build –use-sage-attention –fast
運行 ComfyUI。查看 cmd.exe 控制台窗口,確保在啟動過程中顯示 pytorch version: 2.7.0.dev20250306+cu126。您還應該看到 Enabled fp16 accumulation 和 Using sage attention。
在更新擴展或重啟時,可能會出現一個錯誤,報告不正確的 pytorch 版本。如果發生這種情況,請關閉 Comfy 並重新啟動。如果您在更新擴展後使用 Comfy 的“重啟”按鈕,則最常發生此錯誤,因此請手動關閉並在更新擴展後手動啟動。這也可能在更新 Comfy 後發生。如果在第二次重啟後仍然不是 2.7.0dev,請再次執行步驟 5。
打開其中一個工作流程。打開管理器並安裝缺失的自定義節點。最後,安裝 ComfyUI-GGUF 擴展。
如果在安裝並重新啟動 Comfy 後仍然抱怨缺少節點,您可能需要手動安裝缺失的節點。如果在使用 KJ 的包裝器時發生此情況,請手動安裝包裝器 從他的倉庫 ,並事先刪除自定義節點中的舊版本。如果它抱怨缺少 WanVideoEnhanceAVideoKJ,則同樣適用於 KJNodes 。請確保遵循可攜版 安裝的安裝說明。
對於視頻插值模型,請訪問這個倉庫 ,下載film_net_fp32.pt ,並將其放在 ComfyUI\custom_nodes\comfyui-frame-interpolation\ckpts\film
確保每次啟動 Comfy 時,pytorch 版本顯示為 2.7.0dev,否則 fp16_fast / fp16 accumulation 將無法正常工作。
運行您的第一次生成。如果在模型加載期間出現“按任意鍵繼續”時凍結,您需要重新啟動計算機。如果在運行工作流程時出現此錯誤:ImportError: DLL load failed while importing cuda_utils: The specified module could not be found。請轉到 \users\username\ 並打開 .triton 目錄。刪除其中的 cache 子目錄。請不要 刪除整個 .triton 目錄。
生成前的重要注意事項
您獲得的初始生成時間不 準確。Teacache 在生成過程中啟動,並且如果您使用的是 Comfy 原生/核心,則在過程中途會啟動自適應引導。
當視頻生成完成後,您將在各自的 i2v 或 t2v 目錄及子目錄中獲得兩個文件。原始文件是 16 幀輸出,而 int 文件則插值為 32 幀,這使得運動更加平滑。
強烈建議您在生成過程中啟用預覽。如果您遵循了指南,您將擁有所需的擴展。轉到 ComfyUI 設置(左下角的齒輪圖標),搜索“在取樣時顯示動畫預覽”。啟用它。然後打開 Comfy 管理器,將預覽方法設置為 TAESD(慢)。到第 10 步時,輸出將變得更清晰,您將對構圖和運動有一般的感覺。這可以並且將節省您大量時間,因為如果您不喜歡它們的外觀,可以提前取消生成。
永遠 不要在 480p 解析度下使用 720p i2v 模型,反之亦然。如果您使用 720p i2v 模型並將解析度設置為 832×480,例如,您獲得的輸出將比簡單使用 480p i2v 模型要差得多。您永遠不會通過在 720p 模型上生成 480p 來提高質量,因此不要這樣做。唯一允許您混合 480p 和 720p 解析度的模型是 t2v 14B。
支持的解析度
每個模型都是針對特定解析度進行訓練和微調的。理論上,偏離這些精確解析度可能會產生比堅持支持的解析度更差的結果,特別是對於 i2v。
然而,根據我的經驗,只要調整保持合理,我已成功使用非標準解析度進行 i2v,而沒有明顯的問題。例如,您應該避免對 480p 或 720p 進行劇烈偏離,並始終固定一個維度 - 要麼 480 用於 480p 模型,要麼 720 用於 720p 模型 - 同時將另一個維度向下縮放(絕不要向上縮放)以調整長寬比。這意味著一個維度應始終固定在 480 或 720,具體取決於模型,另一個維度根據需要調整為較低的值。您永遠不希望超過 480p 的最大設置值 832 和 720p 的 1280,因為這將大幅增加生成時間並超出模型開發者設置的解析度限制。
這些是 Wan 官方倉庫中列出的“支持的”解析度:
文本到視頻 - 1.3B 文本到視頻 - 14B 圖像到視頻 - 480p 圖像到視頻 - 720p 480*832 720*1280 832*480 1280*720 832*480 1280*720 480*832 720*1280 624*624 960*960 704*544 1088*832 544*704 832*1088 480*832 832*480 624*624 704*544 544*704
在 720P 下生成
如果您想在 i2v 中使用 720p 模型或在 t2v 中使用 720p 解析度,您需要:
在 t2v 中,您需要將解析度提高到 720p (1280×720 / 720×1280)。單一的 14B t2v 模型支持 480p 和 720p。
當在 Wan 上使用 i2v 時,首先在模型加載器中選擇 i2v 720P 模型。接下來,將輸入圖像的寬度和高度設置為 1280×720 或 720×1280。此模型經過優化,在此精確解析度下性能最佳,但您可以稍微調整以適應不同的長寬比。為了獲得最佳結果,始終保持高度或寬度為 720,同時按比例將另一個維度縮小(例如,1152×720、1024×720 或 720×960)。您不希望在任何維度上超過 1280。
在 Comfy 原生中,將 Teacache 係數設置為 i2v_720。Kijai 的包裝器會自動選擇正確的係數。
將 Teacache 閾值設置為 0.2,這是中等設置。將其提高到 0.3 可在犧牲輸出質量的情況下加快生成速度。
根據您使用的實現方式,增加 virtual_vram_gb (Comfy 原生)或區塊交換 (Kijai 的包裝器)。 在 24GB GPU 上,您希望增加到使用總共不到 23GB。您永遠不希望超過 23.5GB 的總使用量,否則生成時間將大幅增加。
優化
本指南中的幾個選項可以加快推理時間。它們是 fp16_fast(fp16 累加)、TeaCache、Torch Compile、自適應引導(僅限於 Comfy 原生)和 Sage Attention。如果您希望禁用它們以進行測試或在犧牲時間的情況下提高質量,請執行以下操作:
fp16_fast : 從 run_nvidia_gpu.bat 中刪除 –fast。如果您使用 KJ 的,還需要將 WanVideo 模型加載器的 base_precision 從 fp16_fast 設置為 fp16
Sage Attention : 從 run_nvidia_gpu.bat 中刪除 –use-sage-attention
自適應引導 : 將自適應引導節點的閾值設置為 1
Torch Compile : 右鍵單擊 TorchCompileModelWanVideo 節點並單擊旁路
TeaCache : 右鍵單擊 TeaCache 節點並單擊旁路