Hướng dẫn này sẽ cung cấp một hướng dẫn toàn diện về việc sử dụng mô hình Video Hunyuan của Tencent trong ComfyUI để tạo video từ văn bản. Chúng tôi sẽ hướng dẫn bạn từng bước trong toàn bộ quá trình.
1. Cài đặt và Cập nhật ComfyUI lên Phiên bản Mới Nhất
Nếu bạn chưa cài đặt ComfyUI, vui lòng tham khảo các phần sau:
ComfyUI/├── models/│ ├── diffusion_models/│ │ └── hunyuan_video_t2v_720p_bf16.safetensors # Tệp mô hình chính│ ├── text_encoders/│ │ ├── clip_l.safetensors # Bộ mã hóa văn bản CLIP│ │ └── llava_llama3_fp8_scaled.safetensors # Bộ mã hóa văn bản LLaVA│ └── vae/│ └── hunyuan_video_vae_bf16.safetensors # Tệp mô hình VAE
3. Tải về Tệp Quy trình
Tải về Quy trình Tạo Video từ Văn Bản HunyuanVideo
Loại trọng số: default (có thể chọn loại fp8 nếu bộ nhớ không đủ)
DualCLIPLoader
Mục đích: Tải các mô hình bộ mã hóa văn bản
Các tham số:
CLIP 1: clip_l.safetensors
CLIP 2: llava_llama3_fp8_scaled.safetensors
Bộ mã hóa văn bản: hunyuan_video
VAELoader
Mục đích: Tải mô hình VAE
Các tham số:
Mô hình VAE: hunyuan_video_vae_bf16.safetensors
4.2 Các Nút Tạo Video Chính
EmptyHunyuanLatentVideo
Mục đích: Tạo không gian tiềm ẩn video
Các tham số:
Chiều rộng: Chiều rộng video (ví dụ: 848)
Chiều cao: Chiều cao video (ví dụ: 480)
Số khung hình: Số lượng khung hình (ví dụ: 73)
Kích thước lô: Kích thước lô (mặc định 1)
CLIPTextEncode
Mục đích: Mã hóa văn bản prompt
Các tham số:
Văn bản: Các prompt tích cực (miêu tả những gì bạn muốn tạo ra)
Khuyến nghị sử dụng mô tả chi tiết bằng tiếng Anh
FluxGuidance
Mục đích: Kiểm soát cường độ hướng dẫn tạo ra
Các tham số:
Thang hướng dẫn: Cường độ hướng dẫn (mặc định 6.0)
Các giá trị cao hơn làm cho kết quả gần với các prompt nhưng có thể ảnh hưởng đến chất lượng video
KSamplerSelect
Mục đích: Chọn bộ lấy mẫu
Các tham số:
Bộ lấy mẫu: Phương pháp lấy mẫu (mặc định euler)
Các tùy chọn khác: euler_ancestral, dpm++_2m, v.v.
BasicScheduler
Mục đích: Đặt lịch trình lấy mẫu
Các tham số:
Lịch trình: Phương pháp lập lịch (mặc định simple)
Bước: Bước lấy mẫu (khuyến nghị 20-30)
Làm sạch: Cường độ làm sạch (mặc định 1.0)
4.3 Các Nút Giải mã và Lưu Video
VAEDecodeTiled
Mục đích: Giải mã video không gian tiềm ẩn thành video thực tế
Các tham số:
Kích thước ô: 256 (có thể giảm nếu bộ nhớ không đủ)
Chồng chéo: 64 (có thể giảm nếu bộ nhớ không đủ)
Ghi chú: Ưu tiên VAEDecodeTiled hơn VAEDecode vì nó tiết kiệm bộ nhớ hơn
SaveAnimatedWEBP
Mục đích: Lưu video đã tạo
Các tham số:
Tiền tố tên tệp: Tiền tố tên tệp
FPS: Tốc độ khung hình (mặc định 24)
Mất dữ liệu: Có mất dữ liệu hay không (mặc định false)
Chất lượng: Chất lượng (0-100, mặc định 80)
Loại bộ lọc: Loại bộ lọc (mặc định default)
5. Mẹo Tối ưu hóa Tham số
5.1 Tối ưu hóa Bộ nhớ
Nếu gặp phải vấn đề về bộ nhớ:
Chọn loại trọng số fp8 trong UNETLoader
Giảm tham số tile_size và overlap trong VAEDecodeTiled
Sử dụng độ phân giải video và số khung hình thấp hơn
5.2 Tối ưu hóa Chất lượng Tạo ra
Tối ưu hóa Prompt[Mô tả Chủ đề], [Mô tả Hành động], [Mô tả Cảnh], [Mô tả Phong cách], [Yêu cầu Chất lượng]Ví dụ:cô gái anime phong cách anime với đôi tai fennec khổng lồ và một cái đuôi bông to, cô ấy có tóc vàng dài và đôi mắt xanh, mặc áo len hồng và chân váy dài màu xanh, đi bộ trong một cảnh đẹp ngoài trời với những ngọn núi tuyết ở phía sau
Điều chỉnh Tham số
Tăng số bước lấy mẫu để có chất lượng tốt hơn
Tăng cường độ Thang hướng dẫn một cách hợp lý để có độ bám sát văn bản tốt hơn
Điều chỉnh FPS và các tham số chất lượng video theo nhu cầu
6. Các Vấn đề Thường Gặp
Bộ nhớ không đủ
Tham khảo các gợi ý trong phần tối ưu hóa bộ nhớ
Đóng các chương trình khác tiêu tốn bộ nhớ
Sử dụng cài đặt độ phân giải video thấp hơn
Tốc độ Tạo ra Chậm
Điều này là bình thường, việc tạo video cần thời gian