คู่มือการสร้างวิดีโอ Hunyuan (ComfyUI)

บทเรียนนี้จะให้คำแนะนำที่ครอบคลุมเกี่ยวกับการใช้โมเดล Hunyuan Video ของ Tencent ใน ComfyUI สำหรับการสร้างวิดีโอจากข้อความ เราจะพาคุณผ่านกระบวนการทั้งหมดทีละขั้นตอน

1. ติดตั้งและอัปเดต ComfyUI เป็นเวอร์ชันล่าสุด

หากคุณยังไม่ได้ติดตั้ง ComfyUI โปรดดูที่ส่วนเหล่านี้:

คู่มือการติดตั้ง ComfyUI คู่มือการอัปเดต ComfyUI

คุณจะต้องติดตั้งและอัปเดต ComfyUI เป็นเวอร์ชันล่าสุดเพื่อเข้าถึงโหนด ‘EmptyHunyuanLatentVideo’

2. การดาวน์โหลดและติดตั้งโมเดล

HunyuanVideo ต้องการไฟล์โมเดลดังต่อไปนี้:

2.1 ไฟล์โมเดลหลัก

ดาวน์โหลดไฟล์ต่อไปนี้จาก หน้าดาวน์โหลดโมเดลหลัก HunyuanVideo:

ชื่อไฟล์	ขนาด	ไดเรกทอรี
hunyuan_video_t2v_720p_bf16.safetensors	~25.6GB	ComfyUI/models/diffusion_models

2.2 ไฟล์ตัวเข้ารหัสข้อความ

ดาวน์โหลดไฟล์ต่อไปนี้จาก หน้าดาวน์โหลดตัวเข้ารหัสข้อความ HunyuanVideo:

ชื่อไฟล์	ขนาด	ไดเรกทอรี
clip_l.safetensors	~246MB	ComfyUI/models/text_encoders
llava_llama3_fp8_scaled.safetensors	~9.09GB	ComfyUI/models/text_encoders

2.3 ไฟล์โมเดล VAE

ดาวน์โหลดไฟล์ต่อไปนี้จาก หน้าดาวน์โหลด VAE ของ HunyuanVideo:

ชื่อไฟล์	ขนาด	ไดเรกทอรี
hunyuan_video_vae_bf16.safetensors	~493MB	ComfyUI/models/vae

การอ้างอิงโครงสร้างไดเรกทอรีโมเดล

ComfyUI/├── models/│   ├── diffusion_models/│   │   └── hunyuan_video_t2v_720p_bf16.safetensors  # ไฟล์โมเดลหลัก│   ├── text_encoders/│   │   ├── clip_l.safetensors                       # ตัวเข้ารหัสข้อความ CLIP│   │   └── llava_llama3_fp8_scaled.safetensors      # ตัวเข้ารหัสข้อความ LLaVA│   └── vae/│       └── hunyuan_video_vae_bf16.safetensors       # ไฟล์โมเดล VAE

3. การดาวน์โหลดไฟล์เวิร์กโฟลว์

ดาวน์โหลด HunyuanVideo เวิร์กโฟลว์การสร้างวิดีโอจากข้อความ

รูปแบบ Json ดิบ

แหล่งไฟล์เวิร์กโฟลว์: ดาวน์โหลดเวิร์กโฟลว์ HunyuanVideo

เวิร์กโฟลว์การสร้างวิดีโอพื้นฐาน

HunyuanVideo รองรับการตั้งค่าความละเอียดดังต่อไปนี้:

ความละเอียด	อัตราส่วน 9:16	อัตราส่วน 16:9	อัตราส่วน 4:3	อัตราส่วน 3:4	อัตราส่วน 1:1
540p	544×960×129f	960×544×129f	624×832×129f	832×624×129f	720×720×129f
720p (แนะนำ)	720×1280×129f	1280×720×129f	1104×832×129f	832×1104×129f	960×960×129f

4. คำอธิบายโหนดเวิร์กโฟลว์

4.1 โหนดการโหลดโมเดล

UNETLoader
- วัตถุประสงค์: โหลดไฟล์โมเดลหลัก
- พารามิเตอร์:
  - โมเดล: hunyuan_video_t2v_720p_bf16.safetensors
  - ประเภทน้ำหนัก: default (สามารถเลือกประเภท fp8 หากหน่วยความจำไม่เพียงพอ)
DualCLIPLoader
- วัตถุประสงค์: โหลดโมเดลตัวเข้ารหัสข้อความ
- พารามิเตอร์:
  - CLIP 1: clip_l.safetensors
  - CLIP 2: llava_llama3_fp8_scaled.safetensors
  - ตัวเข้ารหัสข้อความ: hunyuan_video
VAELoader
- วัตถุประสงค์: โหลดโมเดล VAE
- พารามิเตอร์:
  - โมเดล VAE: hunyuan_video_vae_bf16.safetensors

4.2 โหนดการสร้างวิดีโอหลัก

EmptyHunyuanLatentVideo
- วัตถุประสงค์: สร้างพื้นที่ลับของวิดีโอ
- พารามิเตอร์:
  - ความกว้าง: ความกว้างของวิดีโอ (เช่น 848)
  - ความสูง: ความสูงของวิดีโอ (เช่น 480)
  - จำนวนเฟรม: จำนวนเฟรม (เช่น 73)
  - ขนาดแบตช์: ขนาดแบตช์ (ค่าเริ่มต้น 1)
CLIPTextEncode
- วัตถุประสงค์: การเข้ารหัสข้อความ prompt
- พารามิเตอร์:
  - ข้อความ: positive prompts (อธิบายสิ่งที่คุณต้องการสร้าง)
  - แนะนำให้ใช้คำบรรยายภาษาอังกฤษที่ละเอียด
FluxGuidance
- วัตถุประสงค์: ควบคุมความแข็งแกร่งของการแนะนำการสร้าง
- พารามิเตอร์:
  - Guidance Scale: ความแข็งแกร่งของการแนะนำ (ค่าเริ่มต้น 6.0)
  - ค่าที่สูงกว่าจะทำให้ผลลัพธ์ใกล้เคียงกับ prompts แต่จะส่งผลต่อคุณภาพวิดีโอ
KSamplerSelect
- วัตถุประสงค์: เลือก sampler
- พารามิเตอร์:
  - Sampler: วิธีการสุ่ม (ค่าเริ่มต้น euler)
  - ตัวเลือกอื่นๆ: euler_ancestral, dpm++_2m, เป็นต้น
BasicScheduler
- วัตถุประสงค์: ตั้งค่าตารางการสุ่ม
- พารามิเตอร์:
  - Scheduler: วิธีการจัดตาราง (ค่าเริ่มต้น simple)
  - Steps: ขั้นตอนการสุ่ม (แนะนำ 20-30)
  - Denoise: ความแข็งแกร่งในการลดเสียงรบกวน (ค่าเริ่มต้น 1.0)

4.3 โหนดการถอดรหัสและบันทึกวิดีโอ

VAEDecodeTiled
- วัตถุประสงค์: ถอดรหัสวิดีโอในพื้นที่ลับเป็นวิดีโอจริง
- พารามิเตอร์:
  - ขนาด Tile: 256 (สามารถลดได้หากหน่วยความจำไม่เพียงพอ)
  - การทับซ้อน: 64 (สามารถลดได้หากหน่วยความจำไม่เพียงพอ)
หมายเหตุ: แนะนำให้ใช้ VAEDecodeTiled แทน VAEDecode เนื่องจากมีประสิทธิภาพในการใช้หน่วยความจำมากกว่า
SaveAnimatedWEBP
- วัตถุประสงค์: บันทึกวิดีโอที่สร้างขึ้น
- พารามิเตอร์:
  - ชื่อไฟล์นำหน้า: ชื่อไฟล์นำหน้า
  - FPS: อัตราเฟรม (ค่าเริ่มต้น 24)
  - Lossless: ว่าจะเป็น lossless หรือไม่ (ค่าเริ่มต้น false)
  - คุณภาพ: คุณภาพ (0-100, ค่าเริ่มต้น 80)
  - ประเภทฟิลเตอร์: ประเภทฟิลเตอร์ (ค่าเริ่มต้น default)

5. เคล็ดลับการปรับแต่งพารามิเตอร์

5.1 การปรับแต่งหน่วยความจำ

หากพบปัญหาเกี่ยวกับหน่วยความจำ:

เลือกประเภทน้ำหนัก fp8 ใน UNETLoader
ลดพารามิเตอร์ tile_size และ overlap ใน VAEDecodeTiled
ใช้ความละเอียดวิดีโอและจำนวนเฟรมที่ต่ำลง

5.2 การปรับแต่งคุณภาพการสร้าง

การปรับแต่ง Prompt[คำอธิบายหัวข้อ], [คำอธิบายการกระทำ], [คำอธิบายฉาก], [คำอธิบายสไตล์], [ข้อกำหนดคุณภาพ]ตัวอย่าง:สาวอนิเมะสไตล์อนิเมะที่มีหูฟีนิกซ์ขนาดใหญ่และหางฟูใหญ่ เธอมีผมยาวสีบลอนด์ ตาสีฟ้า สวมสเวตเตอร์สีชมพูและกระโปรงยาวสีน้ำเงิน เดินอยู่ในทิวทัศน์กลางแจ้งที่สวยงามพร้อมภูเขาหิมะอยู่เบื้องหลัง
การปรับพารามิเตอร์
- เพิ่มจำนวนขั้นตอนการสุ่มเพื่อคุณภาพที่ดีกว่า
- เพิ่ม Guidance Scale อย่างเหมาะสมเพื่อให้สอดคล้องกับข้อความได้ดีขึ้น
- ปรับ FPS และพารามิเตอร์คุณภาพวิดีโอตามความจำเป็น

6. ปัญหาที่พบบ่อย

หน่วยความจำไม่เพียงพอ
- ดูคำแนะนำในส่วนการปรับแต่งหน่วยความจำ
- ปิดโปรแกรมอื่นที่ใช้หน่วยความจำมาก
- ใช้การตั้งค่าความละเอียดวิดีโอที่ต่ำลง
ความเร็วในการสร้างช้า
- นี่เป็นเรื่องปกติ การสร้างวิดีโอต้องใช้เวลา
- สามารถลดจำนวนขั้นตอนการสุ่มและจำนวนเฟรม
- ใช้ความละเอียดที่ต่ำลงเพื่อเพิ่มความเร็ว
ปัญหาคุณภาพ
- ปรับแต่งคำอธิบาย prompt
- เพิ่มจำนวนขั้นตอนการสุ่ม
- ปรับ Guidance Scale
- ลองใช้ sampler ที่แตกต่างกัน