이 튜토리얼에서는 ComfyUI에서 텍스트-비디오 생성을 위해 Tencent의 Hunyuan Video 모델을 사용하는 방법에 대한 포괄적인 가이드를 제공합니다. 전체 과정을 단계별로 안내해 드리겠습니다.
1. ComfyUI를 최신 버전으로 설치 및 업데이트하기
아직 ComfyUI를 설치하지 않았다면, 다음 섹션을 참조하세요:
ComfyUI 설치 가이드 ComfyUI 업데이트 가이드
‘EmptyHunyuanLatentVideo’ 노드에 접근하기 위해 ComfyUI를 최신 버전으로 설치하고 업데이트해야 합니다.
2. 모델 다운로드 및 설치
HunyuanVideo는 다음 모델 파일이 필요합니다:
2.1 주요 모델 파일
다음 파일을 HunyuanVideo 주요 모델 다운로드 페이지 에서 다운로드하세요:
파일 이름 크기 디렉토리 hunyuan_video_t2v_720p_bf16.safetensors ~25.6GB ComfyUI/models/diffusion_models
2.2 텍스트 인코더 파일
다음 파일을 HunyuanVideo 텍스트 인코더 다운로드 페이지 에서 다운로드하세요:
파일 이름 크기 디렉토리 clip_l.safetensors ~246MB ComfyUI/models/text_encoders llava_llama3_fp8_scaled.safetensors ~9.09GB ComfyUI/models/text_encoders
2.3 VAE 모델 파일
다음 파일을 HunyuanVideo VAE 다운로드 페이지 에서 다운로드하세요:
파일 이름 크기 디렉토리 hunyuan_video_vae_bf16.safetensors ~493MB ComfyUI/models/vae
모델 디렉토리 구조 참조
ComfyUI/├── models/│ ├── diffusion_models/│ │ └── hunyuan_video_t2v_720p_bf16.safetensors # 주요 모델 파일│ ├── text_encoders/│ │ ├── clip_l.safetensors # CLIP 텍스트 인코더│ │ └── llava_llama3_fp8_scaled.safetensors # LLaVA 텍스트 인코더│ └── vae/│ └── hunyuan_video_vae_bf16.safetensors # VAE 모델 파일
3. 워크플로우 파일 다운로드
HunyuanVideo 텍스트-비디오 워크플로우를 다운로드하세요
원시 Json 형식
워크플로우 파일 출처: HunyuanVideo 워크플로우 다운로드
기본 비디오 생성 워크플로우
HunyuanVideo는 다음 해상도 설정을 지원합니다:
해상도 9:16 비율 16:9 비율 4:3 비율 3:4 비율 1:1 비율 540p 544×960×129f 960×544×129f 624×832×129f 832×624×129f 720×720×129f 720p (권장) 720×1280×129f 1280×720×129f 1104×832×129f 832×1104×129f 960×960×129f
4. 워크플로우 노드 설명
4.1 모델 로딩 노드
UNETLoader
목적: 주요 모델 파일 로드
매개변수:
모델: hunyuan_video_t2v_720p_bf16.safetensors
가중치 유형: default (메모리가 부족할 경우 fp8 유형 선택 가능)
DualCLIPLoader
목적: 텍스트 인코더 모델 로드
매개변수:
CLIP 1: clip_l.safetensors
CLIP 2: llava_llama3_fp8_scaled.safetensors
텍스트 인코더: hunyuan_video
VAELoader
목적: VAE 모델 로드
매개변수:
VAE 모델: hunyuan_video_vae_bf16.safetensors
4.2 주요 비디오 생성 노드
EmptyHunyuanLatentVideo
목적: 비디오 잠재 공간 생성
매개변수:
너비: 비디오 너비 (예: 848)
높이: 비디오 높이 (예: 480)
프레임 수: 프레임 수 (예: 73)
배치 크기: 배치 크기 (기본값 1)
CLIPTextEncode
목적: 텍스트 프롬프트 인코딩
매개변수:
텍스트: 긍정적인 프롬프트 (생성하고 싶은 것을 설명)
자세한 영어 설명을 사용하는 것이 권장됩니다
FluxGuidance
목적: 생성 가이드 강도 조절
매개변수:
가이드 스케일: 가이드 강도 (기본값 6.0)
높은 값은 결과를 프롬프트에 가깝게 만들지만 비디오 품질에 영향을 줄 수 있습니다
KSamplerSelect
목적: 샘플러 선택
매개변수:
샘플러: 샘플링 방법 (기본값 euler)
기타 옵션: euler_ancestral, dpm++_2m 등
BasicScheduler
목적: 샘플링 스케줄러 설정
매개변수:
스케줄러: 스케줄링 방법 (기본값 simple)
스텝: 샘플링 스텝 (권장 20-30)
디노이즈: 디노이징 강도 (기본값 1.0)
4.3 비디오 디코딩 및 저장 노드
VAEDecodeTiled 목적: 잠재 공간 비디오를 실제 비디오로 디코딩 매개변수:타일 크기: 256 (메모리가 부족할 경우 줄일 수 있음) 오버랩: 64 (메모리가 부족할 경우 줄일 수 있음) 참고: VAEDecode보다 VAEDecodeTiled를 선호하는 것이 메모리 효율성이 더 좋습니다
SaveAnimatedWEBP
목적: 생성된 비디오 저장
매개변수:
파일 이름 접두사: 파일 이름 접두사
FPS: 프레임 속도 (기본값 24)
무손실: 무손실 여부 (기본값 false)
품질: 품질 (0-100, 기본값 80)
필터 유형: 필터 유형 (기본값 default)
5. 매개변수 최적화 팁
5.1 메모리 최적화
메모리 문제가 발생할 경우:
UNETLoader에서 fp8 가중치 유형 선택
VAEDecodeTiled에서 tile_size 및 overlap 매개변수 줄이기
더 낮은 비디오 해상도 및 프레임 수 사용
5.2 생성 품질 최적화
프롬프트 최적화 [주제 설명], [행동 설명], [장면 설명], [스타일 설명], [품질 요구 사항]예시:애니메이션 스타일의 애니메이션 소녀, 거대한 페넥 귀와 하나의 큰 복슬복슬한 꼬리를 가진, 그녀는 금발의 긴 머리와 파란 눈을 가지고 있으며, 분홍색 스웨터와 긴 파란 치마를 입고 아름다운 야외 풍경에서 눈 덮인 산을 배경으로 걷고 있습니다
매개변수 조정
더 나은 품질을 위해 샘플링 스텝 증가
더 나은 텍스트 준수를 위해 가이드 스케일 적절히 증가
필요에 따라 FPS 및 비디오 품질 매개변수 조정
6. 일반적인 문제
메모리 부족
메모리 최적화 섹션의 제안 참조
다른 메모리 소모 프로그램 종료
더 낮은 비디오 해상도 설정 사용
느린 생성 속도
정상입니다, 비디오 생성에는 시간이 걸립니다
샘플링 스텝 및 프레임 수 줄일 수 있습니다
속도를 높이기 위해 더 낮은 해상도 사용
품질 문제
프롬프트 설명 최적화
샘플링 스텝 증가
가이드 스케일 조정
다양한 샘플러 시도