Course Hub
PHASE 03: VIDEO

Lip Sync & Facial Animation

캐릭터가 말을 하게 만드세요. 불쾌한 골짜기(Uncanny Valley)를 넘어 자연스러운 대화 영상을 만드는 법.

Advertisement

01. 립싱크(Lip Sync) 기술의 현주소

정지된 캐릭터 이미지와 녹음된 목소리(TTS)만 있다면, AI가 입모양을 자동으로 맞춰줍니다. ElevenLabs로 목소리를 만들고, SadTalkerHeyGen으로 입을 움직입니다. 핵심은 '감정 일치'입니다. 화난 목소리에는 화난 표정이 필요합니다.

02. Viseme (입모양)의 이해

Viseme은 'Visual Phoneme'의 약자로, 특정 소리를 낼 때의 입 모양을 뜻합니다. AI는 오디오 파형을 분석하여 이 Viseme을 매 프레임마다 배치합니다.

  • 'A' / 'O': 입이 크게 열림. 가장 눈에 띄는 움직임.
  • 'M' / 'B' / 'P': 입술이 닫힘. 타이밍이 어긋나면 가장 어색함.

Lip Sync Studio

Audio-Visual Visualization

스크립트를 재생하여 AI가 실시간으로 입모양을 맞추는 과정을 테스트하세요.

Advertisement
Next Lesson: Sound Design & SFX