IT

구글 딥마인드의 Veo 2: 차세대 AI 비디오 생성 모델

ITnewB 2024. 12. 17. 17:15
728x90
반응형

구글 딥마인드가 비디오 생성 분야에서 OpenAI의 Sora와의 경쟁에서 앞서기 위해 새로운 AI 비디오 생성 모델 Veo 2를 발표했습니다. Veo 2는 고화질 비디오 생성과 개선된 제어력을 바탕으로 주목을 받고 있습니다.


🔍 Veo 2의 핵심 기능과 업그레이드

Veo 2는 이전 버전인 Veo와 비교해 크게 발전된 성능을 제공합니다.

  1. 고해상도 비디오 생성
    • 최대 4K 해상도 (4096x2160 픽셀) 지원
    • OpenAI의 Sora(1080p)보다 4배 높은 해상도 제공
    • 2분 이상의 긴 영상 생성 가능 (Sora는 최대 20초)
    • 다만 현재 VideoFX 도구를 통해 공개된 버전은 720p 해상도와 8초 길이로 제한되어 있습니다.
  2. 향상된 물리적 이해
    Veo 2는 현실감 있는 영상 생성을 위해 물리적 요소를 더욱 정교하게 구현합니다.
    • 모션과 유체 역학: 커피를 따르는 장면처럼 복잡한 액체 움직임 표현
    • 광원 효과: 반사광, 그림자 등 빛의 속성을 사실적으로 구현
    • 카메라 제어: 카메라 각도와 움직임을 세밀하게 조정해 다양한 시점 제공
  3. 스타일 및 표현
    Veo 2는 다양한 비디오 스타일을 지원하며, 사람의 표정과 캐릭터 애니메이션에서도 발전된 성능을 보여줍니다.
    특히 픽사(Pixar) 스타일의 애니메이션과 같은 부드러운 질감과 표현이 가능해졌습니다.

🛠 Veo 2의 한계와 개선 과제

Veo 2는 뛰어난 기능을 제공하지만 아직 몇 가지 개선할 점이 있습니다.

  1. 일관성 문제
    복잡한 프롬프트나 긴 시간 동안 캐릭터의 일관성을 유지하는 것이 여전히 도전 과제입니다.
    • 캐릭터 모델링: 움직임과 표정의 세부 디테일을 더 자연스럽게 표현해야 함.
    • 복잡한 장면: 빠르고 복잡한 움직임에 대한 완벽한 구현이 필요합니다.
  2. 비현실적인 요소
    특정 장면에서는 여전히 현실감을 잃고 ‘언캐니 밸리(Uncanny Valley)’에 빠지기도 합니다.
    • 예: 배경에서 사람들의 실루엣이 겹치거나 비현실적인 건물의 표현

🖥 Veo 2의 활용과 접근성

  • Veo 2는 현재 VideoFX 도구를 통해 제한적으로 접근할 수 있으며, 구글 클라우드의 Vertex AI 플랫폼에 단계적으로 통합될 예정입니다.
  • 구글은 사용자의 피드백을 기반으로 지속적인 모델 개선을 약속했으며, 크리에이터와 협업을 통해 더 정교한 도구로 발전시킬 계획입니다.

Eli Collins (딥마인드 제품 부사장):
"Veo 2는 창작자의 비전을 실현하고 다양한 구글 생태계에서 활용될 수 있도록 개발되었습니다. 앞으로 더 많은 업데이트를 공유할 것입니다."


🎨 Imagen 3 업그레이드: 더 나은 이미지 생성

딥마인드는 Veo 2와 함께 Imagen 3의 업그레이드도 발표했습니다. Imagen 3은 구글의 상업용 이미지 생성 모델로, 보다 정교하고 생생한 이미지 생성을 지원합니다.

Imagen 3 주요 개선점

  1. 세부 묘사 강화: 텍스처와 질감이 더 풍부하고 섬세해짐.
  2. 스타일 다양화: 포토리얼리즘, 인상파, 애니메이션 등 다양한 스타일을 지원.
  3. 프롬프트 최적화: 사용자가 입력한 키워드를 기반으로 추천 단어와 옵션을 제공하는 ‘칩렛’ 기능 추가.

🔒 안전성과 저작권 이슈

딥마인드는 Veo 2의 학습 데이터를 공개하지 않았지만, 유튜브와 같은 플랫폼의 콘텐츠를 활용했을 가능성이 제기되고 있습니다.

  • 저작권 문제를 최소화하기 위해 프롬프트 수준의 필터링을 적용하고, 비디오에 SynthID 기술을 사용해 워터마크를 삽입합니다.
  • 그러나 워터마크 기술도 완벽하지는 않아 여전히 딥페이크와 같은 리스크가 남아 있습니다.

딥마인드의 입장:
"우리는 크리에이터와 협력해 AI 기술이 윤리적이고 창의적으로 사용될 수 있도록 최선을 다하고 있습니다."


🔮 Veo 2와 Imagen 3의 미래

Veo 2와 Imagen 3는 비디오 및 이미지 생성 분야에서 혁신적인 기술을 제공하며,

  • 크리에이티브 콘텐츠: 영화 제작, 광고, 게임 개발 등 다양한 산업에 활용
  • 교육과 예술: 창의적인 교육 도구와 예술 프로젝트의 새로운 가능성

특히 Veo 2는 향후 4K 해상도와 더 긴 비디오를 실질적으로 구현할 수 있을 것으로 기대됩니다.

구글 딥마인드가 비디오 생성 분야에서 선두를 유지하기 위해 Veo 2를 지속적으로 발전시키는 만큼, AI 기술이 창작자와 산업 전반에 어떤 변화를 가져올지 주목해볼 필요가 있습니다.


결론

Veo 2는 고도화된 AI 비디오 생성 모델로, OpenAI의 Sora를 넘어서는 기능을 제공하며 비디오 생성의 새로운 지평을 열고 있습니다. 다만 저작권과 기술적 한계를 해결해야 하는 과제가 남아 있으며, 크리에이터와의 협업을 통해 이를 극복해 나갈 것으로 보입니다.

728x90
반응형