구글 Veo Omni, AI 영상 제작의 통합
프롬프트 한 줄로 이미지 9개를 만든 뒤 이를 첫 프레임 삼아 영상 9개로 잇고, 영상 위에 CG를 입히며, 나만의 아바타까지 제작하는 시대가 가능해졌다. 구글의 새로운 AI 모델 Veo Omni와 대대적으로 업데이트된 Flow는 영상 제작의 전 과정을 한 플랫폼 안에서 해결하는 것을 목표로 한다. 이 글은 Veo Omni와 Flow의 주요 기능과 실제 활용법을 상세히 소개한다.
Veo Omni와 Flow 업데이트의 핵심
구글 Flow에 새롭게 추가된 Veo Omni 모델은 AI 영상 제작의 방식을 변화시킨다. Veo Omni는 사용자가 촬영한 영상의 물리 법칙을 이해하고, 그 위에 새로운 효과를 자연스럽게 입힌다. 이는 마치 영상 위에 CG나 VFX 효과를 합성하는 것과 같다. 특히 원본 영상을 그대로 유지한 채 효과를 적용하는 점이 두드러진다. 기존에는 이미지만 참조 자료로 넣을 수 있었으나, 이제는 영상과 이미지를 함께 참조 재료로 사용하는 멀티모달 기능을 제공한다.
Flow 자체도 대규모 업데이트를 단행했다. 에이전트, 전환, 도구 기능이 새롭게 추가되었고, 과거의 위스크(Whisk) 기능도 다시 도입되었다. 이 업데이트는 Flow가 단순한 영상 제작 플랫폼을 넘어 AI 크리에이티브 스튜디오로 자리매김하려는 의도를 보여준다.
Flow 에이전트, 다중 이미지·영상 생성
Flow의 에이전트 기능은 프롬프트 한 줄로 여러 개의 이미지와 영상을 동시에 생성한다. 예를 들어, “엄마 고양이와 아기 고양이가 우베 케이크를 만드는 과정 장면으로 총 아홉 개 신을 3x3 그리드 형식으로 제작”하라는 프롬프트를 입력하면, 에이전트는 스토리보드를 위한 9개의 이미지를 자동으로 생성한다. 이 과정에서 에이전트는 사용자와 대화하며, 필요에 따라 2D 이미지를 실사 느낌으로 재구성하는 등 스타일 변경도 가능하다.
생성된 3x3 그리드 이미지는 개별 프레임으로 분해하여 각각의 이미지로 변환한다. 이후 각 이미지를 첫 프레임으로 활용해 시나리오에 맞는 9개의 영상을 생성할 수 있다. 이 방식은 영상을 빠르게 대량 생산해야 하는 사용자에게 매우 유용하다. 현재 에이전트는 퀄리티보다 효율성에 중점을 두며, Veo Omni는 기존 크레딧의 절반(50%) 비용으로 사용 가능하다.
인페인팅과 멀티모달, 영상에 새로운 요소 추가
인페인팅은 원본 영상의 특정 부분을 선택하여 변경하는 기능이다. 멀티모달은 이미지나 영상 등 여러 소스를 참조 자료로 활용해 새로운 영상을 제작하는 방식이다. 기존에도 유사한 기능이 있었으나, 구글 Flow의 차별점은 원본 영상 유지율에서 나타난다. 원본 영상 유지율이 다른 도구보다 훨씬 높다.
Flow와 다른 AI 도구의 원본 영상 유지 방식은 다음과 같다.
| 도구 | 비유 | 원본 영상 처리 방식 | 결과 |
|---|---|---|---|
| 클링 옴니 | 마스크 | 원본 움직임을 추출하여 모션을 입힌다 | 원본 영상의 무너짐 현상이 자주 발생한다 |
| 구글 Flow | 화장 | 얼굴 본판을 유지하며 디테일을 추가한다 | 원본을 유지한 채 세부 요소만 변경한다 |
이 기능을 활용하면 촬영한 영상 위에 가상의 요소를 자연스럽게 입힐 수 있다. 사용자가 직접 촬영한 공원 영상에 대화를 통해 생성한 이미지를 에셋으로 추가하면 포켓몬이나 드래곤을 등장시킬 수 있다. 심지어 공사장 밖에 물감이 쏟아지는 연출도 가능하다. 새로운 영상을 만들기보다 기존 영상을 수정하고 편집하는 영역에 가깝다.
특히, Flow는 한국어 텍스트 애니메이션 기능에서 강점을 보인다. 다른 도구에서 텍스트가 깨지는 현상과 달리, Flow는 영상 내 한국어 텍스트를 자연스럽게 영상에 구현한다. 이러한 기능은 대기업뿐 아니라 브랜드 캐릭터나 제품만 있는 소규모 기업도 쉽게 홍보 영상을 만들 수 있게 한다. 드론 샷 연출도 가능하다. Flow의 그리기 기능으로 빨간색 경로선을 만들고, 이를 바탕으로 드론 촬영 영상을 생성할 수 있다.
영상 퀄리티 측면에서는 시덴스가 더 뛰어나다. 그러나 시덴스는 크레딧 소모가 커 비용 부담이 있다. Flow는 가성비 측면에서 시덴스보다 효율적이다.
텍스트 애니메이션, 한국어 완벽 지원
기존 AI 영상 제작 툴들은 영상 내 한국어 텍스트를 깔끔하게 구현하는 데 어려움이 있었다. 사용자는 미리 한국어 텍스트가 완벽하게 들어간 참조 이미지를 준비해야 했다. 하지만 Flow 내 Veo Omni는 간결한 프롬프트만으로도 한국어를 깨짐 없이 깔끔하게 구현한다. 캐릭터가 흰 배경에 들어간 간단한 이미지를 첨부해도 영어는 물론 한국어 텍스트도 자연스럽게 처리한다.
이 기능은 브랜딩 유튜브 채널의 인트로 영상 제작에 특히 유용하다. 과거에는 전문 모션 디자이너에게 의뢰하거나 프리미어 프로 등 편집 툴의 템플릿을 활용해야 했던 작업들을 이제 프롬프트 하나로 Flow 내에서 구현할 수 있다.
도구 기능, AI 크리에이티브 스튜디오
Flow의 ‘도구’ 기능은 단순히 영상 생성 플랫폼을 넘어 다양한 AI 크리에이티브 서비스를 제공하는 앱과 유사하다. 이 메뉴를 통해 심플 스케치, 모션 캡처, 다양한 앵글의 이미지 추출, 그리고 초창기 이미지 생성 AI인 위스크 등을 이용할 수 있다.
예를 들어, 심플 스케치를 활용하면 사용자가 그린 간단한 그림에 프롬프트를 추가하여 캐릭터를 생성한다. 이를 통해 초보자도 자신만의 캐릭터나 이미지를 쉽게 만들고 모션 캡처 작업을 할 수 있다.
나만의 아바타와 캐릭터 시트 제작
Flow는 사용자 아바타 제작 기능도 제공한다. 모바일 앱에서 카메라와 마이크에 접근해 얼굴을 촬영하고 몇 가지 지시사항(영문 숫자 외치기, 얼굴 움직이기)을 따르면 아바타를 등록한다. 이 아바타는 사용자가 입력한 대사를 음성으로 말하는 영상을 생성한다. 더 긴 영상이 필요하다면 헤이젠(HeyGen)과 같은 외부 도구를 활용한다.
또한, Flow는 영상 콘텐츠의 일관성 유지를 위해 필수적인 캐릭터 시트를 자동으로 생성한다. 과거에는 복잡한 프롬프트로 캐릭터 시트를 개별적으로 만들어야 했지만, 이제는 Flow 내에서 캐릭터를 생성하고, 해당 캐릭터를 기반으로 캐릭터 시트를 한 번에 뽑아낼 수 있다. 캐릭터 생성 시 구글 AI 스튜디오에서 제공하는 음성 AI를 선택하여 캐릭터에 부여하는 것도 가능하다.
전환 기능, Flow 내 영상 편집의 시작
Flow의 ‘전환’ 기능은 장면 전환을 넘어 사실상 편집 기능의 시작을 알린다. 기존에는 기획, 이미지 생성, 영상 변환, 편집 등 영상 제작의 전 과정이 각기 다른 플랫폼에서 진행되었다. 하지만 Flow는 에이전트로 기획하고, Flow 내 도구로 이미지를 만들며, Veo Omni로 영상을 생성한 뒤, 전환 기능을 포함한 여러 기능을 활용해 편집까지 한 플랫폼 내에서 해결한다.
이 전환 기능으로 영상 클립을 추가하고 길이를 조절하며 붙이는 기본적인 컷 편집이 가능하다. 여기에 구글의 음성 기능과 음악 모델인 리리아(Lyria)가 통합된다면 캡컷(CapCut), 브루(Vrew), 프리미어 프로(Premiere Pro)와 같은 기존 편집 툴의 영역까지 흡수할 가능성이 있다.
구글 AI의 미래 방향
현재 구글의 AI 전략은 하나의 생태계 안에서 모든 것을 해결하도록 만들고, 이를 ‘AI 크리에이터 플랫폼’으로 명명하는 방향으로 나아간다. 영상 퀄리티만 놓고 보면 크링(Kling), 시덴스, 그록(Grok) 같은 모델이 더 우수하다고 평가되기도 한다. 그러나 구글은 저작권적 제한이 크다는 점을 고려하여, 기능 경쟁보다는 생태계 경쟁에 집중하는 모습을 보인다. 이는 사용자가 Flow라는 단일 플랫폼 내에서 영상 제작의 모든 과정을 처리할 수 있도록 하는 전략이다.
출처
- 원카AI Wonka. (2026-06-13). 프롬프트 하나로 영상 9개 뽑는다고?! 구글 Veo Omni와 Flow 2026 업데이트 완전정복. YouTube.