키노트 하이라이트 — 30초 요약
한국 시각 2026년 5월 20일 새벽 2시 키노트에서, 구글 딥마인드 CEO 데미스 허사비스(Demis Hassabis)는 "Omni"라는 새로운 모델 패밀리를 공개했습니다. 그리고 그 패밀리의 첫 모델인 Gemini Omni Flash는 발표 당일 곧바로 Gemini 앱, Google Flow, YouTube Shorts 세 채널에 풀렸습니다.
핵심은 단순합니다. 텍스트·이미지·오디오·영상 어느 조합을 넣어도 영상을 만들어 주고, 만들어진 영상은 그 자리에서 대화로 다시 편집할 수 있다는 것. 허사비스의 표현을 빌리면 “Omni의 장기 목표는 어떤 입력에서든 어떤 출력이든 생성하는 것(the long-term goal for Omni is to generate any type of output from any kind of input)”입니다. (Business Today)
지난 4월 OpenAI가 Sora 2 컨슈머 앱 운영을 사실상 접은 직후 (JXP 분석), 구글이 영상 생성 자리에 정조준해 꽂은 카드라는 점에서 “Sora 킬러”라는 별명이 이미 키노트 직후부터 따라붙고 있습니다.
무엇이 새로운가 — Veo와 같은 듯 다른 모델
구글에는 이미 Veo 라인업이 있습니다. 텍스트를 받아 짧은 영상을 만드는 모델이죠. 그렇다면 Omni Flash는 왜 따로 나왔을까요?
표면적인 차이부터 봅시다.
| 항목 | Veo (기존) | Gemini Omni Flash (신규) |
|---|---|---|
| 주 입력 | 텍스트(+ 일부 이미지) | 텍스트 / 이미지 / 오디오 / 영상의 자유로운 조합 |
| 출력 | 영상 | 영상 (대화형 편집 포함) |
| 편집 흐름 | 새 프롬프트로 다시 생성 | 같은 영상에 대화로 리믹스·수정 |
| 진입점 | Vertex AI, Flow | Gemini 앱, Google Flow, YouTube Shorts |
| 워터마크 | SynthID | SynthID (영상 단위 자동 삽입) |
진짜 차별점은 “워크플로우”에 있습니다. Veo 시절에는 결과가 마음에 안 들면 프롬프트를 바꿔 처음부터 다시 돌리는 게 일반적이었습니다. Omni Flash는 그 과정을 한 채팅 창 안으로 끌어옵니다. 9to5Google이 키노트 전 유출 시점에 잡아낸 문구가 이 변화를 잘 요약하는데요, “영상을 리믹스하고, 채팅에서 직접 편집하고, 템플릿을 써 보라”는 설명이 그대로 들어 있었습니다. (9to5Google)
다시 말해, Omni Flash는 “더 잘 만드는 모델”보다 “덜 다시 만들게 하는 모델”에 가깝습니다. 캐릭터·배경·조명·소품을 reference image로 잡아 두면 후속 편집에서도 그 정체성을 유지합니다. 카메라 각도만 바꿔라, 의상을 흰색으로 바꿔라, 카페 장면을 비 오는 골목으로 옮겨라 — 이런 지시를 같은 영상 위에서 받아냅니다.
물리 엔진 측면에서도 한 단계 진척이 있었습니다. 키노트와 사전 데모에서 가장 자주 인용된 장면은 칠판 위에 삼각함수 항등식 증명을 손글씨로 적어 가는 교수 영상이었는데, 글자가 깨지지 않고 식이 끝까지 일관되게 이어졌습니다. (9to5Google) 텍스트 렌더링과 시퀀스 일관성은 그동안 영상 생성 모델 다수가 미끄러진 지점이라, 데모 자체가 “Omni가 무엇을 노리고 있는지” 보여주는 신호로 받아들여졌습니다.
오늘 바로 써볼 수 있는 3가지 사용 시나리오
발표 당일에 풀렸다는 점이 이 글의 핵심입니다. 정식 API는 “앞으로 몇 주 안” 공개 예정이지만 (OfficeChai), 일반 사용자가 손에 잡을 수 있는 채널이 세 개나 동시에 열렸습니다. 각 채널이 노리는 사용 결이 다르기 때문에, 본인이 쓰는 자리에 맞춰 진입점을 고르는 것이 좋습니다.
시나리오 1 — Gemini 앱: “설명용 짧은 영상” 만들기
복잡한 개념을 30초 안에 시각적으로 설명해야 할 때 유리한 자리입니다. Google AI Plus / Pro / Ultra 구독자라면 Gemini 앱(모바일·웹)의 영상 생성 탭에서 “Create with Gemini Omni” 진입점을 곧 보게 됩니다. (Yahoo Tech)
추천 워크플로우는 이렇습니다.
- 화면 캡처나 다이어그램 한 장을 첨부합니다.
- “이 그림을 30초 영상으로 풀어 줘. 첫 5초는 전체 구조, 다음 10초는 데이터 흐름 화살표, 마지막 15초는 사용자 시점 데모”처럼 시퀀스를 텍스트로 함께 줍니다.
- 결과가 나오면 같은 채팅에서 “두 번째 클립의 카메라를 위에서 아래로 내려다보는 시점으로 바꿔 줘”라고 말로 수정합니다.
자기 목소리를 디지털 아바타에 입혀 내레이션을 넣는 기능도 함께 풀렸습니다. 다만 구글은 안전 검수가 끝날 때까지 본인의 목소리에 한해서만 사용을 허용한다고 명시했습니다. (Yahoo Tech)
시나리오 2 — Google Flow: “시리즈물 톤” 유지하기
Flow는 작년부터 Veo를 얹은 영상 워크스페이스로 쓰이던 자리입니다. Omni Flash가 합류하면서 진가가 드러나는 곳이 바로 여기인데요, 캐릭터·로케이션·룩을 reference로 고정해 두고, 여러 컷을 같은 톤으로 찍어 내는 작업에 어울립니다.
블로거·1인 크리에이터 관점에서는 이런 용도가 즉시 떠오릅니다.
- 자기 채널의 시그니처 캐릭터(혹은 본인 셀카) 한 장을 anchor로 등록해 두면, 매주 다른 주제의 인트로를 같은 인물로 일관되게 찍을 수 있습니다.
- 같은 카페·같은 책상 톤을 reference로 잡고, 매 영상의 “책 펴는 컷” 같은 패턴 샷만 빠르게 변형해 가며 시리즈를 굴릴 수 있습니다.
Flow도 마찬가지로 AI Plus / Pro / Ultra 티어가 필요합니다. (OfficeChai)
시나리오 3 — YouTube Shorts: “모두에게 무료”인 진입점
가장 큰 뉴스는 YouTube Shorts에서 Omni Flash가 무료라는 점입니다. (Yahoo Tech) Shorts 작성 화면 안에 Omni 기반 영상 생성·리믹스 도구가 붙으면서, 구독료를 내지 않는 일반 사용자도 짧은 콘텐츠 제작 흐름 안에서 이 모델을 만질 수 있게 됐습니다.
Shorts 시나리오에서 가장 빠르게 시도해 볼 만한 패턴은 이런 것들입니다.
- 기존 본인 Shorts를 anchor로 던지고 “이 클립의 룩을 유지한 채 결말 5초만 다른 장소로 바꿔 줘”라고 부탁
- 사진 한 장을 영상으로 끌어 올리는 “포토 투 모션” 형태로 짧은 트렌드 영상 만들기
- 음악만 첨부해 두고 “이 음악 비트에 맞춰 우리 강아지 일상 컷 15초”처럼 오디오 기반 영상 생성
요약하면, 본인이 어떤 사용자냐에 따라 채널이 다릅니다. 학습·업무용 설명 영상이 필요하면 Gemini 앱, 시리즈물 톤을 잡으려면 Google Flow, 짧은 콘텐츠 실험을 가볍게 하려면 YouTube Shorts입니다.
Sora·Veo·Seedance와의 진짜 차이 — 입력 모달 비교
“Sora 킬러”라는 별명이 따라붙은 이유는 두 가지입니다. 하나는 시점입니다. OpenAI가 컨슈머용 Sora 2 앱을 4월 말 셧다운한 직후, 구글이 정면 진입했습니다. 다른 하나는 “입력 자유도” 격차입니다.

| 모델 | 입력 모달 | 강점 | 약점 / 한계 |
|---|---|---|---|
| OpenAI Sora 2 | 텍스트(+ 일부 이미지) | 시네마틱 카메라 워크, 짧은 컷의 시각 품질 | 4월 말 컨슈머 앱 셧다운, 워크플로우 약함 |
| ByteDance Seedance 2.0 | 텍스트 / 이미지 | 공개 벤치마크에서 raw 영상 품질 상위 | 편집·재생성 흐름은 단발성 |
| Google Veo 3.1 | 텍스트 / 이미지 | Vertex AI·Flow 통합, 안정적 길이감 | 단일 텍스트 프롬프트 의존 |
| Gemini Omni Flash | 텍스트 / 이미지 / 오디오 / 영상 | any input → video, 같은 채팅에서 대화형 편집, 캐릭터 일관성 | 출시 직후라 raw 품질은 Veo 3.1·Seedance 2 대비 다소 거칠다는 사전 평 (JXP 분석) |
진짜 차이가 잘 드러나는 사례는 “같은 캐릭터로 10컷을 찍는 영상”입니다. Sora나 Seedance가 매 컷마다 인물 정체성을 흔드는 동안, Omni Flash는 reference image 하나로 정체성·조명·색감을 잡아 가도록 설계됐다는 점에서 시리즈물·브랜드 영상 영역에 직접적인 영향을 줄 것으로 보입니다. (Apiyi 분석)
다만 한 가지 정직하게 짚어야 합니다. 출시 직후 모델인 만큼, 단발 컷의 raw 품질만 두고 비교하면 Veo 3.1이나 Seedance 2.0이 한두 단계 위라는 사전 평가가 적지 않습니다. (JXP 분석) Omni Flash가 “질”이 아닌 “흐름”을 무기로 들고 나온 모델이라는 점을 기억하면, 어떤 작업에 적합한지 판단이 쉬워집니다.
안전 장치 — SynthID와 “본인 목소리 한정” 정책
영상 생성 모델은 보이스피싱·딥페이크 우려가 늘 따라붙습니다. 구글은 키노트에서 두 가지 가드레일을 명확히 했습니다.
- 모든 Omni Flash 생성물에는 SynthID 디지털 워터마크가 자동으로 들어갑니다. 사람 눈에는 보이지 않지만 구글 도구로 검증할 수 있는 신호입니다.
- 디지털 아바타 기능은 본인 목소리에 한해서만 학습·합성을 허용합니다. 오디오 편집·음성 변환 기능 전반은 안전성 검수가 끝날 때까지 단계적으로 풀린다고 명시했습니다. (Yahoo Tech)
이 두 정책은 Omni Flash가 “워크플로우 도구”로 자리 잡으려면 반드시 필요한 신뢰 장치입니다. 동시에 “남의 목소리로 영상 만들어 줘” 같은 시나리오는 의도적으로 막혀 있다는 뜻이기도 합니다.
개발자가 주목할 포인트 — API와 가격, 그리고 토큰
지금 단계에서는 사용자용 채널만 열렸지만, OfficeChai는 구글이 “앞으로 몇 주 안에 API를 공개한다”고 명시했다고 전했습니다. (OfficeChai) Vertex AI를 통한 통합이 가장 유력한 경로입니다.
키노트에서 가격표가 정식으로 공개되진 않았지만, 사전 유출 단계에서 한 가지 신호는 분명했습니다. 9to5Google이 5월 11일 시점에 잡아낸 사용 로그에서는 단 두 개의 프롬프트가 AI Pro 일간 사용량의 86%를 소진한 사례가 등장했습니다. (9to5Google) 영상 한 컷이 토큰·크레딧 단위로 만만치 않다는 뜻입니다.
다시 정리하면 이렇습니다.
- API는 “coming weeks”. 정식 SKU와 토큰당 단가가 곧 공개됩니다.
- 현재 무료 진입점은 YouTube Shorts 한 곳.
- Gemini 앱·Google Flow에서 작업하려면 Google AI Plus·Pro·Ultra 중 하나가 필요합니다.
영상 한 편의 토큰 소비가 큰 만큼, 사이드 프로젝트로 Omni Flash를 붙일 계획이라면 “생성 빈도”와 “재생성 횟수”를 처음부터 설계에 반영하는 편이 안전합니다.
관전 포인트 — 다음 24~72시간
키노트 직후 며칠은 모델 자체보다 “움직임”이 더 중요한 시기입니다. 다음 몇 가지를 지켜볼 만합니다.
- YouTube Shorts에서 무료 풀린 만큼, 일반 사용자 후기가 며칠 내로 폭발할 가능성이 높습니다. raw 품질 평가가 Veo 3.1·Seedance 2 대비 어떻게 자리 잡는지가 관전 포인트입니다.
- OpenAI가 Sora 2 컨슈머 앱을 접은 뒤 “API 전용” 노선으로 갈지, 새 컨슈머 카드를 꺼낼지 — 구글의 이번 발표가 그 답을 앞당길 가능성이 큽니다.
- Veo 3.1과의 역할 분담 정리. 영상 생성에 Vertex AI를 쓰던 기업 고객은 “언제 Omni로 옮기느냐” 결정 시점이 다가오고 있습니다.
오늘 새벽 키노트는 “구글이 영상 생성 시장에 들어왔다”가 아니라 “구글이 영상 생성 워크플로우 시장에 들어왔다”에 가까웠습니다. raw 품질 1위는 아직 Seedance가 쥐고 있을 수 있지만, 구글이 들고 들어온 무기는 검색·YouTube·Workspace·Chrome이라는 진입점입니다. 허사비스가 키노트에서 강조한 표현 — “순수 AI 스타트업이 따라잡기 어려운 통합 면(integration surfaces no pure-play AI startup can match)” (OfficeChai) — 은 이 글을 쓰는 시점의 구글 전략을 가장 정확히 드러내는 문장이라고 봅니다.
가장 합리적인 실험 방법은 단 하나입니다. 지금 YouTube Shorts를 열고 본인 영상 한 편을 anchor로 던져, 마지막 5초만 다른 장소로 바꿔 보세요. 구독료를 내지 않고도 손에 잡히는 새 모델의 첫인상을 얻을 수 있는 가장 빠른 길입니다.
참고 자료
- Google launches Gemini 3.5 Flash, Omni and more AI updates at Google I/O 2026 — Yahoo Tech
- Google Makes Gemini Omni Flash Available To Users — OfficeChai
- Google I/O 2026: Google unveils Gemini Omni AI video editing model — Business Today
- Gemini 'Omni' video model shows up with some early demos — 9to5Google
- Gemini Omni Leak: Google's AI Video Strategy Just Changed — JXP
- Gemini Omni video model intelligence summary — Apiyi
