AI 툴 카니 2026.05.20 AI 보조 작성·편집자 검수

카니 · AI 보조 작성, 편집자 검수

Keep 음성 노트 ‘talk-to-create’: 두서없이 말해도 주제별로 나뉘는 메모 (Google I/O 2026)

Keep 음성 모드 — 두서없는 발화를 주제별 노트로 분리하는 talk-to-create 일러스트

30초 요약

Google I/O 2026 키노트에서 Google Keep이 가장 조용히, 그러나 가장 결이 다른 업그레이드를 받았습니다. 새 음성 모드의 이름은 'talk-to-create'. 마이크에 대고 떠오르는 생각을 두서없이 쏟아내면, Keep이 그 안에서 서로 다른 주제를 알아서 갈라내 각각의 노트로 만들어 줍니다.

핵심만 추리면 이렇습니다.

입력 — 사용자가 한 번의 음성으로 여러 주제를 섞어 말함 ("저녁에 살 것: 두부, 대파. 그리고 내일 회의 안건: 마케팅 예산, 신제품 출시 일정. 아, 친구 생일 선물도 알아봐야 함")
처리 — Gemini가 발화의 의도를 파악해 주제별로 분할
출력 — '장보기 리스트', '회의 안건', '할 일' 세 개의 별도 노트가 자동 생성
UI — 플로팅 액션 버튼 → 풀스크린 waveform 화면 → 실시간 노트 미리보기 → 음성으로 수정 가능 → "Save to Keep" (9to5Google, Android Authority)

출시는 2026년 여름, Android 앱 우선, 미국 영어 한정. Google AI Pro·Ultra 구독자 + Google Workspace 비즈니스 프리뷰. (Google 공식 Workspace 블로그) 한국어 지원 일정은 발표 시점 기준 공개되지 않았습니다.

같은 키노트에서 발표된 Gmail Live, Docs Live와 같은 'Live' 시리즈로 묶여 있고, 세 기능을 합치면 'Workspace가 통째로 말로 일하는 환경'으로 옮겨가는 그림이 됩니다. 이 글은 그중에서도 Keep이 왜 시리즈의 핵심 자리에 들어왔는지, 그리고 입력 단계의 카오스를 출력 단계의 구조로 바꾼다는 것이 실제로 무엇을 의미하는지에 절반 이상을 할애했습니다.

배경 — 메모 앱은 왜 늘 'AI 이전'에 머물러 있었나

스마트폰 음성 받아쓰기는 10년 넘게 발전했습니다. 한국어 인식률은 일상 발화 기준 95%를 넘은 지 오래고, Apple 받아쓰기·Google Gboard 음성 입력은 거의 모든 사용자가 쓸 만한 수준에 올라왔습니다. 그럼에도 음성으로 메모를 남기는 사람은 여전히 소수입니다. 이유는 단순합니다. 받아쓰기 결과물이 그대로 메모가 되어 버리기 때문입니다.

머릿속에 떠오르는 생각은 거의 항상 구조가 없습니다. 운전하며 떠오른 다섯 가지 일거리, 회의 끝나고 정리해야 할 결론과 다음 액션, 마트 가는 길에 생각난 살 것들 — 이런 발화는 자연스럽게 토픽을 넘나듭니다. 받아쓰기는 이걸 그대로 한 덩어리로 옮깁니다. 결국 사용자는 입력 직후 다시 들여다보며 손으로 자르고, 토픽별로 옮기고, 제목을 붙여야 했습니다. '한 번 더 정리해야 한다'는 비용 때문에 음성 메모는 늘 외면당했습니다.

Keep talk-to-create는 그 한 번 더의 비용을 AI 쪽으로 옮긴 기능입니다. Google이 키노트에서 쓴 표현 그대로 옮기면 이렇습니다. "당신이 그냥 'brain dump'를 해도, Keep은 그 두서없는 말들을 알아듣고 백그라운드에서 정리된 노트와 리스트로 바꿔 놓습니다." (Google 공식 Workspace 블로그)

이 한 줄을 풀어서 읽으면 두 가지 약속이 들어 있습니다. 첫째, 받아쓰기가 아니라 의도 파악이라는 약속. 둘째, 결과물이 '하나의 길고 정돈되지 않은 텍스트'가 아니라 '여러 개의 작고 명확한 노트'라는 약속. 이 둘이 함께 지켜져야 비로소 사용자가 정리에 들이던 두 번째 단계가 사라집니다.

talk-to-create 핵심 동작 — 한 발화, 여러 노트

UI 흐름

9to5Google이 키노트 데모를 묘사한 내용을 모아 보면 사용자 경험은 이렇게 흘러갑니다.

Keep 앱 우하단의 새 플로팅 액션 버튼(Live 아이콘)을 누른다
화면 전체가 음성 모드로 전환되며, 화면 가장자리를 따라 waveform이 흐른다
사용자가 두서없이 말한다 — 한 주제든 여러 주제든 상관없다
화면 중앙에 Keep이 생성 중인 노트의 미리보기가 실시간으로 떠오른다
추가로 말해 내용을 보강하거나, 음성으로 수정 지시를 내릴 수 있다 ("두 번째 리스트에서 '대파' 빼"처럼)
마음에 들면 하단의 'Save to Keep'을 누르면 노트들이 한꺼번에 저장된다 (9to5Google)

핵심은 4번과 5번입니다. 결과물이 저장 전에 화면에서 미리 보이고, 음성으로 다시 다듬을 수 있다는 점. 받아쓰기 앱들이 가지지 못했던 'AI 결과물에 대한 실시간 피드백 루프'가 이 자리에 들어와 있습니다.

talk-to-create UI 흐름도 — FAB 진입에서 풀스크린 waveform, 실시간 노트 미리보기, 음성 수정, Save to Keep까지 6단계

토픽 분할 — 진짜 차이가 만들어지는 자리

talk-to-create가 단순한 음성 입력과 결정적으로 갈리는 지점은 한 번의 발화에서 여러 노트를 만들어 낸다는 데 있습니다. Android Authority가 인용한 Google의 설명에 따르면 "선물 사기, 장보기 리스트 작성, 빈 방 페인트칠 같은 서로 다른 주제를 말하면 AI가 각 주제별로 별도의 노트를 자동 생성"합니다. (Android Authority)

키노트 시연을 한국 사용자 상황으로 옮겨 보면 이런 그림이 나옵니다.

발화 — "오늘 회의 정리 좀 해 둬야지. A는 마케팅 예산 늘리자고 했고, B는 제품 출시를 6월로 미루자는 의견. 그리고 내일 마트에서 두부랑 대파 사 와야 하고, 아 맞다 다음 주 화요일에 치과 예약 잡아야 함."
결과 — Keep이 세 개의 노트로 분할
- 노트 1 '회의 메모' — 마케팅 예산 증액(A), 제품 출시 6월로 연기(B)
- 노트 2 '장보기 리스트' — 두부, 대파
- 노트 3 '할 일' — 다음 주 화요일 치과 예약

이게 가능하려면 AI는 단순히 받아쓴 문장을 토픽 모델링으로 묶는 수준이 아니라, 각 문장의 의도(회고/리스트/일정)와 시제(현재/미래/예약)를 함께 분류해야 합니다. Gemini의 reasoning이 들어가는 자리가 이 자리입니다. TechCrunch는 이 기능이 "단순 받아쓰기 이상의 의도 파악"을 한다고 짚었고, Google도 같은 표현으로 정리했습니다. (TechCrunch)

같은 자리에 이미 있던 것들 — Voicenotes, AudioPen, Wispr Flow, Gboard Rambler

talk-to-create는 새 개념이 아닙니다. TheNextWeb와 TechCrunch가 똑같이 짚은 대로, Voicenotes·AudioPen·Wispr Flow·Monologue·Aqua 같은 음성 노트 앱들은 이미 몇 년 전부터 비슷한 일을 해 왔습니다. (TechCrunch) Google 자체도 같은 키노트에서 Gboard의 Rambler 업데이트를 가져와 비교했습니다. Android Authority는 talk-to-create를 "Gboard Rambler의 업그레이드와 매우 닮았지만 더 낫다"고 평했습니다. (Android Authority)

그러면 Keep talk-to-create가 갖는 차별점은 무엇일까. 결국 두 가지로 좁혀집니다.

첫째, 스케일. Voicenotes·AudioPen은 좋은 도구이지만 별도의 앱입니다. Keep은 이미 수억 단위 사용자가 깔고 있고, Google Workspace의 일부로 Docs·Sheets·Calendar와 같은 화면 안에 살아 있습니다. TheNextWeb가 짚은 표현 그대로 "Google의 강점은 스케일이다. Keep은 이미 Workspace 안에 박혀 있어, 음성으로 만든 노트가 Docs·Sheets로 곧장 흘러간다." (TheNextWeb)

둘째, 토픽 분할이 표준 동작이라는 점. 기존 음성 노트 앱들은 받아쓴 텍스트를 정리해 주는 후처리에 집중했지, 한 번의 녹음을 여러 개의 별도 노트로 자동 분할하는 것을 기본 동작으로 두진 않았습니다. talk-to-create는 분할을 디폴트로 잡았고, 그 결과 사용자의 발화 패턴 자체가 달라집니다. '한 주제에 집중해서 녹음해야 한다'는 제약이 사라지면, 떠오르는 생각을 그대로 던질 수 있게 됩니다.

이 작은 차이가 메모 앱의 사용 빈도를 크게 흔들 가능성이 있습니다. 메모를 안 하는 사람들의 대다수가 안 하는 이유는 '메모할 거리가 없어서'가 아니라 '메모할 만큼 정리할 시간이 없어서'였기 때문입니다.

출시 정보 — 누가, 언제, 어떻게 쓸 수 있나

항목	내용
출시 시점	2026년 여름(summer 2026)
플랫폼	Android 앱 우선
지원 언어	영어(English)
지역	미국(US) 우선
구독 요건	Google AI Pro 또는 Google AI Ultra
추가 트랙	Google Workspace 비즈니스 고객 — 프리뷰

출처: Google 공식 Workspace 블로그, 9to5Google, Android Authority

발표 시점 기준으로 정리하면 이렇습니다. 같은 시리즈인 Docs Live는 처음부터 글로벌(영어)·Android·iOS로 풀린 반면, Keep talk-to-create와 Gmail Live는 미국 영어 한정으로 시작합니다. iOS 출시 일정은 따로 안내되지 않았습니다.

한국어는 언제?

가장 많이 받게 될 질문일 것입니다. 정답은 '미정'입니다. Google은 talk-to-create의 한국어 지원 시점을 공개하지 않았고, Google AI Pro·Ultra 자체는 한국에서 구독 가능하지만 음성 모드의 다국어 확장 일정은 별도 트랙입니다.

다만 참고할 만한 패턴이 있습니다. Gemini Live는 한국어를 포함한 다수 언어로 비교적 빠르게 확장됐고, NotebookLM의 음성 대화 역시 한국어가 비교적 이른 시점에 들어왔습니다. talk-to-create가 Gemini 기반이라는 점, 그리고 Google이 한국을 음성 AI 시장의 우선 확장 지역으로 꼽아 왔다는 점을 모아 보면, 베타나 단계적 확장으로 2026년 하반기 ~ 2027년 초에 한국어가 합류할 가능성이 있다는 정도가 합리적인 추정입니다. 다만 이 일정은 Google이 공식적으로 보장한 것이 아닙니다.

지금 당장 써 보고 싶다면, 미국 지역 설정 + 영어 Google AI Pro 구독 + Android 기기가 필요합니다. VPN으로 우회한 사용자가 일부 사용 후기를 올릴 것으로 보이지만, 약관상 권장되는 사용법은 아닙니다.

누가 가장 큰 영향을 받을까

talk-to-create의 잠재 사용자는 메모 앱의 'heavy user'가 아닙니다. 오히려 '메모해야 한다는 걸 알지만 늘 못 하는' 사람들입니다.

운전 중인 직장인. 회의실에서 막 빠져나온 PM. 마트 주차장에 차를 세운 워킹맘. 산책 중 아이디어가 떠오른 작가. 이들의 공통점은 손이 자유롭지 않거나, 손이 자유롭더라도 키보드 타이핑이 흐름을 끊는 상황에 자주 놓인다는 점입니다. 기존 메모 앱은 이런 상황에서 잘 작동하지 않았고, 받아쓰기는 결과물 정리 비용 때문에 외면당했습니다.

talk-to-create는 두 마찰점을 모두 줄입니다. 손을 자유롭게 하면서, 결과물 정리도 안에서 끝냅니다. 그 결과 그동안 '머릿속에서 사라졌던 아이디어와 할 일'이 노트 형태로 잡힐 확률이 올라갑니다.

조직 단위로 보면 영향이 더 큽니다. Google Workspace 비즈니스 프리뷰가 함께 풀린다는 점은 사내 회의록·미팅 후 액션 아이템 정리 자리에 talk-to-create가 들어설 수 있다는 뜻입니다. 회의 직후 5분간 한 사람이 두서없이 정리만 해 두면, Keep이 알아서 결정 사항·할 일·다음 미팅 안건으로 갈라 줄 가능성이 있습니다. 회의록 작성을 자동화하는 기존 솔루션(Otter, Fireflies)이 '회의 중 받아쓰기'에 강했다면, talk-to-create는 '회의 직후 회고'에 강합니다.

'Live' 시리즈 — 입으로 일하는 시대의 첫 챕터

talk-to-create는 단독으로 봐도 매력적이지만, Gmail Live 그리고 Docs Live와 함께 묶어 보면 Google의 Workspace 비전이 더 또렷해집니다.

세 기능을 한 작업 흐름으로 연결하면 다음과 같은 시나리오가 가능합니다.

출장 가는 차 안에서 Gmail Live에 묻는다 — "다음 주 출장지 호텔 체크인 시간이 언제였지?"
받은 답을 기억하기 위해 Keep 음성 모드를 켜고 두서없이 정리한다 — "호텔 체크인 3시, 첫 미팅 4시 30분, 저녁 자리에서 거래처 OO에게 신제품 시안 보여주기, 그리고 다녀와서 영수증 정리"
Keep이 노트를 '출장 일정' '미팅 액션 아이템' '경비 정리' 세 개로 분할
출장 후 Docs Live를 열어 음성으로 출장 보고서 초안을 받아쓰면서, Keep과 Gmail의 정보를 끌어와 한 번에 정리

이 흐름의 마디마다 키보드가 빠집니다. Google이 'Live' 시리즈를 한 키노트에 묶어 발표한 이유가 여기 있습니다. 받은편지함에 묻고(Gmail Live), 떠오르는 생각을 잡고(Keep talk-to-create), 결과물로 마무리하는(Docs Live) 한 사이클이 처음으로 음성으로 닫힙니다.

관전 포인트 — 출시 이후 무엇을 봐야 하나

발표는 끝났고, 이제 관전 포인트는 다음 세 가지입니다.

첫째, 토픽 분할의 정확도. 키노트 시연은 늘 매끄럽지만, 실제 사용자는 더 복잡한 발화를 던집니다. 이를테면 회의 안건과 그 회의에서 나온 결정 사항이 한 발화에 섞일 때, talk-to-create가 그 둘을 한 노트 안의 섹션으로 묶을지 별도 노트로 가를지가 사용성에 큰 영향을 줍니다. 분할이 과하면 노트가 파편화되고, 약하면 기존 받아쓰기와 다를 게 없어집니다. 이 균형이 첫 베타 후기에서 가장 자주 등장할 평가 지점입니다.

둘째, Workspace 비즈니스 IT 관리자의 통제권. AI 음성 기능이 사내에서 어떻게 통제될지(녹음·전사 보존 정책, 외부 데이터 노출 차단, 감사 로그)는 아직 발표되지 않았습니다. Google Workspace Admin 콘솔에 어떤 토글이 추가될지가 기업 도입의 속도를 결정합니다.

셋째, iOS와 한국어. 두 자리는 발표에서 빠졌지만, 시장 영향이 큰 자리입니다. iOS 출시가 늦어지면 'Keep 음성 = Android 전용'이라는 인식이 굳어 다른 음성 노트 앱(Voicenotes, AudioPen)의 iOS 점유율을 뒤집기 어렵게 됩니다. 한국어 출시는 국내 사용자 입장에서 talk-to-create의 운명을 가르는 자리이기도 합니다.

talk-to-create가 키노트의 화려한 자리(Gemini 3.5, Android XR 안경 등)에 가려 조용히 지나간 발표라는 점은 분명합니다. 그러나 일상 도구의 사용 패턴을 가장 직접적으로 바꿀 가능성이 있는 기능 중 하나라는 점도 분명합니다. 입력 단계의 카오스를 출력 단계의 구조로 옮기는 메모 앱은 지금까지 없었습니다. 이제 그 첫 번째가 가장 큰 메모 앱에서 시작됩니다.