AI 툴 2026.05.20

Antigravity 2.0 v2.0 deep-dive: 데스크탑·CLI·SDK 삼위일체와 병렬 서브에이전트가 코딩 워크플로우를 다시 짠 방식

Antigravity 2.0 v2.0 deep-dive: 데스크탑·CLI·SDK 삼위일체와 병렬 서브에이전트가 코딩 워크플로우를 다시 짠 방식

핵심 요약

Antigravity 2.0 4-tier 플랫폼: Desktop, CLI, SDK, Managed Agents API

Google I/O 2026 Day 1 키노트(2026년 5월 19일)에서 Antigravity가 v2.0으로 다시 풀렸다. 같은 이름의 1.x가 작년에 풀린 "VS Code 포크 기반 agent-first IDE"였다면, 이번 v2.0은 단순 업그레이드가 아니다. IDE 본체를 떼어내 독립 데스크탑 앱으로 만들고, Go로 새로 쓴 CLI와 프로그래매틱 SDK, 그리고 Gemini API 안에 박아 넣은 Managed Agents API까지 한꺼번에 풀렸다. 같은 agent harness를 네 개의 표면이 공유한다는 것이 발표 묶음의 본질이다.

출처:
Google Developers Blog의 I/O 2026 하이라이트
TechCrunch의 Antigravity 2.0 보도
Google Cloud Blog의 I/O '26 개발자용 정리

발표 자료에서 구글이 직접 꺼낸 표현은 두 줄로 압축된다. 하나는 에이전트 상호작용을 위한 허브 정의이고, 다른 하나는 dynamic subagents와 scheduled tasks를 묶어 "persistent automation pipeline"으로 부른 부분이다.

"central home for agent interaction, allowing you to orchestrate multiple agents to execute tasks in parallel."

번역: "에이전트 상호작용의 중앙 허브로서, 여러 에이전트를 오케스트레이션해 작업을 병렬로 실행할 수 있게 합니다."

한 줄로 옮기면 이렇다. 에이전트 한 개가 한 번 답하는 도구에서, N개의 에이전트가 24시간 도는 자동화 라인으로 카테고리가 바뀌었다.

이 글은 v1과 v2의 차이가 왜 구조적 격상인지, 병렬 서브에이전트가 화면에서 정확히 어떻게 도는지, Cursor와 Windsurf 2.0이 같은 시기 내놓은 답안과 무엇이 갈리는지, 그리고 v1 사용자가 지금 무엇을 챙겨야 하는지를 deep-dive로 다룬다.

v1에서 v2로, 본질적으로 무엇이 바뀌었나

작년에 풀린 Antigravity 1.x는 VS Code 포크에 Gemini 코딩 에이전트를 박은 IDE였다. UI 구조는 Cursor와 비슷했다. 좌측 파일 트리, 우측 사이드바 챗, 인라인 편집 패널. 다른 모델 사이드바와 다른 점은 "에이전트가 멀티파일을 자율 수정한다"는 정도였다. 시장 분류로 묶으면 "AI 네이티브 에디터" 진영이었다.

v2.0이 바꾼 건 단일 IDE라는 카테고리 자체다. 9to5Google이 그대로 옮긴 구글의 메시지가 깔끔하다.

"Rather than performing one task at a time, you can set agents to work on several problems in parallel, multiplying your development velocity."

번역: "한 번에 하나의 작업을 처리하는 대신, 여러 에이전트가 여러 문제를 병렬로 작업하도록 설정해 개발 속도를 배가할 수 있습니다."

출처:
9to5Google의 agentic developer suite 정리

한 번에 한 작업을 처리하던 도구가, 여러 작업을 동시에 처리하는 오케스트레이션 허브로 재정의됐다.

구조적으로 보면 v2는 네 개의 표면을 같은 backend 위에 얹은 형태다.

  1. Antigravity 데스크탑 앱: 에이전트 오케스트레이션 허브. 익숙한 Editor 뷰는 그대로 두고, 그 위에 Manager 뷰(Mission Control)를 새로 얹었다.
  2. Antigravity CLI: Go로 다시 짠 터미널 인터페이스. 데스크탑 앱과 같은 harness를 공유한다. 인증, 컨텍스트, 스킬, 설정이 한 곳에서 동기화된다.
  3. Antigravity SDK: agent harness에 프로그래매틱으로 접근하는 길. 자체 인프라 위에 Antigravity 스타일 에이전트를 박을 수 있다.
  4. Gemini API의 Managed Agents: 단일 API 호출로 격리 Linux 환경이 뜨는 매니지드 실행 환경. 자체 백엔드 운영을 원하지 않는 팀을 위한 선택지.

Google Cloud Blog는 이걸 네 단계의 사다리(Agent Development Ladder)로 정리했다. Rung 1: Agent Studio, Rung 2: Managed Agents API, Rung 3: Antigravity, Rung 4: ADK 2.0. 네 단계 전부가 A2A 프로토콜 위에 올라가서, 어떤 단계에서 만든 에이전트든 다른 단계의 서브에이전트로 호출된다. 같은 backend, 같은 프로토콜이라는 점이 v2를 단순 업그레이드가 아니라 플랫폼 격상이라고 부르는 이유다.

Agent Manager, 병렬 서브에이전트가 실제로 도는 화면

Mission Control에서 5개 에이전트 병렬 디스패치와 dynamic/browser subagent 트리

v2의 정체성을 한 화면으로 보여주는 곳이 Agent Manager 뷰다. Google Codelabs는 이걸 "mission control dashboard"라고 부르고, 핵심 기능을 한 줄로 요약했다.

"spawn, monitor, and interact with multiple agents operating asynchronously across different workspaces or tasks."

번역: "서로 다른 워크스페이스 또는 작업에서 비동기로 동작하는 여러 에이전트를 띄우고, 모니터링하고, 상호작용합니다."

출처:
Getting Started with Google Antigravity 공식 Codelab

작동 방식은 이렇다.

  • 개발자가 Manager 뷰에서 다섯 개의 다른 버그/태스크를 다섯 개의 에이전트 카드로 동시에 디스패치한다. 각 카드는 독립된 작업 디렉토리, 자기만의 컨텍스트, 별개의 모델 선택(Gemini 3.5 Flash 기본, Claude Sonnet 4.6, GPT-OSS-120B 등 드롭다운에서 교체)을 가진다.
  • 에이전트는 두 가지 모드 중 하나로 돈다. Fast는 단순한 작업, Planning은 사람이 한 번 검토를 끼우는 복잡한 작업용이다.
  • 각 에이전트는 작업 도중 자기 일이 너무 크다고 판단하면 자리에서 dynamic subagent를 spawn한다. 사람이 "subagent를 띄워라"고 시키지 않는다. 메인 에이전트가 임무를 쪼개고, 보조 에이전트는 별도 컨텍스트로 들어간다.
  • 브라우저가 필요한 작업이 들어오면 별도의 Browser Subagent가 호출된다. 이 친구는 페이지 상호작용에 최적화된 모델 위에서 돌고, 클릭, 스크롤, 타이핑, 로그 읽기를 한다. 화면을 DOM, 스크린샷, 마크다운 파싱으로 잡고, 세션 전체를 비디오 아티팩트로 녹화한다.

여기서 Cursor와 Windsurf와 가장 두드러지게 갈리는 지점이 컨텍스트 격리다. Manager 뷰의 에이전트들은 서로 다른 디렉토리를 보고, 서로의 컨텍스트를 침범하지 않는다. 한 에이전트가 리팩터링을 돌리는 동안 다른 에이전트가 같은 파일을 건드릴 위험을 IDE 차원에서 줄여놓은 셈이다. 챗봇 UI 시절의 "사용자가 답을 기다리는 동안 다른 일을 못 함"이라는 직렬 모델을 정면으로 깨는 설계다.

Artifacts, 결과 검증을 IDE 차원에서 묶어준다

병렬 실행만 풀어주면 개발자는 결과 검증에 익사한다. 다섯 에이전트가 다섯 PR을 던지면 사람이 다섯 번 코드를 읽어야 한다는 뜻이고, 그러면 병렬화 자체가 환상이 된다. v2가 들고 온 답이 Artifacts 시스템이다.

공식 Codelab은 Artifacts를 "Trust Gap"을 메우는 장치로 표현한다. 에이전트가 "고쳤다"고 하면 예전에는 사람이 코드를 일일이 읽어야 했지만, v2에서는 에이전트가 그 주장을 증명할 산출물을 같이 낸다. 종류는 다섯 가지로 정리된다.

  • Task Lists: 코드 생성 전에 만드는 구조화 계획. 사람이 단계별로 승인 가능.
  • Implementation Plans: 기술 아키텍처 변경 개요.
  • Code Diffs: 줄 단위 코멘트가 붙는 리뷰 가능한 변경.
  • Walkthroughs: 구현 후 요약과 스크린샷·영상.
  • Browser Recordings: E2E 동작 검증을 위한 세션 녹화.

코드 변경만 보여주는 도구와의 차이가 여기서 벌어진다. Cursor와 Claude Code도 화면 녹화나 스크린샷을 산출할 수 있지만, IDE 차원에서 검증 산출물의 종류와 흐름을 표준화해놓진 않았다. v2는 모든 에이전트가 같은 다섯 종 아티팩트를 만들도록 강제한다. Manager 뷰에 떠 있는 다섯 카드를 사람이 빠르게 훑을 수 있는 이유다.

Scheduled Tasks, IDE가 꺼져도 도는 자동화 루틴

v2 발표에서 가장 카테고리 자체가 바뀌었다고 볼 수 있는 부분이 scheduled tasks다. Google Developers Blog는 이걸 dynamic subagents와 묶어 "scheduled tasks for background automation"이라 부르고, MarkTechPost는 한 줄로 정리한다.

"define tasks that invoke agents automatically in the background, converting the agent from a single-turn tool into something closer to a persistent automation pipeline."

번역: "백그라운드에서 에이전트를 자동으로 호출하는 작업을 정의해, 에이전트를 단일 턴 도구에서 영구적인 자동화 파이프라인에 가까운 형태로 전환합니다."

출처:
MarkTechPost의 Antigravity 2.0 표준 정리

쓰임새 예시는 이런 식이다.

  • 매일 새벽 3시에 의존성 업데이트 PR을 자동 생성하라.
  • main 브랜치에 새 커밋이 들어올 때마다 E2E 회귀 테스트를 돌리고, 깨지면 이슈로 만든다.
  • 매주 월요일 아침에 지난 한 주 로그를 요약해 노션 페이지에 붙여라.

핵심은 이 잡들이 사용자가 IDE를 닫아놓아도 도는 백그라운드 잡이라는 점이다. 결과는 다음 출근 때 Manager 뷰에 누적된다. 한 명의 개발자가 "낮에 본인이 쓸 에이전트"와 "밤에 도는 자동화 라인"을 같은 도구로 관리한다. 이게 v2가 약속한 "에이전트와 영구적 자동화 파이프라인"의 실체다.

Cursor에는 정확히 같은 자리에 들어맞는 기능이 없다. Windsurf 2.0은 Devin 클라우드 에이전트를 임베드해 원격 VM에 위임하는 식으로 비슷한 그림을 만들지만, 트리거가 사용자 클릭 기반이다. 시간 또는 이벤트 기반 cron-like 자동화로 묶은 곳은 현재 Antigravity 2.0이 유일하다.

출처:
Codecademy의 Agentic IDE 비교 분석

SDK와 Managed Agents, Cursor 폐쇄형과 결정적으로 갈리는 지점

여기서 v2를 단순 도구가 아닌 플랫폼이라고 부를 수 있는 결정타가 나온다. Antigravity SDK와 Managed Agents API다.

SDK는 데스크탑 앱과 CLI가 쓰는 agent harness에 프로그래매틱으로 붙는다. SiliconANGLE은 SDK 의도를 이렇게 정리했다.

"define custom agent behaviors and host them on third-party infrastructure."

번역: "맞춤 에이전트 동작을 정의해 서드파티 인프라 위에서 호스팅합니다."

출처:
SiliconANGLE의 expanded Antigravity 플랫폼 보도

즉 자체 인프라 위에 Antigravity 스타일 에이전트를 박고, 자기 제품 안에 그 에이전트를 임베드할 수 있다.

Managed Agents API는 "자체 인프라 운영조차 하기 싫다"는 팀을 위한 길이다. Google Cloud Blog는 핵심을 한 줄로 옮긴다.

"spins up a full isolated Linux environment with a single API call, with persistent state across multi-turn sessions."

번역: "단일 API 호출로 완전히 격리된 Linux 환경을 띄우고, 멀티턴 세션 전체에 걸쳐 상태를 유지합니다."

출처:
Google Cloud Blog의 I/O '26 개발자용 정리

단일 API 호출 한 번이면 격리 Linux 환경이 뜨고, 그 안에서 에이전트가 외부 도구를 호출하고, 코드를 실행하고, 멀티턴 세션 상태를 유지한다. 사용자 데이터는 Google Cloud의 데이터 프라이버시·리전 엔드포인트 정책 안에 머문다.

이 두 가지가 Cursor와 갈리는 지점을 정확히 만든다. Cursor는 자기 에디터 안에서만 에이전트가 돈다. 폐쇄형 제품이다. Antigravity는 같은 agent harness가 데스크탑, 터미널, 자체 인프라, 매니지드 클라우드 네 곳에서 동시에 돈다. 어떤 한국 팀이 자사 SaaS 안에 "Antigravity 스타일 에이전트"를 임베드하고 싶다면 v2에선 가능하지만, Cursor에선 가능하지 않다.

Windsurf 2.0은 Devin과의 통합으로 SDK 비슷한 길을 열어놓긴 했지만, "Windsurf의 에이전트를 다른 제품 안에 임베드"하는 시나리오는 사실상 닫혀 있다. 플랫폼 개방도라는 축에서 보면 v2의 자리가 가장 외곽이다.

Antigravity 2.0 vs Cursor vs Windsurf, 3사 비교표

Antigravity 2.0 vs Cursor vs Windsurf 2.0 비교표 (2026-05-20 KST 기준)

세 도구의 정체성, 가격, 역량을 한 번에 보고 싶다면 아래 표가 빠르다. 2026년 5월 19일 기준 공식 자료를 바탕으로 정리했다.

항목 Antigravity 2.0 Cursor Windsurf 2.0
카테고리 데스크탑 + CLI + SDK + Managed Agents 4-tier AI 네이티브 에디터 Devin 임베드 에디터
베이스 독립 데스크탑 + Go CLI VS Code 포크 VS Code 포크
기본 모델 Gemini 3.5 Flash Claude/GPT/Gemini 멀티 Claude/GPT/Gemini 멀티
병렬 에이전트 Manager 뷰에서 N개 동시 디스패치 사이드바, 제한적 Devin 위임 한 번에 한 작업
Dynamic subagents 메인 에이전트가 자동 spawn 사용자가 직접 spawn 없음
Browser subagent 전용 모델 + Chrome 확장 + 영상 녹화 별도 도구/MCP 필요 별도 도구 필요
Scheduled tasks (백그라운드) 내장 cron-like 자동화 없음 없음
검증 산출물(Artifacts) Task list, Plan, Diff, Walkthrough, Browser recording 표준화 비표준, 채팅 출력 위주 비표준
동봉 CLI Antigravity CLI(Go), 같은 harness 없음 없음
SDK 개방도 프로그래매틱 SDK + Managed Agents API 폐쇄형 제한적(Devin 경유)
Google Cloud sandbox 통합 Managed Agents API 내장 없음 없음
가격(2026-05 기준) Free 한도 + Google AI Pro $20/월 + Ultra $100/월(5x) + Ultra $200/월(20x) Pro $20/월, Pro+ $60/월, Ultra $200/월, Teams $40/user Free $0/월, Pro $20/월, Max $200/월, Teams $40/user/월

출처:
antigravity.google
Google Developers Blog
Cursor 공식 pricing
Windsurf 공식 pricing

가격대만 보면 Antigravity Pro $20과 Cursor Pro $20이 같은 자리다. 차이는 Pro 위로 올라간 라인업의 의미다. Cursor의 $200 Ultra는 동일 도구 안의 더 큰 사용량이지만, Antigravity의 $200 Ultra는 같은 가격에 데스크탑 앱뿐 아니라 SDK, Managed Agents, Google Cloud sandbox까지 같이 묶는다. "비슷한 가격에 더 많은 표면"이라는 패키징이다.

v1에서 v2로 마이그레이션, 한국 개발자가 지금 챙겨야 할 것

이미 Antigravity 1.x를 쓰던 사용자라면 v2로 이사는 본질적으로 자연스럽다. 같은 Gemini 계정으로 로그인하면 데스크탑 앱이 그대로 v2 UI로 뜨고, 기존 Editor 뷰는 살아 있다. 다만 v2에서 새로 의미가 생기는 자리가 있다.

  1. Manager 뷰에 익숙해지기. Cmd+Shift+M으로 전환되는 새로운 화면 모드다. 처음에는 익숙한 Editor 뷰만 쓰지만, 손에 익으면 사이드 프로젝트 두 개를 동시에 굴리는 게 자연스러워진다.

  2. Skills 디렉토리 점검. 전역 스킬은 ~/.gemini/antigravity/skills/, 워크스페이스 스킬은 .agents/skills/다. 1.x의 스킬 폴더 위치와 다르므로 한 번 이동이 필요하다. SKILL.md 메타데이터, scripts, references, assets 구조도 같이 정리한다.

  3. Policies 재설정. 터미널 실행은 Request Review / Always Proceed / Sandbox enabled 중에서, 아티팩트 리뷰는 Always Proceed / Agent Decides / Asks for Review 중에서, JavaScript 실행은 Always Proceed / Request Review / Disabled 중에서 고른다. 멀티 에이전트가 동시에 도는 환경이라 1.x보다 권한 정책을 엄격히 잡는 게 좋다.

  4. CLI 동기화. antigravity 명령어를 설치해 같은 계정으로 로그인한다. 데스크탑에서 만든 Skills, Rules, Workflows가 그대로 CLI에서 호출된다. Gemini CLI를 쓰고 있었다면 2026년 6월 18일자로 무료/유료 개인 사용자 서비스가 종료되므로, 한 달 안에 옮겨야 한다.

    공식 가이드:
    Transitioning Gemini CLI to Antigravity CLI

  5. Scheduled task 한두 개 등록. "매일 새벽 의존성 업데이트 PR 만들어라" 같은 작은 잡 하나만 걸어둬도 v2가 약속한 자동화 라인이 무엇을 뜻하는지 손에 잡힌다.

SDK와 Managed Agents API는 자체 제품 안에 에이전트를 박을 계획이 있는 팀에서 우선 검토하면 된다. AI Studio의 "Export to Antigravity" 원클릭은 프로토타입을 본격 개발로 끌고 올 때의 표준 길목이 되도록 설계됐다.

관전 포인트, 무엇이 진짜 바뀌고 있나

발표를 그냥 "구글이 Cursor 잡으려고 IDE 업그레이드한 것"으로 읽으면 의미를 놓친다. v2의 묶음 자체에서 세 가지 신호가 보인다.

첫째, "에이전트가 단일 도구"라는 시대 정의가 깨졌다. v2는 같은 agent harness를 데스크탑, 터미널, SDK, 매니지드 API 네 군데에 동시에 뿌렸다. 사용자 한 명이 GUI에서, 자동화 스크립트에서, 자기 제품 안 임베드 형태로 같은 에이전트를 호출한다. 도구 카테고리 단위가 아니라 "harness가 어디 깔리느냐"가 새로운 기준이 된다.

둘째, Cursor와 Windsurf가 따라잡아야 할 라인이 분명해졌다. 병렬 디스패치 UI, dynamic subagents, scheduled tasks, 표준 Artifacts 네 가지는 IDE 한 점만 잡고 있어선 흉내 내기 어렵다. 같은 사용자 한 명에게 "낮에 쓰는 에디터"와 "밤에 도는 자동화 라인"을 같은 backend로 묶어주는 회사가 누가 될 것인지가 다음 6개월의 관전 포인트다.

셋째, Gemini 3.5 Flash와 Antigravity가 같은 키노트에서 같이 풀렸다는 사실은 가볍게 넘길 부분이 아니다. 멀티 에이전트는 어차피 같은 시간에 N개의 추론이 동시에 도는 워크로드다. 모델이 느리거나 비싸면 병렬화 자체가 환상이 된다. 구글이 frontier 수준 성능을 Flash 라인에 박았다는 건, Manager 뷰에 다섯 카드를 띄워도 비용이 폭주하지 않게 만들겠다는 의지의 표현이다. Varun Mohan이 무대에서 못박은 한 줄은 다음과 같다.

"outperforms Gemini 3.1 Pro across almost all benchmarks while running four times faster."

번역: "거의 모든 벤치마크에서 Gemini 3.1 Pro를 능가하면서 4배 더 빠르게 동작합니다."

출처:
Google Developers Blog의 I/O 2026 하이라이트

v2는 Cursor와 Windsurf가 같은 시기 내놓은 답안과 카테고리가 다르다. 같은 IDE의 자리에서 더 똑똑한 챗봇을 만든 것이 아니라, IDE를 넘어선 "에이전트 오케스트레이션 플랫폼"의 자리로 옮긴 것이다. 이 자리가 비어 있다면 한동안 구글이 단독 주자다.

참고 출처

공유

Threads X