AI 툴 카니 2026.05.20 AI 보조 작성·편집자 검수

카니 · AI 보조 작성, 편집자 검수

CodeMender: 구글이 I/O 2026 키노트에서 다시 꺼낸 AI 보안 패치 에이전트, 그래서 진짜 뭐가 다른가

03:46 KST에 다시 등장한 도구

한국 시간 2026년 5월 20일 새벽, Google I/O 2026 키노트 종반부에 Demis Hassabis가 다시 무대로 올라왔습니다. 자리는 안전성 트랙. 메시지는 한 줄이었습니다. "전문가들을 초대해 새 제품 CodeMender를 테스트하게 한다(inviting experts to test new product called Code Mender that automatically finds vulnerabilities and patches them)" (tech.yahoo.com 라이브 블로그).

이 발표는 한국 시간 기준 새벽 3시 46분쯤이었고, 처음 보는 이름처럼 보이지만 사실은 7개월 전부터 외부에 공개돼 있던 도구입니다. CodeMender는 2025년 10월 6일 Google DeepMind 블로그에서 처음 소개됐고, 이번 키노트는 그 도구가 마침내 사내에서 외부로 손을 뻗는 단계라는 점을 공식 선언한 자리에 가깝습니다 (deepmind.google 원문).

이 차이는 작은 차이가 아닙니다. 보안 도구는 발표만 빨라서는 의미가 없고, 사람이 실제로 patch PR을 받아들였는지가 본질입니다. CodeMender는 이미 그 단계를 통과한 뒤에야 무대 위로 올라왔습니다.

Code Mender 작동 흐름 4단계

CodeMender가 정확히 무엇을 하는가

한 문장으로 풀면, AI가 코드를 직접 읽고 취약점을 찾고 패치 PR까지 만들어 사람에게 리뷰만 시키는 도구입니다.

지금까지 시장에 나와 있던 도구들의 분담은 이랬습니다. 정적 분석 도구는 "여기 취약점 있을 가능성 높음"이라고 알람을 보냅니다. SAST 도구는 false positive를 거를 책임을 사용자에게 넘깁니다. AI 코딩 어시스턴트는 "이렇게 고쳐보세요"라고 코멘트만 답니다. 누군가 사람이 알람을 보고, 분석하고, 패치 코드를 직접 짜고, 테스트를 돌리고, PR을 올려야 합니다.

CodeMender는 그 사이 단계 전체를 자동화하는 것을 목표로 합니다. Google DeepMind의 Raluca Ada Popa, Four Flynn 두 연구원이 적은 표현 그대로 옮기면, 이 도구는 "반응적으로(reactive) 새로 발견된 취약점을 즉시 패치하고, 또한 능동적으로(proactive) 기존 코드를 다시 작성해 취약점 클래스 자체를 제거"하도록 설계됐습니다.

핵심은 두 번째입니다. 반응적 패치는 기존 도구들도 어느 정도 흉내 냅니다. 정말 차별점이 생기는 지점은, 한 번 발견한 취약점 패턴을 추상화해 동일한 버그가 다시는 들어올 수 없도록 코드 구조 자체를 다시 짜는 능력입니다. Buffer overflow가 한 곳에서 나왔다면, 그 모듈 전체의 메모리 다루는 방식을 안전한 패턴으로 일괄 교체해버리는 식입니다.

어떻게 작동하나 — Gemini Deep Think와 멀티 에이전트 검증

기술 스택은 단순하지 않습니다. Gemini Deep Think 모델을 추론 엔진으로 두고, 그 위에 보조 도구를 여러 겹 얹은 구조입니다.

DeepMind가 공개한 도구 목록을 그대로 옮기면, 정적 분석(static analysis), 동적 분석(dynamic analysis), 디퍼런셜 테스팅(differential testing), 퍼징(fuzzing), 그리고 SMT solver입니다. SMT solver까지 들어간 이유는 패치 후 코드가 원래 코드와 의미적으로 동등한지 형식 검증을 하기 위해서입니다. 단순히 "테스트가 통과하니까 괜찮다"는 수준이 아니라, "이 패치가 원래 함수가 보장하던 invariant을 깨지 않는다"를 수학적으로 보이려는 시도입니다.

이 도구들 위에 멀티 에이전트 구조가 얹힙니다. 한 에이전트는 패치를 만들고, 다른 에이전트는 그 패치를 비판합니다. DeepMind는 이를 "LLM 기반 critique 메커니즘"이라고 표현했고, 비판 에이전트가 원본 코드와 수정된 코드를 직접 비교해 새 문제가 생기지 않았는지 검증한 뒤에야 사람 리뷰어에게 PR이 올라갑니다 (The Hacker News, The Hacker News 원문).

결과적으로 사람의 일은 "패치 PR이 합당한지 최종 판단"으로 축소됩니다. 알람을 받고 코드를 짜는 단계가 빠지는 것이 가장 큰 변화입니다.

6개월간 72개 패치 — 실제 성과의 의미

DeepMind가 공개한 숫자는 두 개뿐인데, 둘 다 묵직합니다. 첫째, 도구 개발과 동시에 사내에서 6개월간 운영한 결과 72개의 보안 패치를 오픈소스에 upstream 했습니다. 둘째, 그 대상 중에는 약 450만 줄(4.5 million lines of code) 규모의 코드베이스도 포함됐습니다.

이 두 숫자는 두 가지를 동시에 말합니다.

먼저 양 자체. 72개라는 숫자만 보면 평범해 보일 수 있지만, 핵심은 "DeepMind 연구원이 사람 손으로 짠 72개"가 아니라 "AI가 만들고 사람이 검토해서 메인테이너가 받아들인 72개"라는 점입니다. 오픈소스 메인테이너는 외부에서 들어오는 패치 PR을 까다롭게 봅니다. 보안 패치는 더 까다롭습니다. 그 72개가 모두 PR로 채택됐다는 것은 코드 품질이 코드 리뷰를 통과할 수준이라는 1차 검증을 통과했다는 뜻입니다.

다음은 규모. 450만 줄짜리 코드베이스에서 동작했다는 것은 단순한 함수 단위 패치가 아니라 큰 프로젝트 전반의 컨텍스트를 읽고 패치 위치를 잡았다는 의미입니다. 이는 GitHub Copilot이 흔히 보여주는 "현재 파일 컨텍스트만 보고 제안" 수준을 한참 넘어선 작업입니다.

다만 한 가지는 분명히 짚어야 합니다. DeepMind는 이 6개월 동안 패치 한 건도 빠짐없이 사람 리뷰어가 검수한 뒤 upstream 했다고 명시했습니다. 즉 현 시점 CodeMender는 "사람을 완전히 대체하는 도구"가 아니라 "사람의 일 중 코드 작성·테스트 작성·근본 원인 분석을 대신해주고 최종 책임은 사람에게 남기는 도구"라는 위치를 분명히 하고 있습니다.

Copilot Security·Snyk과는 무엇이 다른가

한국 보안 현장에서 가장 자주 비교될 도구는 GitHub Copilot의 보안 기능(Code Scanning Autofix 계열)과 Snyk입니다. 셋의 위치는 다음 표로 정리됩니다.

Code Mender vs 기존 보안 도구 비교

항목	Snyk 같은 정적 분석	GitHub Copilot Security	CodeMender
1차 산출물	취약점 알람·리포트	인라인 코드 제안·코멘트	자동화된 패치 PR
패치 작성 책임	개발자 본인	개발자 본인이 제안 채택·수정	도구가 작성, 사람은 검수
근본 원인 분석	패턴 매칭 기반	함수·파일 수준 컨텍스트	데이터 흐름·invariant까지 형식 분석
동일 클래스 버그 일괄 차단	룰 추가로 알람만	제한적	코드 구조 자체 재작성 시도
사람 개입 시점	알람부터 끝까지	제안 채택 단계	최종 PR 리뷰

핵심을 한 줄로 압축하면 이렇습니다. Snyk가 "알람기"이고, Copilot Security가 "제안기"라면, CodeMender는 "패치 PR 제출기"입니다. 사람이 일을 시작하는 지점이 점점 뒤로 밀리는 흐름입니다.

물론 표 비교만으로 판단을 끝내면 안 됩니다. CodeMender는 아직 외부 일반 개발자가 자유롭게 쓸 수 없는 도구이고, Snyk·Copilot Security는 이미 한국 기업이 결재 가능한 제품입니다. 단기적으로는 비교 대상이 아니라 "패치 자동화의 미래 표준이 어디로 가고 있는지를 보여주는 신호"로 읽는 편이 더 정확합니다.

"전문가 초대" — 외부 테스트 신청은 어떻게 하나

이번 I/O 2026 발표에서 가장 헷갈리는 지점이 여기입니다. 결론부터 말하면, 지금 시점 누구나 신청할 수 있는 공개 베타 페이지는 없습니다.

DeepMind 공식 블로그는 외부 확장 방식을 이렇게 적었습니다. "중요한 오픈소스 프로젝트의 관심 있는 메인테이너들에게 점진적으로 CodeMender가 생성한 패치를 보내고, 그 피드백을 받아 도구를 다듬어 나갈 계획(slowly reach out to interested maintainers of critical open-source projects with CodeMender-generated patches, and solicit their feedback)"이라고. I/O 2026에서 발표된 "전문가 초대" 단계는 이 흐름이 더 넓어졌다는 신호로 읽는 것이 맞습니다. 즉 신청 양식이 열린 것이 아니라, DeepMind가 직접 컨택할 풀이 더 커진 것입니다.

따라서 한국에서 직접 신청해 들어갈 수 있는 가장 현실적인 경로는 세 가지입니다.

첫째, 오픈소스 메인테이너로서 노출되는 길입니다. 본인이 관리하는 프로젝트가 보안적으로 임팩트가 큰 코드베이스라면, DeepMind security 팀에 이메일로 컨택 의사를 직접 보낼 수 있습니다. 공식 컨택 채널은 DeepMind security 페이지(blog.google/technology/safety-security)에서 안내되는 흐름을 따르면 됩니다 (Google 안전성 블로그).

둘째, Google AI Vulnerability Reward Program 참여입니다. Google은 AI 관련 취약점 보고에 430,000달러 이상을 이미 지급한 상태이고, 이 프로그램 참여자는 CodeMender 외부 확장 단계의 1차 후보군으로 자연스럽게 노출됩니다.

셋째, 인내. 가장 현실적인 답은 이쪽입니다. DeepMind는 발표문 마지막에 "CodeMender를 모든 소프트웨어 개발자가 쓸 수 있는 도구로 풀겠다"고 적었습니다. 시점은 못 박지 않았습니다. 한국 기업이 자유롭게 도입 가능한 시점은 다음 1년 안에 공개 확장이 더 진행될 때 다시 보는 것이 맞습니다.

한국 컨텍스트 — CISO·SI·보안 스타트업이 지금 점검해야 할 것

CodeMender 자체는 아직 도입 의사결정 단계가 아닙니다. 하지만 이 발표는 한국 보안 의사결정자에게 세 가지 즉시 점검 포인트를 던집니다.

첫 번째 점검은 라이선스와 리전입니다. CodeMender가 일반 공개로 풀릴 때 거의 확실히 Google Cloud 또는 Gemini 엔터프라이즈 라이선스 체계 안에 들어옵니다. 한국 금융권·공공처럼 데이터 리전과 망분리가 엄격한 영역은 "코드를 외부 클라우드 LLM에 보낸다"는 사실 자체가 결재 차단 사유가 될 수 있습니다. 지금부터 컴플라이언스 부서와 사전 협의를 시작해야 도입 시점에 결정 속도가 납니다.

두 번째 점검은 사내 코드 자산 분류입니다. 오픈소스 라이브러리에 적용 가능한 도구와, 사내 비공개 코드에 적용 가능한 도구는 보통 다른 트랙으로 풀립니다. CodeMender도 같은 길을 갈 가능성이 높습니다. 사내 코드 중 "외부 LLM에 노출 가능한 코드", "절대 외부에 나가면 안 되는 코드"의 경계가 미리 그려져 있어야 도구 선택 단계에서 흔들리지 않습니다.

세 번째 점검은 인하우스 코드 리뷰 워크플로우입니다. CodeMender가 일반화되는 미래는 "AI가 PR을 올리고 사람이 검수만 한다"는 워크플로우가 표준이 되는 미래입니다. 지금 한국 기업의 코드 리뷰 SLA, PR 리뷰어 풀, 보안 리뷰 책임자 구조가 이 흐름에 맞게 설계돼 있는지 점검할 시점입니다. AI가 만든 패치를 1주일 동안 큐에 방치하는 팀과, 24시간 안에 검수해 머지하는 팀의 격차는 도구 도입 이전에 이미 벌어집니다.

보안 스타트업 입장에서는 또 다른 관전 포인트가 있습니다. CodeMender는 "AI 보안 도구 = 알람 + 제안" 시장의 위쪽 천장을 위로 한 칸 더 끌어올렸습니다. 단순히 알람을 제공하는 SaaS는 향후 2~3년 안에 차별화가 좁아집니다. 한국 보안 스타트업이 살아남는 길은 (1) CodeMender가 닿지 않는 한국 특화 컴플라이언스·도메인 영역, (2) 패치 PR 이후 단계인 리뷰·머지·롤백 자동화, (3) 사내 비공개 코드 환경에서만 도는 온프레미스 시큐어 코딩 에이전트 셋 중 하나입니다.

액션 포인트

보안 책임자·CISO: Gemini 엔터프라이즈 라이선스 도입 시 컴플라이언스 사전 검토를 다음 분기 안에 시작. CodeMender 외부 확장 일정에 맞춰 결재 라인 미리 정리.
인하우스 개발자·SI 보안 담당: 사내 PR 리뷰 SLA 점검. AI가 만든 보안 패치를 빠르게 받아들일 수 있는 워크플로우인지 확인.
보안 스타트업: 알람·제안 단계 차별화는 좁아진다. 한국 컴플라이언스, 머지·롤백 자동화, 온프레미스 시큐어 코딩 중 한 길을 골라 포지셔닝 재정의.
오픈소스 메인테이너: DeepMind security 채널을 통해 CodeMender 패치 수신 의사 표명 가능. 본인 프로젝트가 보안 임팩트가 크다면 가장 빠른 진입 경로.

다음 점검 시점은 두 군데입니다. 첫째, DeepMind가 이번 분기 안에 추가 외부 확장 발표(2026 Q3 보안 컨퍼런스 라인업이 가장 유력)를 낼지. 둘째, Google이 Gemini Code Assist 같은 일반 개발자용 도구에 CodeMender 기능 일부를 흡수해 출시할지. 둘 다 한국 도입 결정 속도를 바꿀 신호입니다.

CodeMender는 신규 발표는 아니었지만, "사내 도구 단계를 끝낸 보안 AI가 외부로 풀려나가는 흐름의 첫 공식 신호"라는 점에서 이번 키노트에서 가장 묵직한 발표 중 하나였습니다. AI 보안 시장의 자동화 천장이 한 칸 올라간 날로 기록될 가능성이 큽니다.

출처 및 참고 자료

AI 보안 CISO CodeMender Copilot Security Gemini Deep Think Google DeepMind Google IO 2026 Snyk 시큐어 코딩 취약점 패치