AI 이슈 카니 2026.06.03 AI 보조 작성·편집자 검수

카니 · AI 보조 작성, 편집자 검수

Claude Mythos 1만 건 쇼크: AI가 찾은 취약점보다 무서운 건 패치 병목이다

핵심 요약

AI가 보안 취약점 1만 개를 찾아내면, 진짜 문제는 발견이 아니라 처리량입니다.

Anthropic은 2026년 6월 2일 Project Glasswing을 15개국 이상, 약 150개 추가 조직으로 확대한다고 발표했습니다. Project Glasswing은 아직 일반 공개되지 않은 Claude Mythos Preview를 엄선된 보안팀과 주요 인프라 운영 조직에 제공해, 중요 소프트웨어의 취약점을 먼저 찾고 고치는 프로그램입니다.

숫자만 보면 “AI 보안 모델이 더 강해졌다”는 뉴스처럼 보입니다. 하지만 공식 발표가 더 강조한 문장은 따로 있습니다. 취약점 발견 속도가 빨라지면서 병목이 검증, 공개, 패치, 배포로 옮겨갔다는 점입니다. 보안팀 입장에서는 “AI가 얼마나 잘 찾는가”보다 “AI가 찾은 것을 우리 조직이 며칠 안에 믿고 고칠 수 있는가”가 더 중요한 질문이 됐습니다.

Anthropic의 2026년 6월 2일 Project Glasswing 확대 공식 이미지

이미지 출처: Anthropic News, “Expanding Project Glasswing”, 2026년 6월 2일.

무슨 일이 있었나

Project Glasswing은 2026년 4월 7일 공개됐습니다. 초기 파트너에는 AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks 등이 포함됐고, Anthropic은 Claude Mythos Preview를 “코딩과 에이전트 작업에서 가장 강력한 모델”로 설명했습니다.

이번 6월 2일 업데이트는 접근 범위가 커졌다는 점이 핵심입니다. Anthropic은 기존 약 50개 파트너 이후, 보안 요구사항을 충족하는 약 150개 조직에 추가 접근권을 주겠다고 밝혔습니다. 새 그룹은 15개국 이상에 기반을 두고, 전력, 수도, 의료, 통신, 하드웨어처럼 초기 그룹에서 상대적으로 덜 대표됐던 핵심 인프라 영역을 포함합니다.

공식 발표에서 눈에 띄는 표현은 “대부분의 파트너는 대규모 공격이 1억 명 이상에게 영향을 줄 수 있다”는 추정입니다. 이 말은 Mythos가 일반 개발자용 코딩 모델로 풀리는 단계가 아니라, 사회 기반 소프트웨어를 운영하는 조직에 제한적으로 배포되는 이유를 설명합니다.

동시에 Anthropic은 Mythos급 모델이 6~12개월 안에 여러 AI 회사에서 나올 수 있다고 봤습니다. 이 전망이 맞다면 Project Glasswing은 단순한 파트너십이 아니라 “공격자도 곧 비슷한 능력을 갖게 될 때, 방어자는 어떤 운영 규칙을 가져야 하는가”를 미리 실험하는 장치입니다.

사람들이 실제로 겪는 문제

보안 현장의 문제는 취약점이 부족한 게 아닙니다. 이미 많은 팀은 SAST, DAST, 퍼징, 버그바운티, 클라우드 설정 점검, 의존성 스캔에서 쏟아지는 알림을 다 처리하지 못합니다. 여기에 Mythos급 모델이 붙으면 리포트 수는 더 늘어납니다.

Anthropic의 초기 업데이트는 이 병목을 숫자로 보여줍니다. 약 50개 초기 파트너가 Claude Mythos Preview로 1만 건 이상의 고위험 또는 치명 등급 취약점을 찾았고, Anthropic 자체 오픈소스 스캔에서는 1,000개 이상 프로젝트에서 23,019건의 전체 후보와 6,202건의 고위험 또는 치명 후보가 나왔습니다. 그중 1,752건을 보안 회사와 내부 팀이 평가했고, 90.6%가 true positive, 62.4%가 실제 고위험 또는 치명 등급으로 확인됐습니다.

문제는 그 다음입니다. Anthropic은 고위험 또는 치명 취약점 530건을 메인테이너에게 보고했고, 그중 75건이 패치됐으며 65건에 공개 advisory가 붙었다고 밝혔습니다. 또 Mythos가 찾은 고위험 또는 치명 버그 하나를 패치하는 데 평균 2주가 걸린다고 설명했습니다.

이 숫자는 Mythos가 부족하다는 뜻이 아닙니다. 반대로 너무 많이 찾아내기 시작했다는 뜻입니다. 찾는 속도는 AI가 끌어올렸지만, 재현, 심각도 재평가, 영향 범위 확인, maintainer 소통, 패치 설계, 릴리스, 고객 업데이트는 여전히 사람과 조직의 속도를 탑니다.

이 흐름은 앞서 정리한 Microsoft의 Agent Control Specification과 ASSERT 분석과도 맞물립니다. 고급 사이버 능력을 가진 모델은 단순히 “답을 잘 내는가”보다, 기업 내부에서 어떤 하네스와 승인 루프 안에서 실행되는지가 실제 리스크를 가릅니다.

왜 중요한가

첫째, 보안의 기준점이 “탐지율”에서 “패치 처리량”으로 이동합니다.

전통적인 보안 도구 경쟁은 얼마나 빨리 많이 찾는가에 집중했습니다. 하지만 AI 모델이 취약점 후보를 대량으로 만들 수 있다면, 탐지율만 높이는 도구는 오히려 업무 부하를 키울 수 있습니다. 앞으로 좋은 AI 보안 시스템은 리포트를 만드는 데서 끝나지 않고, 재현 로그, 최소 PoC, 영향 범위, 패치 후보, 회귀 테스트, 배포 우선순위까지 함께 내야 합니다.

둘째, 오픈소스 메인테이너에게 부담이 집중될 수 있습니다.

Anthropic은 일부 메인테이너가 “공개 속도를 늦춰 달라”고 요청했다고 밝혔습니다. 이유는 단순합니다. 오픈소스 핵심 패키지는 전 세계가 의존하지만, 메인테이너 수는 적고 보안 대응은 대개 자원봉사에 가깝습니다. AI가 좋은 의도로 취약점을 많이 보내도, 리포트 품질과 검증 자료가 낮으면 메인테이너의 큐만 막힙니다.

셋째, 공격자와 방어자의 시간표가 함께 빨라집니다.

Mythos Preview는 공식적으로 제한된 방어 프로그램 안에서 쓰이고 있습니다. 그러나 Anthropic은 Mythos급 모델이 다른 회사에서도 곧 나올 수 있다고 경고합니다. 공격자가 비슷한 능력을 쓰기 시작하면, 공개된 취약점의 exploit window는 더 짧아질 수 있습니다. “언젠가 패치하면 된다”가 아니라 “발견, 공개, 악용 가능성, 패치 배포가 같은 주 안에 움직일 수 있다”는 가정으로 바뀝니다.

넷째, 기업 보안팀의 구매 기준이 바뀝니다.

기업이 AI 보안 도구를 볼 때 “취약점 몇 개를 찾았나”만 묻는 것은 부족합니다. 더 중요한 질문은 다음입니다. 이 도구는 false positive를 어떻게 줄이는가. 패치 PR을 만들 수 있는가. 우리 CI와 릴리스 절차에 붙을 수 있는가. 고위험 리포트가 들어왔을 때 누가 승인하고, 누가 고객 공지를 내고, 누가 롤백을 결정하는가.

이 지점은 Google DeepMind의 CodeMender 분석과도 연결됩니다. CodeMender가 보여준 방향은 “알림”이 아니라 “패치 PR 제출”이었습니다. Mythos 확장은 같은 시장을 더 넓은 질문으로 밀어붙입니다. AI가 발견을 맡으면, 사람은 패치 공장과 검증 루프를 어떻게 다시 설계해야 하는가.

어떻게 써야 하나

Project Glasswing은 누구나 신청해 쓰는 일반 제품이 아닙니다. Anthropic은 각 조직이 보안 요구사항을 충족해야 접근할 수 있다고 밝혔고, Mythos Preview 자체도 일반 공개 모델이 아닙니다. 다만 이번 발표에서 기업이 바로 가져갈 운영 기준은 분명합니다.

단계	해야 할 일	피해야 할 실수
접수	AI 리포트를 일반 버그와 분리해 별도 큐로 받는다	AI 리포트를 그대로 Jira에 쏟아 넣는다
검증	재현 스크립트, 로그, 영향 버전, 공격 전제 조건을 요구한다	“모델이 critical이라 했으니 critical”로 처리한다
우선순위	CVSS, EPSS, CISA KEV, 인터넷 노출 여부, 고객 영향도를 함께 본다	CVSS 점수 하나만으로 패치 순서를 정한다
패치	테스트, 코드 오너 리뷰, 롤백 계획을 PR 템플릿에 넣는다	AI가 만든 패치를 리뷰 없이 머지한다
공개	coordinated disclosure 일정과 고객 업데이트 문구를 미리 둔다	메인테이너나 고객에게 검증 안 된 리포트를 보낸다
배포	패치 적용률과 남은 취약 버전을 추적한다	패치 릴리스만 하고 실제 배포율은 보지 않는다

실무 체크리스트로 줄이면 이렇습니다.

AI가 찾은 취약점은 “후보”로 받는다. 확정 판정은 재현과 영향 분석 이후에만 내린다.
리포트마다 exploit 가능성, 인증 필요 여부, 네트워크 노출 여부, 데이터 접근 가능성을 별도 필드로 기록한다.
이미 악용 중인 취약점은 CISA KEV를 우선 확인하고, 공개 CVE는 EPSS와 CVSS를 함께 본다.
패치 PR에는 테스트 결과, 실패 시 롤백 방법, 배포 대상 버전, 고객 공지 필요 여부를 포함한다.
오픈소스에 보고할 때는 maintainer가 바로 재현할 수 있는 최소 자료만 보낸다. 검증되지 않은 대량 리포트 발송은 피한다.
AI 보안 모델에는 코드 저장소, 빌드 시스템, 티켓, 배포 권한을 한 번에 열지 않는다. 하네스 권한은 읽기, 재현, 패치 제안, PR 생성 순서로 나눠야 한다.

리스크와 한계

첫 번째 리스크는 오탐보다 더 미묘합니다. “진짜 버그지만 지금 고칠 가치가 낮은 버그”가 많아질 수 있습니다. 모든 true positive가 같은 우선순위를 갖지는 않습니다. 인증된 내부 사용자만 닿는 낮은 영향 버그와, 인터넷에 노출된 무인증 RCE는 같은 큐에 있으면 안 됩니다.

두 번째 리스크는 공개 지연입니다. Anthropic은 90일 공개 관행과 패치 후 약 45일 공개 관행을 언급했습니다. 이 방식은 사용자 보호를 위해 필요하지만, AI가 발견 속도를 크게 올리면 비공개 상태의 취약점 재고도 함께 커집니다. 누가 접근할 수 있고, 어떤 로그가 남고, 어떤 파트너가 어떤 범위의 정보를 받는지가 중요해집니다.

세 번째 리스크는 권한입니다. Mythos급 모델은 방어에도 좋지만 공격에도 좋습니다. Anthropic의 Red Team 글은 Mythos Preview가 실제 취약점 발견, exploit 작성, 재현, 패치까지 수행하는 과정을 설명합니다. 이런 모델을 기업 내부에 붙일 때는 “모델이 안전한가”보다 “모델이 어떤 도구를 호출할 수 있는가”를 먼저 봐야 합니다.

네 번째 리스크는 비용입니다. Project Glasswing 공식 페이지는 Mythos Preview가 참여자에게 Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry를 통해 제공되며 입력 100만 토큰당 25달러, 출력 100만 토큰당 125달러 가격을 명시했습니다. Anthropic은 프로그램 지원을 위해 1억 달러 모델 사용 크레딧을 약속했지만, 일반 기업이 비슷한 스캔을 자체 운영한다면 비용, 토큰 폭주, 병렬 하네스 운영 비용을 별도로 관리해야 합니다.

Project Glasswing 초기 업데이트 공식 대표 이미지

이미지 출처: Anthropic Research, “Project Glasswing: An initial update”, 2026년 5월 22일.

관전 포인트

가장 먼저 볼 지표는 패치 수입니다. 앞으로 Anthropic이 “몇 건을 찾았다”보다 “몇 건이 검증됐고, 몇 건이 패치됐고, 몇 건이 실제 배포됐다”를 얼마나 투명하게 공개하는지가 중요합니다. 1만 건 발견보다 1,000건 배포가 더 실질적인 보안 성과입니다.

두 번째는 Claude Security와 공개 모델의 역할입니다. Anthropic은 Claude Opus 4.8 같은 공개 frontier 모델을 이용해 코드베이스를 스캔하고 패치를 제안하는 Claude Security를 언급했습니다. Mythos는 제한 프로그램에 남더라도, 공개 제품군이 어디까지 보안 워크플로를 흡수하는지가 기업 도입 속도를 좌우할 수 있습니다.

세 번째는 한국 포함 여부입니다. 공식 발표는 15개국 이상이라고만 밝혔고 전체 국가 목록을 공개하지 않았습니다. 일본 정부와 은행권 참여를 언급한 보도는 있지만, 한국 조직이 포함됐는지는 공식 확인이 필요합니다. 국내 금융, 통신, 클라우드, 제조 인프라 기업은 “우리도 써야 하나”보다 먼저 “AI 취약점 리포트가 대량으로 들어왔을 때 처리할 조직 구조가 있는가”를 점검해야 합니다.

네 번째는 공개 표준입니다. AI가 만든 취약점 리포트는 사람이 쓴 리포트와 형식이 달라질 수 있습니다. 재현 스크립트, 컨테이너 환경, 패치 후보, 회귀 테스트, 모델 신뢰도, 사람 검증 여부를 표준 필드로 담는 형식이 필요해질 가능성이 큽니다. 이 표준을 먼저 잡는 조직이 AI 보안 도구를 더 빨리 흡수할 수 있습니다.

결론은 단순합니다. Mythos 150개 조직 확대는 “AI가 해킹을 잘한다”는 공포 뉴스로 소비하기보다, 보안 운영의 병목이 어디로 이동하는지 보여주는 신호로 봐야 합니다. 발견은 빨라졌습니다. 이제 경쟁력은 검증, 패치, 배포, 책임 소재를 얼마나 짧은 루프로 묶느냐에서 갈립니다.

출처와 더 읽을 거리

Anthropic News – Expanding Project Glasswing: 2026년 6월 2일 공식 발표로, 약 150개 조직 확대, 15개국 이상, 핵심 인프라 범위, 패치 병목 인식을 확인할 수 있다.
Anthropic Research – Project Glasswing: An initial update: 2026년 5월 22일 초기 성과 업데이트로, 1만 건 이상 취약점, 오픈소스 스캔 수치, 검증·패치 병목 데이터를 확인할 수 있다.
Anthropic Project Glasswing 공식 페이지: Project Glasswing의 목적, 초기 파트너, Claude Mythos Preview 가격, 접근 경로, 연구 프리뷰 조건을 확인할 수 있다.
Anthropic Frontier Red Team – Assessing Claude Mythos Preview’s cybersecurity capabilities: Mythos Preview가 취약점을 찾고 재현하고 exploit을 구성하는 평가 방법을 기술적으로 설명하는 원문이다.
TechCrunch – Anthropic scales Claude Mythos to critical infrastructure in 15+ countries: 공식 발표를 바탕으로 확장 대상과 산업적 맥락을 정리한 외신 보도다.
CyberScoop – Anthropic expanding access to Project Glasswing: 사이버보안 전문 매체 관점에서 150개 조직 확대와 1만 건 이상 취약점 수치를 교차 확인할 수 있는 보도다.
CISA Known Exploited Vulnerabilities Catalog: 실제 악용 중인 취약점 우선순위를 잡을 때 참고할 수 있는 미국 CISA의 공식 KEV 카탈로그다.
FIRST EPSS: 공개 CVE의 향후 악용 가능성을 확률로 추정해 패치 우선순위를 보완하는 공식 EPSS 자료다.
NIST National Vulnerability Database: CVE, CVSS, CPE, CWE 등 취약점 관리에 쓰이는 구조화 정보를 제공하는 공식 데이터베이스 설명 자료다.

AI 보안 Anthropic Claude Mythos Project Glasswing 기업 보안 사이버보안 오픈소스 보안 취약점 관리 패치 자동화 하네스