AI 툴 카니 2026.06.02 AI 보조 작성·편집자 검수

카니 · AI 보조 작성, 편집자 검수

Claude Code 한도가 빨리 사라진다면: 리밋 리셋보다 먼저 봐야 할 병렬 subagent 비용

핵심 요약

Claude Code를 쓰다 보면 “5시간 뒤 리셋”이라는 문구를 자주 보게 됩니다. 그래서 많은 사용자는 리밋 문제를 시간표처럼 이해합니다. 지금 막혔으니 몇 시에 다시 열리는지, Max 5x에서 20x로 올리면 얼마나 더 버틸 수 있는지, 추가 usage credits를 켜야 하는지 같은 질문으로 들어갑니다.

그런데 2026년 5월 말 이후 Claude Code의 비용 문제는 단순한 리셋 시각 문제가 아니게 됐습니다. Anthropic은 2026년 5월 28일 Claude Code에 Dynamic Workflows를 연구 프리뷰로 공개했습니다. 핵심은 Claude가 큰 작업을 동적으로 쪼개고, 수십 개에서 수백 개의 병렬 subagent를 한 세션 안에서 실행할 수 있다는 점입니다. 공식 발표는 이 기능이 일반 Claude Code 세션보다 토큰을 상당히 더 쓸 수 있으니 작은 범위 작업에서 먼저 감을 잡으라고 적고 있습니다.

즉 사용자가 봐야 할 질문이 바뀌었습니다. “리밋이 언제 리셋되나?”도 중요하지만, 더 중요한 질문은 “왜 이렇게 빨리 닳았나?”입니다. 병렬 subagent, background task, worktree 격리, high effort, 긴 컨텍스트, 자동 검증 루프가 겹치면 한 번의 요청이 실제로는 여러 개의 agentic run이 됩니다. 겉으로는 프롬프트 하나지만 내부적으로는 작은 CI 파이프라인이 도는 셈입니다.

Claude Code 병렬 subagent 사용량 흐름을 요약한 카드형 인포그래픽

Claude Code의 병렬 subagent가 한 세션 안에서 사용량을 어떻게 끌어올리는지 요약한 카드형 정리. (이미지: 본 블로그 제작)

이 글은 개발자와 팀 리드가 Claude Code 리밋을 운영 관점에서 읽는 방법을 정리합니다. 개인 사용자는 “언제 다시 쓸 수 있나”를 확인하는 법을 얻고, 팀은 “병렬 에이전트 하네스를 어디까지 허용할 것인가”를 판단하는 기준을 얻는 것이 목표입니다.

공식 문서가 말하는 리밋 구조

먼저 공식적으로 확인되는 범위를 분리해야 합니다. Anthropic Help Center의 “Use Claude Code with your Pro or Max plan” 문서는 Pro와 Max 사용자가 Claude 웹, 데스크톱, 모바일 앱, Claude Code를 하나의 통합 구독으로 쓴다고 설명합니다. 중요한 대목은 사용량이 공유된다는 점입니다. Claude Code에서 쓴 사용량은 Claude 앱 사용량과 같은 풀에서 차감됩니다.

Claude Code 문서의 Error reference는 리밋 메시지를 더 구체적으로 보여줍니다. 세션 한도에 닿으면 “You've hit your session limit · resets 3:45pm” 같은 문구가 나오고, 주간 한도에 닿으면 “You've hit your weekly limit · resets Mon 12:00am”처럼 표시됩니다. Claude Code는 표시된 리셋 시간까지 추가 요청을 막습니다. 사용자는 /usage로 플랜 한도와 리셋 시각을 확인할 수 있고, Pro·Max에서는 /usage-credits로 추가 사용량 구매 흐름을 열 수 있습니다.

여기서 헷갈리면 안 되는 구분이 있습니다. 5시간 세션 리밋은 “잠깐 기다리면 다시 열리는” 한도에 가깝습니다. 반면 7일 주간 한도는 더 큰 안전장치입니다. 또 Opus 모델에 별도 한도가 걸릴 수 있습니다. Claude Code status line 문서는 rate_limits.five_hour와 rate_limits.seven_day 필드를 제공한다고 설명합니다. 즉 Claude Code는 이미 5시간과 7일을 서로 다른 사용량 축으로 보고 있습니다.

또 하나 중요한 문장은 인증과 과금입니다. Help Center는 ANTHROPIC_API_KEY 환경 변수가 있으면 Claude Code가 구독 플랜이 아니라 API 키로 인증될 수 있고, 그 경우 API 사용료가 발생할 수 있다고 경고합니다. 팀 환경에서는 이것이 실제 비용 사고로 이어질 수 있습니다. 누군가는 Max 구독으로 쓰고 있다고 생각하지만, 터미널에는 회사 Console API key가 살아 있고 auto-reload까지 켜져 있을 수 있습니다.

Dynamic Workflows가 리밋 체감을 바꾼다

Dynamic Workflows 발표의 핵심은 “큰 작업을 끝까지 한다”입니다. Anthropic은 Claude가 orchestration script를 동적으로 쓰고, 수십~수백 개 병렬 subagent를 실행하며, 결과를 검증한 뒤 하나의 답으로 모은다고 설명합니다. 사용 사례로는 레거시 코드베이스 전체 bug hunt, 보안 감사, 대규모 마이그레이션, 여러 각도에서 검증해야 하는 계획 수립이 제시됐습니다.

성능 관점에서는 매력적입니다. 한 명의 개발자가 직접 파일을 훑고, 테스트를 돌리고, 실패 로그를 읽고, 다시 계획을 세우는 과정을 Claude가 병렬로 나눠 처리할 수 있기 때문입니다. 하지만 사용량 관점에서는 완전히 다른 이야기가 됩니다. 병렬화는 벽시계 시간을 줄일 수 있지만, 총 추론량을 자동으로 줄여주지는 않습니다. 오히려 같은 시간 안에 더 많은 모델 호출과 도구 호출이 발생합니다.

Anthropic의 “Run agents in parallel” 문서도 이 점을 직접 말합니다. subagents, agent view, agent teams, dynamic workflows는 각각 다른 방식으로 일을 병렬화하며, 여러 세션이나 subagent를 동시에 돌리면 토큰 사용량이 곱해집니다. 이 문장은 Claude Code를 개인 assistant가 아니라 실행 하네스로 보는 순간 핵심이 됩니다.

이전에는 “Claude Code 한 프롬프트”가 한 대화 턴처럼 느껴졌습니다. 이제는 “한 프롬프트가 몇 개의 하위 작업으로 쪼개졌는가”를 봐야 합니다. codebase-wide audit을 요청했는데 40개 subagent가 각자 다른 모듈을 읽고, 다시 verifier agent가 결과를 검증하고, 최종 orchestrator가 보고서를 합치면 사용자는 한 번 물었지만 시스템은 수십 번 일한 것입니다.

5시간 리밋, 7일 한도, Opus 한도, API credits가 어떻게 다른지 보여주는 구조도

5시간 세션 리밋, 7일 주간 한도, Opus 한도, API credits가 서로 어떻게 다른지 구분해 보여주는 구조도. (이미지: 본 블로그 제작)

병렬 subagent가 돈을 아끼는 경우와 태우는 경우

병렬 subagent가 항상 나쁜 것은 아닙니다. 오히려 잘 쓰면 비용을 줄입니다. 핵심은 “서로 독립적인 탐색”과 “긴 맥락을 오염시키는 작업”을 분리하는 데 있습니다.

예를 들어 인증, 결제, 알림 모듈을 각각 조사해 위험 파일만 요약하라고 시키는 작업은 subagent에 잘 맞습니다. 각 subagent는 자기 영역에서 많은 파일과 로그를 읽고, 메인 대화에는 짧은 요약만 돌려줍니다. Claude Code subagents 문서도 테스트 실행, 문서 가져오기, 로그 처리처럼 대량 출력이 나오는 작업을 subagent에 맡기면 메인 대화 컨텍스트를 보호할 수 있다고 설명합니다.

반대로 수정 작업을 너무 빨리 병렬화하면 비용과 리스크가 같이 커집니다. 네 개 subagent가 같은 파일 계층을 동시에 고치면 충돌이 생기고, 최종 조정 agent가 diff를 다시 읽고, 테스트가 깨지고, 재시도가 붙습니다. 병렬화로 아낀 시간이 merge conflict와 검증 비용으로 사라질 수 있습니다. 그래서 Claude Code 문서는 worktree를 통해 병렬 세션이 같은 파일을 건드리지 않도록 격리하는 방식을 함께 안내합니다.

실무 기준은 단순합니다.

작업 유형	병렬 subagent 적합도	이유
여러 모듈 조사, 보안 패턴 검색	높음	독립 탐색이고 결과를 요약할 수 있음
테스트 로그 분석, 실패 원인 분류	높음	대량 출력이 메인 컨텍스트를 오염시키지 않음
대규모 마이그레이션 계획 초안	중간~높음	조사와 계획 단계에는 유리하지만 수정 전 승인 필요
같은 파일을 여러 agent가 수정	낮음	충돌과 재검증 비용이 커짐
사양이 모호한 제품 기능 구현	낮음	subagent가 서로 다른 가정을 만들 가능성이 큼

여기서 중요한 것은 “병렬화할 수 있는가”가 아니라 “병렬화해도 검증 비용이 줄어드는가”입니다. 이 기준을 통과하지 못하면 Dynamic Workflows는 생산성 도구가 아니라 토큰 소비 장치가 됩니다.

하네스 비용 리스크는 어디서 생기나

AI 코딩 비용을 모델 단가만으로 보면 놓치는 부분이 많습니다. 실제 비용은 하네스에서 생깁니다. 여기서 하네스는 모델이 파일을 읽고, 셸을 실행하고, 테스트를 돌리고, subagent를 만들고, 결과를 모으는 실행 구조 전체를 뜻합니다.

하네스 비용 리스크는 네 곳에서 커집니다.

첫째, 권한이 넓을수록 실패도 비싸집니다. subagent가 마음대로 셸을 실행하고, 네트워크를 쓰고, 파일을 수정할 수 있으면 작업은 빨라집니다. 하지만 잘못된 방향으로 간 뒤 되돌리는 비용도 커집니다. Claude Code subagents 문서는 tool allowlist, disallowedTools, permissionMode, hooks로 subagent 권한을 제어할 수 있다고 설명합니다. 팀은 “모든 subagent가 모든 도구를 써도 된다”는 기본값을 그대로 두면 안 됩니다.

둘째, 모델 선택이 subagent까지 전파됩니다. subagent 정의에는 model 필드가 있고, 환경 변수 CLAUDE_CODE_SUBAGENT_MODEL, 호출 시 model parameter, subagent frontmatter, 메인 대화 모델 순으로 해석됩니다. 메인 세션을 Opus로 켜둔 채 모든 subagent가 inherit하도록 두면, 간단한 grep성 조사까지 비싼 모델로 돌 수 있습니다. 조사 agent는 Sonnet, 최종 판단이나 위험 리뷰만 Opus로 보내는 식의 라우팅이 필요합니다.

셋째, background subagent는 사용자가 다른 일을 하는 동안 계속 돈을 씁니다. 문서상 background subagent는 concurrent로 돌며, 이미 세션에서 허용된 권한을 사용하고, 추가 권한 질문이 필요한 도구 호출은 자동 거부합니다. 이 설계는 편하지만 “내가 화면을 보고 있지 않은 동안에도 사용량이 흐른다”는 뜻입니다.

넷째, API credits와 구독 사용량이 섞일 수 있습니다. 리밋에 닿았을 때 usage credits나 API pay-as-you-go로 넘어가면 작업은 이어지지만, 예산 경계는 달라집니다. 특히 회사 계정에서는 Console auto-reload와 workspace spend cap을 확인해야 합니다. Claude Code 문서도 낮은 credit balance, API 429, 구독 리밋을 서로 다른 오류로 구분하라고 안내합니다.

Claude Code 하네스에서 비용이 커지는 지점: 모델, 권한, subagent 수, 재시도 루프

Claude Code 하네스에서 비용이 커지는 지점인 모델 선택, 권한 범위, subagent 수, 재시도 루프를 짚은 위험 지점 지도. (이미지: 본 블로그 제작)

지금 바로 확인할 체크리스트

개인 사용자는 먼저 현재 막힌 것이 어떤 리밋인지 확인해야 합니다.

/usage
/status
/model

/usage는 5시간과 주간 리셋 시각을 확인하는 출발점입니다. /status는 어떤 credential로 인증되어 있는지 확인할 때 필요합니다. 구독으로 쓰려는 사용자가 ANTHROPIC_API_KEY 때문에 API 과금으로 빠지는 문제를 피하려면 이 확인이 중요합니다. /model은 Opus를 쓰는지 Sonnet을 쓰는지, effort가 높은지 확인하는 용도입니다.

팀 사용자는 status line을 붙이는 편이 낫습니다. Claude Code status line 문서는 stdin으로 들어오는 JSON에 cost.total_cost_usd, context_window.used_percentage, rate_limits.five_hour.used_percentage, rate_limits.seven_day.used_percentage 같은 필드가 있다고 설명합니다. 이 값을 터미널 하단에 계속 보여주면 “갑자기 막혔다”가 아니라 “이번 작업이 70%를 넘었다”로 바뀝니다.

간단한 상태 표시 스크립트는 이런 식으로 시작할 수 있습니다.

#!/bin/bash
input=$(cat)

MODEL=$(echo "$input" | jq -r '.model.display_name // "unknown"')
COST=$(echo "$input" | jq -r '.cost.total_cost_usd // 0')
FIVE=$(echo "$input" | jq -r '.rate_limits.five_hour.used_percentage // 0')
WEEK=$(echo "$input" | jq -r '.rate_limits.seven_day.used_percentage // 0')
CTX=$(echo "$input" | jq -r '.context_window.used_percentage // 0')

printf "[%s] cost=$%.2f | 5h=%s%% | 7d=%s%% | ctx=%s%%\n" "$MODEL" "$COST" "$FIVE" "$WEEK" "$CTX"

이 스크립트가 실제 청구서를 완전히 대체하지는 않습니다. 공식 문서도 session cost는 client-side estimate이며 실제 청구와 다를 수 있다고 적습니다. 그래도 운영에는 충분히 유용합니다. 개발자가 “이번 refactor는 생각보다 비싸다”는 신호를 작업 중에 볼 수 있기 때문입니다.

팀 운영 기준: 자동화 전에 예산을 먼저 정하라

Claude Code를 팀에 도입할 때 가장 위험한 문장은 “알아서 끝까지 해줘”입니다. Dynamic Workflows가 강해질수록 이 문장은 더 위험해집니다. Claude가 정말 끝까지 가려고 하기 때문입니다.

좋은 프롬프트는 목표와 예산을 같이 줍니다. 예를 들어 “전체 repo에서 인증 우회 가능성을 찾아라”보다 “수정하지 말고, 인증 관련 파일 20개 이하를 우선순위로 조사한 뒤, 근거 있는 위험 후보 5개만 보고하라”가 낫습니다. 첫 프롬프트는 무한 탐색을 부르고, 두 번째 프롬프트는 조사 범위와 반환물을 제한합니다.

팀 규칙은 다음 정도면 출발점으로 충분합니다.

조사와 수정을 분리한다. 첫 run은 read-only 보고서로 끝낸다.
subagent 기본 모델은 Sonnet으로 두고, 최종 위험 판단만 Opus로 올린다.
background subagent는 이름, 목적, 예상 종료 조건을 명시한 경우에만 허용한다.
worktree 격리 없이 여러 agent가 같은 파일을 수정하지 못하게 한다.
/usage와 status line을 팀 표준 세팅에 넣는다.
API key와 구독 login이 섞이지 않게 shell profile과 .env를 정리한다.
usage credits와 Console auto-reload는 팀 예산 책임자가 켠다.

이 기준은 생산성을 늦추기 위한 규칙이 아닙니다. 오히려 반대입니다. 병렬 에이전트는 잘게 통제할수록 더 빨라집니다. 작업 경계가 선명하면 subagent가 덜 헤매고, 결과 검증도 쉬워집니다. 비용도 줄어듭니다.

기존에 다룬 Claude Opus 4.8 Thinking 비용 논란 글이 effort와 Thinking이 한도 체감을 바꾸는 문제를 봤다면, 이번 글의 초점은 그 위에서 실제로 작업을 굴리는 하네스입니다. 또 병렬 에이전트가 IDE 카테고리 자체를 바꾸고 있다는 흐름은 Antigravity 2.0 병렬 subagent 분석과도 이어집니다.

결론: 리셋 시각은 증상이고, 설계가 원인이다

Claude Code 한도가 빨리 사라질 때 가장 먼저 보이는 것은 리셋 시각입니다. 하지만 리셋 시각은 증상입니다. 원인은 더 안쪽에 있습니다. 어떤 모델을 썼는지, effort가 어디에 있었는지, subagent가 몇 개 돌았는지, background task가 남아 있었는지, API key로 빠졌는지, 같은 작업을 몇 번 재시도했는지가 실제 원인입니다.

Dynamic Workflows는 Claude Code를 더 강력한 코딩 도구로 만듭니다. 동시에 Claude Code를 더 비싼 실행 하네스로 만들 수도 있습니다. 수십~수백 개 subagent가 한 세션 안에서 움직이는 시대에는 “AI에게 맡긴다”가 아니라 “AI 작업장을 운영한다”는 감각이 필요합니다.

개인 사용자는 /usage, /status, /model부터 확인하면 됩니다. 팀은 status line, 모델 라우팅, subagent 권한, worktree 격리, usage credits 정책을 같이 정해야 합니다. Claude Code 리밋을 잘 쓰는 팀은 리셋 시간을 외우는 팀이 아니라, 리밋이 빨리 닳지 않도록 작업을 설계하는 팀입니다.

출처와 더 읽을 거리

Anthropic 공식 발표 — Introducing dynamic workflows in Claude Code: 2026년 5월 28일 공개된 Dynamic Workflows 발표 원문으로, 수십~수백 개 병렬 subagent와 토큰 사용 증가 주의 문구를 확인할 수 있다.
Claude Help Center — Use Claude Code with your Pro or Max plan: Pro·Max 구독에서 Claude Code를 연결하는 방법, 공유 사용량, API credits, ANTHROPIC_API_KEY 주의사항을 설명하는 공식 도움말이다.
Claude Code Docs — Error reference: session limit, weekly limit, Opus limit, API 429, credit balance 오류를 구분해 리셋 시간과 대응법을 확인할 수 있는 공식 문서다.
Claude Code Docs — Run agents in parallel: subagents, agent view, agent teams, dynamic workflows가 각각 어떤 병렬화 방식인지 비교하고, 병렬 실행이 토큰 사용량을 늘릴 수 있음을 설명한다.
Claude Code Docs — Create custom subagents: subagent의 모델 선택, tool 제한, permissionMode, background 실행, worktree 격리 등 하네스 설계에 필요한 필드를 확인할 수 있다.
Claude Code Docs — Customize your status line: cost.total_cost_usd, rate_limits.five_hour, rate_limits.seven_day, context usage를 터미널 상태줄에 표시하는 방법을 제공한다.
AI Insight Hub — Claude Opus 4.8 Thinking 비용 논란: Opus 4.8의 effort, Thinking, 토큰 사용량 체감을 별도로 분석한 내부 참고 글이다.
AI Insight Hub — Antigravity 2.0 병렬 subagent 분석: 병렬 에이전트와 하네스가 AI 코딩 도구의 카테고리를 어떻게 바꾸는지 비교 맥락을 제공하는 내부 참고 글이다.

AI 코딩 Anthropic Claude Code Dynamic Workflows subagent 개발자 도구 리밋 리셋 사용량 한도 하네스