5 분 소요

hits

“5시간도 채 쓰지 않았는데 세션 한도에 걸렸다.” 수많은 클로드 코드 사용자가 겪는 공통된 불만이다. 인공지능 모델의 컨텍스트 창이 무한정 크다고 느껴질 때조차, 왜 우리는 이처럼 예상치 못한 제약에 부딪히는가? 그 답은 아이러니하게도 모델의 한계가 아니라 사용자 습관에 있다.

컨텍스트와 토큰: 보이지 않는 비용의 증식

클로드가 한 번에 처리할 수 있는 모든 정보를 컨텍스트라고 부른다. 여기에는 시스템 프롬프트, 주고받은 대화, 읽어들인 파일, 호출된 MCP, 로드된 스킬 등이 모두 포함된다. 중요한 점은 클로드가 매 메시지마다 이 컨텍스트를 처음부터 끝까지 다시 읽는다는 사실이다. 대화가 길어질수록 토큰 소모는 단순히 더해지는 것이 아니라 곱셈의 법칙을 따른다. 예를 들어, 30번째 메시지를 처리할 때 클로드는 첫 메시지에 비해 30배쯤 되는 토큰을 매번 처리한다. 이는 같은 세션을 오래 끌수록 같은 질문에 더 비싼 값을 치르는 구조를 의미한다. 따라서 세션을 끊는 행위는 비용 효율성 측면에서 필수적이다.

컨텍스트 부식(Context Rot): 1M 토큰의 함정

많은 사용자가 클로드 코드1M 토큰이라는 방대한 용량 때문에 여유가 있다고 착각한다. 그러나 Anthropic 공식 문서는 다른 현실을 제시한다. 컨텍스트가 256K일 때 정보 검색도가 92%였던 반면, 1M으로 늘어나면 78%로 떨어진다는 수치다. 즉, 컨텍스트 창이 커진다고 모델이 더 잘 정보를 찾는 것이 아니라 오히려 주의가 분산되는 현상이 발생한다. 공식에서는 이를 컨텍스트 부식(Context Rot)이라고 부른다. 대화가 길어질수록 모델이 산만해지고, 이전 실수를 반복하거나, 심지어 파일을 다시 읽지 않고 멋대로 고치기 시작하는 현상이 여기에 해당한다. 결국 1M 토큰은 보험이지 목표가 아니며, 이를 꽉 채우려고 들수록 품질은 저하된다.

클로드는 컨텍스트가 95% 정도 차면 오토 콤팩션(Auto-compaction) 기능을 자동으로 작동시킨다. 이는 대화를 자동으로 요약하여 기존 이력을 요약본으로 대체하는 방식이다. 하지만 이 기능은 너무 늦게 발동된다는 문제가 있다. 95% 시점은 이미 컨텍스트 부식이 심각한 구간이며, 모델이 가장 산만한 상태에서 요약을 시키는 꼴이 된다. 공식 문서의 비유를 들자면, 이는 출근 5분 전에 허둥지둥 짐을 싸 충전기를 빠뜨리는 상황과 같다. 결론적으로 오토 콤팩션을 기다리기보다는 사용자가 먼저 적극적으로 개입해야 한다.

5가지 공식 탈출구: 세션 관리의 의사결정 테이블

Anthropic은 매 응답 이후 사용자에게 다섯 가지 선택지가 있다고 정리한다. 이 선택지들을 적절히 활용하는 것이 세션 한도를 오래 버티는 핵심이다.

  1. 컨티뉴(Continue): 단순히 다음 메시지를 이어서 보낸다. 기본값으로, 현재 진행 중인 작업에 방금까지의 모든 컨텍스트가 필요할 때만 사용한다.
  2. /rewind: 이전 메시지 지점으로 돌아가 그 이후의 내용을 전부 지운다. 더블 ESC로도 작동한다. 클로드가 잘못된 경로로 가고 있을 때 쓰는 옵션이다.
  3. /clear: 세션을 통째로 비우고 새로 시작한다. 완전히 다른 작업으로 넘어갈 때 적합하다.
  4. /compact: 지금까지의 대화를 요약본으로 대체한다. 오토 콤팩션을 사용자가 원할 때 수동으로 실행하는 방식이다.
  5. 서브 에이전트(Subagent): 깨끗한 별도 컨텍스트를 가진 서브 에이전트에게 작업을 위임하고 결과만 받는다.

대부분의 사용자가 1번 컨티뉴만 사용하며, 이것이 세션 한도에 자주 걸리는 주된 이유다.

실전에서 가장 중요한 세 가지 습관

공식 문서가 강조하는 다섯 가지 선택지 중 실전에서 특히 중요한 세 가지를 살펴보자.

1. /rewind: 잘못된 길에서 돌아오는 1순위 습관

/rewind는 사용자가 1순위 습관으로 삼아야 할 기능이다. 예를 들어, 클로드가 여러 파일을 읽고 접근법 A로 시도했으나 실패했다고 가정한다. 이때 “그게 안 됐어. 이걸 시도해 봐”라고 답하는 것은 실패한 시도, 잘못된 코드, 틀린 추론이 모두 컨텍스트에 그대로 남아 클로드가 그 불필요한 정보를 계속 읽게 만든다. 이는 컨텍스트를 지수적으로 오염시키는 행위다.

반면, /rewind는 파일을 읽기 직전 지점으로 돌아가 그 이후의 모든 내용을 지운다. 그리고 새로운 프롬프트에서 실패를 통해 배운 교훈을 적용하여 “접근법 A는 쓰지 마. 푸 모듈이 그걸 노출하니 B로 가”와 같이 지시한다. 결과물은 같지만, 컨텍스트는 깨끗하게 유지되어 세션 수명을 2~3배 연장한다.

실무 팁: /rewind 메뉴에는 ‘Summarize from here’ 기능이 있다. 이를 활용하면 클로드가 해당 지점까지 학습한 내용을 요약하여 인수인계 메시지를 생성한다. 이는 실패에서 얻은 교훈은 남기되 실패의 흔적은 지우는 효과적인 방법이다.

2. 선제적 /compact: 오토 콤팩션을 기다리지 마라

오토 콤팩션이 95%라는 너무 늦은 시점에 발동되는 문제를 해결하기 위해 선제적 압축(Proactive Compact)이 필요하다. 공식 문서의 답은 “다음에 무엇을 할지 예상 가능한 지점에서 직접 /compact를 실행하라”는 것이다.

핵심은 단순히 /compact를 사용하는 것이 아니라 힌트를 함께 붙이는 것이다. 예를 들어, ` /compact 오스 리팩토링에 집중. 테스트 디버깅 내용은 제외.`와 같이 지시하면 클로드는 사용자의 의도에 따라 요약본을 생성할 때 무엇을 남기고 무엇을 버릴지 결정한다. 이는 오토 콤팩션이 임의로 중요한 정보를 버리는 사고를 막아준다.

또한, 선제적 압축은 모델이 아직 맑은 상태에서 진행되므로, 모델이 가장 산만한 시점에 작동하는 오토 콤팩션과는 비교할 수 없는 품질의 요약본을 얻을 수 있다. 개인적인 경험으로는 1M 모델 사용 시 120K(전체 컨텍스트의 약 12%) 정도에서 한 번 정리하고 큰 작업을 시작하는 것을 권장한다.

3. 서브 에이전트: 중간 과정이 불필요할 때의 현명한 선택

서브 에이전트 활용은 Anthropic의 핵심 전략 중 하나다. 서브 에이전트 사용 여부를 결정하는 공식의 기준은 단 하나의 질문이다. “이 작업의 중간 출력물을 내가 나중에 또 볼 일이 있나?” 만약 답이 “아니, 결론만 알면 돼”라면, 그 작업은 무조건 서브 에이전트 감이다.

예시:

  • “이 사양 문서대로 구현됐는지 검증해 줘.” 검증 과정은 불필요하다. 통과/실패만 필요하므로 서브 에이전트를 사용한다.
  • “다른 레포를 읽고 오스 흐름이 어떻게 구현되는지 요약해 줘.” 그 레포 파일들을 메인 컨텍스트에 남길 이유가 없으므로 서브 에이전트를 사용한다.
  • “깃 풀(Git pull)을 보고 이 기능 문서를 작성해 줘.” 문서만 있으면 되므로 서브 에이전트를 사용한다.

반대로, “지금 보고 있는 코드를 리팩토링해 줘”와 같이 중간 과정을 전부 보아야 하는 작업은 서브 에이전트를 사용하면 오히려 손해이며 메인 세션에서 직접 진행한다. 이 질문 하나를 매번 던지는 습관만 붙여도 메인 세션의 컨텍스트를 놀랍도록 가볍게 유지할 수 있다.

변하지 않는 규칙: 습관이 핵심

Anthropic 공식 문서를 관통하는 핵심 메시지는 명확하다. 컨텍스트 창이 커져도 근본적인 규칙은 변하지 않았다. 모델은 여전히 산만해지고, 세션은 여전히 끊어야 하며, 선택지는 여전히 다섯 가지다. 결국 세션 한도에 걸리는 것은 1M 토큰이라는 큰 컨텍스트 창이 부족해서가 아니라, 200K 토큰 시절에 지켜야 했던 좋은 습관을 1M 시대가 되면서 놓아버렸기 때문이다. 창이 커지니 끊을 필요성을 느끼지 못하는 것이다.

다섯 가지 세션 관리 기준은 다음과 같이 정리할 수 있다.

  • Rewind: 잘못된 길로 갔을 때
  • Compact: 올바른 길로 가고 있지만 컨텍스트가 무거워졌을 때
  • Subagent: 중간 과정이 중요하지 않을 때
  • Clear: 완전히 새로운 작업일 때
  • Continue: 위의 네 가지 경우가 아닐 때

이 다섯 가지 기준만 머리에 명확히 기억해 두면, 같은 클로드 구독으로도 지금보다 훨씬 더 오래 효율적으로 사용할 수 있다. 공식 문서 자체의 분량도 길지 않으니, 이 글을 읽은 후 원문을 한 번 더 살펴보면 이해가 더욱 깊어질 것이다.

연극학·서사이론의 시선으로 보면

연극학의 고전, 아리스토텔레스의 『시학』은 극의 ‘행동의 통일성’을 강조한다. 이는 단일하고 응집력 있는 플롯을 의미하는데, AI의 컨텍스트 창이 비대한 정보로 오염되는 ‘컨텍스트 부식’ 현상은 이 통일성이 무너진 극과 같다. 실패한 시도나 불필요한 정보가 주된 행동을 방해하는 ‘잡음’이 되는 것이다. 결국 세션 관리의 5가지 원칙은 AI가 주어진 역할에서 벗어나지 않고 ‘행동의 통일성’을 유지하도록 돕는 연출가의 지시봉과 다름없다.

<출처> - AgentOS. (2026-04-21). [Claude Code 세션 한도 오래 버티는 법 — Anthropic 공식 문서 5가지 해결법](https://www.youtube.com/watch?v=xFl2QNlAbGM). YouTube.