클로드 사용량 제한 정리: 주간 쿼터, 확장 사고, 맥스 플랜의 불투명한 구조
2026년 2월 프롬프트 캐싱 버그로 앤트로픽이 전체 사용자 한도를 리셋했다. 이 사건은 클로드의 토큰 기반 이중 제한 체계, 즉 5시간 롤링 윈도우와 주간 쿼터의 구조적 불투명성을 드러냈다. 확장 사고의 토큰 비용, 맥스 플랜의 추가 사용량 구매, 홀리데이 프로모션 후 체감 삭감까지. 법적 설명의무, 도구적 전도, 디지털 격차, GPU 패권의 비용 전가라는 네 겹의 분석으로 AI 도구 가격 설계의 정치경제학을 해부한다.
2026년 2월 27일, 앤트로픽(Anthropic)은 전 세계 클로드 코드(Claude Code) 사용자의 주간 사용량 한도를 일괄 리셋했다. 프롬프트 캐싱(Prompt Caching)의 버그로 인해 사용자들의 토큰이 정상보다 2~3배 빠르게 소진되었다는 것이 공식 확인된 사실이다. 월 200달러를 지불하는 맥스(Max) 20x 플랜 사용자조차 며칠 만에 한도에 도달했고, 일부는 일주일 내내 작업이 차단되었다. 사과는 리셋이라는 형태로 왔지만, 그 리셋이 드러낸 것은 사과보다 훨씬 구조적인 문제였다.
2025년 8월 레이로그가 '클로드 사용량 제한의 진실(2025)'에서 지적했던 불투명한 사용량 정책은 2026년에 이르러 더 정교하고 더 복잡한 체계로 진화했다. 메시지 횟수가 아닌 토큰 소모량 기반의 이중 제한 체계, 확장 사고(Extended Thinking)라는 강력하지만 값비싼 새 기능, 그리고 추가 사용량 구매라는 이름의 종량제 편입. 이 모든 변화를 관통하는 질문은 하나다. AI 도구의 가격은 누가, 어떤 논리로 설계하는가.
2025년 8월, 게임의 규칙이 바뀌었다
이 이야기의 출발점은 2025년 8월 28일이다. 앤트로픽은 이날 클로드 프로(Pro)와 맥스(Max) 모든 유료 플랜에 주간 사용량 제한(Weekly Rate Limits)을 도입했다. 기존의 5시간 롤링 윈도우(Rolling Window) 제한에 더해, 7일 단위로 총 사용량을 추적하는 두 번째 장벽이 생긴 것이다.
앤트로픽의 공식 설명은 명확했다. 클로드 코드를 "24시간 백그라운드에서 연속 실행"하는 극소수 파워 유저와 계정 공유, 재판매 같은 정책 위반이 전체 시스템 용량에 영향을 미치고 있으며, 이 제한은 전체 구독자의 5% 미만에게만 적용될 것이라고 했다.
그러나 '5% 미만'이라는 수치 자체가 통계적 착시를 만든다. 앤트로픽이 말하는 5%는 전체 구독자 기준이다. 여기에는 월 한두 번 로그인하는 캐주얼 사용자부터 종일 클로드 코드를 돌리는 전업 개발자까지 모두 포함된다. 분모를 전체 구독자로 잡으면 어떤 제한이든 소수만 영향받는다고 말할 수 있다. 그러나 실제로 AI를 업무 도구로 의존하는 파워 유저 계층으로 분모를 좁히면, 이 비율은 50%를 넘길 가능성이 충분하다. 뒤에서 다룰 시사저널의 데이터가 이를 뒷받침한다. 맥스 200달러 구독자의 46%가 기능의 20% 미만만 사용하고 있다면 나머지 54%는 20% 이상을 사용하고 있다는 뜻이고 이 그룹이야말로 한도에 도달할 확률이 높은 집단이다.
더 근본적으로 모델이 강력해지고 확장 사고가 기본 워크플로우로 자리잡으면 토큰 소모량은 구조적으로 증가할 수밖에 없다. 오늘의 5%는 내일의 15%가 될 수 있다. 앤트로픽은 이 구조적 추세를 알면서도 현재 시점의 스냅샷만 공개한 것이다. 이것은 디지털 격차(digital divide)의 새로운 변주다. 과거의 디지털 격차가 인터넷 접근 여부의 문제였다면, AI 시대의 디지털 격차는 같은 도구를 쓰더라도 얼마나 깊이 쓸 수 있는가의 문제로 이동한다. 월 20달러 프로 사용자와 월 200달러 맥스 사용자 사이에 동일한 모델을 두고 20배의 사용량 격차가 벌어진다. AI가 생산성의 핵심 도구가 된 시대에, 이 격차는 곧 생산성의 격차이며, 궁극적으로 기회의 격차로 번역된다.
이중 제한 체계: 5시간 윈도우와 주간 쿼터의 교차점
2026년 3월 현재, 클로드의 사용량 제한은 두 개의 시간축이 동시에 작동하는 구조다.
첫 번째는 기존의 5시간 롤링 윈도우다. 첫 번째 메시지를 보낸 시점부터 5시간 동안의 토큰 소모량을 추적한다. 앤트로픽 고객센터에 따르면, 이 윈도우는 고정된 리셋 시간이 아니라 연속적으로 슬라이딩한다. 가장 오래된 메시지가 5시간을 넘기면 그만큼의 여유가 생기는 방식이다. 프로 플랜 기준으로 소넷(Sonnet) 모델 사용 시 약 45메시지, 맥스 5x는 약 225메시지, 맥스 20x는 약 900메시지가 이 윈도우 안의 대략적인 상한선이다.
두 번째는 주간 쿼터다. 7일 단위로 전체 사용량을 모니터링하며 이 한도를 초과하면 한도가 리셋되는 요일까지 사용할 수 없다. 여기서 결정적으로 중요한 것은 앤트로픽이 추적하는 단위가 메시지 횟수가 아니라 토큰이라는 점이다. 같은 한 건의 메시지라도 대화의 50번째 턴에서 보내는 메시지는 전체 대화 히스토리를 포함하기 때문에 첫 번째 메시지보다 수십 배 많은 토큰을 소모한다.
이 이중 구조가 만들어내는 체감은 단순하지 않다. 5시간 윈도우 안에서는 여유가 있더라도 주간 쿼터에 먼저 도달할 수 있고 반대로 주간 쿼터가 남아 있어도 짧은 시간 안에 집중적으로 사용하면 5시간 윈도우에 걸린다. 사용자는 두 개의 보이지 않는 한도 사이에서 끊임없이 자기 사용량을 추정해야 한다. 토큰 단위의 사용량 대시보드는 없다. 한도 접근 시 경고 표시가 나타나지만, 현재 소모량이나 잔여량의 구체적 수치를 실시간으로 확인할 방법은 제공되지 않는다.
이것을 투명한 정책이라고 부를 수 있는가?
답은 명확하다. 불투명함은 버그가 아니라 설계다. 사용량의 예측 불가능성은 앤트로픽에게 운영 유연성을 제공한다. 서버 부하에 따라 제한을 동적으로 조절하면서도 그 조절의 근거를 사용자에게 공개할 의무는 지지 않는 구조다.
법학적 관점에서 보면, 이것은 설명의무(Duty of Disclosure)의 문제다. 유료 구독 계약에서 서비스 제공자는 계약의 핵심 조건을 명확하게 고지해야 한다. 토큰 기반 이중 제한이라는 구조를 운영하면서 그 구체적인 한도를 수치로 공개하지 않는 것은, 한국 소비자보호법의 관점에서 알 권리의 침해에 가깝다. 민법상 신의성실의 원칙은 계약 당사자가 상대방의 이익을 배려하고 기대를 존중할 것을 요구한다. 월 20달러 또는 200달러를 지불하는 구독자에게 자신의 사용량 상세 내역조차 제공하지 않는 것은 이 원칙의 정신에 부합하지 않는다.
확장 사고의 역설: 더 똑똑해질수록 더 빨리 바닥난다
2025년 2월 클로드 3.7 소넷(Claude 3.7 Sonnet)과 함께 처음 도입되고 이후 전 모델로 확대된 확장 사고(Extended Thinking)는 클로드가 응답하기 전에 내부적으로 긴 추론 과정을 거치는 기능이다. 복잡한 코딩, 수학적 증명, 다단계 분석에서 응답 품질이 극적으로 향상된다. 앤트로픽 API 문서에 따르면 사고 토큰 예산(budget_tokens)은 최소 1,024토큰부터 설정 가능하며 클로드 오퍼스 4.6(Claude Opus 4.6)에서는 적응형(adaptive) 모드가 도입되어 모델이 필요한 만큼 자율적으로 사고 토큰을 소비한다.
문제는 이 사고 토큰이 사용량 제한에 그대로 반영된다는 점이다. 한 번의 확장 사고 질문이 일반 메시지 수십 건에 해당하는 토큰을 소모할 수 있다. 클로드 코드에서 /think high 모드로 복잡한 아키텍처 결정을 내리는 것은 강력하지만 그 한 번의 사용이 주간 쿼터의 상당 부분을 날려버릴 수 있다.
여기서 구조적 역설이 드러난다. 앤트로픽은 확장 사고를 "더 깊은 추론"이라는 혁신으로 마케팅하지만 그 혁신의 비용은 사용자의 한도에서 차감된다. 모델이 더 똑똑해질수록 이용자가 그 똑똑함을 사용할 수 있는 횟수는 줄어든다. 이것은 기술의 진보가 아니라 기술의 진보를 가격의 장벽 뒤에 가두는 비즈니스 모델이다.
철학적으로 더 깊은 층위의 문제가 있다. 이것은 도구적 전도(instrumental inversion)의 전형이다. 원래 AI는 인간의 사유를 확장하기 위한 도구였다. 그러나 확장 사고의 토큰 비용 구조는 이 관계를 역전시킨다. 이용자는 "이 질문이 확장 사고를 쓸 만큼 가치가 있는가?"를 매번 자기 검열하게 된다. 도구가 이용자의 사유를 확장하는 것이 아니라, 도구의 비용 구조가 이용자의 사유를 사전 검열하는 것이다. 기술이 마스터(master)가 되고 사람이 도구의 허가를 구하는 관계. 확장 사고가 가져온 진짜 역설은 성능의 역설이 아니라 주체성의 역설이다.
앤트로픽이 권장하는 해법은 의미심장하다. "단순한 작업에는 /think low나 /think off를 사용하고 소넷을 기본 모델로 쓰며 오퍼스는 정말 복잡한 결정에만 아껴 쓰라"는 것이다. 바꿔 말하면 최고 성능의 모델을 제공하면서도 그것을 자유롭게 사용하지 말라고 요청하는 것이다. 레스토랑이 최고급 코스를 메뉴에 올려놓고 "되도록 런치 세트를 드세요"라고 말하는 것과 무엇이 다른가.
12월의 선물, 1월의 분노: 홀리데이 보너스가 만든 인지적 착시
2025년 12월 25일부터 31일까지 앤트로픽은 모든 사용자의 사용량 한도를 두 배로 늘리는 홀리데이 프로모션을 실시했다. 일주일간의 관대한 경험이 끝나고 2026년 1월 정상 한도로 복귀했을 때, 사용자들의 반응은 격렬했다. 더 레지스터(The Register)의 보도에 따르면, 개발자들은 앤트로픽의 디스코드 채널에서 "토큰 사용량 한도가 약 60% 감소했다"고 주장했으며, 일부는 자신의 비판이 채널 운영자에 의해 삭제되었다고 항의했다. 앤트로픽은 이에 대해 "홀리데이 보너스의 만료일 뿐 한도를 줄인 적이 없다"고 해명했지만 이용자들의 체감은 달랐다.
깃허브(GitHub)에 등록된 이슈 #17084는 더 구체적인 증거를 제시했다. 2026년 1월 8일 주간 한도 리셋 이후, 오퍼스 4.5(Opus 4.5)의 사용량 한도가 2025년 11월 출시 이래 가장 낮은 수준으로 떨어졌다는 것이다. 이것이 홀리데이 보너스의 잔상 때문인지 아니면 실제로 한도가 하향 조정된 것인지는 앤트로픽만이 정확히 알 수 있다. 그리고 바로 그것이 문제다.
홀리데이 프로모션은 마케팅적으로는 효과적이지만 정책 투명성 측면에서는 독이 된다. 일시적으로 높은 한도를 경험한 이용자는 그것을 새로운 기준선(baseline)으로 인식한다. 복귀는 수치적으로 동일하더라도 심리적으로는 삭감으로 체험한다. 앤트로픽이 이 인지적 메커니즘을 몰랐을 리 없다. 알면서도 실행한 것이라면, 프로모션의 목적이 감사(Thanks)가 아니라 업셀(upsell)이었다는 합리적 추정이 가능하다. 홀리데이 보너스 경험 후 한도에 불만을 느끼는 사용자가 맥스 플랜으로 업그레이드할 가능성은 구조적으로 높아지기 때문이다. 2월의 프롬프트 캐싱 버그 리셋도 같은 구조를 공유한다. 일시적 한도 상향 -> 정상 복귀 -> 체감 삭감이라는 패턴이 반복될 때마다, 이용자의 심리적 저항선은 조금씩 높아지고, 더 비싼 플랜으로의 이동 압력이 누적된다.
2월의 버그, 시스템의 취약점을 비추다
그리고 2월이 왔다. 클로드 코드 v2.1.59에서 v2.1.61까지 프롬프트 캐싱에 레이스 컨디션(Race Condition) 버그가 발생했다. 자동 메모리(Auto Memory)와 컨텍스트 압축(Context Compaction) 사이의 충돌로 캐싱이 깨졌고 동일한 작업에 정상 대비 2~3배의 토큰이 소모되었다. 앤트로픽은 v2.1.62에서 패치를 적용하고 전체 사용자의 주간 한도를 리셋했다.
기술적 버그는 일어날 수 있다. 빠른 수정과 보상 리셋은 적절한 대응이었다. 그러나 이 사건이 드러낸 더 근본적인 문제는 따로 있다. 이용자는 자신의 토큰이 정상적으로 소모되고 있는지 비정상적으로 소모되고 있는지 구분할 방법이 없었다는 것이다. 사용량 대시보드가 없고, 잔여 토큰을 실시간으로 확인할 인터페이스가 없는 구조에서, 버그로 인한 과다 소모와 정상적인 높은 사용의 차이는 이용자에게 불투명하다.
이 불투명함의 비용은 앤트로픽이 아니라 이용자가 지불한다. 프롬프트 캐싱 버그가 발견되기까지 며칠 동안, 한도에 도달한 이용자들은 자신의 사용 습관을 탓하거나 맥스 플랜으로의 업그레이드를 고민했을 것이다. 시스템의 결함이 사용자의 자기 검열로 전가되는 구조. 이것이 불투명한 사용량 정책의 실제 작동 방식이다.
맥스 플랜: 해결책인가, 새로운 포획인가
앤트로픽이 제시하는 공식적인 해결책은 맥스 플랜이다. 월 100달러의 5x 플랜과 월 200달러의 20x 플랜은 프로 대비 각각 5배, 20배의 사용량을 제공한다. 클로드 코드 기준으로 맥스 200달러 플랜은 주당 소넷 4 기준 240~480시간, 오퍼스 4 기준 24~40시간의 쓸 수 있다고 앤트로픽은 제시한다.
그러나 이 숫자의 함정은 기준 모델에 있다. 240~480시간이라는 수치는 소넷 4 기준이다. 오퍼스 4로 전환하면 주당 24~40시간으로 급감한다. 최대치인 40시간은 주 5일 하루 8시간, 즉 풀타임 개발자의 딱 일주일치다. 최소치인 24시간이라면 주 3일치에 불과하다. 이 범위의 폭 자체가 문제다. 이용자는 자신이 24시간 쪽에 가까운지 40시간 쪽에 가까운지조차 예측할 수 없다. 여기에 확장 사고를 활성화하면 이 시간은 더 짧아진다.
더 주목할 것은 맥스 플랜에 도입된 추가 사용량 구매(Extra Usage) 기능이다. 주간 한도를 초과하면 표준 API 요금으로 추가 사용량을 구매할 수 있다. 오퍼스 4.6의 API 가격은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러다. 이것은 월 구독료 위에 종량제가 얹어지는 하이브리드 모델이며, 사실상 맥스 플랜이 무제한이 아니라 상한이 높은 기본료 + 초과 사용 종량제임을 의미한다.
앤트로픽의 프로덕트 리드 스콧 화이트(Scott White)는 TechCrunch 인터뷰에서 월 500달러 이상의 프리미엄 티어 가능성을 묻는 질문에 "다양한 탐색적 옵션을 열어두고 있다(We'll always keep a number of exploratory options available to us)"고 답했다. 직접적인 확약은 아니지만, 가능성을 배제하지 않은 이 답변 자체가 가격 상승 곡선이 아직 정점에 도달하지 않았음을 시사한다.
정치경제학적 관점에서 맥스 플랜과 추가 사용량 구매의 결합은 구조적 포획(structural capture)의 메커니즘이다. 이용자는 클로드에 업무 워크플로우를 깊이 통합할수록 전환 비용(switching cost)이 높아진다. 코드베이스가 클로드 코드에 최적화되고 프롬프트 라이브러리가 축적되고 팀의 작업 습관이 클로드 중심으로 재편된 뒤에는 한도에 불만이 있어도 쉽게 떠날 수 없다. 이 상태에서 "추가 사용량을 API 요금으로 구매하세요"라는 선택지는 해방이 아니라 종속의 심화다. 월 구독료 위에 종량제가 쌓이는 하이브리드 모델은, 사용자를 정액 고객에서 종량 고객으로 점진적으로 전환시키는 가격 설계이며 그 전환의 방향은 언제나 앤트로픽의 수익 극대화를 향한다.
더 넓은 맥락에서 보면, AI 도구의 가격은 이용자의 지불 의사(willingness to pay)가 아니라 GPU 패권의 비용 전가 구조에 의해 결정된다. 엔비디아의 H100, H200 GPU 확보 경쟁에서 앤트로픽, 오픈AI, 구글은 천문학적 투자를 벌이고 있고, 이 투자의 회수 압력은 최종 사용자 가격에 반영된다. GPU 패권 경쟁의 비용이 구독료와 토큰 가격을 통해 개인 사용자에게 전가되는 구조. 이것이 맥스 플랜의 배후에 있는 정치경제학이다.
한국 커뮤니티의 반응: 월 30만 원을 내는데
한국 사용자 커뮤니티와 미디어의 반응은 이 구조적 문제를 체감 수준에서 보여준다. 클리앙 등 커뮤니티에서는 맥스 플랜의 사용량 정책 변경에 대한 비판적 토론이 이어졌다. "월 200달러, 한국 원화로 약 30만 원을 지불하면서도 하루에 여러 번 짧게 사용하면 월 중순이면 한도에 도달한다"는 지적이 나왔고, 뉴스1은 "돈냈는데 30분만 쓰라니…클로드 토큰 논란에 앤트로픽 신뢰 뚝"이라는 제목으로 이 논란을 보도했다.
더 충격적인 데이터가 있다. 시사저널의 분석에 따르면 월 200달러 맥스 플랜 구독자의 26%가 제공된 기능의 0~10%만 사용하고 있었고, 20%는 10~20% 구간에 머물렀다. 최고 요금제 구독자의 거의 절반이 자신이 비용을 지불한 기능의 20%도 활용하지 못하고 있다는 뜻이다. 이것은 커뮤니티의 불만이 감정적 과장이 아니라 구조적 현실임을 보여주는 수치다.
게다가 일부 이용자들이 맥스 플랜 출시 이후 기존 20달러 프로 플랜의 체감 한도가 줄었다고 주장하며 이것이 업셀 전략이 아니냐는 의혹을 제기하고 있다는 점이다. 앤트로픽은 이를 부인하지만, 체감 한도와 공식 한도의 괴리 자체가 정책 불투명성의 증거다. 이용자가 자신의 경험을 수치로 검증할 수 없는 구조에서, 불신은 구조적으로 발생할 수밖에 없다.
도구의 가격은 누가 설계하는가
지난 8월 같은 내용을 다룬 칼럼에서 나는 "AI는 우리의 파트너이지 마스터가 아니다"라고 썼다. 그 명제는 여전히 유효하지만, 2026년의 현실은 더 복잡한 질문을 요구한다.
앤트로픽은 안전한 AI(Safe AI)를 기업 정체성으로 내세우는 회사다. 그러나 안전과 사용량 제한은 다른 문제다. 공정하게 말하자면, 앤트로픽이 직면한 기술적 제약은 실재한다. 대규모 언어 모델의 GPU 클러스터 운영 비용은 천문학적이고, 서버 부하는 시간대와 사용 패턴에 따라 급변하며 동적으로 제한을 조절하지 않으면 전체 서비스가 불안정해질 수 있다. 24시간 무인 실행을 막는 것, 계정 공유와 재판매를 차단하는 것은 시스템 안정성을 위해 합리적인 조치다. 이 글의 논점은 제한의 존재 자체가 아니다. 문제는 그 제한이 작동하는 방식이다. 유료 구독자의 사용량을 불투명하게 관리하면서 초과 사용에 종량제를 부과하는 것은 안전의 논리가 아니라 수익의 논리다. 기술적 제약은 불투명성의 이유가 될 수 없다.
진짜 문제는 가격의 절대적 수준이 아니다. 오퍼스 4.6의 운영 비용이 높다는 것은 이해할 수 있다. 진짜 문제는 구조적 불투명성이다. 이용자는 자신이 얼마나 사용했는지 정확히 알 수 없고, 얼마나 남았는지 예측할 수 없으며, 한도에 도달했을 때 왜 도달했는지 검증할 수 없다. 프롬프트 캐싱 버그는 이 불투명성이 단순한 불편이 아니라 실질적 피해를 야기할 수 있음을 증명했다.
이 글에서 다층적으로 분석한 문제들을 종합하면, 하나의 구조가 보인다. 법적으로는 설명의무와 신의성실 원칙이 미충족된 구독 계약이고, 철학적으로는 도구가 사용자를 규율하는 도구적 전도가 발생했으며, 사회적으로는 5% 미만이라는 통계적 착시 아래 AI 시대의 새로운 디지털 격차가 형성되고 있고 정치경제학적으로는 GPU 패권 경쟁의 비용이 최종 사용자에게 전가되는 포획 구조가 작동하고 있다. 네 겹의 분석이 수렴하는 지점은 동일하다. 불투명성은 단순한 UX 문제가 아니라 법적, 윤리적, 사회적, 경제적 차원을 관통하는 구조적 설계다.
우리에게 필요한 것은 멀티 AI 전략만이 아니다. 그것은 개인 수준의 대응이다. 구조 수준에서 필요한 것은 AI 서비스의 사용량 정책에 대한 투명성 기준이다. 잔여 토큰 실시간 표시, 사용량 소모 내역의 상세 로그, 한도 변경 시 사전 고지. 이것은 기술적으로 불가능한 요구가 아니다. 클라우드 컴퓨팅 업계에서 AWS, GCP, 애저(Azure)는 이미 수년 전부터 사용량 대시보드와 비용 알림을 제공하고 있다.
AI가 우리의 사유를 확장하는 도구라면 그 도구의 가격과 한도는 사유를 제약하는 장벽이 된다. 장벽의 높이를 결정하는 권한이 한 기업의 서버 운영팀에 있고, 그 결정의 근거가 사용자에게 공개되지 않는 구조. 이것이 2026년 AI 도구 시장의 완고한 사실(stubborn fact)이다.
그리고 완고한 사실은 해석의 편의를 위해 무시될 수 없다. 이 사실 위에서 우리가 할 수 있는 것은 두 가지다. 첫째, 도구에 종속되지 않는 사유의 습관을 유지하는 것. AI가 멈추면 나의 사유도 멈추는 상태는 도구적 전도의 완성이다. AI 없이도 생각할 수 있는 능력, AI의 한도에 도달했을 때 불안이 아니라 자기 사유의 시간으로 전환할 수 있는 유연함. 이것이 AI 시대의 지적 자립이다. 둘째, 도구를 만드는 자에게 투명성을 요구하는 것. 개인의 불만이 아니라, 디지털 서비스의 공정성 기준으로서의 요구. 솔직히 말하자. 우리는 둘 다 포기할 수 없다.