앤트로픽이 뒤에 감춘 말: 성능은 좋아졌는데 돈은 더 들거야
앤트로픽은 클로드 오퍼스 4.7을 내놓으며 성능 향상을 길게 강조했다. 더 정교한 코딩, 더 나은 비전, 더 높은 신뢰성이 핵심 메시지였다. 그러나 발표문 뒤쪽에는 같은 입력도 더 많은 토큰으로 계산될 수 있고, 높은 effort에서는 출력 토큰도 늘 수 있다는 문장이 붙어 있었다. 결국 이번 발표는 성능 개선의 약속이면서 동시에 비용 불확실성의 고지이기도 했다.
레이 | 디지털 저널리스트 | awesome.ai.life@gmail.com | 2026년 4월 17일
클로드 오퍼스 4.7 발표문에서 먼저 보이는 것
앤트로픽이 클로드 오퍼스 4.7을 발표했다고 공지를 띄웠다. 아이고 이것봐라, 얼마나 좋아졌을까 하는 내 마음은 보도자료를 읽어내려가면서 점점 더 차가워졌다. 계속해서 이용량 시비를 일으키는 앤트로픽, 그것도 자기들 내부에서 그런 게 한 거라고 아주 자랑스럽게 말하던 앤트로픽이 이제는 아예 대놓고 돈 더 내라고 말하는 것이다.
앤트로픽(Anthropic)의 클로드 오퍼스(Claude Opus) 4.7 발표문은 익숙한 테크 기업 문법으로 시작한다. 더 좋아졌다, 더 정확해졌다, 더 오래 버틴다, 더 어려운 코딩을 맡길 수 있다. 자랑 투성이다. 실제로 회사는 Opus 4.7이 Opus 4.6의 직접 업그레이드이고 고급 소프트웨어 엔지니어링과 장시간 작업, 고해상도 비전 처리에서 개선됐다고 설명한다. 가격표도 겉으로는 그대로다. 입력 100만 토큰 5달러, 출력 100만 토큰 25달러. 표면만 보면 “같은 가격에 더 좋은 모델”처럼 읽힌다.
그런데 이런 발표문은 늘 앞부분보다 뒷부분을 꼼꼼히 읽어야 한다. 진짜 운영비 이야기는 보통 성능 자랑 뒤에 나온다. 이번에도 마찬가지다. 앤트로픽은 Opus 4.7이 Opus 4.6의 직접 업그레이드라고 말한 직후, 토큰 사용량에 영향을 주는 두 가지 변화가 있으니 대비하라고 적었다. 번역하면 이 말이다. 성능은 좋아졌지만, 당신이 실제로 내는 비용 체감은 그만큼 단순하지 않을 수 있다는 뜻이다.
토크나이저 개선이라는 말이 왜 비용 경고가 되는가
첫 번째는 토크나이저(tokenizer) 다. 회사 설명은 점잖다. 텍스트 처리 방식을 개선한 업데이트된 토크나이저를 쓴다고 한다. 문제는 그 다음 문장이다. 같은 입력이 더 많은 토큰으로 매핑될 수 있고, 콘텐트 유형에 따라 대략 1.0배에서 1.35배까지 늘 수 있다는 것이다. 기술 설명처럼 보이지만 실무자 언어로 바꾸면 아주 단순하다. “같은 문서를 넣어도 예전보다 토큰이 더 많이 들 수 있습니다.” 결국 입력 단가가 같아도 입력량이 더 크게 계산될 수 있다는 얘기다.
여기서 묘한 감정이 생긴다. 발표문은 앞에서 개선이라는 말을 쓰고 뒤에서 청구 가능성의 확대를 설명한다. 물론 이건 거짓말이 아니다. 토크나이저가 바뀌면 성능도 달라질 수 있고, 토큰 계산량도 달라질 수 있다. 다만 이용자가 듣는 체감은 다르다. 앤트로픽은 “텍스트 처리가 좋아졌다”고 말하면서 뒤로는 작게 “그럼 같은 입력에도 비용이 늘 수 있을거야” 하고 소곤댄다.
더 많이 생각한다는 말의 다른 이름
두 번째는 더 노골적이다. 앤트로픽은 Opus 4.7이 높은 effort 수준에서, 특히 에이전트형 환경의 후속 턴에서 더 많이 생각한다고 설명한다. 그리고 그 결과 더 많은 출력 토큰을 만들 수 있다고 썼다. 이건 사실상 돌려 말한 비용 공지다. 모델이 더 오래 검토하고 더 깊게 추론하면, 더 안정적일 수는 있다. 하지만 그 안정성은 대개 더 많이 출력하고 더 길게 실행한다. 다시 말해 “더 많이 생각한다”는 문장은 API 사용자의 귀에는 “더 많이 청구될 수 있다”로 들린다.
이 대목이 특히 웃긴 이유는 문장의 포장과 실질이 너무 다르기 때문이다. 발표문은 이것을 신뢰성 향상으로 말한다. 틀린 말은 아니다. 실제로 앤트로픽은 코딩, 장기 작업, 문서 추론, 비전 처리에서 개선을 주장하고 여러 초기 테스트 평가와 이용자 피드백도 길게 붙였다. 하지만 그 찬란한 칭찬의 행렬 뒤에 붙는 문장은 늘 이렇다. 네, 더 잘합니다. 그런데 더 오래 생각할 수도 있고, 그러면 더 많은 토큰을 씁니다. 그러니 감동은 하시되 예산은 따로 보시죠.
결국 발표문이 말하는 진짜 문장
앤트로픽은 사용자가 비용을 통제할 방법도 적어뒀다. effort 파라미터를 조정하고, task budgets를 설정하고, 더 간결하게 답하라고 프롬프트하라는 것이다. 이것도 다 맞는 말이다. 하지만 읽는 사람 입장에서는 은근히 씁쓸하다. 모델은 우리가 더 세게 만들어놨고 성능은 좋아졌다고 자랑하되 운영비 통제는 당신이 더 영리하게 하라는 얘기로 들리기 때문이다.
더 흥미로운 문장은 그 다음이다. 앤트로픽은 내부 테스트에서는 전반적으로 긍정적이었고, 내부 코딩 평가에서는 모든 effort 수준에서 토큰 사용 대비 성능이 개선됐다고 말한다. 그런데 바로 이어서, 실제 트래픽에서 차이를 직접 측정해보기를 권장한다고 적는다. 이 문장 하나로 발표문의 성격이 선명해진다. 요약하면 이렇다. “우리 실험실에서는 좋았습니다. 그런데 당신 서비스에서 얼마가 나올지는 직접 재보세요.” 테크 기업 특유의 문장이다. 자랑은 확신에 차 있지만, 보증은 언제나 사용자 쪽으로 미뤄진다.
그래서 화가 나는 이유
화가 나는 지점은 성능 향상 자체가 아니다. 더 나은 모델을 만드는 건 기업의 일이다. 문제는 말의 배치다. 발표문은 먼저 미래를 판다. 더 똑똑해졌고 더 잘 보고 더 길게 버티고, 더 믿을 만하다고 말한다. 그리고 나서 뒤쪽에 가서야 말한다. 아, 그런데 토큰은 더 늘 수 있고, 실제 비용은 환경마다 다를 수 있으니 각자 재보시라고. 이 순서가 사람을 짜증나게 만든다. 중요한 리스크를 숨겼다고 말하기는 어렵지만, 적어도 앞세우지는 않았다. 읽는 사람에게 필요한 문장은 언제나 뒤에 있다.
그래서 이 발표문을 독하게 한 줄로 줄이면 이렇게 된다. 한참 동안 “우리 모델 정말 잘났습니다”를 펼쳐놓고, 마지막에 조용히 덧붙인다. “그런데 같은 입력도 더 비싸게 셀 수 있고, 더 많이 생각하면 더 많이 청구될 수 있습니다. 내부에서는 괜찮았지만, 당신 비용은 당신이 직접 확인하세요.” 틀린 요약은 아니다. 다만 원문보다 훨씬 솔직할 뿐이다. / raylogue
FAQ
Q1. 클로드 오퍼스 4.7은 왜 더 비싸질 수 있나?
Opus 4.7은 가격표 자체는 Opus 4.6과 같지만 같은 입력도 더 많은 토큰으로 계산될 수 있다고 밝혔다. 여기에 높은 effort 설정에서는 출력 토큰까지 늘 수 있어 실제 비용은 올라갈 수 있다.
Q2. 토크나이저가 바뀌었다는 말은 무슨 뜻인가?
토크나이저는 문장을 AI가 계산 가능한 조각, 즉 토큰으로 나누는 방식이다. 이 규칙이 바뀌면 같은 문장도 예전보다 더 많은 토큰으로 잡힐 수 있고, 그만큼 입력 비용에도 영향을 줄 수 있다.
Q3. effort가 높아지면 왜 출력 토큰이 늘어나나?
effort는 모델이 얼마나 깊게 추론하고 검토할지를 정하는 설정에 가깝다. 높게 둘수록 더 꼼꼼하게 생각하고 더 긴 결과를 내놓을 가능성이 커져 출력 토큰도 함께 늘어난다.
Q4. 앤트로픽은 Opus 4.7의 비용 증가를 인정했나?
직접적으로 “비용이 오른다”고 단정하지는 않았다. 다만 같은 입력이 더 많은 토큰으로 매핑될 수 있고, 높은 effort에서는 더 많은 출력 토큰이 생길 수 있다고 밝혔으며, 실제 트래픽에서 직접 차이를 측정해보라고 권고했다.
Q5. 기업이나 개발자는 Opus 4.7을 어떻게 테스트해야 하나?
기존 Opus 4.6 워크로드를 기준으로 입력 토큰, 출력 토큰, 평균 응답 길이, effort 수준별 비용 차이를 직접 비교해야 한다. 내부 벤치마크보다 실제 서비스 로그와 트래픽 기준으로 검증하는 것이 훨씬 중요하다.