이 글의 기술 정보는 2026년 4월 17일 기준으로 검증되었습니다. AI·LLM 분야는 변화가 빠르므로, 6개월 이상 경과 시 공식 문서를 재확인하세요.
이런 분이 읽으면 좋습니다
요약: Claude Opus 4.7이 2026년 4월 16일 정식 출시됐다. Task Budgets, 새 토크나이저, Adaptive Thinking 전환, /ultrareview 멀티 에이전트 코드 리뷰, 샘플링 파라미터 브레이킹 체인지, 에이전트 성능 향상 — 여섯 가지 핵심 변경사항을 개발자 관점에서 분석한다.
이 글은 Claude API를 프로덕션에서 사용하는 개발자, 에이전트 워크플로우를 설계하는 팀, Opus 4.6에서 4.7로 마이그레이션을 계획하는 엔지니어가 읽으면 좋다. 유출 분석이 아닌, 정식 출시 기준의 공식 변경사항을 다룬다.
핵심 변경사항 6가지 상세 분석
1. Task Budgets — 에이전트 루프의 토큰 예산 제어
Opus 4.7에서 가장 주목할 신규 기능이다. Task Budgets는 에이전트가 하나의 작업을 완료하기까지 소비할 수 있는 토큰의 대략적인 상한을 사전에 지정하는 메커니즘이다.
핵심 동작 방식:
- 사전 예산 설정: API 호출 시 전체 에이전트 루프에 대한 토큰 목표치를 지정한다
- 실시간 카운트다운: 모델이 남은 예산을 실시간으로 확인하면서 작업을 진행한다
- 자율적 조절: 예산이 줄어들면 모델이 스스로 탐색 범위를 좁히고 결론을 향해 수렴한다
이전에는 에이전트 루프의 토큰 소비를 외부에서 하드 컷으로 잘라야 했다. Task Budgets는 모델 자체가 예산을 인지하므로, 작업을 자연스럽게 마무리하면서도 비용을 통제할 수 있다.
2. 새 토크나이저 — 비용 추정 재검증 필수
Opus 4.7은 새로운 토크나이저를 사용한다. 동일한 텍스트를 처리할 때 기존 대비 1x에서 1.35x의 토큰을 소비한다. 즉, 최대 35% 더 많은 토큰이 필요할 수 있다.
영향 범위:
- 비용 추정: 기존 토큰 수 기반 비용 계산 로직이 부정확해진다
- 컨텍스트 윈도우 관리: 같은 텍스트가 더 많은 토큰을 차지하므로 컨텍스트 활용 효율이 달라진다
- Rate limit 계산: 분당 토큰 한도를 사용하는 경우 처리량이 줄어들 수 있다
3. Adaptive Thinking — Extended Thinking 완전 대체
이번 변경에서 가장 파급력이 큰 부분이다.
- Thinking 응답이 기본적으로 생략된다: 별도 설정 없이 호출하면 thinking content가 응답에 포함되지 않는다
- Extended Thinking 예산이 제거됐다: 기존의 thinking budget 파라미터는 더 이상 동작하지 않는다
- Adaptive Thinking이 유일한 사고 모드다: Extended Thinking을 켜는 대신, Adaptive Thinking을 활성화하면 모델이 문제 복잡도에 따라 사고 깊이를 자동으로 조절한다
Anthropic에 따르면 Adaptive Thinking은 Extended Thinking을 **안정적으로 능가(reliably outperform)**한다. 고정된 thinking budget를 할당하는 것보다, 모델이 필요에 따라 사고 깊이를 조절하는 것이 더 효율적이라는 판단이다.
기존에 Extended Thinking budget을 명시적으로 설정하던 코드는 모두 수정이 필요하다. Adaptive Thinking으로 전환하거나, thinking을 명시적으로 비활성화해야 한다.
4. 브레이킹 체인지 — 샘플링 파라미터 제한
temperature, top_p, top_k에 기본값이 아닌 값을 설정하면 400 에러가 반환된다.
이것은 경고가 아니라 즉각적인 에러다. 기존에 이 파라미터를 사용하던 모든 API 호출이 Opus 4.7로 전환하는 순간 실패한다.
조치 방법은 단순하다:
- API 호출에서 temperature, top_p, top_k 파라미터를 완전히 제거한다
- 기본값(예: temperature=1.0)을 명시적으로 설정하는 것도 피하라 — 파라미터 자체를 생략하는 것이 안전하다
5. 에이전트 성능 — 멀티스텝과 장기 추론의 질적 향상
Opus 4.7은 Opus 4.6(1M 토큰 컨텍스트 윈도우) 대비 증분적(incremental) 업그레이드이지만, 에이전트 실행의 안정성에서 유의미한 개선이 있다.
- 멀티스텝 태스크 성능 강화: 여러 단계에 걸친 작업에서 중간 단계의 실패율이 감소했다
- 에이전트 실행의 안정성 향상: 도구 의존적 워크플로우에서 도구 호출 순서와 결과 해석이 더 정확해졌다
- 장기 추론(long-horizon reasoning) 개선: 긴 맥락에 걸친 논리적 일관성이 향상됐다
이것은 벤치마크 숫자의 문제가 아니라, 실제 에이전트 파이프라인에서 “가끔 이상하게 동작하던” 케이스가 줄어드는 실질적 개선이다. 복잡한 도구 체인을 사용하는 에이전트일수록 체감 효과가 클 것이다.
6. /ultrareview — 멀티 에이전트 코드 리뷰
Opus 4.7과 함께 Claude Code에 /ultrareview 명령어가 추가됐다. 기존 /review와는 근본적으로 다른 접근이다.
기존 /review vs /ultrareview:
/review— 단일 에이전트가 diff를 한 번 읽고 코멘트를 남긴다. 3~4분 소요/ultrareview— 복수의 리뷰어 에이전트가 Anthropic 클라우드 인프라에서 병렬로 diff와 주변 코드를 분석한다. 11,000줄 PR 기준 약 17분 소요
동작 방식:
- 병렬 분석 — 여러 에이전트가 diff와 주변 코드를 동시에 분석한다. 각 에이전트는 다른 클래스의 이슈(보안, 로직 오류, 엣지 케이스, 설계 결함)에 집중한다
- 독립 검증 — 발견된 이슈를 실제 코드 동작에 대해 검증한다. “const를 쓰는 게 좋겠다” 수준의 스타일 제안은 필터링되고, 실제 버그나 설계 결함만 남긴다
- 중복 제거 + 심각도 정렬 — 여러 에이전트가 같은 이슈를 발견하면 중복을 합치고, 심각도 순으로 정렬한다
- 인라인 코멘트 — 결과가 문제가 있는 정확한 코드 라인에 인라인 코멘트로 표시된다
핵심 차별점: 단순 린트나 스타일 검사가 아니라, 시니어 리뷰어가 잡을 수 있는 수준의 미묘한 설계 결함과 로직 갭을 탐지하는 것이 목표다. Anthropic의 표현을 빌리면 “주의 깊은 리뷰어가 잡아낼 것들을 플래그한다(flags what a careful reviewer would catch).”
사용 제한:
- Pro, Max 플랜 사용자에게 3회 무료 체험 제공 (1회성, 월간 갱신 아님)
- 이후 유료 사용 (구체적 가격은 Anthropic 문서 참조)
마이그레이션 가이드: Opus 4.6에서 4.7로
전환 전 반드시 확인해야 할 체크리스트:
즉시 수정 (미수정 시 에러):
- API 호출에서 temperature, top_p, top_k 파라미터를 제거한다
- Extended Thinking budget 설정 코드를 제거하거나 Adaptive Thinking으로 교체한다
비용 영향 검증: 3. 새 토크나이저로 인한 토큰 증가량을 실제 워크로드로 측정한다 4. Task Budgets 도입 여부를 검토하고, 에이전트 루프의 비용 상한을 설정한다
성능 검증: 5. 핵심 프롬프트에 대한 eval set를 실행해 출력 품질 변화를 확인한다 6. 에이전트 워크플로우의 end-to-end 테스트를 수행한다
Opus 4.6 vs 4.7 비교
| Opus 4.6 | Opus 4.7 | |
|---|---|---|
| 토큰 예산 제어 | 외부 하드 컷만 가능 | Task Budgets로 모델이 예산을 인지하며 작업 |
| 토크나이저 | 기존 토크나이저 | 새 토크나이저 (1x~1.35x 토큰 증가) |
| Thinking 모드 | Extended Thinking (수동 budget 설정) | Adaptive Thinking (자동 조절, thinking 기본 생략) |
| 샘플링 파라미터 | temperature, top_p, top_k 사용 가능 | 기본값 외 설정 시 400 에러 |
| 멀티스텝 성능 | 기준선 | 유의미한 안정성 향상 |
| 장기 추론 | 기준선 | 장기 일관성 개선 |
| 컨텍스트 윈도우 | 1M 토큰 | 1M 토큰 (동일) |
| Claude Code 리뷰 | /review (단일 에이전트) | /review + /ultrareview (멀티 에이전트 병렬 검증) |
| 동반 출시 | -- | AI 디자인 도구 (웹사이트/프레젠테이션 생성) |
피해야 할 실수
다음에 읽을 글
- Claude Code 데스크톱 앱 리디자인: CLI에서 전환할 때와 말아야 할 때 — Opus 4.7과 동시에 출시된 도구 변화
- 하네스 엔지니어링: 프롬프트에서 런타임 제어까지 — 모델이 바뀌어도 유효한 에이전트 설계 원칙
- 프로덕션 AI 서비스의 프롬프트 버전 관리 — 모델 전환 시 프롬프트 회귀를 막는 방법