기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
적응형 사고
적응형 사고는 Claude Opus 4.6과 확장된 사고 함께 사용하는 권장 방법입니다. 사고 토큰 예산을 수동으로 설정하는 대신 적응형 사고를 통해 각 요청의 복잡성에 따라 언제 얼마나 많이 생각할지 Claude 동적으로 결정할 수 있습니다. 적응형 사고는 고정된를 사용하여 확장형 사고보다 더 나은 성능을 안정적으로 구동budget_tokens하므로 적응형 사고로 이동하여 Claude Opus 4.6에서 가장 지능적인 응답을 얻는 것이 좋습니다. 베타 헤더는 필요하지 않습니다.
지원되는 모델은 다음과 같습니다.
| 모델 | 모델 ID |
|---|---|
Claude Opus 4.6 |
|
Claude Sonnet 4.6 |
|
참고
thinking.type: "enabled" 및 budget_tokens는 Claude Opus 4.6에서 더 이상 사용되지 않으며 향후 모델 릴리스에서 제거될 예정입니다. 대신 노력 파라미터와 thinking.type: "adaptive" 함께를 사용합니다.
이전 모델(Claude Sonnet 4.5, Claude Opus 4.5 등)은 적응형 사고를 지원하지 않으며 thinking.type: "enabled"를 사용해야 합니다budget_tokens.
적응형 사고의 작동 방식
적응형 모드에서는 각 요청의 복잡성을 Claude 평가하고 생각할지 여부와 정도를 결정합니다. 기본 작업 수준(high)에서는 Claude가 거의 항상 생각하게 됩니다. 낮은 노력 수준에서 Claude는 더 간단한 문제에 대한 생각을 건너뛸 수 있습니다.
적응형 사고는 도 자동으로 활성화합니다인터리브 사고(베타). 즉, 도구 호출 간에 생각할 Claude 수 있으므로 에이전트 워크플로에 특히 효과적입니다.
API 요청"adaptive"에서를 thinking.type로 설정합니다.
노력 파라미터를 사용한 적응형 사고
적응형 사고와 노력 파라미터를 결합하여 사고의 정도를 안내할 수 Claude 있습니다. 노력 수준은 Claude의 사고 할당에 대한 소프트 지침 역할을 합니다.
| 작업 수준 | 사고 동작 |
|---|---|
max |
Claude는 항상 사고 깊이에 제약 없이 사고합니다. Claude Opus 4.6 전용 - 다른 모델에서 max를 사용하는 요청은 오류를 반환합니다. |
high(기본값) |
Claude는 항상 생각합니다. 복잡한 작업에 대한 심층 추론을 제공합니다. |
medium |
Claude는 중간 정도의 사고를 사용합니다. 매우 간단한 쿼리에 대한 생각은 건너뛸 수 있습니다. |
low |
Claude는 사고를 최소화합니다. 속도가 가장 중요한 간단한 작업에 대한 생각은 건너뜁니다. |
프롬프트 캐싱
adaptive 사고를 사용한 연속 요청은 프롬프트 캐시 중단점을 보존합니다. 그러나 adaptive 및 enabled/disabled 사고 모드 간에 전환하면 메시지에 대한 캐시 중단점이 끊어집니다. 시스템 프롬프트와 도구 정의는 모드 변경과 관계없이 캐시된 상태로 유지됩니다.
사고 동작 튜닝
Claude가 원하는 것보다 더 자주 생각하거나 덜 자주 생각하면 시스템 프롬프트에 지침을 추가할 수 있습니다.
Extended thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multi-step reasoning. When in doubt, respond directly.
주의
사고 빈도를 줄Claude이도록 조정하면 추론의 이점을 얻는 작업의 품질이 저하될 수 있습니다. 프롬프트 기반 튜닝을 프로덕션에 배포하기 전에 특정 워크로드에 미치는 영향을 측정합니다. 먼저 낮은 노력 수준으로 테스트하는 것이 좋습니다.