翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
アダプティブシンキング
アダプティブシンキングは、 を 4.6 Claude Opus 拡張思考で使用するための推奨方法です。アダプティブシンキングでは、シンキングトークンの予算を手動で設定する代わりに、各リクエストの複雑さに基づいて、いつ、どの程度考えるかをClaude動的に決定できます。アダプティブシンキングはbudget_tokens、固定 を使用した拡張シンキングよりも確実にパフォーマンスを向上させます。4.6 Claude Opus から最もインテリジェントなレスポンスを得るために、アダプティブシンキングに移行することをお勧めします。ベータヘッダーは必要ありません。
サポートされているモデルは次のとおりです。
| モデル | モデル ID |
|---|---|
Claude Opus 4.7 |
|
Claude Mythos プレビュー |
|
Claude Opus 4.6 |
|
Claude Sonnet 4.6 |
|
注記
Claude Opus 4.7 と Claude Mythos Preview は適応的思考のみをサポートします。手動拡張思考 (thinking.type: "enabled" と budget_tokens) は、これらのモデルではサポートされておらず、400 エラーを返します。
thinking.type: "enabled" および budget_tokensは 4Claude Opus.6 および Claude Sonnet 4.6 で非推奨となり、今後のモデルリリースで削除されます。代わりに、エフォートパラメータthinking.type: "adaptive"で を使用します。
古いモデル (Claude Sonnet 4.5、4.5 など) Claude Opus は適応的思考をサポートしておらず、 thinking.type: "enabled"で が必要ですbudget_tokens。
適応的思考の仕組み
アダプティブモードでは、 は各リクエストの複雑さClaudeを評価し、考えるかどうか、どの程度考えるかを決定します。デフォルトのエフォートレベル (high) では、 Claudeはほとんど常に考えます。労力レベルが低い場合、 Claudeはより単純な問題に対する思考をスキップする可能性があります。
アダプティブシンキングでは、 も自動的に有効になりますインターリーブ思考 (ベータ版)。つまり、 Claudeはツール呼び出し間で考えることができるため、エージェントワークフローに特に効果的です。
API リクエスト"adaptive"で thinking.typeを に設定します。
エフォートパラメータを使用した適応的思考
適応的思考と労力パラメータを組み合わせて、思考の量を導くことができますClaude。労力レベルは、 Claudeの思考割り当てのソフトガイダンスとして機能します。
| 労力レベル | 思考動作 |
|---|---|
max |
Claude は常に思考深度に制約を課さずに思考します。 Claude Opus 4.6 のみ — 他のモデルmaxで を使用するリクエストはエラーを返します。 |
high (デフォルト) |
Claude は常に考えます。複雑なタスクに関する深い推論を提供します。 |
medium |
Claude は中程度の思考を使用します。非常に単純なクエリの思考をスキップすることがあります。 |
low |
Claude は思考を最小限に抑えます。速度が最も重要である単純なタスクの思考をスキップします。 |
重要
effort パラメータは、output_configオブジェクト内ではなく、リクエスト本文内の別のthinkingオブジェクト内に配置する必要があります。effort 内部に配置するとthinking、 になりますValidationException。
次の例は、InvokeModel API を使用するときに労力レベルを設定する方法を示しています。
{ "anthropic_version": "bedrock-2023-05-31", "max_tokens": 16000, "thinking": { "type": "adaptive" }, "output_config": { "effort": "high" }, "messages": [{ "role": "user", "content": "Your prompt here" }] }
Converse API での適応的思考の使用
Converse API を使用する場合は、 thinking および effortパラメータを 内に渡しますadditionalModelRequestFields。次の例は、デフォルトの労力レベルでの適応的思考を示しています。
import boto3, json bedrock_runtime = boto3.client(service_name='bedrock-runtime', region_name='us-east-2') response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "Explain why the sum of two even numbers is always even."}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive" } } ) print(json.dumps(response["output"], indent=2, default=str))
エフォートレベルを指定するには、 の別のoutput_configオブジェクト内に effortフィールドを追加しますadditionalModelRequestFields。
response = bedrock_runtime.converse( modelId="us.anthropic.claude-opus-4-6-v1", messages=[{ "role": "user", "content": [{"text": "What is 2 + 2?"}] }], additionalModelRequestFields={ "thinking": { "type": "adaptive" }, "output_config": { "effort": "low" } } )
プロンプトキャッシュ
adaptive 思考を使用した連続リクエストは、プロンプトキャッシュのブレークポイントを保持します。ただし、 adaptiveと enabled/disabled 思考モードを切り替えると、メッセージのキャッシュブレークポイントが壊れます。システムプロンプトとツール定義は、モードの変更に関係なくキャッシュされたままになります。
思考動作の調整
Claude が目的よりも頻繁に考えている場合は、システムプロンプトにガイダンスを追加できます。
Extended thinking adds latency and should only be used when it will meaningfully improve answer quality — typically for problems that require multi-step reasoning. When in doubt, respond directly.
警告
より少ない頻度で考えるClaudeようにステアリングすると、推論の恩恵を受けるタスクの品質が低下する可能性があります。プロンプトベースのチューニングを本番環境にデプロイする前に、特定のワークロードへの影響を測定します。まず、労力レベルを低くしてテストすることを検討してください。