サポートされているリージョンとエンドポイント前提条件モデル API レスポンス API

Responses API を使用した推論

Amazon Bedrock は、大規模な機械学習モデル提供用の分散推論エンジンである Mantle を搭載した bedrock-mantleエンドポイントを介して OpenAI Responses API を提供します。このエンドポイントを使用すると、Amazon Bedrock モデルで使い慣れた OpenAI SDK とツールを使用できるため、最小限のコード変更で既存のアプリケーションを移行できます。基本 URL と API キーを更新するだけです。 SDKs

重要

Amazon Bedrock で OpenAI SDK を使用する場合は、エンドポイントではなく Amazon Bedrock OpenAIエンドポイントを指す必要があります。次の環境変数を設定します。


OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
OPENAI_API_KEY="<your Bedrock API key>"

OpenAI API キーまたはOpenAIベース URL () を使用しないでくださいhttps://api.openai.com/v1。これらは Amazon Bedrock ではなく OpenAIに直接接続します。Amazon Bedrock API キーを作成するには、「」を参照してくださいAPI キー。

主な利点は次のとおりです:

非同期推論 — Responses API による長時間実行される推論ワークロードのサポート
ステートフル会話管理 – 各リクエストで会話履歴を手動で渡すことなく、コンテキストを自動的に再構築します。
ツールの使用の簡素化 – エージェントワークフローの統合の合理化
柔軟なレスポンスモード – ストリーミングレスポンスと非ストリーミングレスポンスの両方のサポート
簡単な移行 – 既存の OpenAI SDK コードベースと互換性があります

bedrock-mantle エンドポイントへの推論トラフィックは、bedrock-runtimeエンドポイントとは別のクォータのセットによって管理されます。入出力トークンのクォータと引き上げをリクエストする方法の詳細については、「」を参照してくださいbedrock-mantle エンドポイントのクォータ。

サポートされているリージョンとエンドポイント

bedrock-mantle エンドポイントは、次のAWSリージョンで使用できます。

リージョン名	リージョン	エンドポイント
米国東部 (オハイオ)	us-east-2	bedrock-mantle.us-east-2.api.aws
米国東部 (バージニア北部)	us-east-1	bedrock-mantle.us-east-1.api.aws
米国西部 (オレゴン)	us-west-2	bedrock-mantle.us-west-2.api.aws
アジアパシフィック (ジャカルタ)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
アジアパシフィック (ムンバイ)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
アジアパシフィック (シドニー)	ap-southeast-2	bedrock-mantle.ap-southeast-2.api.aws
アジアパシフィック (東京)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
欧州 (フランクフルト)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
欧州 (アイルランド)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
欧州 (ロンドン)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
欧州 (ミラノ)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
欧州 (ストックホルム)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
南米 (サンパウロ）	sa-east-1	bedrock-mantle.sa-east-1.api.aws
AWS GovCloud (米国西部)	us-gov-west-1	bedrock-mantle.us-gov-west-1.api.aws

前提条件

OpenAI APIs を使用する前に、以下があることを確認してください。

認証 – 以下を使用して認証できます。
- Amazon Bedrock API キー ( OpenAI SDK に必要)
- AWS認証情報 (HTTP リクエストでサポート)
OpenAI SDK (オプション) – SDK OpenAI ベースのリクエストを使用している場合は、Python SDK をインストールします。
環境変数 – 次の環境変数を設定します。
- OPENAI_API_KEY – Amazon Bedrock API キーに設定する
- OPENAI_BASE_URL – リージョンの Amazon Bedrock エンドポイントに設定します (例: https://bedrock-mantle.us-east-1.api.aws/v1)

モデル API

Models API を使用すると、Mantle を搭載した Amazon Bedrock で利用可能なモデルを検出できます。この API を使用して、 Responses API で使用できるモデルのリストを取得します。API の詳細については、OpenAI「 Models ドキュメント」を参照してください。

使用可能なモデルを一覧表示する

使用可能なモデルを一覧表示するには、任意の方法のタブを選択し、ステップに従います。

レスポンス API

Responses API は、ストリーミング、バックグラウンド処理、マルチターンインタラクションをサポートするステートフルな会話管理を提供します。API の詳細については、OpenAIレスポンスドキュメントを参照してください。

注記

すべてのモデルが Responses API をサポートしているわけではありません。Responses API をサポートするモデルを確認するには、「」を参照してくださいモデルによる API の互換性。

Responses API が会話状態を保存する方法

Responses API は、保存状態を使用してマルチターン会話を有効にし、 previous_response_idパラメータで以前のターンを参照できます。ストレージはデフォルトで有効になっていますが、 storeパラメータを使用してリクエストごとに無効にできます。保存されたレスポンスはプロジェクトによってスコープされます。1 つのプロジェクトからのレスポンスを前のレスポンスとして使用したり、2 番目のプロジェクトで読み取ったりすることはできません。プロジェクトの詳細については、「」を参照してくださいプロジェクト (OpenAI 互換)。

store が true (デフォルト) の場合、Amazon Bedrock は入力と出力を含むレスポンスをリクエストの送信元リージョンで 30 日間保持します。このウィンドウでは、で応答を渡previous_response_idして取得することで、フォローアップリクエストを連鎖できますGET /v1/responses/{id}。30 日後、レスポンスは自動的に削除され、取得できなくなります。
store がの場合false、Amazon Bedrock はリクエストまたはレスポンスのデータを保持しません。previous_response_id パラメータを使用して会話を続行することはできません。

デフォルト値は true OpenAIResponses API 仕様と一致します。Amazon Bedrock が会話データを保持することを望まないお客様は、すべてのリクエストfalseで明示的に store をに設定する必要があります。保存されたデータは、リクエストの送信元リージョンに保持され、保管時に暗号化され、呼び出し元のAWSアカウントのプロジェクトリソースにスコープされます。データはリクエストを処理するためにのみ保存され、他の目的で使用または保持されることはありません。

基本リクエスト

レスポンスを作成するには、任意の方法のタブを選択し、ステップに従います。

ストリームレスポンス

レスポンスイベントを段階的に受信するには、任意の方法のタブを選択し、ステップに従います。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

推論リクエストの実行

チャット完了 API