翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Claude 3 Haiku
Anthropic — Claude 3 Haiku
モデルの詳細
Claude 3 Haiku は、Anthropic で最も高速でコンパクトな Claude 3 モデルであり、ほぼ瞬時に応答する速度と効率のために最適化されています。モデルの開発とパフォーマンスの詳細については、モデル/サービスカード
モデル開始日: 2024 年 3 月 13 日
モデル終了日: 3/14/2025 より前
エンドユーザーライセンス契約と利用規約: 表示
モデルライフサイクル: アクティブ
コンテキストウィンドウ: 200K トークン
最大出力トークン: 4K
ナレッジカットオフ: 2023 年 8 月
| 入力モダリティ | 出力モダリティ | サポートされている APIs | サポートされているエンドポイント |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
料金
料金については、Amazon Bedrock の料金
プログラムによるアクセス
次のモデル IDs とエンドポイント URLsを使用して、このモデルにプログラムでアクセスします。使用可能な APIs「サポートされている APIs」と「サポートされているエンドポイント」を参照してください。
| Endpoint | モデル ID | リージョン内エンドポイント URL | 地理推論 ID | グローバル推論 ID |
|---|---|---|---|---|
bedrock-runtime |
anthropic.claude-3-haiku-20240307-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
|
サポートされていません |
たとえば、region が us-east-1 (バージニア北部) の場合、bedrock-runtime エンドポイント URL は「https://bedrock-runtime.us-east-1.amazonaws.com」になり、bedrock-mantle の URL は「https://bedrock-mantle.us-east-1.api.aws/v1」になります。
サービス階層
Amazon Bedrock は、ワークロードの要件に合わせて複数のサービス層を提供します。Standard はpay-per-tokenアクセスを提供します。Priority は、時間ベースのコミットメントでより高いスループットを提供します。Flex は、柔軟でnon-time-sensitiveワークロードに低コストのアクセスを提供します。リザーブドは、予測可能なワークロードに対するコミットメントという用語で、専用のスループットを提供します。詳細については、「 サービス層」を参照してください。
| スタンダード | 優先度 | Flex | 予約済み |
|---|---|---|---|
リージョン別の利用可能性
リージョンの可用性の概要
Bedrock には 3 つの推論オプションがあります。In-Region は厳格なコンプライアンスのために 1 つのリージョン内にリクエストを保持し、Geo Cross-Region ルートは 1 つのリージョン (米国、欧州など) 内にまたがり、データレジデンシーを尊重しながらスループットを向上させます。Global Cross-Region ルートは、レジデンシーの制約がない場合に、世界中のどこでも最大スループットを実現します。詳細については、リージョナルな可用性「」ページを参照してください。
| リージョン | リージョン内 | 地域 | グローバル |
|---|---|---|---|
us-east-1 (バージニア北部) | |||
us-east-2 (オハイオ) | |||
us-west-2 (オレゴン) | |||
us-gov-east-1 (GovCloud) | |||
us-gov-west-1 (GovCloud) | |||
ca-central-1 (カナダ) | |||
eu-central-1 (フランクフルト) | |||
eu-central-2 (チューリッヒ) | |||
eu-west-1 (アイルランド) | |||
eu-west-2 (ロンドン) | |||
eu-west-3 (パリ) | |||
ap-northeast-1 (東京) | |||
ap-northeast-2 (ソウル) | |||
ap-south-1 (ムンバイ) | |||
ap-southeast-1 (シンガポール) | |||
ap-southeast-2 (シドニー) | |||
sa-east-1 (サンパウロ) |
地理推論の詳細
地域: 米国
地理推論 ID: us.anthropic.claude-3-haiku-20240307-v1:0
| ソースリージョン | 送信先リージョン |
|---|---|
| us-east-1 (バージニア北部) | us-east-1 (バージニア北部)、us-west-2 (オレゴン) |
| us-east-2 (オハイオ) | us-east-1 (バージニア北部)、us-east-2 (オハイオ)、us-west-2 (オレゴン) |
| us-west-2 (オレゴン) | us-east-1 (バージニア北部)、us-west-2 (オレゴン) |
| us-gov-east-1 (AWS GovCloud (米国東部)) | us-gov-east-1 (AWS GovCloud (米国東部))、us-gov-west-1 (AWS GovCloud (米国西部)) |
地域: EU
地理推論 ID: eu.anthropic.claude-3-haiku-20240307-v1:0
| ソースリージョン | 送信先リージョン |
|---|---|
| eu-central-1 (フランクフルト) | eu-central-1 (フランクフルト)、eu-west-1 (アイルランド)、eu-west-3 (パリ) |
| eu-west-1 (アイルランド) | eu-central-1 (フランクフルト)、eu-west-1 (アイルランド)、eu-west-3 (パリ) |
| eu-west-3 (パリ) | eu-central-1 (フランクフルト)、eu-west-1 (アイルランド)、eu-west-3 (パリ) |
クォータと制限
AWS アカウントには、サービスのパフォーマンスを維持し、Amazon Bedrock の適切な使用を確保するためのデフォルトのクォータがあります。アカウントに割り当てられたデフォルトのクォータは、リージョンの要因、支払い履歴、不正使用、および/またはクォータ引き上げリクエストの承認に応じて更新される場合があります。詳細については、 Amazon Bedrock のクォータドキュメントを参照し、モデルの制限を参照してください。
サンプルコード
ステップ 1 - AWS アカウント: AWS アカウントがすでにある場合は、このステップをスキップします。AWS を初めて使用する場合は、AWS アカウントに
ステップ 2 - API キー: Amazon Bedrock コンソール
ステップ 3 - SDK を取得する: この入門ガイドを使用するには、Python がすでにインストールされている必要があります。次に、使用している APIs に応じて、関連するソフトウェアをインストールします。
pip install boto3
ステップ 4 - 環境変数を設定する: API キーを認証に使用するように環境を設定します。
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
ステップ 5 - 最初の推論リクエストを実行する: ファイルを として保存する bedrock-first-request.py