翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
強化ファインチューニングによる Amazon Nova モデルのファインチューニング
ファインチューニングする前に、Amazon Bedrock にはファインチューニングプロセスを作成および管理するための特定のアクセス許可が必要なため、前提条件があることを確認してください。セキュリティとアクセス許可の包括的な情報については、「」を参照してくださいAmazon Nova モデルのアクセスとセキュリティ。
Amazon Nova モデルの強化ファインチューニングを 5 つのステップで実行します。
-
トレーニングデータセットの提供 – 強化ファインチューニングトレーニングデータセットとして、必要な形式 (JSONL など) でプロンプトをアップロードします。詳細については、「Amazon Nova モデルのデータを準備する」を参照してください。
-
Configure Reward Function (grader) – 正確性、構造、トーン、またはその他の目標に基づいてモデルレスポンスをスコアリングするグレーダーを定義します。報酬関数は、Lambda を使用して目標スコアを計算するために実行できます。モデルを審査員として (コンソールを介して) 選択し、設定した基準と原則に基づいてレスポンスをランク付けすることもできます (コンソールはこれらを自動的に Lambda 関数に変換します)。詳細については、「Amazon Nova モデルの報酬関数の設定」を参照してください。
-
強化ファインチューニングジョブを送信する – ベースモデル、データセット、報酬関数、ハイパーパラメータなどのその他のオプション設定を指定して、強化ファインチューニングジョブを起動します。詳細については、「Amazon Nova モデルのファインチューニングジョブの作成と管理」を参照してください。
-
トレーニングのモニタリング – 完了するまでジョブのステータス、報酬メトリクス、トレーニングの進行状況を追跡します。詳細については、「RFT トレーニングジョブをモニタリングする」を参照してください。
-
ファインチューニングモデルを使用する – ジョブが完了したら、オンデマンド推論のためにワンクリックで結果の RFT モデルをデプロイします。一貫したパフォーマンスを必要とするミッションクリティカルなワークロードには、プロビジョンドスループットを使用することもできます。「カスタムモデルの推論を設定する」を参照してください。プレイグラウンドでテストを使用して、レスポンスを評価し、ベースモデルと比較します。
重要
Amazon Bedrock に最大 20K 個のプロンプトを提供して、モデルの微調整を強化できます。
サポートされている Nova モデル
次の表は、強化ファインチューニングでカスタマイズできる Amazon Nova モデルを示しています。
注記
オープンウェイトモデルなど、サポートされているその他のモデルについては、「」を参照してくださいOpenAI互換 APIs。
| プロバイダー | モデル | モデル ID | 単一リージョンモデルのサポート |
|---|---|---|---|
| Amazon | ノバ 2 ライト | amazon.nova-2-lite-v1:0:256k | us–east–1 |