強化ファインチューニングによる Amazon Nova モデルのファインチューニング

ファインチューニングする前に、Amazon Bedrock にはファインチューニングプロセスを作成および管理するための特定のアクセス許可が必要なため、前提条件があることを確認してください。セキュリティとアクセス許可の包括的な情報については、「」を参照してくださいAmazon Nova モデルのアクセスとセキュリティ。

Amazon Nova モデルの強化ファインチューニングを 5 つのステップで実行します。

トレーニングデータセットの提供 – 強化ファインチューニングトレーニングデータセットとして、必要な形式 (JSONL など) でプロンプトをアップロードします。詳細については、「Amazon Nova モデルのデータを準備する」を参照してください。
報酬関数 (グレーダー) の設定 – 正確性、構造、トーン、またはその他の目標に基づいてモデルレスポンスをスコアリングするグレーダーを定義します。報酬関数は、Lambda を使用して目標スコアを計算するために実行できます。モデルを審査員として (コンソールを介して) 選択し、設定した基準と原則に基づいてレスポンスをランク付けすることもできます (コンソールはこれらを自動的に Lambda 関数に変換します）。詳細については、「Amazon Nova モデルの報酬関数の設定」を参照してください。
強化ファインチューニングジョブを送信する – ベースモデル、データセット、報酬関数、ハイパーパラメータなどのその他のオプション設定を指定して、強化ファインチューニングジョブを起動します。詳細については、「Amazon Nova モデルのファインチューニングジョブの作成と管理」を参照してください。
トレーニングのモニタリング – 完了するまでジョブのステータス、報酬メトリクス、トレーニングの進行状況を追跡します。詳細については、「RFT トレーニングジョブをモニタリングする」を参照してください。
ファインチューニングモデルを使用する – ジョブが完了したら、オンデマンド推論のためにワンクリックで結果の RFT モデルをデプロイします。一貫したパフォーマンスを必要とするミッションクリティカルなワークロードには、プロビジョンドスループットを使用することもできます。「カスタムモデルの推論を設定する」を参照してください。プレイグラウンドでテストを使用して、レスポンスを評価し、ベースモデルと比較します。

重要

Amazon Bedrock に最大 20K 個のプロンプトを提供して、モデルの微調整を強化できます。

サポートされている Nova モデル

次の表は、強化ファインチューニングでカスタマイズできる Amazon Nova モデルを示しています。

注記

オープンウェイトモデルなど、サポートされているその他のモデルについては、「」を参照してくださいOpenAI互換 APIs。

強化ファインチューニングでサポートされているモデル
プロバイダー	モデル	モデル ID	単一リージョンモデルのサポート
Amazon	Nova 2 Lite	amazon.nova-2-lite-v1:0:256k	us-east-1

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

強化ファインチューニング

アクセスとセキュリティ