

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Feature Store のストレージ設定
<a name="feature-store-storage-configurations"></a>

Amazon SageMaker Feature Store は、オンラインストアとオフラインストアで構成されています。オンラインストアでは推論用の特徴量をリアルタイムで検索でき、オフラインストアにはモデルトレーニングとバッチ推論用の履歴データが含まれます。特徴量グループを作成する場合、オンラインストア、オフラインストア、あるいはその両方を有効にするかどうかを選択できます。両方を有効にすると、トレーニングデータと配信データの不一致を避けるために同期されます。オンラインストアとオフラインストア、およびその他の特徴量ストアの概念の詳細については、「[Feature Store の概念](feature-store-concepts.md)」を参照してください。

以下のトピックでは、オンラインストアストレージタイプとオフラインストアテーブル形式について説明します。

**Topics**
+ [オンラインストア](feature-store-storage-configurations-online-store.md)
+ [オフラインストア](feature-store-storage-configurations-offline-store.md)
+ [スループットモード](feature-store-throughput-mode.md)

# オンラインストア
<a name="feature-store-storage-configurations-online-store"></a>

オンラインストアは、特徴量をリアルタイムで検索できる、低遅延で可用性の高いデータストアです。通常、機械学習 (ML) モデルの提供に使用されます。特徴量グループを作成する際には、標準のオンラインストア (`Standard`) またはインメモリ階層のオンラインストア (`InMemory`) を選択できます。この方法で、パフォーマンスとコストを考慮しながら、特定のアプリケーションの読み取り/書き込みパターンに最も適したストレージタイプを選択できます。料金の詳細については、「[Amazon SageMaker の料金](https://aws.amazon.com/sagemaker/pricing/)」を参照してください。

オンラインストアには以下の `StorageType` のオプションがあります。オンラインストアのコンテンツの詳細については、「[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html)」を参照してください。

## 標準階層のストレージタイプ
<a name="feature-store-storage-configurations-online-store-standard-tier"></a>

`Standard` 階層は、オンラインストア特徴量グループ向けの低遅延マネージドデータストアです。アプリケーションの ML モデルサービスのデータを高速で取得できます。`Standard` はデフォルトのストレージタイプです。

## インメモリ階層ストレージタイプ
<a name="feature-store-storage-configurations-online-store-in-memory-tier"></a>

`InMemory` 階層は、非常に低遅延の取得をサポートするオンラインストア特徴量グループ向けのマネージドデータストアです。高スループットのアプリケーションに使用される ML モデルサービス用に、大規模なリアルタイムのデータ取得を可能にします。`InMemory` 階層は Amazon ElastiCache (Redis OSS) を基盤としています。詳細については「[Amazon ElastiCache (Redis OSS) とは](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/WhatIs.html)」を参照してください)。

オンラインストア `InMemory` 層は、リスト、セット、ベクターなどのコレクションタイプをサポートします。`InMemory` コレクションタイプの詳細については、「[コレクション型](feature-store-collection-types.md)」を参照してください。

Feature Store では、オンラインストアに対する読み取りと書き込みのレイテンシーが低くなります。アプリケーションレイテンシーは、インフラストラクチャまたはネットワークレイテンシーと特徴量ストア API レイテンシーという 2 つの主要な要素で構成されています。ネットワークレイテンシーの軽減は、Feature Store に対する読み取りと書き込みのレイテンシーを最小限に抑えるのに役立ちます。Feature Store ランタイムエンドポイントにデプロイすることで、Feature Store AWS PrivateLink へのネットワークレイテンシーを減らすことができます。を使用すると AWS PrivateLink、インターフェイス VPC エンドポイントを使用して、スケーラブルな方法で Amazon Virtual Private Cloud (VPC) からすべての Feature Store Runtime API オペレーションにプライベートにアクセスできます。`privateDNSEnabled` オプションが true に設定された AWS PrivateLink デプロイ:
+ Feature Store の読み取り/書き込みトラフィックはすべて VPC 内に保持されます。
+ Feature Store を使用するとき、トラフィックを発信元のクライアントと同じ AZ に保持する。これにより AZ 間の「ホップ」が回避され、オーバーヘッドレイテンシーが減少します。

[AWS 「インターフェイス VPC エンドポイントを使用して サービスにアクセスする](https://docs.aws.amazon.com/vpc/latest/privatelink/create-interface-endpoint.html)」の手順に従って、Feature Store AWS PrivateLink にセットアップします。の Feature Store Runtime のサービス名は AWS PrivateLink です`com.amazonaws.region.sagemaker.featurestore-runtime`。

`InMemory` 階層のオンラインストアは、ストレージの使用状況とリクエスト数に基づいて自動的にスケールされます。自動スケーリングは、新しい使用パターンが急速に変化する場合、それに適応するまでに数分かかることがあります。自動スケーリング中:
+ 特徴量グループへの書き込み操作でスロットリングエラーが発生する可能性があります。数分後にリクエストを再試行する必要があります。
+ 特徴量グループへの書き込み操作でスロットリングエラーが発生する可能性があります。このような場合は、標準の再試行方法が適しています。
+ 読み取り操作ではレイテンシーが高くなる可能性があります。

デフォルトの `InMemory` 階層特徴量グループの最大サイズは 50 GiB です。

現在、この `InMemory` 階層ではオンラインの特徴量グループのみがサポートされており、オンライン\$1オフラインの特徴量グループはサポートされていないため、`InMemory` 階層のオンラインストアとオフラインストア間のレプリケーションは行われないことに注意してください。また、`InMemory` 階層は現在、カスタマーマネージド KMS キーをサポートしていません。

# オフラインストア
<a name="feature-store-storage-configurations-offline-store"></a>

オフラインストアは、1 秒以内に取得する必要がない場合の履歴データに使用されます。通常、データ探索、モデルトレーニング、バッチ推論に使用されます。

特徴量グループでオンラインストアとオフラインストアの両方を有効にすると、トレーニングとデータ提供の間の不一致を避けるため、両方のストアが同期されます。現在、`InMemory` ストレージタイプが有効になっているオンラインストア特徴量グループは、オフラインストアの対応する特徴量グループをサポートしていないことに注意してください (オンラインからオフラインへのレプリケーションはできません)。Amazon SageMaker 特徴量ストアでの ML モデル配信の詳細については、「[オンラインストア](feature-store-storage-configurations-online-store.md)」を参照してください。

オフラインストアには以下の `TableFormat` のオプションがあります。オフラインストアのコンテンツについては、「Amazon SageMaker API リファレンス」の「[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html)」を参照してください。

## Glue テーブル形式
<a name="feature-store-storage-configurations-offline-store-glue-table-format"></a>

`Glue` 形式 (デフォルト) は AWS Glueの標準的な Hive タイプのテーブル形式です。を使用すると AWS Glue、複数のソースからのデータを検出、準備、移動、統合できます。また、ジョブの作成、実行、ビジネスワークフローの実装のための生産性向上に役立つツールやデータ運用ツールも追加されています。詳細については AWS Glue、[「 とは AWS Glue](https://docs.aws.amazon.com/glue/latest/dg/what-is-glue.html)」を参照してください。

## Iceberg テーブル形式
<a name="feature-store-storage-configurations-offline-store-iceberg-table-format"></a>

`Iceberg` 形式 (推奨) は、非常に大きな分析テーブル用のオープンテーブル形式です。`Iceberg` では、パーティション内の小さなデータファイルを少数の大きなファイルに圧縮できるため、クエリが大幅に速くなります。この圧縮操作は同時に実行され、特徴量グループでの進行中の読み取り/書き込み操作には影響しません。Iceberg テーブルの最適化の詳細については、「[Amazon Athena ユーザーガイド](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg-data-optimization.html)」と「[AWS Lake Formationユーザーガイド](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html)」を参照してください。

`Iceberg` は大量のファイルコレクションをテーブルで管理して最新の分析データレイク操作をサポートします。新しい特徴量グループを作成するときに `Iceberg` オプションを選択すると、Amazon SageMaker Feature Store は Parquet ファイル形式を使用して `Iceberg` テーブルを作成し、テーブルを AWS Glue Data Catalogに登録します。`Iceberg` テーブル形式の詳細については、「[Apache Iceberg テーブルの使用](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html)」を参照してください。

**重要**  
`Iceberg` テーブル形式の特徴量グループでは、イベント時刻の値として `String` を指定する必要があることに注意してください。他のタイプを指定すると、特徴量グループを正常に作成できません。

# スループットモード
<a name="feature-store-throughput-mode"></a>

Amazon SageMaker 特徴量ストアでは、オンデマンド (`On-demand`) スループットモードとプロビジョンド (`Provisioned`) スループットモードの 2 つの料金モデルから選択できます。`On-demand` は、予測不可能なトラフィックに最適で、`Provisioned` は一貫性があり予測可能なトラフィックに最適です。

特定の特徴量グループに対して `On-demand` スループットモードと `Provisioned` スループットモードを切り替えるオプションが提供されており、アプリケーションのトラフィックパターンが変化したり予測が困難になったりする期間に対応できます。特徴量グループのスループットモードを `On-demand` に更新できるのは、24 時間に 1 回のみです。スループットモードは、[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API を使用したプログラムでも、コンソール UI でも更新できます。コンソールの使用方法の詳細については、「[コンソールでの Amazon SageMaker 特徴量ストアの使用](feature-store-use-with-studio.md)」を参照してください。

`Provisioned` スループットモードは、オフライン専用の特徴量グループや `Standard` ストレージタイプの特徴量グループで使用できます。その他のストレージ設定の場合、`On-demand` スループットモードが使用されます。オンラインストレージ設定とオフラインストレージ設定の詳細については、「[オンラインストア](feature-store-storage-configurations-online-store.md)」と「[オフラインストア](feature-store-storage-configurations-offline-store.md)」をそれぞれ参照してください。

料金の詳細については、「[Amazon SageMaker の料金](https://aws.amazon.com/sagemaker/pricing/)」を参照してください。

**Topics**
+ [オンデマンドスループットモード](#feature-store-throughput-mode-on-demand)
+ [プロビジョンドスループットモード](#feature-store-throughput-mode-provisioned)
+ [スループットモードのメトリクス](#feature-store-throughput-mode-metrics)
+ [スループットモードの制限](#feature-store-throughput-mode-limits)

## オンデマンドスループットモード
<a name="feature-store-throughput-mode-on-demand"></a>

`On-demand` (デフォルト) スループットモードは、ワークロードが不明かつアプリケーショントラフィックが予測不可能で、容量要件を予測できない特徴量グループを使用する場合に最適です。

`On-demand` モードでは、アプリケーションが特徴量グループで実行する読み取りと書き込みに対して料金が発生します。特徴量ストアはワークロードの増加または減少に応じて直ちに対応するため、アプリケーションが実行する読み取りスループットや書き込みスループットを指定する必要はありません。使用した分だけ料金が発生します。使用については、`ReadRequestsUnits` と `WriteRequestsUnits` で測定されます。

`On-demand` スループットモードは、[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) API、[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API、またはコンソール UI を使用して有効にできます。コンソール UI の使用の詳細については、「[コンソールでの Amazon SageMaker 特徴量ストアの使用](feature-store-use-with-studio.md)」を参照してください。

**重要**  
特徴量グループのスループットモードを `On-demand` に更新できるのは、24 時間に 1 回のみです。

## プロビジョンドスループットモード
<a name="feature-store-throughput-mode-provisioned"></a>

`Provisioned` スループットモードは、予測可能なワークロードで特徴量グループを使用している場合に最も適しており、コストを制御するための容量要件を予測できます。これにより、スループット要件を事前に予測できる特定のワークロードのコスト効率を向上できます。

特徴量グループを `Provisioned` モードに設定する際は、アプリケーションが特徴量グループから利用できる最大容量のキャパシティユニットを指定します。アプリケーションがこの `Provisioned` スループットキャパシティを超えると、リクエストスロットリングの対象になります。

読み取りキャパシティユニットと書き込みキャパシティユニットに関する情報は、以下のとおりです。
+ `GetRecord` API を使用して最大 4 KB の単一のレコードを取得すると、*少なくとも* 1 RCU (読み取りキャパシティユニット) を利用することになります。より大きなペイロードを取得するには、さらに増大する可能性があります。必要な読み取りキャパシティユニットの合計数は、特徴量ストアサービスが追加したごとの小型のメタデータなどの項目のサイズによって異なります。
+ `PutRecord` API を使用して 1 KB のペイロードを持つ単一の書き込みリクエストを実行すると、*少なくとも* 1 WCU (書き込みキャパシティユニット) を利用します。ペイロードの小数は最も近い KB に切り上げられます。イベント時刻、レコードの削除ステータス、Time to Live (TTL) ステータスによっては、利用料が増大する場合もあります。TTL の詳細については、「[レコードの有効期限 (TTL)](feature-store-time-to-live.md)」を参照してください。

**重要**  
キャパシティユニットを設定する際は、以下の点を考慮する必要があります。  
`Provisioned` 容量をフル利用していない場合でも、特徴量グループのためにプロビジョンした読み取り容量と書き込み容量に対して料金が発生します。
読み取り容量または書き込み容量の設定が低すぎると、リクエストスロットリングが発生する可能性があります。
場合によっては、さまざまな機能を有効にするために特徴量ストアサービスが追加したレコードレベルのメタデータが原因で、レコードが追加のキャパシティユニットを利用することがあります。
`GetRecord` API または `BatchGetRecord` API を使用して特徴量のサブセットのみを取得する場合、レコード全体に対応する RCU を利用することになります。
書き込み容量については、バックフィルまたは一括取り込みを実行する際のスロットリングを避けるため、最近のピーク容量の 2 倍をプロビジョンする必要があります。これは、履歴レコードの書き込みによって追加の書き込み容量を利用することになるためです。
特徴量ストアは現時点で、`Provisioned` モードの自動スケーリングはサポートしていません。

`On-demand` スループットモードは、[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) API、[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API、またはコンソール UI を使用して有効にできます。コンソール UI の使用の詳細については、「[コンソールでの Amazon SageMaker 特徴量ストアの使用](feature-store-use-with-studio.md)」を参照してください。

`Provisioned` モードが有効になっている場合に、特徴量グループの RCU スループットと WCU スループットを増減する方法を以下で説明します。

**プロビジョンドスループットの引き上げ**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API またはコンソール UI を使用して、RCU または WCU を必要に応じて何度でも増やすことができます。

**プロビジョンドスループットの引き下げ**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API またはコンソール UI を使用して、特徴量グループの RCU や WCU (または両方) を減らすことができます。

特徴量グループで 1 日に実行できる `Provisioned` 容量の減少回数には、デフォルトの割り当てがあります。日付は、協定世界時 (UTC) に従って定義されます。特定の日に、その日に他の減少をまだ実行していない限り、1 時間以内に最大 4 回の減少を実行することから始めることができます。その後、その前の 1 時間で減少しない限り、1 時間あたりさらに 1 回の減少を実行できます。これにより、1 日で減らすことができる最大の回数は 27 回になります (1 日の中で最初の 1 時間は 4 回、その後は 1 時間ごとに 1 回)。

## スループットモードのメトリクス
<a name="feature-store-throughput-mode-metrics"></a>

`On-demand` モードの特徴量グループは、`ConsumedReadRequestsUnits` メトリクスと `ConsumedWriteRequestsUnits` メトリクスを出力します。`Provisioned` モードの特徴量グループは、`ConsumedReadCapacityUnits` メトリクスと `ConsumedWriteCapacityUnits` メトリクスを出力します。特徴量ストアのメトリクスの詳細については、「[Amazon SageMaker Feature Store メトリクス](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store)」を参照してください。

## スループットモードの制限
<a name="feature-store-throughput-mode-limits"></a>

各 AWS アカウント には、可用性を確保し、請求リスクを管理するために適用されるデフォルトのサービスクォータまたは制限があります。デフォルトのクォータと制限の詳細については、「[クォータ、命名ルール、データ型](feature-store-quotas.md)」を参照してください。

場合によっては、このような制限がドキュメントに記載されている制限よりも低い場合があります。このような制限を引き上げる必要がある場合は、引き上げのリクエストを送信できます。作業の中断を避けるために、現在の制限に達する前にリクエストを行うことをお勧めします。サービスクォータとクォータの引き上げをリクエストする方法の詳細については、「[AWS サービスクォータ](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)」を参照してください。