

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Configurations de stockage Feature Store
<a name="feature-store-storage-configurations"></a>

Amazon SageMaker Feature Store se compose d'une boutique en ligne et d'une boutique hors ligne. Le magasin en ligne permet la recherche en temps réel des fonctionnalités à des fins d'inférence, tandis que le magasin hors connexion contient des données historiques pour l'entraînement des modèles et l'inférence par lots. Lorsque vous créez un groupe de fonctionnalités, vous avez la possibilité d'activer le magasin en ligne, le magasin hors connexion ou les deux. Lorsque vous activez les deux, ils se synchronisent afin d'éviter toute divergence entre les données d'entraînement et les données de service. Pour plus d'informations sur les magasins en ligne et hors connexion et les autres concepts de Feature Store, consultez [Concepts liés à Feature Store](feature-store-concepts.md).

Les rubriques suivantes traitent des types de stockage des magasins en ligne et des formats de tables des magasins hors connexion. 

**Topics**
+ [Magasin en ligne](feature-store-storage-configurations-online-store.md)
+ [Magasin hors ligne](feature-store-storage-configurations-offline-store.md)
+ [Modes de débit](feature-store-throughput-mode.md)

# Magasin en ligne
<a name="feature-store-storage-configurations-online-store"></a>

Le magasin en ligne est un magasin de données à faible latence et à haute disponibilité qui permet de rechercher des fonctionnalités en temps réel. Il est généralement utilisé pour le service de modèles de machine learning (ML). Vous pouvez choisir entre le magasin en ligne standard (`Standard`) et un magasin en ligne de niveau En mémoire (`InMemory`) au moment de créer un groupe de fonctionnalités. De cette façon, vous pouvez sélectionner le type de stockage qui correspond le mieux aux schémas de lecture et d’écriture d’une application particulière, tout en tenant compte des performances et des coûts. Pour plus d'informations sur les tarifs, consultez [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

Le magasin en ligne contient les options `StorageType` suivantes. Pour plus d’informations sur le contenu du magasin en ligne, consultez [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html). 

## Type de stockage de niveau Standard
<a name="feature-store-storage-configurations-online-store-standard-tier"></a>

Le niveau `Standard` est un magasin de données géré à faible latence pour les groupes de fonctionnalités des magasins en ligne. Il fournit une récupération rapide des données pour le service de modèle ML pour vos applications. `Standard` est le type de stockage par défaut.

## Type de stockage de niveau En mémoire
<a name="feature-store-storage-configurations-online-store-in-memory-tier"></a>

Le niveau `InMemory` est un magasin de données géré pour les groupes de fonctionnalités des magasins en ligne qui permet une récupération à très faible latence. Il fournit une récupération de données en temps réel à grande échelle pour le modèle ML utilisé pour les applications à haut débit. Le `InMemory` niveau est développé par Amazon ElastiCache (Redis OSS). Pour plus d'informations, consultez [Qu'est-ce qu'Amazon ElastiCache (Redis OSS) ?](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/WhatIs.html) .

Le niveau `InMemory` des magasins en ligne prend en charge les types de collection, à savoir liste, ensemble et vecteur. Pour plus d’informations sur les types de collections `InMemory`, consultez [Types de collections](feature-store-collection-types.md).

Feature Store permet une lecture à faible latence et une écriture dans le magasin en ligne. La latence des applications est principalement constituée de deux composants principaux : la latence de l'infrastructure et du réseau et la latence des API Feature Store. La réduction de la latence du réseau permet d'obtenir la plus faible latence des lectures et écritures dans Feature Store. Vous pouvez réduire la latence du réseau vers le Feature Store en le déployant sur le point AWS PrivateLink de terminaison Feature Store Runtime. Vous pouvez ainsi accéder en privé à toutes les opérations de l'API Feature Store Runtime depuis votre Amazon Virtual Private Cloud (VPC) de manière évolutive en utilisant les points de terminaison VPC de l'interface. AWS PrivateLink Un AWS PrivateLink déploiement dont l'`privateDNSEnabled`option est définie comme vraie :
+ Il conserve tout le read/write trafic du Feature Store au sein de votre VPC.
+ Il conserve le trafic dans la même zone de disponibilité que le client qui l'a créé en utilisant Feature Store. Cela permet d'éviter les « sauts » entre deux réductions de AZs la latence du réseau.

Suivez les étapes décrites dans [Accéder à un AWS service à l'aide d'un point de terminaison VPC d'interface](https://docs.aws.amazon.com/vpc/latest/privatelink/create-interface-endpoint.html) AWS PrivateLink pour configurer le Feature Store. Le nom de service pour Feature Store Runtime in AWS PrivateLink est`com.amazonaws.region.sagemaker.featurestore-runtime`.

Le magasin en ligne de niveau `InMemory` est mis à l’échelle automatiquement en fonction des demandes et de l’utilisation du stockage. La mise à l’échelle automatique peut prendre quelques minutes pour s’adapter à un nouveau modèle d’utilisation s’il change rapidement. Lors de la mise à l'échelle automatique :
+ Les opérations d'écriture dans le groupe de fonctionnalités peuvent recevoir des erreurs de limitation. Vous devriez réessayer vos demandes quelques minutes plus tard.
+ Les opérations de lecture dans le groupe de fonctionnalités peuvent recevoir des erreurs de limitation. Les stratégies de nouvelle tentative standard conviennent dans ce cas.
+ Les opérations de lecture peuvent présenter une latence élevée.

La taille maximale du groupe de fonctionnalités de niveau `InMemory` par défaut est de 50 Gio.

Notez que le niveau `InMemory` prend actuellement en charge uniquement les groupes de fonctionnalités en ligne, et non les groupes de fonctionnalités en ligne et hors connexion. Il n'y a donc pas de réplication entre les magasins en ligne et hors connexion pour le niveau `InMemory`. En outre, le niveau `InMemory` ne prend actuellement pas en charge les clés KMS gérées par le client.

# Magasin hors ligne
<a name="feature-store-storage-configurations-offline-store"></a>

Le magasin hors connexion est utilisé pour les données historiques lorsqu'il n'est pas nécessaire de les récupérer en moins d'une seconde. Il est généralement utilisé pour l'exploration des données, l'entraînement de modèles et l'inférence par lots. 

Lorsque vous activez les magasins en ligne et hors connexion pour votre groupe de fonctionnalités, les deux magasins sont synchronisés afin d'éviter les divergences entre les données d'entraînement et les données de service. Notez qu’un groupe de caractéristiques d’un magasin en ligne dont le type de stockage `InMemory` est activé ne prend actuellement pas en charge un groupe de caractéristiques correspondant dans le magasin hors ligne (pas de réplication du magasin en ligne vers le magasin hors ligne). Pour plus d'informations sur la diffusion de modèles ML dans Amazon SageMaker Feature Store, consultez[Magasin en ligne](feature-store-storage-configurations-online-store.md).

Le magasin hors connexion contient les options `TableFormat` suivantes. Pour plus d'informations sur le contenu de la boutique hors ligne, consultez [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html)le Amazon SageMaker API Reference.

## Format de table Glue
<a name="feature-store-storage-configurations-offline-store-glue-table-format"></a>

Le format `Glue` (par défaut) est un format de table de type Hive standard pour AWS Glue. Avec AWS Glue, vous pouvez découvrir, préparer, déplacer et intégrer des données provenant de sources multiples. Il inclut également des outils de productivité et d’exploitation des données supplémentaires pour la création, l’exécution de tâches et la mise en œuvre de flux de travail. Pour plus d'informations AWS Glue, voir [Qu'est-ce que c'est AWS Glue ?](https://docs.aws.amazon.com/glue/latest/dg/what-is-glue.html) .

## Format de table Iceberg
<a name="feature-store-storage-configurations-offline-store-iceberg-table-format"></a>

Le format `Iceberg` (recommandé) est un format de table ouvert pour les tables analytiques de très grande taille. Avec `Iceberg`, vous pouvez compacter les petits fichiers de données en un plus petit nombre de grands fichiers dans la partition, ce qui accélère considérablement les requêtes. Cette opération de compactage est simultanée et n’affecte pas les opérations de lecture et d’écriture en cours sur le groupe de caractéristiques. Pour plus d’informations sur l’optimisation des tables Iceberg, consultez les guides de l’utilisateur [Amazon Athena](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg-data-optimization.html) et [AWS Lake Formation](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html).

`Iceberg` gère de grandes collections de fichiers sous forme de tables et prend en charge les opérations modernes de lac de données analytiques. Si vous choisissez `Iceberg` cette option lors de la création de nouveaux groupes de SageMaker fonctionnalités, Amazon Feature Store crée les `Iceberg` tables au format de fichier Parquet et enregistre les tables avec le AWS Glue Data Catalog. Pour plus d’informations sur les formats des tables `Iceberg`, consultez [Utilisation des tables Apache Iceberg](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html). 

**Important**  
Notez que pour les groupes de caractéristiques au format de table `Iceberg`, vous devez spécifier `String` comme type de caractéristique pour l’heure d’événement. Si vous spécifiez un autre type, vous ne pourrez pas créer le groupe de caractéristiques correctement.

# Modes de débit
<a name="feature-store-throughput-mode"></a>

Amazon SageMaker Feature Store propose deux modèles de tarification parmi lesquels choisir : les modes de débit à la demande (`On-demand`) et provisionné (`Provisioned`). `On-demand`fonctionne mieux pour un trafic moins prévisible, tout en `Provisioned` fonctionnant mieux pour un trafic constant et prévisible. 

Vous avez la possibilité de basculer entre les modes de débit `On-demand` et `Provisioned` pour un groupe de caractéristiques donné, afin de vous adapter aux périodes pendant lesquelles les modèles de trafic des applications changent ou sont moins prévisibles. Vous pouvez mettre à jour le mode de débit de votre groupe de caractéristiques sur `On-demand` une seule fois par période de 24 heures. Le mode de débit peut être mis à jour par programmation à l'aide de l'[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou via l'interface utilisateur de la console. Pour plus d’informations sur l’utilisation de la console, consultez [Utilisation d'Amazon SageMaker Feature Store dans la console](feature-store-use-with-studio.md).

Vous pouvez utiliser le mode de débit `Provisioned` avec des groupes de caractéristiques uniquement hors ligne ou des groupes de caractéristiques avec le type de stockage `Standard`. Pour les autres configurations de stockage, le mode de débit `On-demand` est utilisé. Pour en savoir plus sur les configurations de stockage en ligne et hors ligne, consultez [Magasin en ligne](feature-store-storage-configurations-online-store.md) et [Magasin hors ligne](feature-store-storage-configurations-offline-store.md), respectivement.

Pour plus d'informations sur les tarifs, consultez [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

**Topics**
+ [Mode de débit à la demande](#feature-store-throughput-mode-on-demand)
+ [Mode de débit provisionné](#feature-store-throughput-mode-provisioned)
+ [Métriques du mode de débit](#feature-store-throughput-mode-metrics)
+ [Limites du mode de débit](#feature-store-throughput-mode-limits)

## Mode de débit à la demande
<a name="feature-store-throughput-mode-on-demand"></a>

Le mode débit `On-demand` (par défaut) fonctionne le mieux lorsque vous utilisez des groupes de caractéristiques avec une charge de travail inconnue, le trafic applicatif imprévisible et que vous ne pouvez pas prévoir les besoins en capacité.

Le mode `On-demand` vous facture les lectures et les écritures effectuées par votre application sur vos groupes de caractéristiques. Vous n’avez pas besoin de spécifier le débit de lecture et d’écriture que vous attendez de votre application, car Feature Store s’adapte instantanément à vos charges de travail à mesure qu’elles augmentent ou diminuent. Vous ne payez que pour ce que vous utilisez, qui est mesuré en `ReadRequestsUnits` et `WriteRequestsUnits`.

Vous pouvez activer le mode `On-demand` débit à l'aide de [CreateFeatureGroup[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) APIs ou via l'interface utilisateur de la console. Pour plus d’informations sur l’utilisation de l’interface utilisateur de la console, consultez [Utilisation d'Amazon SageMaker Feature Store dans la console](feature-store-use-with-studio.md).

**Important**  
Vous pouvez mettre à jour le mode de débit de votre groupe de caractéristiques sur `On-demand` une seule fois par période de 24 heures.

## Mode de débit provisionné
<a name="feature-store-throughput-mode-provisioned"></a>

Le mode de débit `Provisioned` fonctionne le mieux lorsque vous utilisez des groupes de caractéristiques dont les charges de travail sont prévisibles et que vous pouvez prévoir les besoins en capacité pour contrôler les coûts. Cela peut le rendre plus rentable pour certaines charges de travail pour lesquelles vous pouvez anticiper les exigences de débit à l’avance.

Lorsque vous définissez un groupe de caractéristiques en mode `Provisioned`, vous spécifiez des unités de capacité qui sont la quantité maximale de capacité qu’une application peut consommer à partir d’un groupe de caractéristiques. Si votre application dépasse la capacité de débit `Provisioned`, elle sera soumise à une limitation des demandes.

Vous trouverez ci-dessous des informations sur les unités de capacité de lecture et d’écriture. 
+ L’extraction d’un seul enregistrement d’une taille maximale de 4 Ko à l’aide de l’API `GetRecord` consommera *au moins* 1 RCU (unité de capacité de lecture). L’extraction de données utiles plus importantes peut en exiger plus. Le nombre total d’unités de capacité de lecture requises dépend de la taille de l’élément, y compris de petites métadonnées par enregistrement ajoutées par le service Feature Store. 
+ Une seule demande d’écriture avec des données utiles de 1 Ko utilisant l’API `PutRecord` consommera *au moins* 1 WCU (unité de capacité d’écriture), les données utiles fractionnelles étant arrondies au Ko le plus proche. Il peut en consommer davantage en fonction de l’heure de l’événement, du statut de suppression de l’enregistrement et du statut de durée de vie (TTL). Pour plus d’informations sur TTL, consultez [Durée de vie (TTL) pour les enregistrements](feature-store-time-to-live.md).

**Important**  
Lorsque vous définissez vos unités de capacité, tenez compte des points suivants :  
Les capacités de lecture et d’écriture que vous provisionnez pour votre groupe de caractéristiques vous seront facturées, même si vous n’utilisez pas pleinement ces capacités `Provisioned`.
Si vous définissez une capacité de lecture ou d’écriture trop faible, vos demandes peuvent faire l’objet d’une limitation.
Dans certains cas, les enregistrements peuvent consommer une unité de capacité supplémentaire en raison des métadonnées au niveau des enregistrements ajoutées par le service Feature Store pour activer diverses caractéristiques. 
Extraire uniquement un sous-ensemble de fonctionnalités en utilisant `GetRecord` ou `BatchGetRecord` APIs consommant toujours le RCU correspondant à l'enregistrement complet. 
En ce qui concerne la capacité d’écriture, vous devez provisionner deux fois la capacité maximale récente afin d’éviter une limitation lors du remplissage ou une ingestion massive susceptible d’entraîner un grand nombre d’écritures d’enregistrements historiques. Cela est dû au fait que l’écriture d’enregistrements historiques consomme de la capacité d’écriture supplémentaire.
Feature Store ne prend actuellement pas en charge l’autoscaling pour le mode `Provisioned`. 

Vous pouvez activer le mode `On-demand` débit à l'aide de [CreateFeatureGroup[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) APIs ou via l'interface utilisateur de la console. Pour plus d’informations sur l’utilisation de l’interface utilisateur de la console, consultez [Utilisation d'Amazon SageMaker Feature Store dans la console](feature-store-use-with-studio.md).

Ce qui suit décrit comment augmenter ou diminuer le débit de la RCU et de la WCU pour vos groupes de caractéristiques lorsque le mode `Provisioned` est activé. 

**Augmentation du débit provisionné**

Vous pouvez augmenter le RCU ou le WCU aussi souvent que nécessaire à l'aide de l'[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou de l'interface utilisateur de la console. 

**Diminution du débit provisionné**

Vous pouvez diminuer le RCU et le WCU (ou les deux) pour les groupes de fonctionnalités à l'aide de l'[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou de l'interface utilisateur de la console. 

Il existe un quota par défaut concernant le nombre de diminutions de capacité `Provisioned` que vous pouvez effectuer chaque jour sur votre groupe de caractéristiques. Une journée est définie conformément à l’heure UTC (Universal Time Coordinated). Un jour donné, vous pouvez commencer par effectuer jusqu’à quatre diminutions en une heure tant que vous n’avez pas encore effectué d’autres diminutions durant cette journée. Par la suite, vous pouvez effectuer une diminution supplémentaire par heure, à condition qu’il n’y ait pas eu de diminution au cours de l’heure précédente. Cela porte effectivement le nombre maximum de réductions par jour à 27 (4 réductions durant la première heure, et 1 réduction pour chacune des 23 fenêtres de 1 heure suivantes).

## Métriques du mode de débit
<a name="feature-store-throughput-mode-metrics"></a>

Un groupe de caractéristiques en mode `On-demand` émettra les métriques `ConsumedReadRequestsUnits` et `ConsumedWriteRequestsUnits`. Un groupe de caractéristiques en mode `Provisioned` émettra les métriques `ConsumedReadCapacityUnits` et `ConsumedWriteCapacityUnits`. Pour plus d’informations sur les métriques de Feature Store, consultez [Statistiques de l'Amazon SageMaker Feature Store](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store).

## Limites du mode de débit
<a name="feature-store-throughput-mode-limits"></a>

Chacun d'entre eux Compte AWS comporte des quotas ou des limites de service par défaut qui sont appliqués pour garantir la disponibilité et gérer les risques liés à la facturation. Pour en savoir plus sur les quotas et les limites par défaut, consultez [Quotas, règles de dénomination et types de données](feature-store-quotas.md).

Dans certains cas, ces limites peuvent être inférieures à celles indiquées dans la documentation. Si vous avez besoin de limites plus élevées, vous pouvez soumettre une demande d’augmentation. Il est judicieux de le faire avant d’atteindre les limites actuelles pour éviter toute interruption de travail. Pour en savoir plus sur les quotas de service et sur la manière de demander une augmentation des quotas, consultez [Quotas de service AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).