

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Configuraciones de almacenamiento del almacén de características
<a name="feature-store-storage-configurations"></a>

Amazon SageMaker Feature Store consta de una tienda online y una tienda offline. El almacenamiento en línea permite buscar características en tiempo real para realizar inferencias, mientras que el almacenamiento sin conexión contiene datos históricos para el entrenamiento de modelos y la inferencia por lotes. Al crear un grupo de características, tiene la opción de habilitar el almacenamiento en línea, el almacenamiento sin conexión o ambos. Cuando habilitas ambos, se sincronizan para evitar discrepancias entre los datos de entrenamiento y los de entrega. Para obtener más información sobre el almacenamiento en línea y el almacenamiento sin conexión, así como otros conceptos del almacén de características, consulte [Conceptos del almacén de características](feature-store-concepts.md).

Los siguientes temas tratan sobre los tipos de almacenamiento del almacenamiento en línea y los formatos de tablas del almacenamiento sin conexión. 

**Topics**
+ [Almacenamiento en línea](feature-store-storage-configurations-online-store.md)
+ [Almacenamiento sin conexión](feature-store-storage-configurations-offline-store.md)
+ [Modos de rendimiento](feature-store-throughput-mode.md)

# Almacenamiento en línea
<a name="feature-store-storage-configurations-online-store"></a>

El almacenamiento en línea es un almacén de datos de baja latencia y alta disponibilidad que proporciona una búsqueda de características en tiempo real. Por lo general, se utiliza para atender modelos de machine learning (ML). Cuando cree un grupo de características, puede elegir entre el almacenamiento en línea estándar (`Standard`) o el almacenamiento en línea integrada en la memoria (`InMemory`). De esta forma, puede seleccionar el tipo de almacenamiento que mejor se adapte a los patrones de lectura y escritura de una aplicación concreta, teniendo en cuenta el rendimiento y el costo. Para obtener más información sobre los precios, consulta [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

El almacenamiento en línea contiene las siguientes opciones de `StorageType`. Para obtener más información sobre el contenido del almacenamiento en línea, consulte [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html). 

## Tipo de almacenamiento estándar
<a name="feature-store-storage-configurations-online-store-standard-tier"></a>

El nivel `Standard` es un almacén de datos administrado de baja latencia para los grupos de características del almacenamiento en línea. Proporciona una recuperación rápida de datos para atender modelos de ML para sus aplicaciones. `Standard` es el tipo de almacenamiento predeterminado.

## Tipo de almacenamiento en memoria
<a name="feature-store-storage-configurations-online-store-in-memory-tier"></a>

El nivel `InMemory` es un almacén de datos administrado para los grupos de características del almacenamiento en línea que admite recuperaciones de muy baja latencia. Proporciona una recuperación de datos a gran escala en tiempo real para atender los modelos de ML que se utilizan en aplicaciones de alto rendimiento. El `InMemory` nivel funciona con Amazon ElastiCache (Redis OSS). Para obtener más información, consulte [¿Qué es Amazon ElastiCache (Redis OSS)?](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/WhatIs.html) .

El nivel `InMemory` del almacenamiento en línea admite los tipos de colección, a saber, lista, conjunto y vector. Para obtener más información sobre los tipos de colección `InMemory`, consulte [Tipos de colección](feature-store-collection-types.md).

El almacén de características proporciona lectura y escritura de baja latencia al almacenamiento en línea. La latencia de la aplicación consta principalmente de dos componentes: latencia de infraestructura o red y latencia de API del almacén de características. La reducción de la latencia de la red ayuda a obtener las lecturas y escrituras con la latencia más baja en el almacén de características. Puede reducir la latencia de la red en Feature Store AWS PrivateLink implementándola en el punto final de tiempo de ejecución de Feature Store. Con AWS PrivateLink, puede acceder de forma privada a todas las operaciones de la API Feature Store Runtime desde su Amazon Virtual Private Cloud (VPC) de forma escalable mediante puntos de enlace de VPC de interfaz. Una AWS PrivateLink implementación con la `privateDNSEnabled` opción establecida como verdadera:
+ Mantiene todo el read/write tráfico de Feature Store dentro de tu VPC.
+ Mantiene el tráfico de invocación en la misma AZ que el cliente que lo originó al utilizar el almacén de características. Esto evita los «saltos» entre la AZs reducción de la latencia de la red.

Siga los pasos de [Acceder a un AWS servicio mediante un punto final de VPC de interfaz](https://docs.aws.amazon.com/vpc/latest/privatelink/create-interface-endpoint.html) para AWS PrivateLink configurarlo en Feature Store. El nombre del servicio de Feature Store Runtime AWS PrivateLink es`com.amazonaws.region.sagemaker.featurestore-runtime`.

El nivel `InMemory` del almacenamiento en línea se escala automáticamente en función del uso del almacenamiento y las solicitudes. El escalado automatizado puede tardar unos minutos en adaptarse a un nuevo patrón de uso si este cambia rápidamente. Durante el escalado automatizado:
+ Las operaciones de escritura en el grupo de características pueden recibir errores de limitación. Debe volver a intentar realizar las solicitudes unos minutos más tarde.
+ Las operaciones de lectura en el grupo de características pueden recibir errores de limitación. En este caso, son adecuadas las estrategias de reintento estándar.
+ Es posible que las operaciones de lectura sufran una alta latencia.

El tamaño máximo predeterminado del grupo de características del nivel `InMemory` es 50 GiB.

Tenga en cuenta que, actualmente, el nivel `InMemory` solo admite grupos de características en línea, no grupos de características en línea y sin conexión, por lo que no hay replicación entre el almacenamiento sin conexión y en línea para el nivel `InMemory`. Además, actualmente, el nivel `InMemory` no admite claves de KMS administradas por el cliente.

# Almacenamiento sin conexión
<a name="feature-store-storage-configurations-offline-store"></a>

El almacenamiento sin conexión se utiliza para los datos históricos cuando no es necesario recuperarlos en menos de un segundo. Por lo general, se usa para la exploración de datos, el entrenamiento de modelos y la inferencia por lotes. 

Al habilitar los almacenamiento sin conexión y en línea para su grupo de características, ambos se sincronizan para evitar discrepancias entre los datos de entrenamiento y los de entrega. Tenga en cuenta que, actualmente, un grupo de características del almacenamiento en línea con el tipo de almacenamiento `InMemory` habilitado no admite el grupo de características correspondiente en el almacenamiento sin conexión (no se puede replicar de en línea a sin conexión). Para obtener más información sobre el servicio de modelos de aprendizaje automático en Amazon SageMaker Feature Store, consulte[Almacenamiento en línea](feature-store-storage-configurations-online-store.md).

El almacenamiento sin conexión contiene las siguientes opciones de `TableFormat`. Para obtener información sobre el contenido de la tienda offline, consulta [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html)la referencia de la SageMaker API de Amazon.

## Formato de tabla de Glue
<a name="feature-store-storage-configurations-offline-store-glue-table-format"></a>

El formato de `Glue` (predeterminado) es un formato de tabla de tipo Hive estándar para AWS Glue. Con AWS Glueél, puede descubrir, preparar, mover e integrar datos de múltiples fuentes. También incluye herramientas adicionales de productividad y operaciones de datos para la creación, la ejecución de trabajos y la implementación de flujos de trabajo empresariales. Para obtener más información al respecto AWS Glue, consulte [¿Qué es AWS Glue?](https://docs.aws.amazon.com/glue/latest/dg/what-is-glue.html) .

## Formato de tabla de Iceberg
<a name="feature-store-storage-configurations-offline-store-iceberg-table-format"></a>

El formato de `Iceberg` (recomendado) es un formato de tabla abierto para tablas analíticas muy grandes. Con `Iceberg`, puede compactar los archivos de datos pequeños en un menor número de archivos grandes en la partición, lo que se traduce en consultas considerablemente más rápidas. Esta operación de compactación es simultánea y no afecta a las operaciones de lectura y escritura en curso en el grupo de características. Para obtener más información sobre la optimización de las tablas de Iceberg, consulte las guías del usuario de [Amazon Athena](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg-data-optimization.html) y [AWS Lake Formation](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html).

`Iceberg` administra grandes colecciones de archivos como tablas y es compatible con las modernas operaciones analíticas de lago de datos. Si elige `Iceberg` esta opción al crear nuevos grupos de características, Amazon SageMaker Feature Store crea las `Iceberg` tablas con el formato de archivo Parquet y las registra con AWS Glue Data Catalog. Para obtener más información sobre los formatos de tabla de `Iceberg`, consulte [Uso de tablas de Apache Iceberg](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html). 

**importante**  
Tenga en cuenta que, en el caso de los grupo de características en formato de tabla de `Iceberg`, debe especificar `String` como el tipo de característica para la hora del evento. Si especifica cualquier otro tipo, no podrá crear el grupo de características correctamente.

# Modos de rendimiento
<a name="feature-store-throughput-mode"></a>

Amazon SageMaker Feature Store ofrece dos modelos de precios entre los que elegir: los modos de rendimiento bajo demanda (`On-demand`) y aprovisionados (`Provisioned`). `On-demand`funciona mejor para un tráfico menos predecible, mientras que `Provisioned` funciona mejor para un tráfico constante y predecible. 

Tiene la opción de cambiar entre los modos de rendimiento `On-demand` y `Provisioned` para un grupo de características determinado, a fin de adaptarse a los períodos en los que los patrones de tráfico de las aplicaciones cambian o son menos predecibles. Solo puede actualizar el modo de rendimiento de su grupo de características a `On-demand` una vez cada 24 horas. El modo de rendimiento se puede actualizar mediante programación mediante la [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API o mediante la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la consola, consulte [Uso de Amazon SageMaker Feature Store en la consola](feature-store-use-with-studio.md).

Puede usar el modo de rendimiento `Provisioned` con grupos de características solo sin conexión o grupos de características con el tipo de almacenamiento `Standard`. Para otras configuraciones de almacenamiento, se utiliza el modo de rendimiento `On-demand`. Para obtener más información sobre las configuraciones de almacenamiento en línea y sin conexión, consulte [Almacenamiento en línea](feature-store-storage-configurations-online-store.md) y [Almacenamiento sin conexión](feature-store-storage-configurations-offline-store.md), respectivamente.

Para obtener más información sobre los precios, consulta [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

**Topics**
+ [Modo de rendimiento bajo demanda](#feature-store-throughput-mode-on-demand)
+ [Modo de rendimiento aprovisionado](#feature-store-throughput-mode-provisioned)
+ [Métricas del modo de rendimiento](#feature-store-throughput-mode-metrics)
+ [Límites del modo de rendimiento](#feature-store-throughput-mode-limits)

## Modo de rendimiento bajo demanda
<a name="feature-store-throughput-mode-on-demand"></a>

El modo de rendimiento `On-demand` (predeterminado) funciona mejor cuando se utilizan grupos de características con una carga de trabajo desconocida o un tráfico de aplicaciones impredecible y no se pueden prever los requisitos de capacidad.

El modo `On-demand` le cobra por las lecturas y escrituras que realiza su aplicación en sus grupos de características. No es necesario especificar el rendimiento de lectura y escritura que se espera de la aplicación, ya que el Almacén de características se adapta instantáneamente a las cargas de trabajo a medida que aumentan o disminuyen. Solo pagará por lo que utilice, que se mide en `ReadRequestsUnits` y `WriteRequestsUnits`.

Puede activar el modo de `On-demand` rendimiento mediante [CreateFeatureGroup[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) APIs o a través de la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la IU de la consola, consulte [Uso de Amazon SageMaker Feature Store en la consola](feature-store-use-with-studio.md).

**importante**  
Solo puede actualizar el modo de rendimiento de su grupo de características a `On-demand` una vez cada 24 horas.

## Modo de rendimiento aprovisionado
<a name="feature-store-throughput-mode-provisioned"></a>

El modo de rendimiento `Provisioned` funciona mejor cuando se utilizan grupos de características con cargas de trabajo predecibles y se pueden pronosticar los requisitos de capacidad para controlar los costos. Esto puede hacer que sea más rentable para determinadas cargas de trabajo, en las que puede anticipar los requisitos de rendimiento con antelación.

Al configurar un grupo de características en el modo `Provisioned`, se especifican las unidades de capacidad, que son la cantidad máxima de capacidad que una aplicación puede consumir de un grupo de características. Si la aplicación supera esta capacidad de rendimiento `Provisioned`, se somete a una limitación controlada.

A continuación, se proporciona información sobre las unidades de capacidad de lectura y escritura. 
+ La recuperación de un único registro de hasta 4 KB mediante la API `GetRecord` consumirá *al menos* 1 RCU (unidad de capacidad de lectura). La recuperación de cargas útiles más grandes puede llevar más tiempo. El número total de unidades de capacidad de lectura necesarias depende del tamaño del elemento, incluidos un pequeño metadato por registro que añade el servicio del Almacén de características. 
+ Una sola solicitud de escritura con una carga útil de 1 KB que utilice la API `PutRecord` consumirá *al menos* 1 WCU (unidad de capacidad de escritura), y las cargas útiles fraccionarias se redondearán al KB más cercano. Es posible que consuma más en función de la hora del evento, del estado de eliminación del registro y del tiempo de vida (TTL). Para obtener más información sobre TTL, consulte [Duración del tiempo de vida (TTL) de los registros](feature-store-time-to-live.md).

**importante**  
Al configurar las unidades de capacidad, tenga en cuenta lo siguiente:  
Se le cobrará por las capacidades de lectura y escritura que aprovisione para su grupo de características, incluso si no utiliza toda la capacidad `Provisioned`.
Si configura una capacidad de lectura o escritura demasiado baja, es posible que sus solicitudes se vean limitadas.
En algunos casos, los registros pueden consumir una unidad de capacidad adicional debido a los metadatos de los registros que añade el servicio del Almacén de características para habilitar diversas características. 
Al recuperar solo un subconjunto de funciones, se utiliza `GetRecord` o `BatchGetRecord` APIs se seguirá consumiendo la RCU correspondiente a todo el registro. 
En lo que respecta a la capacidad de escritura, debe aprovisionar el doble de la capacidad máxima reciente para evitar limitaciones al realizar rellenos o ingestiones masivas que pueden dar lugar a un gran número de escrituras de registros históricos. Esto se debe a que la escritura de registros históricos consume una capacidad de escritura adicional.
Actualmente, el Almacén de características no admite el escalado automático para el modo `Provisioned`. 

Puede activar el modo de `On-demand` rendimiento mediante [CreateFeatureGroup[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) APIs o a través de la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la IU de la consola, consulte [Uso de Amazon SageMaker Feature Store en la consola](feature-store-use-with-studio.md).

A continuación, se describe cómo puede aumentar o disminuir el rendimiento de RCU y WCU de sus grupos de características cuando el modo `Provisioned` está habilitado. 

**Aumento del rendimiento aprovisionado**

Puede aumentar la RCU o la WCU tantas veces como sea necesario mediante la [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API o la interfaz de usuario de la consola. 

**Reducción de rendimiento aprovisionado**

Puede reducir la RCU y la WCU (o ambas) para los grupos de funciones mediante la [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API o la interfaz de usuario de la consola. 

Existe una cuota predeterminada del número de reducciones de la capacidad `Provisioned` que puede realizar en su grupo de características por día. Un día se define según la hora universal coordinada (UTC). En un día determinado, puede empezar realizando hasta cuatro disminuciones en una hora, siempre que no haya realizado todavía ninguna otra disminución durante ese día. Posteriormente, puede realizar una disminución adicional por hora siempre que no haya habido disminuciones en la hora anterior. Esto efectivamente aumenta el número máximo de reducciones a 27 al día (4 reducciones en la primera hora y 1 reducción en cada hora posterior durante un día).

## Métricas del modo de rendimiento
<a name="feature-store-throughput-mode-metrics"></a>

Un grupo de características en modo `On-demand` emitirá métricas `ConsumedReadRequestsUnits` y `ConsumedWriteRequestsUnits`. Un grupo de características en modo `Provisioned` emitirá métricas `ConsumedReadCapacityUnits` y `ConsumedWriteCapacityUnits`. Para obtener más información acerca de las métricas del Almacén de características, consulte [Estadísticas de Amazon SageMaker Feature Store](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store).

## Límites del modo de rendimiento
<a name="feature-store-throughput-mode-limits"></a>

Cada uno Cuenta de AWS tiene cuotas o límites de servicio predeterminados que se aplican para garantizar la disponibilidad y gestionar los riesgos de facturación. Para obtener más información acerca de los límites y cuotas predeterminados, consulte [Cuotas, reglas de nomenclatura y tipos de datos](feature-store-quotas.md).

En algunos casos, estos límites pueden ser inferiores a lo que se indica en la documentación. Si necesita límites más elevados, puede enviar una solicitud de aumento. Es recomendable hacerlo antes de alcanzar los límites actuales para evitar interrupciones en el trabajo. Para obtener más información acerca de las cuotas de servicio y cómo solicitar un aumento de cuota, consulte [AWS service quotas](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).