

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Configurações de armazenamento do Feature Store
<a name="feature-store-storage-configurations"></a>

A Amazon SageMaker Feature Store consiste em uma loja online e uma loja offline. O armazenamento on-line permite a pesquisa em tempo real de atributos para inferência, enquanto o armazenamento offline contém dados históricos para treinamento de modelos e inferência em lote. Ao criar um grupo de atributos, você tem a opção de habilitar o armazenamento on-line, o armazenamento offline ou ambos. Quando você habilita os dois, eles são sincronizados para evitar discrepâncias entre os dados de treinamento e de fornecimento. Para obter mais informações sobre os armazenamentos on-line e offline e outros conceitos do Feature Store, consulte [Conceitos do Feature Store](feature-store-concepts.md).

Os tópicos a seguir abordam os tipos de armazenamento do armazenamento on-line e os formatos de tabela do armazenamento offline. 

**Topics**
+ [Armazenamento on-line](feature-store-storage-configurations-online-store.md)
+ [Armazenamento offline](feature-store-storage-configurations-offline-store.md)
+ [Modos de throughput](feature-store-throughput-mode.md)

# Armazenamento on-line
<a name="feature-store-storage-configurations-online-store"></a>

O armazenamento on-line é um armazenamento de dados de baixa latência e alta disponibilidade que fornece pesquisa de atributos em tempo real. Geralmente é usado para fornecer modelos de machine learning (ML). Você pode escolher entre o armazenamento on-line padrão (`Standard`) ou um armazenamento on-line na camada de memória (`InMemory`) no momento em que cria um grupo de atributos. Dessa forma, você pode selecionar o tipo de armazenamento que melhor corresponda aos padrões de leitura e gravação de uma aplicação específico, considerando o desempenho e o custo. Para obter mais detalhes sobre preços, consulte [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

O armazenamento on-line contém as seguintes opções de `StorageType`: Para obter mais informações sobre o conteúdo do armazenamento on-line, veja [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html). 

## Tipo de armazenamento de nível padrão
<a name="feature-store-storage-configurations-online-store-standard-tier"></a>

O nível `Standard` é um armazenamento de dados gerenciado de baixa latência para grupos de atributos de armazenamento on-line. Ele fornece recuperação rápida de dados para o serviço de modelo de ML para suas aplicações. O `Standard` é o tipo de armazenamento padrão.

## Tipo de armazenamento em nível de memória
<a name="feature-store-storage-configurations-online-store-in-memory-tier"></a>

O nível `InMemory` é um armazenamento de dados gerenciado para grupos de atributos de armazenamento on-line que oferece apoio à recuperação de latência muito baixa. Ele fornece recuperação de dados em tempo real em grande escala para o fornecimento de modelos de ML usados em aplicações de alta throughput. O `InMemory` nível é desenvolvido pela Amazon ElastiCache (Redis OSS). Para obter mais informações, consulte [O que é a Amazon ElastiCache (Redis OSS](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/WhatIs.html))? .

O nível `InMemory` do armazenamento on-line oferece apoio a tipos de coleção, ou seja, lista, conjunto e vetor. Para obter mais informações sobre tipos de coleção `InMemory`, consulte [Tipos de coleção](feature-store-collection-types.md).

O Feature Store fornece leitura e gravação de baixa latência para o armazenamento on-line. A latência da aplicação é composta principalmente por dois componentes principais: latência da infraestrutura ou da rede e latência da API do Feature Store. A redução da latência de rede ajuda a obter as leituras e gravações de menor latência no Feature Store. Você pode reduzir a latência da rede para o Feature Store AWS PrivateLink implantando no endpoint do Feature Store Runtime. Com AWS PrivateLink, você pode acessar de forma privada todas as operações da API Feature Store Runtime a partir da sua Amazon Virtual Private Cloud (VPC) de forma escalável usando endpoints de interface VPC. Uma AWS PrivateLink implantação com a `privateDNSEnabled` opção definida como verdadeira:
+ Ele mantém todo o read/write tráfego da Feature Store em sua VPC.
+ Mantém o tráfego na mesma AZ do cliente que o originou ao usar o Feature Store. Isso evita os “saltos” entre a AZs redução da latência da rede.

Siga as etapas em [Acessar um AWS serviço usando uma interface VPC endpoint](https://docs.aws.amazon.com/vpc/latest/privatelink/create-interface-endpoint.html) AWS PrivateLink para configurar o Feature Store. O nome do serviço do Feature Store Runtime em AWS PrivateLink é`com.amazonaws.region.sagemaker.featurestore-runtime`.

O armazenamento on-line de nível `InMemory` escala automaticamente com base no uso e nas solicitações. O escalonamento automatizado pode levar alguns minutos para se adaptar a um novo padrão de uso se ele mudar rapidamente. Durante o dimensionamento automatizado:
+ As operações de gravação no grupo de atributos podem sofrer controle de utilização. Você deve repetir suas solicitações alguns minutos depois.
+ As operações de leitura no grupo de atributos podem sofrer controle de utilização. As estratégias de repetição padrão são adequadas nesse caso.
+ As operações de leitura podem apresentar latência elevada.

O tamanho máximo do grupo de atributos de nível `InMemory` padrão é de 50 GiB.

Observe que o nível `InMemory`atualmente é compatível com somente grupos de atributos online, não grupos de atributos online\$1offline, portanto, não há replicação entre armazenamentos on-line e offline para o nível `InMemory`. Além disso, o nível `InMemory` atualmente não oferece apoio a chaves do KMS gerenciadas pelo cliente.

# Armazenamento offline
<a name="feature-store-storage-configurations-offline-store"></a>

O armazenamento offline é usado para dados históricos quando a recuperação em menos de um segundo não é necessária. Geralmente é usado para exploração de dados, treinamento de modelos e inferência em lote. 

Quando você habilita os armazenamentos on-line e offline para seu grupo de atributos, os dois armazenamentos são sincronizados para evitar discrepâncias entre os dados de treinamento e de fornecimento. Observe que um grupo de atributos do armazenamento on-line com o tipo de armazenamento `InMemory` habilitado atualmente não oferece apoio a um grupo de atributos correspondente no armazenamento offline (sem replicação online para offline). Para obter mais informações sobre a veiculação do modelo de ML na Amazon SageMaker Feature Store, consulte[Armazenamento on-line](feature-store-storage-configurations-online-store.md).

O armazenamento offline contém as seguintes opções de `TableFormat`: Para obter informações sobre o conteúdo da loja off-line, consulte [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html)a Amazon SageMaker API Reference.

## Formato de tabela do Glue
<a name="feature-store-storage-configurations-offline-store-glue-table-format"></a>

O formato do `Glue` (padrão) é um formato de tabela padrão do tipo Hive para AWS Glue. Com AWS Glue isso, você pode descobrir, preparar, mover e integrar dados de várias fontes. Também inclui outras ferramentas de produtividade e operações de dados para criação, execução de trabalhos e implementação de fluxos de trabalho de negócios. Para obter mais informações sobre AWS Glue, consulte [O que é AWS Glue?](https://docs.aws.amazon.com/glue/latest/dg/what-is-glue.html) .

## Formato de tabela do Iceberg
<a name="feature-store-storage-configurations-offline-store-iceberg-table-format"></a>

O formato `Iceberg` (recomendado) é um formato de tabela aberta para tabelas analíticas muito grandes. Com o `Iceberg`, você pode compactar os pequenos arquivos de dados em menos arquivos grandes na partição, resultando em consultas significativamente mais rápidas. Essa operação de compactação é simultânea e não afeta as operações contínuas de leitura e gravação no grupo de atributos. Para obter mais informações sobre optimização de tabelas do Iceberg, consulte o [Guia do usuário do Amazon Athena](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg-data-optimization.html) e o [Guia do usuário do AWS Lake Formation](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html).

O `Iceberg` gerencia grandes coleções de arquivos como tabelas e oferece apoio a operações analíticas modernas de data lake. Se você escolher a `Iceberg` opção ao criar novos grupos de recursos, a Amazon SageMaker Feature Store cria as `Iceberg` tabelas usando o formato de arquivo Parquet e registra as tabelas com o. AWS Glue Data Catalog Para obter mais informações sobre formatos de tabela `Iceberg`, consulte [Usar tabelas do Apache Iceberg](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html). 

**Importante**  
Observe que, para grupos de atributos no formato de tabela `Iceberg`, você deve especificar `String` como o tipo do atributo do horário do evento. Se você especificar qualquer outro tipo, não poderá criar o grupo de atributos com êxito.

# Modos de throughput
<a name="feature-store-throughput-mode"></a>

A Amazon SageMaker Feature Store oferece dois modelos de preços para você escolher: modos de taxa de transferência sob demanda (`On-demand`) e provisionado (`Provisioned`). `On-demand`funciona melhor para tráfego menos previsível, enquanto `Provisioned` funciona melhor para tráfego consistente e previsível. 

Você tem a opção de alternar entre os modos `On-demand` e `Provisioned` do throughput para um determinado grupo de atributos, para acomodar períodos nos quais os padrões de tráfego da aplicação estão mudando ou são menos previsíveis. Você só pode atualizar o modo de throughput do grupo de atributos para `On-demand` uma vez em um período de 24 horas. O modo de taxa de transferência pode ser atualizado programaticamente usando a [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou por meio da interface do usuário do console. Para obter mais informações sobre como usar o console, consulte [Usando a Amazon SageMaker Feature Store no console](feature-store-use-with-studio.md).

Você pode usar o modo de throughput `Provisioned` com grupos de atributos somente offline ou grupos de atributos com o tipo de armazenamento `Standard`. Para outras configurações de armazenamento, o modo `On-demand` da throughput é usado. Para obter informações sobre as configurações de armazenamento on-line e offline, consulte [Armazenamento on-line](feature-store-storage-configurations-online-store.md) e [Armazenamento offline](feature-store-storage-configurations-offline-store.md), respectivamente.

Para obter mais detalhes sobre preços, consulte [Amazon SageMaker Pricing](https://aws.amazon.com/sagemaker/pricing/).

**Topics**
+ [Modo de throughput sob demanda](#feature-store-throughput-mode-on-demand)
+ [Modo de throughput provisionada](#feature-store-throughput-mode-provisioned)
+ [Métricas do modo de throughput](#feature-store-throughput-mode-metrics)
+ [Limites do modo de throughput](#feature-store-throughput-mode-limits)

## Modo de throughput sob demanda
<a name="feature-store-throughput-mode-on-demand"></a>

O modo de throughput `On-demand` (padrão) funciona melhor quando você usa grupos de atributos com workload desconhecido, tráfego de aplicações imprevisível e não consegue prever os requisitos de capacidade.

O modo `On-demand` cobra pelas leituras e gravações que a aplicação realiza nos grupos de atributos. Não é necessário especificar o throughput de leitura e gravação que você espera que sua aplicação execute, pois o Feature Store acomoda instantaneamente o crescimento e a redução dos workloads. Você paga apenas pelo que usa, que é medido em `ReadRequestsUnits` e `WriteRequestsUnits`.

Você pode ativar o modo de taxa de `On-demand` transferência usando [CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html)ou [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) APIs ou por meio da interface do usuário do console. Para obter mais informações sobre como usar a interface do console, consulte [Usando a Amazon SageMaker Feature Store no console](feature-store-use-with-studio.md).

**Importante**  
Você só pode atualizar o modo de throughput do grupo de atributos para `On-demand` uma vez em um período de 24 horas.

## Modo de throughput provisionada
<a name="feature-store-throughput-mode-provisioned"></a>

O modo de throughput `Provisioned` funciona melhor quando você usa grupos de atributos com workloads previsíveis e pode prever os requisitos de capacidade para controlar os custos. Isso pode reduzir o custo para determinadas workloads, nas quais você pode antecipar os requisitos de throughput.

Quando você define um grupo de atributos para o modo `Provisioned`, você especifica as unidades de capacidade que uma aplicação pode consumir de um grupo de atributos. Se a aplicação exceder sua capacidade de throughput `Provisioned`, ele estará sujeito à controle de utilização de solicitações.

Veja a seguir informações sobre as unidades de capacidade de leitura e gravação. 
+ Recuperar um único registro de até 4 KB usando a API `GetRecord` consumirá *pelo menos* 1 RCU (unidade de capacidade de leitura). A recuperação de cargas úteis maiores pode demorar mais. O número total de unidades de capacidade de leitura necessárias varia de acordo com o tamanho do item, incluindo um pequeno metadado por registro adicionado pelo Feature Store. 
+ Uma única solicitação de gravação com uma carga útil de 1 kB usando a API `PutRecord` consumirá *pelo menos* 1 WCU (unidade de capacidade de gravação), com cargas fracionárias arredondadas para o kB mais próximo. Pode consumir mais dependendo da hora do evento, do status de exclusão do registro e do status do tempo de vida (TTL). Para mais informações sobre TTL, consulte [Duração do tempo de vida (TTL) dos registros](feature-store-time-to-live.md).

**Importante**  
Ao definir suas unidades de capacidade, considere o seguinte:  
Você será cobrado pelas capacidades de leitura e gravação provisionadas para seu grupo de atributos, mesmo que não utilize totalmente a capacidade de `Provisioned`.
Se você definir uma capacidade de leitura ou gravação muito baixa, suas solicitações poderão sofrer controle de utilização.
Em alguns casos, os registros podem consumir uma unidade de capacidade extra devido aos metadados em nível de registro adicionados pelo Feature Store para ativar vários atributos. 
Recuperar somente um subconjunto de recursos usando `GetRecord` ou ainda `BatchGetRecord` APIs consumirá a RCU correspondente ao registro inteiro. 
Para capacidade de gravação, você deve provisionar o dobro da capacidade de pico recente para evitar controle de utilização ao realizar preenchimentos ou ingestão em massa, o que pode resultar em um grande número de gravações históricas de registros. Isso ocorre porque a gravação de registros históricos consome mais capacidade de gravação.
Atualmente, o Feature Store não oferece apoio ao ajuste de escala automático para o modo `Provisioned`. 

Você pode ativar o modo de taxa de `On-demand` transferência usando [CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html)ou [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) APIs ou por meio da interface do usuário do console. Para obter mais informações sobre como usar a interface do console, consulte [Usando a Amazon SageMaker Feature Store no console](feature-store-use-with-studio.md).

A seguir, descrevemos como você pode aumentar ou diminuir o throughput de RCU e WCU para seus grupos de atributos quando o modo `Provisioned` está ativado. 

**Aumentar a throughput provisionada**

Você pode aumentar a RCU ou a WCU sempre que necessário usando a [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou a interface do console. 

**Diminuir a throughput provisionada**

Você pode diminuir a RCU e a WCU (ou ambas) para grupos de recursos usando a [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html)API ou a interface do console. 

Há uma cota padrão para o número de reduções de capacidade `Provisioned` que você pode realizar no grupo de atributos por dia. Um dia é definido de acordo com o Tempo Universal Coordenado (UTC). Em determinado dia, você pode começar realizando até quatro reduções dentro de uma hora, desde que ainda não tenha realizado nenhuma outra redução durante esse dia. Posteriormente, você pode realizar uma redução adicional por hora, desde que não haja reduções na hora anterior. Isso leva o número máximo de diminuições em um dia para 27 vezes (4 diminuições na primeira hora e 1 diminuição para cada uma das janelas de 1 hora subsequentes em um dia).

## Métricas do modo de throughput
<a name="feature-store-throughput-mode-metrics"></a>

Um grupo de atributos no modo `On-demand` emitirá `ConsumedReadRequestsUnits` e métricas `ConsumedWriteRequestsUnits`. Um grupo de atributos no modo `Provisioned` emitirá `ConsumedReadCapacityUnits` e métricas `ConsumedWriteCapacityUnits`. Para obter mais informações sobre métricas do Feature Store, consulte [Métricas da Amazon SageMaker Feature Store](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store).

## Limites do modo de throughput
<a name="feature-store-throughput-mode-limits"></a>

Cada um Conta da AWS tem cotas ou limites de serviço padrão que são aplicados para ajudar a garantir a disponibilidade e gerenciar os riscos de cobrança. Para obter mais informações sobre limites e cotas padrão, consulte [Cotas, regras de nomenclatura e tipos de dados](feature-store-quotas.md).

Em alguns casos, esses limites podem ser menores do que o indicado na documentação. Se você precisar aumentar esse limite, pode enviar uma solicitação. É uma boa ideia fazer isso antes de atingir os limites atuais para evitar interrupções no trabalho. Para obter mais informações sobre service quotas e como solicitar um aumento de cota, consulte [Service quotas da AWS](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).