

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# O que é Application Auto Scaling?
<a name="what-is-application-auto-scaling"></a>

[O Application Auto Scaling é um serviço web para desenvolvedores e administradores de sistemas que precisam de uma solução para escalar automaticamente seus recursos escaláveis para serviços individuais além do AWS Amazon Auto Scaling. EC2 ](https://docs.aws.amazon.com/autoscaling/ec2/userguide/what-is-amazon-ec2-auto-scaling.html) Com o Application Auto Scaling, você pode configurar o escalonamento automático para os seguintes recursos: Com o recursos na Região Secreta: AWS 
+ WorkSpaces Frotas de aplicativos
+ Réplicas do Aurora
+ Classificação de documentos e endpoints de reconhecimento de entidade do Amazon Comprehend
+ Tabelas e índices secundários globais do DynamoDB
+ Serviços do Amazon ECS
+ ElastiCache grupos de replicação (Redis OSS e Valkey) e clusters Memcached 
+ Clusters do Amazon EMR
+ Tabelas do Amazon Keyspaces (for Apache Cassandra)
+ Simultaneidade provisionada pela função do Lambda 
+ Armazenamento de agente do Amazon Managed Streaming for Apache Kafka (MSK)
+ Clusters do Amazon Neptune
+ SageMaker Variantes de endpoint de IA
+ SageMaker Componentes de inferência de IA
+ SageMaker Concorrência provisionada por IA sem servidor
+ Solicitações de frota spot
+ Pool da Amazon WorkSpaces
+ Os recursos personalizados fornecidos por seus próprios aplicativos ou serviços. Para obter mais informações, consulte o [GitHubrepositório.](https://github.com/aws/aws-auto-scaling-custom-resource) 

Para ver a disponibilidade regional de qualquer um dos AWS serviços listados acima, consulte a tabela de [regiões Tabela](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/) de .

Para obter informações sobre como escalar sua frota de EC2 instâncias da Amazon usando grupos do Auto Scaling, consulte o Guia do usuário do [Amazon Auto EC2 Scaling](https://docs.aws.amazon.com/autoscaling/ec2/userguide/). 

## Recursos do Application Auto Scaling
<a name="features"></a>

O Application Auto Scaling permite escalar automaticamente os recursos escaláveis de acordo com as condições definidas por você.
+ **Escala de rastreamento de metas** — Dimensione um recurso com base em um valor alvo para uma CloudWatch métrica específica.
+ **Escalabilidade em etapas**: escale um recurso com base em um conjunto de ajustes de escalabilidade que variam de acordo com o tamanho da ruptura do alarme.
+ **Escalabilidade programada**: escale um recurso apenas uma vez ou em uma programação recorrente.
+ Escalabilidade **preditiva — Dimensione** um recurso de forma proativa para corresponder à carga prevista com base em dados históricos.

## Trabalho com o Application Auto Scaling
<a name="access"></a>

Você pode configurar a escalabilidade usando as seguintes interfaces, dependendo do recurso que você está escalando:
+ **Console de gerenciamento da AWS**: fornece uma interface da Web que você pode usar para configurar a escalabilidade. Crie uma AWS conta e faça login no Console de gerenciamento da AWS. Abra o console do serviço para um dos recursos listados na introdução. Por exemplo, para escalar uma função Lambda, abra o. AWS Lambda console Certifique-se de abrir o console da Região da AWS mesma forma que o recurso com o qual você deseja trabalhar.
**nota**  
O acesso ao console não está disponível para todos os recursos. Para obter mais informações, consulte [Serviços da AWS que você pode usar com o Application Auto Scaling](integrated-services-list.md).
+ **AWS Command Line Interface (AWS CLI)** — Fornece comandos para um amplo conjunto de Serviços da AWS e é compatível com Windows, macOS e Linux. Para começar, consulte o [AWS Command Line Interface](https://docs.aws.amazon.com/cli/). Para conferir uma lista de comandos, consulte [application-autoscaling](https://docs.aws.amazon.com/cli/latest/reference/application-autoscaling/) na *AWS CLI Command Reference*.
+ **AWS Tools for Windows PowerShell**— Fornece comandos para um amplo conjunto de AWS produtos para quem cria scripts no PowerShell ambiente. Para começar a usar, consulte o [Guia do usuário do Ferramentas da AWS para PowerShell](https://docs.aws.amazon.com/powershell/latest/userguide/). Para obter mais informações, consulte [Referência de Cmdlets do Ferramentas da AWS para PowerShell](https://docs.aws.amazon.com/powershell/latest/reference/Index.html).
+ **AWS SDKs**— fornece operações de API específicas do idioma e cuida de muitos detalhes da conexão, como calcular assinaturas, lidar com novas tentativas de solicitação e lidar com erros. Para obter mais informações, consulte [Ferramentas para desenvolver AWS](https://aws.amazon.com/developer/tools/).
+ **API HTTPS**: fornece ações de API de nível inferior que você chama usando solicitações HTTPS. Para obter mais informações, consulte a [Referência da API do Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/APIReference/).
+ **CloudFormation**— Suporta a configuração do dimensionamento usando um CloudFormation modelo. Para obter mais informações, consulte [Configurar recursos do Application Auto Scaling usando AWS CloudFormation](creating-resources-with-cloudformation.md).

Para se conectar programaticamente a um AWS service (Serviço da AWS), você usa um endpoint. . 

# Conceitos do Application Auto Scaling
<a name="getting-started"></a>

Este tópico explica conceitos-chave para ajudar a aprender sobre o Application Auto Scaling e começar a usá-lo. 

**Destinos escaláveis**  <a name="scalabletarget"></a>
Uma entidade que você cria para especificar o recurso que deseja dimensionar. Cada destino escalável é identificado exclusivamente por um namespace de serviço, ID de recurso e dimensão escalável, que representa uma dimensão de capacidade do serviço subjacente. Por exemplo, um serviço do Amazon ECS é compatível com escalabilidade automática de sua contagem de tarefas, uma tabela do DynamoDB é compatível com escalabilidade automática da capacidade de leitura e gravação da tabela e de seus índices secundários globais, e um cluster do Aurora é compatível com escalabilidade de sua contagem de réplicas.   
Cada destino escalável também tem capacidades mínima e máxima. As políticas de escalabilidade nunca serão superiores ou inferiores ao intervalo mínimo máximo. Você pode fazer out-of-band alterações diretamente no recurso subjacente que está fora desse intervalo, o que o Application Auto Scaling não conhece. No entanto, sempre que uma política de escalabilidade for invocada ou a API `RegisterScalableTarget` for chamada, Application Auto Scaling recuperará a capacidade atual e comparará com as capacidades mínima e máxima. Se sair do intervalo mínimo-máximo, então a capacidade será atualizada para cumprir com o mínimo e o máximo definidos.

**Reduzir a escala**  <a name="scalein"></a>
Quando o Application Auto Scaling diminui automaticamente a capacidade de um destino escalável, o destino escalável *reduz a escala*. Quando as políticas de escalabilidade estão definidas, elas não podem reduzir a escala horizontalmente no destino dimensionável abaixo de sua capacidade mínima.

**Escalonamento horizontal**  <a name="scaleout"></a>
Quando o Application Auto Scaling diminui automaticamente a capacidade de um destino escalável, o destino escalável *aumenta a escala*. Quando as políticas de escalabilidade estão definidas, elas não podem aumentar a escala horizontalmente no destino dimensionável acima de sua capacidade máxima.

**Política de escalabilidade**  <a name="scalingpolicy"></a>
Uma política de escalabilidade instrui o Application Auto Scaling a rastrear uma métrica específica. CloudWatch Em seguida, determina a ação de escalabilidade a ser executada quando a métrica é maior ou menor do que um determinado valor limite. Por exemplo, convém aumentar a escala horizontalmente se o uso da CPU em todo o cluster começar a aumentar, e reduzir a escala horizontalmente quando ele cair novamente.   
As métricas usadas para escalonamento automático são publicadas pelo serviço de destino, mas você também pode publicar sua própria métrica CloudWatch e usá-la com uma política de escalabilidade.   
Um período de desaquecimento entre as atividades de escalabilidade permite que o recurso se estabilize antes que outra atividade de escalabilidade comece. O Application Auto Scaling continua a avaliar métricas durante o período de desaquecimento. Quando o período de desaquecimento termina, a política de escalabilidade inicia outra atividade de escalabilidade se necessário. Enquanto um período de desaquecimento estiver em vigor, se uma escala horizontal maior for necessária com base no valor da métrica atual, a política de escalabilidade aumentará a escala imediatamente.

**Ação programada**  <a name="scheduledaction"></a>
As ações programadas escalam automaticamente os recursos em uma data e hora específicas. Eles funcionam modificando as capacidades mínima e máxima de um destino escalável e, portanto, podem ser usados para aumentar e reduzir a escala em uma programação, definindo a capacidade mínima alta ou a capacidade máxima baixa. Por exemplo, você pode usar ações programadas para escalar uma aplicação que não consome recursos nos fins de semana, diminuindo a capacidade na sexta-feira e aumentando a capacidade na segunda-feira seguinte.  
Você também pode usar ações agendadas para otimizar os valores mínimo e máximo ao longo do tempo para se adaptar a situações em que é esperado um tráfego maior do que o normal, por exemplo, campanhas de marketing ou flutuações sazonais. Isso pode ajudar você a melhorar a performance em momentos em que você precisa aumentar a escala para o uso crescente e reduzir os custos quando você usa menos recursos.

## Saiba mais
<a name="getting-started-learn-more"></a>

[Serviços da AWS que você pode usar com o Application Auto Scaling](integrated-services-list.md): esta seção apresenta os serviços que você pode escalar e ajuda a configurar o Auto Scaling, registrando um destino escalável. Também descreve cada uma das funções vinculadas ao serviço do IAM que o Application Auto Scaling cria para acessar recursos no serviço de destino. 

[Políticas de dimensionamento com monitoramento do objetivo para o Application Auto Scaling](application-auto-scaling-target-tracking.md): um dos principais recursos do Application Auto Scaling são as políticas de dimensionamento de monitoramento do objetivo. Saiba como as políticas de monitoramento do objetivo ajustam automaticamente a capacidade desejada para manter a utilização em um nível constante com base na métrica e nos valores de destino configurados. Por exemplo, é possível configurar o monitoramento do objetivo para manter a utilização de CPU da sua frota de servidores da Web em 50%. Em seguida, o Application Auto Scaling inicia ou encerra EC2 instâncias conforme necessário para manter a utilização agregada da CPU em todos os servidores em 50%.