

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# En quoi consiste Application Auto Scaling ?
<a name="what-is-application-auto-scaling"></a>

Application Auto Scaling est un service Web destiné aux développeurs et aux administrateurs système qui ont besoin d'une solution permettant de dimensionner automatiquement leurs ressources évolutives pour des AWS services individuels autres qu'[Amazon EC2 Auto Scaling](https://docs.aws.amazon.com/autoscaling/ec2/userguide/what-is-amazon-ec2-auto-scaling.html). Avec Application Auto Scaling, vous pouvez configurer le dimensionnement automatique pour les ressources suivantes : 
+ WorkSpaces Flottes d'applications
+ Réplicas Aurora
+ Classification de documents et points de terminaison de module de reconnaissance d’entité Amazon Comprehend
+ Tables DynamoDB et index secondaires globaux
+ Services Amazon ECS
+ ElastiCache groupes de réplication (Redis OSS et Valkey) et clusters Memcached 
+ Clusters Amazon EMR
+ Tables Amazon Keyspaces (for Apache Cassandra)
+ Simultanéité allouée pour la fonction Lambda
+ Stockage de l'agent Amazon Managed Streaming for Apache Kafka (MSK)
+ Clusters Amazon Neptune
+ SageMaker Variantes de terminaux AI
+ SageMaker Composants d'inférence AI
+ SageMaker Concurrence provisionnée sans serveur AI
+ Demandes de parc d'instances Spot
+ Pool d'Amazon WorkSpaces
+ Ressources personnalisées fournies par vos propres applications ou services. Pour plus d'informations, consultez le [GitHubréférentiel](https://github.com/aws/aws-auto-scaling-custom-resource). 

Pour connaître la disponibilité régionale de l'un des AWS services énumérés ci-dessus, consultez le [tableau](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/) des .

Pour plus d'informations sur le dimensionnement de votre parc d' EC2 instances Amazon à l'aide de groupes Auto Scaling, consultez le [guide de l'utilisateur d'Amazon EC2 Auto Scaling](https://docs.aws.amazon.com/autoscaling/ec2/userguide/). 

## Caractéristiques d'Application Auto Scaling
<a name="features"></a>

Application Auto Scaling vous permet de mettre automatiquement à l'échelle vos ressources évolutives en fonction des conditions que vous définissez.
+ **Mise à l'échelle du suivi des cibles : redimensionnez** une ressource en fonction de la valeur cible d'une CloudWatch métrique spécifique.
+ **Mise à l'échelle par étapes** – Met à l'échelle une ressource en fonction d'un ensemble d'ajustements de mise à l'échelle qui varient en fonction de la valeur du niveau de l'alarme.
+ **Mise à l'échelle planifiée** – Met à l'échelle une ressource une seule fois ou selon un calendrier récurrent.
+ **Mise à l'échelle prédictive** : dimensionnez une ressource de manière proactive pour qu'elle corresponde à la charge prévue en fonction des données historiques.

## Fonctionnent avec Application Auto Scaling
<a name="access"></a>

Vous pouvez configurer la mise à l'échelle à l'aide des interfaces suivantes en fonction de la ressource pour laquelle vous effectuez une mise à l'échelle :
+ **AWS Management Console**  - offre une interface Web que vous pouvez utiliser pour configurer la mise à l'échelle. Créez un AWS compte et connectez-vous au AWS Management Console. Ensuite, ouvrez la console du service pour l'une des ressources répertoriées dans l'introduction. Par exemple, pour redimensionner une fonction Lambda, ouvrez le. AWS Lambda console Assurez-vous d'ouvrir la console au même endroit Région AWS que la ressource avec laquelle vous souhaitez travailler.
**Note**  
L'accès par la console n'est pas disponible pour toutes les ressources. Pour de plus amples informations, veuillez consulter [Services AWS que vous pouvez utiliser avec Application Auto Scaling](integrated-services-list.md).
+ **AWS Command Line Interface (AWS CLI)** — Fournit des commandes pour un large éventail de Services AWS, et est compatible avec Windows, macOS et Linux. Consultez [AWS Command Line Interface](https://docs.aws.amazon.com/cli/) pour démarrer. *Pour obtenir la liste des commandes, consultez la section [application-autoscaling](https://docs.aws.amazon.com/cli/latest/reference/application-autoscaling/) dans le AWS CLI manuel Command Reference.*
+ **AWS Tools for Windows PowerShell**— Fournit des commandes pour un large éventail de AWS produits pour ceux qui écrivent des scripts dans l' PowerShell environnement. Consultez le [Guide de l'utilisateur Outils AWS pour PowerShell](https://docs.aws.amazon.com/powershell/latest/userguide/) pour démarrer. Pour plus d'informations, consultez le [Guide de référence des cmdlets Outils AWS pour PowerShell](https://docs.aws.amazon.com/powershell/latest/reference/Index.html).
+ **AWS SDKs**— Fournit des opérations d'API spécifiques au langage et prend en charge de nombreux détails de connexion, tels que le calcul des signatures, la gestion des nouvelles tentatives de demande et la gestion des erreurs. Pour plus d'informations, consultez la section [Outils sur lesquels vous pouvez vous appuyer AWS](https://aws.amazon.com/developer/tools/).
+ **API HTTPS** : Fournit des actions d'API de bas niveau appelées à l'aide de demandes HTTPS. Pour plus d'informations, consultez la [Référence de l'API Application Auto Scaling](https://docs.aws.amazon.com/autoscaling/application/APIReference/).
+ **CloudFormation**— Permet de configurer le dimensionnement à l'aide d'un CloudFormation modèle. Pour de plus amples informations, veuillez consulter [Configurez les ressources Application Auto Scaling à l'aide de AWS CloudFormation](creating-resources-with-cloudformation.md).

Pour vous connecter par programmation à un Service AWS, vous utilisez un point de terminaison. Pour plus d'informations sur les points de terminaison pour les appels à Application Auto Scaling, consultez [Application Auto Scaling endpoints and quotas](https://docs.aws.amazon.com/general/latest/gr/as-app.html) in the *Références générales AWS* . 

# Concepts d'Application Auto Scaling
<a name="getting-started"></a>

Cette rubrique explique les concepts clés qui vous permettront de découvrir Application Auto Scaling et de l'utiliser. 

**Cible évolutive**  <a name="scalabletarget"></a>
Une entité que vous créez pour spécifier la ressource que vous souhaitez mettre à l'échelle. Chaque cible évolutive est identifiée de manière unique par un espace de noms de service, un ID de ressource et une dimension évolutive, qui représente une certaine dimension de capacité du service sous-jacent. Par exemple, Amazon ECS service prend en charge la scalabilité automatique de son nombre de tâches, une table DynamoDB prend en charge la scalabilité automatique de la capacité de lecture et d'écriture de la table et de ses index secondaires globaux, et un cluster Aurora prend en charge la mise à l'échelle de son nombre de réplicas.   
Chaque cible évolutive possède également une capacité minimale et maximale. Les politiques de mise à l'échelle ne seront jamais supérieures ou inférieures à la plage minimum-maximum. Vous pouvez apporter out-of-band des modifications directement à la ressource sous-jacente qui se situent en dehors de cette plage, ce qu'Application Auto Scaling ne connaît pas. Cependant, chaque fois qu'une politique de mise à l'échelle est invoquée ou que l'API `RegisterScalableTarget` est appelée, Application Auto Scaling récupère la capacité actuelle et la compare à la capacité minimale et maximale. Si elle se situe en dehors de la plage minimum-maximum, la capacité est mise à jour pour se conformer aux minimums et maximums définis.

**Mise à l'échelle horizontale**  <a name="scalein"></a>
Lorsque l'Application Auto Scaling réduit automatiquement la capacité d'une cible évolutive, la cible évolutive est *mise à l'échelle horizontale*. Lorsque des politiques de mise à l’échelle sont définies, elles ne peuvent pas mettre à l’échelle horizontale la cible capable d’être mise à l’échelle en dessous de sa capacité minimale.

**Monter en puissance**  <a name="scaleout"></a>
Lorsque l'Application Auto Scaling augmente automatiquement la capacité d'une cible évolutive, la cible évolutive subit une *montée en puissance*. Lorsque des politiques de mise à l’échelle sont définies, elles ne peuvent pas faire monter en puissance la cible capable d’être mise à l’échelle au dessus de sa capacité maximale.

**Politique de mise à l'échelle**  <a name="scalingpolicy"></a>
Une politique de dimensionnement indique à Application Auto Scaling de suivre une CloudWatch métrique spécifique. Ensuite, elle détermine l'action de mise à l'échelle à prendre lorsque la métrique est supérieure ou inférieure à une certaine valeur de seuil. Par exemple, vous pourriez vouloir augmenter la capacité de votre cluster si l'utilisation du CPU commence à augmenter, et la diminuer lorsqu'elle retombe.   
Les métriques utilisées pour le dimensionnement automatique sont publiées par le service cible, mais vous pouvez également publier votre propre métrique sur, CloudWatch puis l'utiliser avec une politique de dimensionnement.   
Un temps de stabilisation entre les activités de mise à l'échelle permet à la ressource de se stabiliser avant le début d'une autre activité de mise à l'échelle. Application Auto Scaling continue à évaluer les métriques pendant le temps de stabilisation. À la fin du temps de stabilisation, la politique de mise à l'échelle lance une autre activité de mise à l'échelle si nécessaire. Pendant le temps de stabilisation, si une plus grande augmentation est nécessaire en fonction de la valeur métrique actuelle, la politique de mise à l'échelle effectue une augmentation immédiatement.

**Action planifiée**  <a name="scheduledaction"></a>
Les actions planifiées mettent automatiquement à l'échelle les ressources à une date et une heure spécifiques. Elles fonctionnent en modifiant la capacité minimale et maximale d'une cible évolutive, et peuvent donc être utilisées pour effectuer une diminution ou une augmentation selon une planification en définissant une capacité minimale élevée ou une capacité maximale faible. Par exemple, vous pouvez utiliser des actions planifiées pour mettre à l'échelle une application qui ne consomme pas de ressources le week-end en diminuant la capacité le vendredi et en l'augmentant le lundi suivant.  
Vous pouvez également utiliser des actions planifiées pour optimiser les valeurs minimales et maximales au fil du temps afin de vous adapter à des situations où l'on s'attend à un trafic supérieur à la normale, par exemple des campagnes de marketing ou des fluctuations saisonnières. Cela peut vous aider à améliorer les performances lorsque vous devez augmenter la capacité pour faire face à l'augmentation de l'utilisation, et à réduire les coûts lorsque vous utilisez moins de ressources.

## En savoir plus
<a name="getting-started-learn-more"></a>

[Services AWS que vous pouvez utiliser avec Application Auto Scaling](integrated-services-list.md) : Cette section vous présente les services que vous pouvez mettre à l'échelle et vous aide à configurer la scalabilité automatique en enregistrant une cible évolutive. Elle décrit également chacun des rôles liés au service IAM que Application Auto Scaling crée pour accéder aux ressources du service cible. 

[Politique de suivi des cibles et d'échelonnement pour Application Auto Scaling](application-auto-scaling-target-tracking.md) : Les politiques de suivi des cibles et d'échelonnement sont l'une des principales caractéristiques d'Application Auto Scaling. Découvrez comment les politiques de suivi des cibles ajustent automatiquement la capacité souhaitée pour maintenir l'utilisation à un niveau constant en fonction des valeurs de métriques et d'objectifs que vous avez configurées. Par exemple, vous pouvez configurer le suivi de cible pour maintenir l'utilisation moyenne du CPU de votre parc d'instances Spot à 50 %. Application Auto Scaling lance ou arrête ensuite les EC2 instances selon les besoins afin de maintenir l'utilisation agrégée du processeur sur tous les serveurs à 50 %.