Supervisión del estado de la instancia de contenedor de Amazon ECS
Amazon ECS proporciona supervisión del estado de las instancias de contenedores. Puede determinar rápidamente si Amazon ECS ha detectado algún problema que pudiera impedir a las instancias de contenedores ejecutar contenedores. Amazon ECS realiza comprobaciones automatizadas en cada instancia de contenedor en ejecución con versión de agente 1.57.0 o posterior para identificar problemas. Para obtener más información sobre cómo verificar la versión del agente y una instancia de contenedor, consulte Actualización del agente de contenedor de Amazon ECS.
Debe utilizar la version de AWS CLI 1.22.3 o posterior o la version de AWS CLI 2.3.6 o posterior. Para obtener más información sobre como actualizar la AWS CLI, consulte Instalación o actualización de la última versión de la AWS CLI en la Guía del usuario de AWS Command Line Interface versión 2.
Para ver el estado de la instancia de contenedor, ejecute describe-container-instances con la opción CONTAINER_INSTANCE_HEALTH.
El valor overallStatus lo determinan los estados de las comprobaciones de estado individuales de la matriz details. El estado más grave tiene prioridad en el siguiente orden: IMPAIRED, INSUFFICIENT_DATA, INITIALIZING y OK.
Los siguientes son los valores válidos para overallStatus:
-
OK: todas las comprobaciones de estado se han superado. -
IMPAIRED: una o más comprobaciones de estado no se han superado. -
INSUFFICIENT_DATA: los datos para una o más comprobaciones de estado no están disponibles. -
INITIALIZING: una o más comprobaciones de estado se están iniciando.
Los valores del type de comprobación de estado incluyen los siguientes:
-
CONTAINER_RUNTIME: supervisa el estado del tiempo de ejecución del contenedor (por ejemplo, el daemon de Docker). Disponible en el tipo de lanzamiento de EC2. -
ACCELERATED_COMPUTE: supervisa el estado de los dispositivos informáticos acelerados, como las GPU. Cuando una GPU está deteriorada, elstatusReasoncontiene el código de error Xid de NVIDIA en el formatoXID_<number>. Disponible en el tipo de lanzamiento de instancias administradas de Amazon ECS. -
DAEMON: supervisa el estado de las tareas del daemon necesarias en la instancia de contenedor. Disponible en el tipo de lanzamiento de instancias administradas de Amazon ECS.
También puede supervisar los cambios en el estado a través de eventos. Para obtener más información, consulte Eventos de cambio de estado de la instancia de contenedor de Amazon ECS.
A continuación, se muestra un ejemplo de cómo ejecutar describe-container-instances.
aws ecs describe-container-instances \ --clustercluster_name\ --container-instances47279cd2cadb41cbaef2dcEXAMPLE\ --include CONTAINER_INSTANCE_HEALTH
A continuación, se muestra un ejemplo del objeto de estado de estado de la salida.
"healthStatus": { "overallStatus": "OK", "details": [{ "type": "CONTAINER_RUNTIME", "status": "OK", "lastUpdated": "2021-11-10T03:30:26+00:00", "lastStatusChange": "2021-11-10T03:26:41+00:00" }] }
Problemas de estado de las instancias de contenedor
Cuando el overallStatus sea cualquier estado que no sea OK, intente lo siguiente:
-
Espere y, a continuación, ejecute
describe-container-instances. -
Verifique el estado de la instancia de contenedor en la consola de EC2 o mediante el uso de la CLI.
-
Revise las métricas de CloudWatch. Para obtener más información, consulte Supervisión de Amazon ECS con CloudWatch
-
Consulte el Panel de AWS Health para ver si hay algún problema con el servicio.