# OPS 9 ¿Qué hace para comprender el estado de las operaciones?
<a name="w2aac19b5b9b7"></a>

 Defina, capture y analice las métricas de las operaciones para obtener visibilidad de los eventos de operaciones y poder tomar las medidas adecuadas. 

**Topics**
+ [OPS09-BP01 Identificar los indicadores clave de rendimiento](ops_operations_health_define_ops_kpis.md)
+ [OPS09-BP02 Definir métricas de operaciones](ops_operations_health_design_ops_metrics.md)
+ [OPS09-BP03 Recopilar y analizar métricas de operaciones](ops_operations_health_collect_analyze_ops_metrics.md)
+ [OPS09-BP04 Establecer referencias de métricas de operaciones](ops_operations_health_ops_metric_baselines.md)
+ [OPS09-BP05 Descubrir patrones esperados de actividad para las operaciones](ops_operations_health_learn_ops_usage_patterns.md)
+ [OPS09-BP06 Alertar cuando los resultados de las operaciones estén en riesgo](ops_operations_health_ops_outcome_alerts.md)
+ [OPS09-BP07 Alertar cuando se detecten anomalías en las operaciones](ops_operations_health_ops_anomaly_alerts.md)
+ [OPS09-BP08 Validar el logro de resultados y la efectividad de los KPI y las métricas](ops_operations_health_biz_level_view_ops.md)

# OPS09-BP01 Identificar los indicadores clave de rendimiento
<a name="ops_operations_health_define_ops_kpis"></a>

 Identifique los indicadores clave de rendimiento (KPI) en función de los resultados empresariales deseados (por ejemplo, las nuevas funciones entregadas) y los resultados de los clientes (por ejemplo, los casos de asistencia al cliente). Evalúe los KPI para determinar el éxito de las operaciones. 

 **Antipatrones usuales:** 
+  La dirección de la empresa le pregunta por el éxito de las operaciones en la consecución de los objetivos empresariales, pero no tiene un marco de referencia para determinar el éxito. 
+  No puede determinar si sus ventanas de mantenimiento tienen un impacto en los resultados del negocio. 

 **Beneficios de establecer esta práctica recomendada:** La identificación de los indicadores clave de rendimiento permite obtener resultados empresariales como prueba del estado y el éxito de sus operaciones. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Alto 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Identificar los indicadores clave de rendimiento: identifique los indicadores clave de rendimiento (KPI) en función de los resultados que desee obtener para la empresa y los clientes. Evalúe los KPI para determinar el éxito de las operaciones. 

# OPS09-BP02 Definir métricas de operaciones
<a name="ops_operations_health_design_ops_metrics"></a>

 Defina las métricas de las operaciones para medir la consecución de los KPI (por ejemplo, despliegues correctos y despliegues con errores). Defina las métricas de las operaciones para medir el estado de las actividades de las operaciones (por ejemplo, el tiempo medio para detectar un incidente [MTTD] y el tiempo medio de recuperación [MTTR] de un incidente). Evalúe las métricas para determinar si las operaciones obtienen los resultados deseados y para conocer el estado de las actividades de las operaciones. 

 **Patrones de uso no recomendados comunes:** 
+  Las métricas de sus operaciones se basan en lo que el equipo considera razonable. 
+  Tiene errores en los cálculos de las métricas que darán resultados incorrectos. 
+  No tiene ninguna métrica definida para las actividades de las operaciones. 

 **Beneficios de establecer esta práctica recomendada:** Al definir y evaluar las métricas de las operaciones, puede determinar el estado de las actividades de las operaciones y medir la consecución de los resultados empresariales. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Alto 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Defina la métrica de las operaciones: la finalidad es medir el logro de los KPI. Defina la métrica de las operaciones para medir estado de las operaciones y sus actividades. Evalúe las métricas para determinar si las operaciones están obteniendo los resultados deseados y para conocer el estado de las operaciones. 
  +  [Publique métricas personalizadas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Buscar y filtrar datos de registro](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
  +  [Referencia de métricas y dimensiones de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [AWS Answers: registro centralizado](https://aws.amazon.com/answers/logging/centralized-logging/) 
+  [Referencia de métricas y dimensiones de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Detecte y reaccione a los cambios en el estado de la canalización con Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Publique métricas personalizadas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Buscar y filtrar datos de registro](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Vídeos relacionados:** 
+  Diseñe un plan de monitoreo 

# OPS09-BP03 Recopilar y analizar métricas de operaciones
<a name="ops_operations_health_collect_analyze_ops_metrics"></a>

 Realice exámenes periódicos y proactivos de las métricas para identificar las tendencias y determinar dónde se necesitan respuestas apropiadas. 

 Debe agregar los datos de registro de la ejecución de sus actividades de operaciones y las llamadas a la API de operaciones en un servicio como CloudWatch Logs. Genere métricas a partir de la observación del contenido de los registros necesarios para poder obtener información sobre el rendimiento de las actividades de las operaciones. 

 En AWS, puede [exportar sus datos de registro a Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) o bien [enviar los registros directamente](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Sending-Logs-Directly-To-S3.html) to [Amazon S3](https://aws.amazon.com/s3/) para el almacenamiento a largo plazo. Con [AWS Glue](https://aws.amazon.com/glue/), puede descubrir y preparar sus datos de registro para el análisis, almacenando los metadatos asociados en [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html). [Amazon Athena](https://aws.amazon.com/athena/), a través de su integración nativa con AWS Glue, puede utilizarse para analizar sus datos de registro, consultándolos mediante SQL estándar. Utilizando una herramienta de inteligencia empresarial como [Quick](https://aws.amazon.com/quicksight/) puede visualizar, explorar y analizar sus datos. 

 **Patrones de uso no recomendados comunes:** 
+  La entrega constante de nuevas funciones se considera un indicador clave de rendimiento. No tiene ningún método para medir la frecuencia de los despliegues. 
+  Se registran los despliegues, los despliegues revertidos, las revisiones y las revisiones revertidas para hacer un seguimiento de las actividades de las operaciones, pero nadie revisa las métricas. 
+  Tiene un objetivo de tiempo de recuperación de quince minutos para restaurar una base de datos perdida, lo cual se definió al desplegar el sistema sin usuarios. Ahora tiene diez mil usuarios y lleva dos años funcionando. Una restauración reciente llevó más de dos horas en realizarse. Esto no se registró y nadie lo sabe. 

 **Beneficios de establecer esta práctica recomendada:** mediante la recopilación y el análisis de las métricas de sus operaciones, podrá comprender el estado de las mismas y conocer las tendencias que puedan tener un impacto en sus operaciones o en la consecución de sus resultados empresariales. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Alto 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Recopilar y analizar métricas de operaciones: realice exámenes periódicos y proactivos de las métricas para identificar las tendencias y determinar dónde se necesitan respuestas apropiadas. 
  +  [Uso de métricas de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Referencia de métricas y dimensiones de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
  +  [Recopile métricas y registros de las instancias de Amazon EC2 y de los servidores locales con el agente de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [Amazon Athena](https://aws.amazon.com/athena/) 
+  [Referencia de métricas y dimensiones de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [AWS Glue](https://aws.amazon.com/glue/) 
+  [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html) 
+  [Recopile métricas y registros de las instancias de Amazon EC2 y de los servidores locales con el agente de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 
+  [Uso de métricas de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS09-BP04 Establecer referencias de métricas de operaciones
<a name="ops_operations_health_ops_metric_baselines"></a>

 Establezca referencias para las métricas con el fin de proporcionar valores esperados como base para la comparación e identificación de las actividades de las operaciones que están por debajo o por encima de lo esperado. 

 **Patrones de uso no recomendados comunes:** 
+  Le han preguntado cuál es el tiempo previsto para el despliegue. No ha medido el tiempo que tarda en desplegarse y no puede determinar los tiempos previstos. 
+  Le han preguntado cuánto tiempo se tarda en recuperarse de un problema con los servidores de aplicaciones. No tiene información sobre el tiempo de recuperación desde el primer contacto con el cliente. No tiene información sobre el tiempo de recuperación desde la primera identificación de un problema hasta la supervisión. 
+  Se le ha preguntado por cuántas personas del servicio de asistencia se necesitan durante el fin de semana. No tiene ni idea de cuántos casos de asistencia son típicos durante un fin de semana y no puede proporcionar una estimación. 
+  Tiene un objetivo de tiempo de recuperación de quince minutos para restaurar una base de datos perdida, lo cual se definió al desplegar el sistema sin usuarios. Ahora tiene diez mil usuarios y lleva dos años funcionando. No tiene información sobre cómo ha cambiado el tiempo de restauración de su base de datos. 

 **Beneficios de establecer esta práctica recomendada:** al definir los valores de las métricas de referencia, podrá evaluar los valores actuales de las métricas y las tendencias de las mismas para determinar si es necesario adoptar medidas. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Mediana 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Descubrir los patrones esperados de actividad de las operaciones: establezca patrones de actividad de las operaciones para determinar cuando el comportamiento está fuera de los valores esperados para que pueda responder apropiadamente si es necesario. 

# OPS09-BP05 Descubrir patrones esperados de actividad para las operaciones
<a name="ops_operations_health_learn_ops_usage_patterns"></a>

 Establezca patrones de actividades de operaciones para identificar actividades anómalas, de modo que pueda responder adecuadamente en caso necesario. 

 **Patrones de uso no recomendados comunes:** 
+  Su tasa de errores en el despliegue ha aumentado sustancialmente en los últimos tiempos. Aborda cada uno de los errores de forma independiente. No se da cuenta de que los errores corresponden a despliegues realizados por un nuevo empleado que no está familiarizado con el sistema de gestión de despliegues. 

 **Beneficios de establecer esta práctica recomendada:** al aprender patrones de comportamiento, puede reconocer comportamientos inesperados y adoptar medidas en caso necesario. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Mediana 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Descubrir los patrones esperados de actividad de las operaciones: establezca patrones de actividad de las operaciones para determinar cuando el comportamiento está fuera de los valores esperados para que pueda responder apropiadamente si es necesario. 

# OPS09-BP06 Alertar cuando los resultados de las operaciones estén en riesgo
<a name="ops_operations_health_ops_outcome_alerts"></a>

 Siempre que los resultados de las operaciones estén en riesgo, se debe generar una alerta y actuar en consecuencia. Los resultados de las operaciones son cualquier actividad que admita una carga de trabajo en producción. Esto incluye todo, desde desplegar nuevas versiones de aplicaciones hasta recuperarse de una interrupción. Los resultados de las operaciones se deben tratar con la misma importancia que los resultados empresariales. 

Los equipos de software deben identificar las métricas y actividades clave de las operaciones y crear alertas para ellas. Las alertas deben ser oportunas y procesables. Si se produce una alerta, debe incluirse una referencia a un runbook o una guía de estrategias correspondiente. Las alertas sin una acción correspondiente pueden conllevar una saturación de alertas.

 **Resultado deseado:** cuando las actividades de las operaciones están en riesgo, se envían alertas para impulsar la acción. Las alertas contienen el contexto de los motivos por los que se produce una alerta e indican una guía de estrategias para investigar o un runbook para mitigarla. En la medida de lo posible, se automatizan los runbooks y se envían notificaciones. 

 **Patrones comunes de uso no recomendados:** 
+ Está investigando un incidente y se están presentando casos de asistencia. Estos casos incumplen el acuerdo de nivel de servicio (SLA), pero no se están generando alertas. 
+ Un despliegue a producción programado para medianoche se retrasa debido a cambios de código de última hora. No se genera ninguna alerta y el despliegue se bloquea.
+ Se produce una interrupción de producción pero no se envían alertas.
+  Su tiempo de despliegue se retrasa sistemáticamente con respecto a las estimaciones. No se toma ninguna medida para investigar. 

 **Beneficios de establecer esta práctica recomendada:** 
+  Las alertas cuando los resultados de las operaciones están en riesgo impulsan su capacidad de prestar asistencia a la carga de trabajo al adelantarse a los problemas. 
+  Los resultados empresariales mejoran gracias a los resultados de las operaciones en buen estado. 
+  Se han mejorado la detección y la reparación de los problemas de las operaciones. 
+  El estado operativo general aumenta. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Medio 

## Guía para la implementación
<a name="implementation-guidance"></a>

 Se deben definir los resultados de las operaciones para poder generar alertas de ellos. Empiece por definir qué actividades operativas son las más importantes para su organización. ¿Se trata de desplegar a producción en menos de dos horas o de responder a un caso de asistencia en un tiempo determinado? Su organización debe definir las actividades clave de las operaciones y cómo se miden para poder supervisarlas, mejorarlas y generar alertas de ellas. Necesita una ubicación central donde se almacene y analice la carga de trabajo y la telemetría de las operaciones. El mismo mecanismo debe poder emitir una alerta cuando el resultado de una operación esté en peligro. 

 **Ejemplo de cliente** 

 Se ha desencadenado una alarma de CloudWatch durante un despliegue rutinario en AnyCompany Retail. Se ha sobrepasado el plazo de despliegue. Amazon EventBridge ha creado un OpsItem en AWS Systems Manager OpsCenter. El equipo de operaciones en la nube ha utilizado una guía de estrategias para investigar el problema y ha identificado que un cambio de esquema tardaba más de lo previsto. Ha alertado al desarrollador de guardia y ha seguido supervisando el despliegue. Una vez desplegado, el equipo de operaciones en la nube ha resuelto el OpsItem. El equipo analizará el incidente durante una autopsia. 

## Pasos para la aplicación
<a name="implementation-steps"></a>

1. Si no ha identificado los KPI, las métricas ni las actividades de las operaciones, trabaje en la implementación de las prácticas recomendadas anteriores a esta cuestión (OPS09-BP01 a OPS09-BP05). 
   +  Los clientes de Soporte con [Asistencia Enterprise](https://aws.amazon.com/premiumsupport/plans/enterprise/) pueden solicitar el [taller sobre KPI de operaciones](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) a su gerente técnico de cuentas. Este taller de colaboración, que se ofrece sin coste adicional, le ayuda a definir los KPI de las operaciones y las métricas alineadas con los objetivos empresariales. Póngase en contacto con su gerente de cuentas técnicas para obtener más información. 

1.  Una vez que tenga establecidas las actividades de las operaciones, los KPI y las métricas, configure las alertas en su plataforma de observabilidad. Las alertas deben tener una acción asociada, como una guía de estrategias o un runbook. Deben evitarse las alertas sin una acción. 

1.  Con el tiempo, deberá evaluar las métricas de las operaciones, los KPI y las actividades para identificar las áreas de mejora. Capture la retroalimentación de los operadores en los runbooks y guías de estrategias para identificar las áreas de mejora en la respuesta a las alertas. 

1.  Las alertas deben incluir un mecanismo para marcarlas como un falso positivo. Esto debería conllevar una revisión de los umbrales de las métricas. 

 **Nivel de esfuerzo para el plan de implementación:** Medio. Hay varias prácticas recomendadas que deben estar aplicadas antes de implementar esta práctica recomendada. Una vez que se han identificado las actividades de las operaciones y se han establecido los KPI de ellas, deben establecerse las alertas. 

## Recursos
<a name="resources"></a>

 **Prácticas recomendadas relacionadas:** 
+  [OPS02-BP03 Las actividades operativas han identificado a los propietarios responsables de su rendimiento](ops_ops_model_def_activity_owners.md): todas las actividades y resultados de las operaciones deben tener un propietario identificado que sea responsable. Es quien debe recibir la alerta cuando los resultados están en riesgo. 
+  [OPS03-BP02 Los miembros del equipo están capacitados para actuar cuando los resultados están en riesgo](ops_org_culture_team_emp_take_action.md): cuando se produzcan las alertas, su equipo debe tener una agencia para actuar y solucionar el problema. 
+  [OPS09-BP01 Identificar los indicadores clave de rendimiento](ops_operations_health_define_ops_kpis.md): las alertas de los resultados de las operaciones empiezan por identificar los KPI de las operaciones. 
+  [OPS09-BP02 Definir métricas de operaciones](ops_operations_health_design_ops_metrics.md): establezca esta práctica recomendada antes de empezar a generar alertas. 
+  [OPS09-BP03 Recopilar y analizar métricas de operaciones](ops_operations_health_collect_analyze_ops_metrics.md): la recopilación centralizada de las métricas de las operaciones es necesaria para crear alertas. 
+  [OPS09-BP04 Establecer referencias de métricas de operaciones](ops_operations_health_ops_metric_baselines.md): las bases de referencia de las métricas de operaciones proporcionan la capacidad de ajustar las alertas y evitar la saturación. 
+  [OPS09-BP05 Descubrir patrones esperados de actividad para las operaciones](ops_operations_health_learn_ops_usage_patterns.md): puede mejorar la precisión de las alertas si comprende los patrones de actividad de los eventos de las operaciones. 
+  [OPS09-BP08 Validar el logro de resultados y la efectividad de los KPI y las métricas](ops_operations_health_biz_level_view_ops.md): evalúe la consecución de los resultados de las operaciones para asegurarse de que sus indicadores clave de rendimiento y sus métricas son válidos. 
+  [OPS10-BP02 Tener un proceso por alerta](ops_event_response_process_per_alert.md): cada alerta debe tener asociado un runbook o una guía de estrategias y proporcionar el contexto a la persona a la que se alerta. 
+  [OPS11-BP02 Realizar un análisis después del incidente](ops_evolve_ops_perform_rca_process.md): realice un análisis posterior al incidente después de la alerta para identificar las áreas de mejora. 

 **Documentos relacionados:** 
+  [AWS Deployment Pipelines Reference Architecture: Application Pipeline Architecture (Arquitectura de referencia de las canalizaciones de despliegue de AWS: arquitectura de canalización de aplicaciones)](https://pipelines.devops.aws.dev/application-pipeline/) 
+  [GitLab: Getting Started with Agile / DevOps Metrics (GitLab: Introducción a las métricas de Agile/DevOps)](https://about.gitlab.com/handbook/marketing/strategic-marketing/devops-metrics/) 

 **Vídeos relacionados:** 
+  [Aggregate and Resolve Operational Issues Using AWS Systems Manager OpsCenter (Agregar y resolver problemas operativos mediante AWS Systems Manager OpsCenter)](https://www.youtube.com/watch?v=r6ilQdxLcqY) 
+  [Integrate AWS Systems Manager OpsCenter with Amazon CloudWatch Alarms (Integrar AWS Systems Manager OpsCenter con las alarmas de Amazon CloudWatch)](https://www.youtube.com/watch?v=Gpc7a5kVakI) 
+  [Integrate Your Data Sources into AWS Systems Manager OpsCenter Using Amazon EventBridge (Integre sus orígenes de datos en AWS Systems Manager OpsCenter con Amazon EventBridge)](https://www.youtube.com/watch?v=Xmmu5mMsq3c) 

 **Ejemplos relacionados:** 
+  [Automate remediation actions for Amazon EC2 notifications and beyond using Amazon EC2 Systems Manager Automation and AWS Health (Automatización de las medidas de corrección para las notificaciones de Amazon EC2, entre otros, mediante la automatización de Amazon EC2 y AWS Health)](https://aws.amazon.com/blogs/mt/automate-remediation-actions-for-amazon-ec2-notifications-and-beyond-using-ec2-systems-manager-automation-and-aws-health/) 
+  [AWS Management and Governance Tools Workshop - Operations 2022 (Taller de herramientas de administración y gobernanza de AWS - Operaciones 2022)](https://mng.workshop.aws/operations-2022.html) 
+  [Ingesting, analyzing, and visualizing metrics with DevOps Monitoring Dashboard on AWS (Ingesta, análisis y visualización de métricas con el panel de supervisión de DevOps en AWS)](https://docs.aws.amazon.com/solutions/latest/devops-monitoring-dashboard-on-aws/welcome.html) 

 **Servicios relacionados:** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 
+  [Soporte Proactive Services - Operations KPI Workshop (Servicios proactivos de Soporte - Taller de KPI de operaciones)](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 
+  [Eventos de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP07 Alertar cuando se detecten anomalías en las operaciones
<a name="ops_operations_health_ops_anomaly_alerts"></a>

 Emita una alerta cuando se detecten anomalías en las operaciones para poder responder adecuadamente en caso necesario. 

 El análisis de las métricas de operaciones a lo largo del tiempo puede establecer patrones de comportamiento que puede cuantificar lo suficiente como para definir un evento o dar una alarma en respuesta. 

 Una vez entrenada, la función [Detección de anomalías de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) se puede usar para [alertar](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) sobre las anomalías detectadas o puede proporcionar valores esperados superpuestos en un [gráfico](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) de datos métricos para una comparación continua. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) puede utilizarse para identificar comportamientos anómalos mediante la correlación de eventos, el análisis de registros y la aplicación de machine learning para analizar la telemetría de la carga de trabajo. La [información](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) obtenida se presenta con los datos y recomendaciones pertinentes. 

 **Patrones de uso no recomendados comunes:** 
+  Está aplicando una revisión a su flota de instancias. Ha probado la revisión con éxito en el entorno de pruebas. La revisión está fallando en un gran porcentaje de instancias de su flota. No hace nada. 
+  Observa que hay despliegues a partir del viernes al final del día. Su organización tiene ventanas de mantenimiento predefinidas los martes y los jueves. No hace nada. 

 **Beneficios de establecer esta práctica recomendada:** al comprender los patrones de comportamiento de las operaciones, puede identificar comportamientos inesperados y adoptar medidas en caso necesario. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Bajo 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Alertar cuando se detectan anomalías en las operaciones: emita una alerta cuando se detecten anomalías en las operaciones para poder responder adecuadamente si es necesario. 
  +  [¿Qué es Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Creación de alarmas de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Invocación de funciones de Lambda utilizando notificaciones de Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [Detección de anomalías de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Creación de alarmas de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Detecte y reaccione a los cambios en el estado del proceso con Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Invocación de funciones de Lambda utilizando notificaciones de Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [¿Qué es Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP08 Validar el logro de resultados y la efectividad de los KPI y las métricas
<a name="ops_operations_health_biz_level_view_ops"></a>

 Cree una visión a nivel empresarial de sus actividades de operaciones para determinar si está satisfaciendo las necesidades e identificar las áreas que necesitan mejoras para alcanzar los objetivos empresariales. Valide la eficacia de los KPI y las métricas y revíselos si es necesario. 

 AWS también ofrece asistencia para sistemas de análisis de registros de terceros y herramientas de inteligencia comercial a través de las API y SDK del servicio de AWS (por ejemplo, Grafana, Kibana y Logstash). 

 **Patrones de uso no recomendados comunes:** 
+  La frecuencia de sus despliegues ha aumentado con el incremento del número de equipos de desarrollo. El número de despliegues que ha definido es de una vez a la semana. Ha realizado despliegues diarios con regularidad. Cuando hay un problema con su sistema de despliegue y este no es posible, pasa desapercibido durante días. 
+  Cuando su empresa anteriormente prestaba asistencia solo durante el horario comercial principal de lunes a viernes. Ha establecido un objetivo de tiempo de respuesta al siguiente día laborable para los incidentes. Recientemente ha empezado a ofrecer una cobertura de asistencia las 24 horas del día con un objetivo de tiempo de respuesta de dos horas. Su personal nocturno está desbordado y los clientes están descontentos. No hay indicios de que haya problemas con los tiempos de respuesta a incidentes porque está informando con respecto a un objetivo de siguiente día laborable. 

 **Beneficios de establecer esta práctica recomendada:** Al examinar y revisar los indicadores clave de rendimiento y las métricas, comprenderá cómo su carga de trabajo contribuye a la consecución de los resultados de la empresa y podrá identificar los aspectos que deben mejorarse para alcanzar los objetivos empresariales. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** Bajo 

## Guía para la implementación
<a name="implementation-guidance"></a>
+  Validar los resultados obtenidos y la eficacia de los KPI y las métricas: cree una visión a nivel empresarial de las actividades de las operaciones para determinar si está satisfaciendo las necesidades e identificar las áreas que necesitan mejoras para alcanzar los objetivos empresariales. Valide la eficacia de los KPI y las métricas y revíselos si es necesario. 
  +  [Uso de paneles de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [¿Qué es el análisis de registros?](https://aws.amazon.com/log-analytics/) 

## Recursos
<a name="resources"></a>

 **Documentos relacionados:** 
+  [Uso de paneles de Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [¿Qué es el análisis de registros?](https://aws.amazon.com/log-analytics/)