

# Prácticas recomendadas
<a name="oe-bp"></a>

**Topics**
+ [Organización](oe-organization.md)
+ [Prepárese](oe-prepare.md)
+ [Opere](oe-operate.md)
+ [Evolución](oe-evolve.md)

# Organización
<a name="oe-organization"></a>

 Sus equipos necesitan tener un entendimiento compartido de toda la carga de trabajo, su rol en ella y los objetivos empresariales comunes para establecer las prioridades que permitan el éxito empresarial. Unas prioridades bien definidas maximizarán los beneficios de sus esfuerzos. Evalúe las necesidades internas y externas de los clientes, e involucre a las partes interesadas clave, incluidos los equipos de negocios, desarrollo y operaciones, para determinar dónde se deben centrar los esfuerzos. La evaluación de las necesidades de los clientes le garantizará una comprensión profunda del apoyo que se necesita para lograr los resultados empresariales. Compruebe que conoce las directrices y las obligaciones definidas por la gobernanza organizativa y los factores externos, como los requisitos normativos de conformidad y los estándares industriales, para asegurarse de que puede exigir o aplicar un enfoque específico. Valide la existencia de mecanismos para identificar cambios en la gobernanza interna y en los requisitos de cumplimiento externos. Si no se identifican requisitos, asegúrese de haber aplicado la debida diligencia a dicha determinación. Revise sus prioridades con regularidad para poder actualizarlas a medida que las necesidades cambien. 

 Evalúe las amenazas a la empresa (por ejemplo, riesgos y responsabilidades empresariales, amenazas a la seguridad de la información) y mantenga dicha información en un registro de riesgos. Evalúe el impacto de los riesgos y las compensaciones entre los intereses opuestos o los enfoques alternativos. Por ejemplo, la aceleración de la velocidad de comercialización de las nuevas funciones puede primar sobre la optimización de los costes, o puede elegir una base de datos relacional para los datos no relacionales para simplificar el esfuerzo de migración de un sistema sin refactorizar. Gestione los beneficios y riesgos para tomar decisiones fundamentadas a la hora de determinar dónde centrar los esfuerzos. Algunos riesgos u opciones son aceptables durante un tiempo, incluso se podrían mitigar los riesgos asociados, pero también podría ser inaceptable permitir que un riesgo persista, en cuyo caso se tomarán medidas para abordarlo. 

 Sus equipos deben comprender su papel en la consecución de los resultados empresariales. Los equipos deben comprender el rol que tienen en el éxito de otros equipos, conocer el rol de los demás equipos en su propio éxito, y tener objetivos en común. Comprender la responsabilidad, la propiedad, cómo se toman las decisiones y quién tiene autoridad para tomarlas ayudará a centrar los esfuerzos y a maximizar los beneficios de sus equipos. Las necesidades de un equipo se verán determinadas por el cliente al que apoyan, su organización, la composición del equipo y las características de su carga de trabajo. No es razonable esperar que un único modelo operativo sea capaz de respaldar a todos los equipos y sus cargas de trabajo en la organización. 

 Asegúrese de que haya propietarios identificados para cada aplicación, carga de trabajo, plataforma y componente de la infraestructura, y de que cada proceso y procedimiento tenga un responsable propietario para definirlos y que sean responsable de su rendimiento. 

 Las acciones de los miembros del equipo se fundamentarán en la comprensión del valor empresarial de cada componente, proceso y procedimiento, el motivo por el cual se establecieron los recursos o se realizan determinadas actividades, y la razón por la que esa propiedad existe. Defina claramente las responsabilidades de los miembros del equipo para que puedan actuar de forma adecuada y disponer de mecanismos para identificar la responsabilidad y la propiedad. Cuente con mecanismos para solicitar adiciones, cambios y excepciones para no limitar la innovación. Defina acuerdos entre los equipos que describan el trabajo conjunto para darse apoyo entre sí y respaldar los resultados de la empresa. 

 Preste asistencia a los miembros de su equipo para que puedan ser más eficaces a la hora de actuar y apoyar los resultado empresariales. Los líderes comprometidos deben establecer expectativas y medir el éxito. Deben ser los patrocinadores, defensores e impulsores de la adopción de las prácticas recomendadas y de la evolución de la organización. Empodere a los miembros del equipo para que actúen cuando los resultados corran algún riesgo para, así, minimizar el impacto, y anímelos a realizar escalamientos hacia los responsables de la toma de decisiones y las partes interesadas cuando crean que exista un riesgo, de manera que se pueda abordar y se eviten incidentes. Proporcione una comunicación oportuna, clara y procesable de los riesgos conocidos y de los eventos planificados para que los miembros del equipo puedan reaccionar de forma oportuna y adecuada. 

 Fomente la experimentación, pues acelera el aprendizaje y mantiene a los miembros del equipo interesados y comprometidos. Los equipos deben aumentar el conjunto de habilidades para adoptar nuevas tecnologías, y para apoyar los cambios en la demanda y las responsabilidades. Debe apoyar y fomentar esto ofreciendo un horario estructurado dedicado a la formación. Debe asegurarse de que los miembros del equipo dispongan de los recursos (herramientas y miembros del equipo) para lograr el éxito y realizar escalamientos, con el fin de lograr los resultados empresariales. Aproveche la diversidad entre organizaciones para buscar múltiples perspectivas únicas. Utilice esta perspectiva para aumentar la innovación, cuestionar sus suposiciones y reducir el riesgo de sesgo de confirmación. Fomente la inclusión, la diversidad y la accesibilidad en sus equipos para obtener perspectivas beneficiosas. 

 Si hay requisitos normativos o de cumplimiento que afecten a su organización, debe usar los recursos proporcionado por la [Conformidad en la nube de AWS](https://aws.amazon.com/compliance/?ref=wellarchitected-wp) para ayudar a educar a los equipos, a fin de que puedan determinar el impacto en sus prioridades. Well-Architected Framework hace hincapié en aprender, medir y mejorar. Proporciona un enfoque coherente para evaluar las arquitecturas e implementar diseños que se escalarán con el tiempo. AWS proporciona laAWS Well-Architected Tool para ayudarle a revisar su enfoque antes del desarrollo, el estado de sus cargas de trabajo antes de la producción y el estado de sus cargas de trabajo durante la producción. Puede comparar las cargas de trabajo de las prácticas recomendadas de arquitectura de AWS más recientes, supervisar su estado global y obtener información sobre los riesgos potenciales. AWS Trusted Advisor es una herramienta que proporciona acceso a un conjunto básico de comprobaciones que recomiendan optimizaciones que pueden ayudar a definir sus prioridades. Los clientes de Business y Enterprise Support reciben acceso a comprobaciones adicionales centradas en la seguridad, la fiabilidad, el rendimiento y la optimización de los costos que pueden ayudar a configurar sus prioridades. 

 AWS puede ayudarle a instruir a sus equipos sobre AWS y sus servicios para aumentar su comprensión de cómo sus elecciones pueden tener un impacto en su carga de trabajo. Debe utilizar los recursos proporcionados por AWS (Centro de conocimientos de AWS, Foros de debate de AWS, y Centro de soporte de AWS Support) y Documentación de AWS para instruir a sus equipos. En caso de preguntas sobre AWS, contacte con AWS Support a través del Centro de AWS Support. AWS también comparte los patrones y prácticas recomendadas que hemos aprendido a través del funcionamiento de AWS en la Amazon Builders' Library. Hay una gran variedad de información útil disponible a través del Blog de AWS y el Podcast oficial de AWS. AWS Training and Certification ofrece una formación gratuita a través de cursos digitales autodidactas sobre los fundamentos de AWS. También puede inscribirse en una capacitación adicional dirigida por un instructor para apoyar el desarrollo de las habilidades de AWS de sus equipos. 

 Debe utilizar herramientas o servicios que le permitan controlar de forma centralizada sus entornos en todas las cuentas, como, por ejemplo, AWS Organizations, para ayudarle a administrar los modelos operativos. Los servicios como AWS Control Tower amplían esta capacidad de administración al permitirle definir esquemas (que respaldan sus modelos operativos) para la configuración de las cuentas, aplicar una gobernanza continua mediante AWS Organizations y automatizar el aprovisionamiento de nuevas cuentas. Los proveedores de servicios administrados tales como AWS Managed Services, los socios de AWS Managed Services o los proveedores de servicios administrados en la red de socios de AWS proporcionan experiencia en la implementación de entornos en la nube, y admiten sus requisitos de seguridad y cumplimiento y sus objetivos empresariales. La incorporación de los servicios administrados a su modelo operativo puede ahorrarle tiempo y recursos, y le permite mantener a sus equipos internos racionalizados y centrados en los resultados estratégicos que diferenciarán a su empresa, en lugar de desarrollar nuevas competencias y capacidades. 

 Las siguientes preguntas se centran en estas consideraciones acerca de la excelencia operativa. (Para ver una lista de preguntas y prácticas recomendadas sobre la excelencia operativa, consulte el [Apéndice](a-operational-excellence.md)). 


| OPS 1 ¿Cómo determina cuáles son sus prioridades? | 
| --- | 
|  Todos deben comprender su parte para permitir el éxito empresarial. Tenga objetivos compartidos para establecer prioridades en cuanto a los recursos. Esto maximizará los beneficios de sus esfuerzos.  | 


| OPS 2 ¿Cómo estructura su organización para lograr los resultados empresariales? | 
| --- | 
| Sus equipos deben comprender su papel en la consecución de los resultados empresariales. Los equipos deben comprender el rol que tienen en el éxito de otros equipos, conocer el rol de los demás equipos en su propio éxito, y tener objetivos en común. Comprender la responsabilidad, la propiedad, cómo se toman las decisiones y quién tiene autoridad para tomarlas ayudará a centrar los esfuerzos y a maximizar los beneficios de sus equipos.  | 


| OPS 3 ¿Cómo ayuda la cultura de su organización a lograr los resultados empresariales? | 
| --- | 
|  Preste asistencia a los miembros de su equipo para que puedan ser más eficaces a la hora de actuar y apoyar el resultado empresarial.  | 

 Es posible que en algún momento quiera hacer énfasis en un pequeño subconjunto de sus prioridades. Utilice un enfoque equilibrado a largo plazo para asegurar el desarrollo de las capacidades necesarias y la gestión de riesgos. Revise las prioridades con regularidad y actualícelas según cambien las necesidades. Cuando la responsabilidad y la propiedad no están definidas o se desconocen, se corre el riesgo, tanto de no actuar a tiempo, como de que se hagan esfuerzos repetidos y potencialmente conflictivos para abordar esas necesidades. La cultura organizativa tiene un impacto directo en la satisfacción laboral y la retención de los miembros del equipo. Facilite el compromiso y las capacidades de los miembros de su equipo para lograr el éxito de su negocio. La experimentación es necesaria para innovar y convertir las ideas en resultados. Debe saber que un resultado no deseado es un experimento exitoso que ha identificado un camino que no llevará al éxito. 

# Prepárese
<a name="oe-prepare"></a>

 Para prepararse para la excelencia operativa hay que entender las cargas de trabajo y sus comportamientos esperados. Entonces, podrá diseñarlas para que proporcionen información sobre su estado y crear los procedimientos para respaldarlas. 

 Diseñe la carga de trabajo para que proporcione la información necesaria para que pueda comprender el estado interno (por ejemplo, métricas, registros, eventos y rastreos) en todos los componentes en caso de problemas de investigación y observabilidad. Itere para desarrollar la telemetría necesaria para supervisar el estado de su carga de trabajo, identificar cuándo los resultados corren riesgo y activar respuestas efectivas. Al instrumentar su carga de trabajo, debe recoger un amplio conjunto de información para facilitar la comprensión de la situación (por ejemplo, los cambios de estado, la actividad de los usuarios, el acceso a los privilegios o los contadores de uso), sin olvidar que puede aplicar un filtro para seleccionar la información que le resulte más útil con el paso del tiempo. 

 Adopte enfoques que mejoren el flujo de cambios en la producción, que permitan la refactorización, la retroalimentación rápida sobre la calidad y la corrección de errores. Estos aceleran los cambios beneficiosos que se introducen en la producción, limitan los problemas implementados y permiten una rápida identificación y solución de los problemas introducidos a través de las actividades de implementación o descubiertas en sus entornos. 

 Adopte enfoques que proporcionen una respuesta rápida sobre la calidad y permitan una recuperación rápida de los cambios que no tienen los resultados deseados. El uso de estas prácticas ayuda a mitigar el impacto de los problemas generados con la implementación de cambios. Planifique para hacer frente a los cambios fallidos para que pueda responder rápidamente si es necesario. Además, pruebe y valide los cambios que realice. Debe conocer las actividades planificadas en sus entornos para poder administrar el riesgo de que los cambios afecten a dichas actividades. Realice cambios frecuentes, pequeños y reversibles para limitar el alcance del cambio. Lo que se traduce en una solución más fácil de los problemas y una solución más rápida con la opción de revertir un cambio. También significa que podrá beneficiarse de unos cambios valiosos de forma más frecuente. 

 Evalúe la disponibilidad operativa de la carga de trabajo, de los procesos y procedimientos y del personal para comprender los riesgos operativos relacionados con la carga de trabajo. Debe usar un proceso coherente (que incluya listas de verificación manuales y automáticas) para saber cuándo una carga de trabajo o cambio estarán listos para lanzarse. Esto también le permitirá encontrar cualquier área para la que sea necesaria la elaboración de un plan de tratamiento. Tendrá runbooks que documenten sus actividades rutinarias y guías de estrategias que orienten los procesos de resolución de errores. Debe comprender los beneficios y los riesgos para tomar decisiones bien fundamentadas. 

 AWS le permite ver toda su carga de trabajo (aplicaciones, infraestructura, política, gobernanza y operaciones) como código. Eso significa que puede aplicar la misma disciplina de ingeniería que usa para el código de las aplicaciones a cada elemento de su pila y compartirla entre los equipos u organizaciones para magnificar los beneficios de los esfuerzos de desarrollo. Use las operaciones como código en la nube y la capacidad de experimentar de manera segura para desarrollar la carga de trabajo, sus procedimientos operativos y poner en práctica los casos en los que se produzcan errores. Usar CloudFormation le permite tener entornos de producción, de pruebas y de desarrollo de la zona de pruebas coherentes y con formatos ya definidos, con un aumento de los niveles de control operativo. 

 Las siguientes preguntas se centran en estas consideraciones acerca de la excelencia operativa. 


| OPS 4  ¿Cómo diseña la carga de trabajo para poder comprender su estado? | 
| --- | 
|  Diseñe la carga de trabajo para que proporcione la información necesaria en todos los componentes (por ejemplo, métricas, registros y rastreos), a fin de que comprenda el estado interno. Esto le permite proporcionar respuestas efectivas cuando sea apropiado.  | 


| OPS 5 ¿Cómo reduce los defectos, facilita la reparación y mejora el flujo en la producción? | 
| --- | 
|  Adopte enfoques que mejoren el flujo de cambios en la producción, que permitan la refactorización, la retroalimentación rápida sobre la calidad y la corrección de errores. Estos aceleran los cambios beneficiosos que se introducen en la producción, limitan los problemas implementados, y permiten una rápida identificación y solución de los problemas introducidos a través de las actividades de implementación.  | 


| OPS 6 ¿Cómo mitiga los riesgos de implementación? | 
| --- | 
|  Adopte enfoques que proporcionen una respuesta rápida sobre la calidad y permitan una recuperación rápida de los cambios que no tienen los resultados deseados. El uso de estas prácticas ayuda a mitigar el impacto de los problemas generados con la implementación de cambios.  | 


| OPS 7 ¿Cómo sabe que está listo para dar respaldo a una carga de trabajo? | 
| --- | 
|  Evalúe la disponibilidad operativa de la carga de trabajo, los procesos y procedimientos, y el personal para comprender los riesgos operativos relacionados con la carga de trabajo.  | 

 Invierta en implementar actividades operativas como código para maximizar la productividad del personal operativo, minimizar las tasas de error y habilitar las respuestas automatizadas. Realice ensayos de fallas “pre-mortem” para anticipar el fracaso y crear procedimientos cuando sea apropiado. Aplique metadatos usando etiquetas de registro y Grupos de recursos de AWS mediante una estrategia de etiquetado consistente para permitir la identificación de sus recursos. Etiquete sus recursos para la organización, la contabilidad de costos, los controles de acceso y el objetivo de la ejecución de actividades de operaciones automatizadas. Adopte las prácticas de implementación que aprovechan la elasticidad de la nube a fin de facilitar las actividades de desarrollo y la implementación previa de sistemas para que la implementación sea más rápida. Cuando haga cambios en las listas de control que utiliza para evaluar sus cargas de trabajo, planifique lo que hará con los sistemas activos que ya no cumplen los requisitos. 

# Opere
<a name="oe-operate"></a>

 El éxito operativo de una carga de trabajo se mide por los logros de los resultados del cliente y del negocio. Defina los resultados esperados, decida cómo se medirá el éxito e identifique las métricas que se usarán en los cálculos para determinar si su carga de trabajo y las operaciones se realizan con éxito. El estado de las operaciones incluye tanto el estado de la carga de trabajo como el éxito de las operaciones que se realizan para llevarlas a cabo (por ejemplo, la implementación y la respuesta frente a incidencias). Establezca puntos de referencia de métricas para las mejoras, la investigación y la intervención, y recopile y analice las métricas. A continuación, corrobore si comprende el éxito de las operaciones y cómo cambia con el tiempo. Utilice métricas recopiladas para determinar si satisface las necesidades del cliente y del negocio. Identifique también las áreas a mejorar. 

 Se requiere eficacia y eficiencia en la gestión de los eventos operativos para lograr excelencia operativa. Se aplica tanto a los eventos operativos planificados como a los no planificados. Utilice los runbooks establecidos para eventos bien conocidos y guías de estrategia para la investigación y para resolver otros problemas. Priorice aquellos eventos que tengan mayor repercusión en el negocio y en el cliente. Asegúrese de que, si se genera una alerta como respuesta a un evento, se ejecutará un proceso asociado con un propietario identificado de forma específica. Defina con antelación el personal necesario para resolver un evento e incluya desencadenadores de derivación para que participe personal adicional, si es necesario, en función de la urgencia y el impacto. Identifique e implique a aquellos individuos que tengan autoridad para decidir sobre las acciones en aquellos casos en los que la respuesta a un evento que no se haya abordado previamente repercuta en el negocio. 

 Comunique el estado operativo de las cargas de trabajo mediante paneles y notificaciones adaptadas a la audiencia de destino (por ejemplo, cliente, negocio, desarrolladores, operaciones) para que puedan llevar a cabo las medidas adecuadas, gestionen sus expectativas y se les informe cuando se reanuden las operaciones habituales. 

 En AWS, puede generar vistas de panel de las métricas recopiladas a partir de cargas de trabajo y de AWS de forma nativa. Puede aprovechar CloudWatch o aplicaciones de terceros para agregar y presentar vistas del negocio, la carga de trabajo y las operaciones de las actividades operativas. AWS proporciona información sobre cargas de trabajo mediante capacidades de registros, como AWS X-Ray, CloudWatch, CloudTrail y registros de flujo de VPC que permiten la identificación de problemas de las cargas de trabajo para brindar apoyo a la hora de analizar y corregir la causa raíz. 

 Las siguientes preguntas se centran en estas consideraciones acerca de la excelencia operativa. 


| OPS 8 ¿Qué hace para comprender el estado de la carga de trabajo? | 
| --- | 
|  Defina, capture y analice las métricas de cargas de trabajo para obtener visibilidad de los eventos de cargas de trabajo y poder tomar las medidas adecuadas.  | 


| OPS 9 ¿Qué hace para comprender el estado de las operaciones? | 
| --- | 
|  Defina, capture y analice las métricas de las operaciones para obtener visibilidad de los eventos de operaciones y poder tomar las medidas adecuadas.  | 


| OPS 10 ¿Cómo administra la carga de trabajo y los eventos de operaciones? | 
| --- | 
|  Prepare y valide los procedimientos de respuesta a los eventos para minimizar la interrupción de la carga de trabajo.  | 

 Todas las métricas que recopile deben estar alineadas con una necesidad empresarial y los resultados que apoyan. Desarrolle respuestas con scripts para los eventos bien conocidos y automatice su rendimiento en respuesta al reconocimiento del evento. 

# Evolución
<a name="oe-evolve"></a>

 Debe aprender, compartir y mejorar continuamente para mantener la excelencia operativa. Dedique ciclos de trabajo a mejorar gradualmente de forma continua. Realice análisis posteriores al incidente de todos los eventos que afecten a los clientes. Identifique los factores que han contribuido a ello y actúe de forma preventiva para limitar o impedir que se repita. Comunique los factores que han contribuido a ello a las comunidades afectadas, según proceda. Evalúe y priorice las oportunidades de mejora de forma gradual (por ejemplo, solicitudes de características, solución de problemas y requisitos de conformidad), entre ellos, los procedimientos operativos y de cargas de trabajo. 

 Incluya bucles de retroalimentación en los procedimientos para identificar rápidamente aquellas áreas de mejora y captar las enseñanzas que surjan de la ejecución de operaciones. 

 Comparta lo aprendido con los equipos para enseñar los beneficios de dichas lecciones. Analice las tendencias de las lecciones aprendidas y realice un análisis retrospectivo de las métricas de las operaciones entre equipos para identificar oportunidades y métodos de mejora. Aplique aquellos cambios que traigan consigo mejoras y evalúe los resultados para determinar el éxito. 

 En AWS, puede exportar los datos de registro a Amazon S3 o enviar registros directamente a Amazon S3 para un almacenamiento a largo plazo. Con AWS Glue, puede descubrir y preparar los datos de registro en Amazon S3 para realizar análisis y almacenar los metadatos asociados en AWS Glue Data Catalog. Amazon Athena, a través de su integración nativa con AWS Glue, se puede usar para analizar los datos de registro, haciendo consultas con la SQL estándar. Con una herramienta de inteligencia empresarial como Amazon Quick, puede visualizar, explorar y analizar sus datos. También puede descubrir tendencias y eventos de interés que fomenten las mejoras. 

 La siguiente pregunta se centra en estas consideraciones acerca de la excelencia operativa. 


| OPS 11 ¿Cómo desarrolla las operaciones? | 
| --- | 
|  Dedique tiempo y recursos para la mejora incremental continua, para desarrollar la efectividad y la eficiencia de sus operaciones.  | 

 La correcta evolución de las operaciones se basa en cambios pequeños pero frecuentes; entornos seguros y tiempo para experimentar, desarrollar y probar mejoras, así como entornos en los que se anima a aprender a partir de los errores. La asistencia operativa en entornos de producción, pruebas, desarrollo y zonas de pruebas, con un nivel creciente de controles operativos, facilita el desarrollo y aumenta la predictibilidad de resultados exitosos a partir de los cambios que se implementen en la producción. 