Proaktive Prävention von Zwischenfällen - AWS DevOps Agentin

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Proaktive Prävention von Zwischenfällen

AWS DevOps Der Agent analysiert Muster bei Ihren Vorfalluntersuchungen, um gezielte Empfehlungen zu geben, mit denen Sie Ihre betriebliche Situation kontinuierlich verbessern und future Vorfälle verhindern können. Über die Ops Backlog-Seite in der Operator Web App können Sie auf die proaktive Prävention von Vorfällen zugreifen.

So funktioniert die proaktive Prävention von Zwischenfällen

AWS DevOps Der Mitarbeiter bewertet die jüngsten Untersuchungen von Vorfällen, um dauerhafte Verbesserungen zu ermitteln, um future Vorfälle zu verhindern und die mittlere Erkennungszeit (MTTD) zu verkürzen. Der Agent analysiert mehrere Vorfälle, um Empfehlungen zu identifizieren, mit denen ganze Gruppen von Vorfällen in future verhindert werden können. Dabei konzentriert er sich auf die wirksamsten Empfehlungen, um sicherzustellen, dass sie umsetzbar sind.

Standardmäßig führt der Agent wöchentlich automatisch Evaluierungen durch. Sie können den Zeitplan unterbrechen, wenn Sie es vorziehen, Evaluierungen nur bei Bedarf durchzuführen. Manuelle Bewertungen sind immer verfügbar. Dies ist nützlich, wenn eine kürzlich durchgeführte Untersuchung eine schnelle Bearbeitung der empfohlenen Verbesserungen rechtfertigt.

Der Agent identifiziert Verbesserungen in vier Kategorien, die in der Tabelle zur Kategorisierung von Empfehlungen auf der Seite Ops Backlog dargestellt werden:

  • Beobachtbarkeit — Empfehlungen zur Verbesserung von Überwachung, Warnmeldungen, Protokollierung und Systemtransparenz, sodass Probleme schneller und genauer erkannt werden können.

  • Infrastruktur — Empfehlungen zur Optimierung der Ressourcenkonfigurationen, der Kapazitätsoptimierung und der Widerstandsfähigkeit der Architektur.

  • Verwaltung — Empfehlungen zur Stärkung der Bereitstellungsprozesse, der Verbesserung der Pipeline, der Testpraktiken und der Betriebskontrollen.

  • Codeoptimierung — Empfehlungen zur Verbesserung der Qualität des Anwendungscodes, der Fehlerbehandlung und der Widerstandsfähigkeit des Codes.

Diese Kategorisierung hilft Ihnen zu verstehen, wo Ihre betrieblichen Verbesserungen am dringendsten erforderlich sind, und ermöglicht es Ihnen, Empfehlungen auf der Grundlage der Schwerpunktbereiche Ihres Teams zu priorisieren.

Vorteile

  • Vermeiden Sie wiederkehrende Vorfälle — Gehen Sie systematisch auf die Grundursachen ein, anstatt immer wieder auf dieselben Probleme zu reagieren

  • Reduzieren Sie den betrieblichen Aufwand — Befreien Sie Ihr Team von wiederholter Brandbekämpfung, sodass es sich auf Innovationen und strategische Verbesserungen konzentrieren kann

  • Verbessern Sie die Systemstabilität — Stärken Sie Ihre Infrastruktur, Beobachtbarkeit und Bereitstellungsprozesse auf der Grundlage realer Vorfalldaten

  • Lernen Sie aus historischen Mustern — Nutzen Sie Erkenntnisse aus vergangenen Vorfällen, um gezielte Verbesserungen vorzunehmen, die die größte Wirkung haben

Zusammenfassung der Agenten

Die Agentenübersicht auf der Seite Ops Backlog der Web-App enthält eine Beschreibung der Ergebnisse der letzten Bewertung der jüngsten Vorfälle. In der Zusammenfassung wird die Anzahl der analysierten Vorfalluntersuchungen erläutert, welche Vorfälle früheren ähnlich sind und welche Empfehlungen erstellt oder mit neuen Informationen aktualisiert wurden.

Die Zusammenfassung hilft Ihnen dabei, schnell zu verstehen, was der Mitarbeiter bei seiner letzten Bewertung herausgefunden hat, und hebt die wichtigsten Empfehlungen hervor, die sich am stärksten auf Ihre betriebliche Situation auswirken könnten.

Kontrolle von Evaluierungen

Sie können steuern, wann der AWS DevOps Agent Vorfälle bewertet und Empfehlungen generiert:

  • Manuelles Ausführen von Evaluierungen — Klicken Sie auf der Seite Ops Backlog auf die Schaltfläche Jetzt ausführen, um sofort eine Bewertung zu starten. Dies ist nützlich, wenn eine kürzlich durchgeführte Untersuchung eine schnelle Bearbeitung der empfohlenen Verbesserungen rechtfertigt.

  • Aktive Evaluierungen beenden — Klicken Sie auf der Ops-Backlog-Seite auf die Schaltfläche Bewertung beenden, um eine Evaluierung zu beenden, die gerade läuft.

Empfehlungen verwalten

AWS DevOps Der Agent stellt Empfehlungen auf der Ops Backlog-Seite bereit, wo Sie sie überprüfen und verwalten können:

  • Empfehlungsdetails anzeigen — Klicken Sie auf eine Empfehlung, um die Seite mit den Empfehlungsdetails zu öffnen. Dort finden Sie weitere Informationen zu der vorgeschlagenen Verbesserung, einschließlich der Vorfälle, die der Empfehlung zugrunde lagen, der erwarteten Auswirkungen und der nächsten Schritte. Empfehlungen mit Codeänderungen finden Sie auch in der für den Agenten geeigneten Spezifikation, die Sie einem Programmierer zur Implementierung aushändigen können.

  • Beibehalten — Klicken Sie auf „Beibehalten“, um eine Empfehlung zur Nachverfolgung in Ihrem Backlog beizubehalten. Auf diese Weise können Sie überwachen, welche Verbesserungen Sie umsetzen möchten, und deren Fortschritt verfolgen.

  • Verwerfen — Klicken Sie auf „Verwerfen“, um eine Empfehlung aus Ihrem Backlog zu entfernen. Wenn Sie eine Empfehlung verwerfen, können Sie in natürlicher Sprache erklären, warum sie nicht Ihren Bedürfnissen entspricht. Der Mitarbeiter lernt aus diesem Feedback und verwendet es als Grundlage für future Empfehlungen, um sicherzustellen, dass diese im Laufe der Zeit besser an Ihre betrieblichen Prioritäten und Anforderungen angepasst werden.

  • Implementiert — Klicken Sie auf „Implementiert“, um eine Empfehlung als abgeschlossen zu markieren. Auf diese Weise können Sie nachverfolgen, welche Verbesserungen vorgenommen wurden, und der Berater kann die Wirksamkeit seiner Empfehlungen im Laufe der Zeit messen.

  • Automatisches Entfernen — Empfehlungen, die nicht als „Beibehalten“ oder „Implementiert“ gekennzeichnet wurden, können nach etwa 6 Wochen entfernt werden, sofern durch die Umsetzung der Empfehlung keine neuen Vorfälle verhindert worden wären. Dadurch wird sichergestellt, dass sich die Seite „Ops Backlog“ auf die wichtigsten Verbesserungen für Ihre betrieblichen Herausforderungen konzentriert.

  • Aktualisierungen von Empfehlungen — Bestehende Empfehlungen werden aktualisiert, wenn neuere Vorfälle gefunden werden, die durch die Empfehlung verhindert worden wären. Aktualisierungen können die Priorität der Empfehlung ändern oder die Empfehlung auf der Grundlage neuer Erkenntnisse verfeinern.

Spezifikationen, die sofort einsatzbereit sind

Für Empfehlungen, die Code- oder Konfigurationsänderungen beinhalten, kann der AWS DevOps Agent eine für den Agenten geeignete Spezifikation generieren. Diese Spezifikation bietet ein strukturiertes Dokument, das zur Implementierung direkt an einen Codierungsagenten übergeben werden kann.

Die Spezifikation beinhaltet:

  • Problemstellung — Eine Zusammenfassung des Problems und seiner Ursache

  • Lösungszusammenfassung — Eine allgemeine Beschreibung des empfohlenen Ansatzes

  • Ziel-Repositorys — Die spezifischen Repositorys, an denen Änderungen vorgenommen werden müssen

  • Codeänderungen — Detaillierte Beschreibungen dessen, was geändert werden muss und warum, mit spezifischen Dateipfaden und Überlegungen zur Implementierung

  • Testanforderungen — Welche Szenarien müssen getestet werden

  • Implementierungsplan — Ein schrittweiser Ansatz zur Umsetzung der Änderungen

Agentenfertige Spezifikationen beschleunigen die Implementierung, indem sie den Programmierern den Kontext bieten, den sie benötigen, um produktionsreife Änderungen vorzunehmen, ohne dass umfangreiche Techniker hinzugezogen werden müssen. back-and-forth

Umsetzung von Empfehlungen

Um den Nutzen proaktiver Empfehlungen zur Prävention von Zwischenfällen zu maximieren, sollten Sie die folgenden Methoden zur Umsetzung dieser Empfehlungen in Betracht ziehen:

  • Verwendung einsatzbereiter Spezifikationen — Verwenden Sie für Empfehlungen zu Codeänderungen die generierte Spezifikation, um die Implementierung zu beschleunigen, indem Sie sie einem Codierungsagenten übergeben oder sie als detaillierten Leitfaden für die manuelle Implementierung verwenden.

  • Empfehlungen zu Ihrem Ticket-Backlog hinzufügen — Kopieren Sie Empfehlungen in das Ticketsystem oder das Projektmanagement-Tool Ihres Teams, um sicherzustellen, dass sie neben anderen technischen Arbeiten priorisiert werden.

  • Priorisierung von Empfehlungen auf der Grundlage ihrer Auswirkungen — Konzentrieren Sie sich zunächst auf Empfehlungen, die sich auf die häufigsten oder schwerwiegendsten Arten von Vorfällen beziehen, oder auf solche, die kritische Systeme betreffen.

  • Nachverfolgung des Umsetzungsfortschritts — Überwachen Sie, welche Empfehlungen umgesetzt wurden, und messen Sie deren Wirksamkeit, indem Sie beobachten, ob ähnliche Vorfälle im Laufe der Zeit abnehmen.

  • Abstimmung mit den Entwicklungsteams — Teilen Sie Empfehlungen mit den entsprechenden Teams, denen die betroffenen Systeme gehören, und stellen Sie sicher, dass sie über den Kontext und die Ressourcen verfügen, die für die Umsetzung von Verbesserungen erforderlich sind.