

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 了解事件報告中 AI 衍生的事實
<a name="Investigations-IncidentReports-ai-facts"></a>

AI 衍生的事實構成 CloudWatch 調查事件報告的基礎，代表 AI 系統根據 AWS 環境的全面分析而認為客觀或高度可能的資訊。這些事實會透過複雜的程序出現，將機器學習模式辨識與系統化驗證方法結合，為事件分析建立健全的架構，以維護生產環境所需的操作嚴格性。

了解 AI 衍生事實的開發方式，可協助您評估其可靠性，並在事件回應期間做出明智的決策。此程序代表一種混合方法，其中人工智慧增強了人類的專業知識，而不是取代它，確保產生的洞察是全面且值得信任的。

## AI 衍生事實的開發程序
<a name="Investigations-ai-facts-development"></a>

從原始遙測資料到可操作 AI 衍生事實的旅程從模式觀察開始，CloudWatch 調查 AI 會使用複雜的機器學習演算法分析大量 AWS 遙測。AI 會同時檢查多個維度的 CloudWatch 指標、日誌和追蹤，識別人類運算子可能不會立即顯現的重複模式和關係。此分析包含時間模式，可顯示事件發生的時間及其持續時間特性、顯示故障案例期間不同 AWS 服務互動方式的服務關聯、事件之前或隨附的指標異常，以及指出特定故障模式的日誌事件序列。

例如，考慮 AI 如何在您的環境中觀察到，Amazon EC2 執行個體 CPU 使用率在應用程式回應時間超過可接受的閾值前約 15 分鐘持續遽增至超過 90%。當在多個事件中觀察到時，這種時間關係會成為值得進一步調查的重要模式。AI 不僅會記下相互關聯性，還會測量關係的統計意義，並考慮可能影響模式的各種干擾因素。

根據這些觀察到的模式，AI 會進入假設產生階段，並針對其探索到的關係制定潛在解釋。此程序涉及建立多個競爭假設，並根據支援證據的強度，依機率進行排名。當 AI 在回應時間降級之前觀察到 CPU 峰值時，可能會產生幾個假設：由於運算容量不足而導致資源耗盡、記憶體流失導致 CPU 額外負荷增加，或由特定輸入模式觸發的效率低落演算法。每個假設都會根據其解釋觀察資料的程度來接收初步的可信度層級，並與已知 AWS 的服務行為保持一致。

這些假設的人工驗證和驗證可確保這些 AI 產生的洞察符合操作標準，然後再成為事件報告中的事實。此程序涉及將 AI 衍生的模式與已建立 AWS 的服務行為模型相互關聯、檢查事件回應與產業最佳實務的一致性，以及針對類似環境的歷史事件資料進行驗證。AI 必須證明其調查結果在不同分析方法和時段之間可重現、符合營運決策的統計顯著性要求、符合 AWS 服務行為的實證觀察，並提供可行的洞見，以解決或預防事件。

在整個過程中，AI 面臨了在解譯 AI 衍生事實時應了解的幾個固有挑戰。相互關聯和因果關係之間的差異仍然是基本的挑戰；雖然 AI 可能會識別網路流量激增和事件發生之間的高度相互關聯，但建立直接因果關係需要額外的調查和領域專業知識。存在於 AWS 遙測範圍之外的隱藏變數，例如第三方服務相依性或外部網路提供者問題，可能會影響事件，而不會在 AI 分析中被擷取。AI 衍生事實的品質完全取決於基礎 CloudWatch 資料的完整性和準確性，因此全面監控涵蓋範圍對於可靠的洞見至關重要。

新事件模式帶來另一個挑戰，因為 AI 訓練資料中不存在這些挑戰，AIs 通常難以解譯不熟悉的失敗模式。此限制強調了人類專業知識在解釋 AI 衍生事實時的重要性，並補充了領域知識和內容理解。

## 在事件回應中套用 AI 衍生的事實
<a name="Investigations-ai-facts-practical-application"></a>

AI 擅長識別大型資料集之間不切實際的模式，以便人類手動分析，提供可大幅加速事件診斷和解決的洞見。AI 與人類專業知識結合，可提供內容、驗證結論，以及識別可能無法在遙測資料中擷取的因素時，效果最佳。

最有效的方法包括將 AI 衍生的事實視為高度明智的調查起點，而不是明確的結論。當 AI 識別諸如「資料庫連線集區耗盡事件前 8 分鐘」之類的事實時，這提供了寶貴的潛在客戶，可以透過資料庫指標和應用程式日誌的目標分析快速進行驗證。事實為您提供了特定的調查時間範圍和潛在的根本原因，相較於手動搜尋所有可用的遙測，可大幅減少識別問題所需的時間。

資料品質在 AI 衍生事實的可靠性中扮演重要角色。全面的 CloudWatch 監控涵蓋範圍提供 AI 存取，以便分析完整且準確的資訊。監控中的差距可能會導致不完整或誤導的事實，因為 AI 只能使用可用的資料。使用包括詳細指標收集、全方位記錄和分散式追蹤的全面可觀測性實務的組織，更有可能在其事件報告中擁有準確且可行的 AI 衍生事實。