View a markdown version of this page

隨需 DevOps 任務 - AWS DevOps 代理程式

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

隨需 DevOps 任務

AWS DevOps Agent On Demand Tasks 是生成式人工智慧 (AI) 支援的對話式助理,可讓營運團隊查詢其應用程式架構、分析系統運作狀態,並使用自然語言存取調查洞見。您可以詢問有關 AWS 資源、系統指標、警示狀態、部署歷史記錄和事件模式的問題。聊天提供以實際基礎設施和操作資料為基礎的立即答案,無需在多個 AWS 主控台或監控工具之間導覽。

Chat 已整合到 DevOps Agent Space Web 應用程式,並根據您正在檢視的頁面提供內容感知回應。界面會維護對話歷史記錄,讓您繼續先前的討論並建置在先前的查詢上。

任務功能

AWS DevOps Agent On Demand Tasks 提供全方位的功能,可協助您管理和了解基礎設施:

資源查詢 – 詢問 代理程式空間中的 AWS 資源,包括 Lambda 函數、DynamoDB 資料表、EKS 部署、憑證和基礎設施組態。聊天可以根據執行時間版本、容量設定或部署狀態等屬性來篩選和分析資源。例如,詢問「有多少 Lambdas 使用 Python 3.8?」 或「我是否有任何即將過期的憑證?」

系統運作狀態分析 – 查詢目前和歷史系統運作狀態指標,包括警示狀態、錯誤率、CPU 使用率和服務可用性。聊天可以產生涵蓋特定時段的運作狀態摘要,並識別系統行為的趨勢。詢問以下問題:「在過去 24 小時內觸發了哪些警示?」 或「過去一小時有任何 5xx 錯誤?」

調查洞察 – 從已完成和進行中的調查存取資訊,包括根本原因分析、探索的假設、檢閱的日誌和解決模式。聊天可以識別常見的事件原因,並根據歷史資料提供建議。查詢「上個月事件最常見的原因是什麼?」 或「已完成調查的平均解決時間為何?」

調查轉向 – 檢視調查詳細資訊頁面時,請指示客服人員專注於特定日誌、探索特定假設或更新根本原因分析,以引導調查。提供轉向輸入,例如「付款服務日誌上的焦點和更新您的 RCA」或「探索 DynamoDB 限流導致問題的假設。」

聊天成品 – 產生結構化報告和文件,例如操作運作狀態摘要、錯誤報告和事件分析。成品會出現在專用面板中,並支援對話中的版本編輯。

檔案連接 – 將映像、文件和程式碼檔案連接到您的訊息,以便聊天功能可以在內容中分析它們。例如,附加警示儀表板、YAML 組態檔案或 Runbook PDF 的螢幕擷取畫面,並詢問 Chat 接下來該怎麼做。如需詳細資訊,請參閱傳送檔案附件

建議篩選 – 使用特定條件查詢事件預防建議,例如與特定服務或操作問題相關的建議。聊天說明每個建議的影響和實作考量。例如,「顯示可預防涉及 DynamoDB 之事件的建議」或「哪些建議有助於更快偵測請求延遲問題?」

存取聊天

聊天功能可作為 DevOps Agent Space Web 應用程式左側的持久性面板。左側邊欄包含 + 新增聊天按鈕、導覽至事件、改善和拓撲的頁面區段,以及顯示您最近對話的聊天區段。選擇檢視全部,查看您的完整對話歷史記錄。

聊天功能會根據您存取內容的位置提供內容感知回應:

拓撲 – 詢問有關 Agent Space 資源、架構和運作狀態的一般問題。聊天功能可完整查看所有連線的帳戶和服務。在此內容中,您可以查詢資源組態、部署歷史記錄、拓撲資訊和可觀測性工具整合。

事件回應 – 檢視事件回應頁面時,請針對整個客服人員空間的調查趨勢、解決時間和事件模式提出問題。聊天可以分析歷史調查資料,以識別常見原因和改善機會。

調查詳細資訊 – 檢視特定調查時,聊天會提供有關該調查的內容感知回應。詢問已檢閱的日誌、探索的假設、根本原因結論和緩解計劃。您也可以提供轉向輸入來引導調查焦點。

預防 – 從預防頁面,使用篩選條件查詢建議,了解提出建議的原因,並探索實作方法。聊天可協助您排定優先順序,並了解事件預防建議的影響。

當您在頁面之間切換時,聊天界面仍然可用,但內容會變更,以提供目前檢視的相關資訊。當您開始新的對話時,它會在沒有上下文的情況下開始。當您繼續現有的對話時,聊天會維護後續問題的完整對話歷史記錄。

內容感知回應

Chat 會根據您在 DevOps Agent Space Web 應用程式中檢視的頁面調整其回應。此內容感知可確保您接收相關資訊,而不需要指定您要詢問的調查或資源範圍。

檢視調查詳細資訊頁面時,聊天會自動了解您正在詢問有關該特定調查的問題。例如「您查看了哪些日誌?」的問題 或「您探索了哪些假設?」 請參閱目前顯示的調查。當您提供轉向輸入時,聊天會將其套用至主動調查,並在適當時建立新的根本原因版本。

在預防頁面上,聊天了解您對事件預防建議感興趣。查詢會自動篩選和分析 Agent Space 內容中的建議。系統會辨識您是否詢問一般建議或特定建議詳細資訊。

從拓撲頁面存取聊天時,聊天可讓您全面了解客服人員空間中的所有資源、指標和歷史資料。您可以詢問任何資源、服務或操作問題,而無需指定調查或建議內容。

這種內容感知不需要重複指定您正在參考的調查、建議或資源範圍,從而建立更自然的對話流程。

管理對話

聊天會維護對話歷史記錄,讓您繼續先前的討論並參考先前的查詢。

建立新的對話 – 按一下聊天面板中的「新工作階段」按鈕,在沒有先前內容的情況下開始新的對話。新的對話不會延續先前聊天中的資訊,可讓您提出不相關的問題,而不會造成混淆。

存取對話歷史記錄 – 按一下「歷史記錄」以檢視客服人員空間中的所有先前對話。對話會依時間順序以時間戳記和預覽文字進行組織。對話歷史記錄會保留 90 天,並在客服人員空間中私有至您的使用者帳戶。

繼續對話 – 從歷史記錄中選取任何對話,從您離開的地方繼續。聊天會維護先前訊息的完整內容,讓您提出參考先前對話部分的後續問題。當您在檢視對話時切換頁面時,對話內容仍會保留,但頁面特定內容會根據您目前的位置更新。

請注意,對話歷史記錄會在每個客服人員空間中隔離。無法從其他客服人員空間看見或存取一個客服人員空間中的對話。此隔離可確保敏感資訊根據您的組織界限保持隔離。

產生成品

AWS DevOps Agent 支援聊天成品:客服人員在對話期間產生的結構化、版本控制文件。成品在聊天 UI 中提供專用的互動式面板,用於檢閱和編輯 AI 產生的內容,例如操作報告、錯誤摘要和運作狀態評估。

您可以從 DevOps Agent Space Web 應用程式中的任何頁面請求成品。聊天使用目前的頁面內容來限定成品內容的範圍。

成品的運作方式

當您要求聊天建立或更新內容時,聊天會產生成品,通常是格式化的文件,並將其顯示在對話旁的成品面板中。

產生 – 傳送自然語言請求以建立報告或文件。例如,詢問「為我的客服人員空間產生每週營運運作狀態報告」或「顯示上週我的 4xx 錯誤報告」。

檢閱 – 成品與對話一起出現在專用面板中。您可以檢閱完整內容,同時繼續與聊天互動。

編輯 – 透過聊天請求對成品進行變更。例如,詢問「在 Lambda 冷啟動上新增區段」或「更新報告以包含上個月的資料」。Chat 會使用您請求的變更來建立新的成品版本。

傳送檔案附件

您可以將檔案連接到聊天訊息,以便聊天可以與您的問題一起閱讀。使用附件來分享您正在查看的內容:儀表板或警示的螢幕擷取畫面、組態檔案、原始程式碼、操作 Runbook,並要求客服人員直接說明原因。

檔案範圍限定於您的客服人員空間 – 其他客服人員空間不會顯示這些檔案,而且存取權會受到切換聊天其餘部分的相同 IAM 許可所限制。一旦您連接檔案,檔案就會上傳至受管的 Agent Space 儲存體。

如何連接檔案

您可以透過三種方式將檔案新增至訊息:

  • 在聊天輸入工具列中選擇上傳圖示,然後從您的裝置中選取一或多個檔案。

  • 將一或多個檔案拖放到聊天輸入區域。

  • 直接從剪貼簿貼上影像,例如擷取螢幕擷取畫面之後。

您連接的每個檔案都會在聊天輸入中顯示為晶片,並顯示上傳進度指標。若要預覽檔案,請選擇其晶片。若要移除檔案,請選擇晶片上的 X。當任何連接的檔案仍在上傳時,傳送按鈕會保持停用狀態。

支援的檔案類型

Chat 接受下列三個類別的檔案:

  • 影像pngjpegjpggifwebp

  • 文件pdfcsvdocdocxxlsxlsxhtmltxtmd

  • 文字和程式碼檔案jsonyamlymlxmljstspyjavarbgo、、rsshbashlogcfg、、initoml

上傳前會拒絕這些類別以外的檔案。

限制

下列限制適用於每則訊息:

限制 Value
檔案大小上限 3.75 MB
每則訊息的附件 (任何類型組合) 20
其中,二進位文件 (PDF、DOC、DOCX、XLS、XLSX) 最多 5 個

此外,您的訊息文字和附件內容必須同時符合模型的每個訊息內容視窗。如果訊息及其附件太大,聊天會拒絕訊息,並要求您在傳送之前減少附件的大小或數量。

使用案例

搭配 DevOps 代理程式使用檔案附件的常見方式:

  • 連接警示或錯誤儀表板的螢幕擷取畫面,並要求 Chat 解譯失敗的內容,以及接下來要查看的位置。

  • 連接服務原始碼,並要求聊天功能檢閱變更、建議修正或解釋其行為。

  • 連接組態檔案 (例如 YAML、JSON 或 TOML 組態),並要求 Chat 疑難排解部署、警示或整合行為不佳的原因。

  • 連接操作 Runbook 或事件後報告 PDF,並要求 Chat 將其轉換為技能 — 客服人員會擷取程序並將其儲存至您的 Agent Space,以便未來的調查可以自動套用。

範例查詢

下列範例示範您可以詢問 Chat 的問題類型。這些範例會依使用案例和內容進行組織。

成品產生查詢

從 DevOps Agent Space Web 應用程式的任何頁面:

  • 為我的客服人員空間產生每週操作運作狀態摘要

  • 建立上週所有 4xx 錯誤的報告

  • 建置過去 30 天的事件摘要報告

  • 建立本週付款服務的警示活動摘要

  • 產生過去 7 天的部署歷史記錄報告

  • 將所有開啟的建議摘要到報告中

資源資訊查詢

從 DevOps Agent Space Web 應用程式的任何頁面:

  • 有多少 Lambda 函數正在使用 Python 3.8?

  • 我是否有任何即將過期的憑證?

  • 列出具有隨需計費的所有 DynamoDB 資料表

  • 在生產環境中顯示 EKS 叢集

  • 哪些 Lambda 函數在過去 90 天內尚未部署?

  • 列出未啟用版本控制的 S3 儲存貯體

  • 哪些 RDS 執行個體正在執行資料庫版本 X?

系統運作狀態查詢

從拓撲或事件回應頁面:

  • 哪些警示在過去 24 小時內觸發?

  • 過去一小時有任何 5xx 錯誤?

  • 顯示付款服務的 Lambda 錯誤趨勢

  • 我的 ECS 叢集的 CPU 使用率是多少?

  • 負載平衡器中是否有任何運作狀態不佳的目標?

  • 顯示昨天的 API Gateway 限流事件

  • 上週哪些服務的錯誤率最高?

  • 提供涵蓋過去 24 小時的整體運作狀態報告

可觀測性工具查詢

從拓撲:

  • 列出 Splunk 日誌群組

  • 顯示 Prometheus 指標及其警示閾值

  • 此服務設定了哪些 Datadog 監視器?

  • 列出新複本提醒政策

  • 顯示 Dynatrace 儀表板組態

調查洞察查詢

從事件回應頁面:

  • 上個月事件最常見的原因是什麼?

  • 已完成調查的平均解決時間為何?

  • 總結上週的調查及其 RCA

  • DynamoDB 調節造成了多少個事件?

  • 顯示過去季度的調查趨勢

  • 哪些服務發生最常見的事件?

調查詳細資訊查詢

從調查詳細資訊頁面:

  • 您查看了哪些日誌?

  • 您探索了哪些假設?

  • 您提議的緩解動作風險有多高?

  • 此事件期間的事件時間表為何?

  • 您為什麼認為這是根本原因?

  • 哪些證據支援您的根本原因分析?

  • 調查期間,誰提供了指導?

  • 提供此事件調查的摘要

調查轉向查詢

從調查詳細資訊頁面:

  • 專注於 14:00-15:00 UTC 之間的付款服務日誌,並更新您的 RCA

  • 探索 DynamoDB 調節導致問題的假設

  • 檢查 ECS 叢集組態,以查看是否造成警示

  • 只檢查過去 2 小時的日誌,而不是整天的日誌

  • 在下午 3 點調查錯誤峰值

  • 查看 API Gateway 日誌而非 Lambda 日誌

預防建議查詢

從預防頁面:

  • 我的前 3 個事件預防建議是什麼?

  • 顯示可預防涉及 DynamoDB 之事件的建議

  • 哪些建議有助於我更快地偵測請求延遲問題?

  • 列出可預防類似事件的可觀測性改善

  • 顯示付款服務的基礎設施建議

  • 哪些建議對系統彈性的影響最高?

在客服人員空間中啟用聊天

聊天功能適用於所有 DevOps Agent Space Web 應用程式。設定程序取決於您是否擁有新的或現有的客服人員空間。

新的客服人員空間

當您建立新的客服人員空間時,聊天功能會自動啟用。不需要額外的組態或 IAM 許可設定。設定 DevOps Agent Space Web 應用程式後,聊天功能可立即做為任何頁面左側的持久性面板使用。

現有的客服人員空間

如果您在聊天發佈之前建立了客服人員空間,則必須啟用所需的 IAM 許可。您有兩種選擇:

選項 1:撤銷並重新啟用運算子應用程式存取

導覽至 AWS DevOps 代理程式管理主控台,找到右上角的動作下拉式清單,並停用目前的操作員存取組態。

動作下拉式選單顯示選項,包括反白顯示的停用操作員存取。

然後啟用操作員存取的自動建立選項。

選取自動建立新的 AWS DevOps 代理程式角色選項的運算子存取區段。

這會自動套用聊天所需的 IAM 許可,以及所有其他目前的運算子許可。

選項 2:手動新增 IAM 許可

將下列 IAM 許可新增至現有的操作員存取角色:

  • aidevops:ListChats – 檢視聊天對話歷史記錄

  • aidevops:CreateChat – 建立新的聊天對話

  • aidevops:SendMessage – 傳送訊息和接收回應

導覽至 AWS IAM 主控台,找到您的 DevOps Agent Operator 角色,然後將這些許可新增至角色政策。新增許可後,聊天會立即可用。

完成任一選項後,請重新整理 DevOps Agent Space Web 應用程式,聊天面板會顯示在任何頁面的左側。