View a markdown version of this page

온디맨드 DevOps 작업 - AWS DevOps 에이전트

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

온디맨드 DevOps 작업

AWS DevOps Agent On Demand Tasks는 운영 팀이 애플리케이션 아키텍처를 쿼리하고, 시스템 상태를 분석하고, 자연어를 사용하여 조사 인사이트에 액세스할 수 있는 생성형 인공 지능(AI) 기반 대화형 어시스턴트입니다. AWS 리소스, 시스템 지표, 경보 상태, 배포 기록 및 인시던트 패턴에 대해 질문할 수 있습니다. Chat은 실제 인프라 및 운영 데이터에 기반한 즉각적인 답변을 제공하므로 여러 AWS 콘솔 또는 모니터링 도구를 탐색할 필요가 없습니다.

채팅은 DevOps Agent Space 웹 앱 전체에 통합되며 보고 있는 페이지를 기반으로 컨텍스트 인식 응답을 제공합니다. 인터페이스는 대화 기록을 유지 관리하므로 이전 논의를 계속하고 이전 쿼리를 기반으로 구축할 수 있습니다.

작업 기능

AWS DevOps Agent On Demand Tasks는 인프라를 관리하고 이해하는 데 도움이 되는 포괄적인 기능을 제공합니다.

리소스 쿼리 - Lambda 함수, DynamoDB 테이블, EKS 배포, 인증서 및 인프라 구성을 포함하여 에이전트 스페이스의 AWS 리소스에 대해 질문합니다. 채팅은 런타임 버전, 용량 설정 또는 배포 상태와 같은 속성을 기반으로 리소스를 필터링하고 분석할 수 있습니다. 예를 들어 "Python 3.8을 사용하는 Lambda는 몇 개입니까?"라고 질문합니다. 또는 "만료될 인증서가 있습니까?"

시스템 상태 분석 - 경보 상태, 오류율, CPU 사용률 및 서비스 가용성을 포함하여 현재 및 과거 시스템 상태 지표를 쿼리합니다. 채팅은 특정 기간을 다루는 상태 요약을 생성하고 시스템 동작의 추세를 식별할 수 있습니다. “지난 24시간 동안 어떤 경보가 발생했나요?”와 같은 질문을 합니다. 또는 "지난 1시간 동안 5xx 오류가 있습니까?"

조사 인사이트 - 근본 원인 분석, 탐색된 가설, 검토된 로그, 해결 패턴을 포함하여 완료 및 진행 중인 조사의 정보에 액세스합니다. 채팅은 일반적인 인시던트 원인을 식별하고 기록 데이터를 기반으로 권장 사항을 제공할 수 있습니다. "지난 달 인시던트의 가장 일반적인 원인은 무엇입니까?" 쿼리 또는 "완료된 조사의 평균 해결 시간은 얼마입니까?"

조사 조향 - 조사 세부 정보 페이지를 볼 때 에이전트에게 특정 로그에 집중하거나, 특정 가설을 탐색하거나, 근본 원인 분석을 업데이트하도록 지시하여 조사를 안내합니다. "결제 서비스에 대한 로그에 집중하고 RCA 업데이트" 또는 "DynamoDB 제한으로 인해 문제가 발생했다는 가설 탐색"과 같은 조향 입력을 제공합니다.

채팅 아티팩트 - 운영 상태 요약, 오류 보고서 및 인시던트 분석과 같은 구조화된 보고서 및 문서를 생성합니다. 아티팩트는 전용 패널에 나타나며 대화 내에서 버전이 지정된 편집을 지원합니다.

권장 사항 필터링 - 특정 서비스 또는 운영 문제와 관련된 권장 사항과 같은 특정 기준으로 인시던트 방지 권장 사항을 쿼리합니다. Chat은 각 권장 사항에 대한 영향 및 구현 고려 사항을 설명합니다. 예를 들어 "DynamoDB와 관련된 인시던트를 방지하는 권장 사항 표시" 또는 "요청 지연 시간 문제를 더 빠르게 감지하는 데 도움이 되는 권장 사항은 무엇입니까?"

채팅 액세스

채팅은 DevOps 에이전트 스페이스 웹 앱의 왼쪽에 영구 패널로 제공됩니다. 왼쪽 사이드바에는 + 새 채팅 버튼, 인시던트, 운영 백로그 및 토폴로지로 이동하기 위한 페이지 섹션, 최근 대화를 표시하는 채팅 섹션이 포함되어 있습니다. 전체 대화 기록을 보려면 모두 보기를 선택합니다.

Chat은 액세스하는 위치에 따라 컨텍스트 인식 응답을 제공합니다.

토폴로지 - 에이전트 스페이스 리소스, 아키텍처 및 운영 상태에 대한 일반적인 질문을 합니다. 채팅은 연결된 모든 계정과 서비스를 완벽하게 볼 수 있습니다. 이 컨텍스트에서 리소스 구성, 배포 기록, 토폴로지 정보 및 관찰성 도구 통합을 쿼리할 수 있습니다.

인시던트 대응 - 인시던트 대응 페이지를 볼 때 에이전트 스페이스 전반의 조사 추세, 해결 시간 및 인시던트 패턴에 대해 질문합니다. 채팅은 과거 조사 데이터를 분석하여 일반적인 원인과 개선 기회를 식별할 수 있습니다.

조사 세부 정보 - 특정 조사를 보는 동안 Chat은 해당 조사에 대한 컨텍스트 인식 응답을 제공합니다. 검토된 로그, 탐색된 가설, 근본 원인 결론 및 완화 계획에 대해 질문합니다. 또한 조향 입력을 제공하여 조사 포커스를 안내할 수 있습니다.

예방 - 예방 페이지에서 필터로 권장 사항을 쿼리하고, 권장 사항이 작성된 이유를 이해하고, 구현 접근 방식을 살펴봅니다. 채팅은 인시던트 방지 권장 사항의 영향을 우선시하고 이해하는 데 도움이 됩니다.

페이지 간에 전환할 때 채팅 인터페이스는 계속 사용할 수 있지만 현재 보기와 관련된 정보를 제공하도록 컨텍스트가 변경됩니다. 새 대화를 시작하면 이전 컨텍스트 없이 시작됩니다. 기존 대화를 계속하면 Chat은 후속 질문에 대한 전체 대화 기록을 유지합니다.

컨텍스트 인식 응답

Chat은 DevOps 에이전트 스페이스 웹 앱에서 보고 있는 페이지를 기반으로 응답을 조정합니다. 이러한 컨텍스트 인식을 통해 요청하려는 조사 또는 리소스 범위를 지정할 필요 없이 관련 정보를 받을 수 있습니다.

조사 세부 정보 페이지를 볼 때 Chat은 사용자가 특정 조사에 대해 질문하고 있음을 자동으로 이해합니다. “어떤 로그를 보셨나요?”와 같은 질문 또는 "어떤 가설을 탐색했나요?" 는 현재 표시된 조사를 참조합니다. 조향 입력을 제공하면 Chat은 이를 활성 조사에 적용하고 적절한 경우 새 근본 원인 버전을 생성합니다.

예방 페이지에서 Chat은 인시던트 예방 권장 사항에 관심이 있음을 이해합니다. 쿼리는 에이전트 스페이스 컨텍스트 내에서 추천을 자동으로 필터링하고 분석합니다. 시스템은 일반 권장 사항 또는 특정 권장 사항 세부 정보에 대해 질문하는지 여부를 인식합니다.

토폴로지 페이지에서 채팅에 액세스할 때 Chat은 에이전트 스페이스의 모든 리소스, 지표 및 기록 데이터에 대한 광범위한 가시성을 제공합니다. 조사 또는 권장 사항 컨텍스트를 지정하지 않고도 리소스, 서비스 또는 운영 문제에 대해 질문할 수 있습니다.

이러한 컨텍스트 인식을 사용하면 참조하는 조사, 권장 사항 또는 리소스 범위를 반복적으로 지정할 필요가 없으므로 보다 자연스러운 대화 흐름이 가능합니다.

대화 관리

채팅은 이전 토론을 계속하고 이전 쿼리를 참조할 수 있도록 대화 기록을 유지합니다.

새 대화 생성 - 채팅 패널에서 "새 세션" 버튼을 클릭하여 이전 컨텍스트 없이 새 대화를 시작합니다. 새 대화는 이전 채팅의 정보를 전달하지 않으므로 혼동 없이 관련 없는 질문을 할 수 있습니다.

대화 기록 액세스 - 에이전트 스페이스 내의 모든 이전 대화를 보려면 "기록"을 클릭합니다. 대화는 타임스탬프와 미리 보기 텍스트로 시간순으로 구성됩니다. 대화 기록은 90일 동안 유지되며 에이전트 스페이스 내의 사용자 계정에 비공개입니다.

대화 계속 - 기록에서 대화를 선택하여 중단한 부분에서 다시 시작합니다. Chat은 이전 메시지의 전체 컨텍스트를 유지하므로 대화의 이전 부분을 참조하는 후속 질문을 할 수 있습니다. 대화를 보는 동안 페이지를 전환하면 대화 컨텍스트는 그대로 유지되지만 현재 위치에 따라 페이지별 컨텍스트가 업데이트됩니다.

대화 기록은 각 에이전트 스페이스 내에서 격리됩니다. 한 에이전트 스페이스의 대화는 다른 에이전트 스페이스에서 보거나 액세스할 수 없습니다. 이 격리를 통해 민감한 정보를 조직의 경계에 따라 구분된 상태로 유지할 수 있습니다.

아티팩트 생성

AWS DevOps Agent는 대화 중에 에이전트가 생성한 구조화되고 버전이 지정된 문서인 채팅 아티팩트를 지원합니다. 아티팩트는 운영 보고서, 오류 요약 및 상태 평가와 같은 AI 생성 콘텐츠를 검토하고 편집하기 위한 전용 대화형 패널을 채팅 UI에 제공합니다.

DevOps 에이전트 스페이스 웹 앱의 모든 페이지에서 아티팩트를 요청할 수 있습니다. Chat은 현재 페이지 컨텍스트를 사용하여 아티팩트 콘텐츠의 범위를 지정합니다.

아티팩트 작동 방식

Chat에 콘텐츠를 생성하거나 업데이트하도록 요청하면 Chat은 일반적으로 형식이 지정된 문서인 아티팩트를 생성하여 대화와 함께 아티팩트 패널에 표시합니다.

생성 - 자연어 요청을 보내 보고서 또는 문서를 생성합니다. 예를 들어 '에이전트 스페이스에 대한 주간 운영 상태 보고서 생성' 또는 '지난 주의 4xx 오류에 대한 보고서 표시'를 요청합니다.

검토 - 아티팩트가 대화와 함께 전용 패널에 나타납니다. 채팅과 계속 상호 작용하면서 전체 콘텐츠를 검토할 수 있습니다.

편집 - 채팅을 통해 아티팩트에 대한 변경 사항을 요청합니다. 예를 들어 "Lambda 콜드 스타트에 대한 섹션 추가" 또는 "지난 달의 데이터를 포함하도록 보고서 업데이트"를 요청합니다. Chat은 요청된 변경 사항을 사용하여 아티팩트의 새 버전을 생성합니다.

샘플 쿼리

다음 예제에서는 채팅에 질문할 수 있는 질문 유형을 보여줍니다. 이 예제는 사용 사례 및 컨텍스트별로 구성되어 있습니다.

아티팩트 생성 쿼리

DevOps 에이전트 스페이스 웹 앱의 모든 페이지에서:

  • 내 에이전트 스페이스에 대한 주간 운영 상태 요약 생성

  • 지난 주의 모든 4xx 오류에 대한 보고서 생성

  • 지난 30일 동안의 인시던트 요약 보고서 작성

  • 이번 주에 결제 서비스에 대한 경보 활동 요약 생성

  • 지난 7일 동안의 배포 기록 보고서 생성

  • 열려 있는 모든 권장 사항을 보고서로 요약

리소스 정보 쿼리

DevOps 에이전트 스페이스 웹 앱의 모든 페이지에서:

  • Python 3.8을 사용하는 Lambda 함수는 몇 개입니까?

  • 만료될 인증서가 있나요?

  • 온디맨드 결제로 모든 DynamoDB 테이블 나열

  • 프로덕션 환경에서 EKS 클러스터 표시

  • 지난 90일 동안 배포되지 않은 Lambda 함수는 무엇입니까?

  • 버전 관리가 활성화되지 않은 S3 버킷 나열

  • 데이터베이스 버전 X를 실행하는 RDS 인스턴스는 무엇입니까?

시스템 상태 쿼리

토폴로지 또는 인시던트 대응 페이지에서:

  • 지난 24시간 동안 발생한 경보는 무엇입니까?

  • 지난 한 시간 동안 5xx 오류가 있었나요?

  • 결제 서비스에 대한 Lambda 오류 추세 표시

  • ECS 클러스터의 CPU 사용률은 얼마입니까?

  • 로드 밸런서에 비정상 대상이 있나요?

  • 어제의 API Gateway 제한 이벤트 표시

  • 지난 주에 오류율이 가장 높은 서비스는 무엇입니까?

  • 지난 24시간 동안의 전체 상태 보고서 제공

관찰성 도구 쿼리

토폴로지에서:

  • Splunk 로그 그룹 나열

  • Prometheus 지표 및 경보 임계값 표시

  • 이 서비스에 대해 구성된 Datadog 모니터는 무엇입니까?

  • New Relic 알림 정책 나열

  • Dynatrace 대시보드 구성 표시

조사 인사이트 쿼리

인시던트 대응 페이지에서:

  • 지난 달 인시던트의 가장 일반적인 원인은 무엇입니까?

  • 완료된 조사의 평균 해결 시간은 얼마입니까?

  • 지난 주의 조사 및 해당 RCA 요약

  • DynamoDB 제한으로 인해 발생한 인시던트 수는 몇 개입니까?

  • 지난 분기의 조사 추세 표시

  • 인시던트가 가장 자주 발생하는 서비스는 무엇입니까?

조사 세부 정보 쿼리

조사 세부 정보 페이지에서:

  • 어떤 로그를 보셨나요?

  • 어떤 가설을 탐색했나요?

  • 제안하는 완화 조치는 얼마나 위험합니까?

  • 이 인시던트의 이벤트 타임라인은 어떻게 되었나요?

  • 이것이 근본 원인이라는 결론을 내린 이유는 무엇입니까?

  • 근본 원인 분석을 지원하는 증거는 무엇입니까?

  • 조사 중에 누가 조향을 제공했습니까?

  • 이 인시던트 조사에 대한 요약 제공

조사 조향 쿼리

조사 세부 정보 페이지에서:

  • 14:00~15:00 UTC 사이에 결제 서비스에 대한 로그에 집중하고 RCA를 업데이트합니다.

  • DynamoDB 제한으로 인해 문제가 발생했다는 가설 탐색

  • ECS 클러스터 구성을 확인하여 이로 인해 경보가 발생했는지 확인합니다.

  • 하루가 아닌 지난 2시간 동안의 로그만 확인

  • 오후 3시에 오류 급증 조사

  • Lambda 로그 대신 API Gateway 로그 보기

예방 권장 사항 쿼리

예방 페이지에서:

  • 상위 3가지 인시던트 예방 권장 사항은 무엇인가요?

  • DynamoDB와 관련된 인시던트를 방지하는 권장 사항 표시

  • 요청 지연 시간 문제를 더 빠르게 감지하는 데 도움이 되는 권장 사항은 무엇입니까?

  • 유사한 인시던트를 방지할 수 있는 관찰성 개선 사항 나열

  • 결제 서비스에 대한 인프라 권장 사항 표시

  • 시스템 복원력에 가장 큰 영향을 미치는 권장 사항은 무엇입니까?

에이전트 스페이스에서 채팅 활성화

채팅은 모든 DevOps 에이전트 스페이스 웹 앱에서 사용할 수 있습니다. 설정 프로세스는 새 에이전트 스페이스가 있는지 기존 에이전트 스페이스가 있는지에 따라 달라집니다.

새 에이전트 공간

채팅은 새 에이전트 스페이스를 생성할 때 자동으로 활성화됩니다. 추가 구성 또는 IAM 권한 설정은 필요하지 않습니다. DevOps 에이전트 스페이스 웹 앱을 구성한 후에는 페이지 왼쪽에 영구 패널로 채팅을 즉시 사용할 수 있습니다.

기존 에이전트 공간

채팅이 릴리스되기 전에 에이전트 스페이스를 생성한 경우 필요한 IAM 권한을 활성화해야 합니다. 여기에는 두 가지 옵션이 있습니다.

옵션 1: 운영자 앱 액세스 취소 및 다시 활성화

AWS DevOps 에이전트 관리 콘솔로 이동하여 오른쪽 상단 모서리에서 작업 드롭다운을 찾아 현재 운영자 액세스 구성을 비활성화합니다.

그런 다음 운영자 액세스를 위한 자동 생성 옵션을 활성화합니다.

이렇게 하면 채팅에 필요한 IAM 권한이 다른 모든 현재 운영자 권한과 함께 자동으로 적용됩니다.

옵션 2: 수동으로 IAM 권한 추가

기존 운영자 액세스 역할에 다음 IAM 권한을 추가합니다.

  • aidevops:ListChats - 채팅 대화 기록 보기

  • aidevops:CreateChat - 새 채팅 대화 생성

  • aidevops:SendMessage - 메시지 전송 및 응답 수신

AWS IAM 콘솔로 이동하여 DevOps 에이전트 운영자 역할을 찾고 이러한 권한을 역할 정책에 추가합니다. 권한이 추가된 직후 채팅을 사용할 수 있습니다.

두 옵션 중 하나를 완료한 후 DevOps Agent Space 웹 앱을 새로 고치면 페이지 왼쪽에 채팅 패널이 나타납니다.