

# 内容领域 4： 监控和日志记录
<a name="devops-engineer-professional-02-domain4"></a>

## 任务说明 4.1： 配置日志及指标的收集、聚合和存储。
<a name="dop-02-task-4-1"></a>

### 掌握以下知识：
<a name="dop-02-task-4-1-knowledge"></a>
+ 如何监控应用程序和基础设施
+ Amazon CloudWatch 指标（例如，命名空间、指标、维度和分辨率）
+ 实时摄取日志
+ 静态和传输中的日志和指标的加密选项（例如，客户端和服务器端、AWS Key Management Service [AWS KMS]）
+ 安全配置（例如，允许收集日志的 IAM 角色和权限）

### 具备以下技能：
<a name="dop-02-task-4-1-skills"></a>
+ 安全地存储和管理日志
+ 使用指标筛选条件从日志事件中创建 CloudWatch 指标
+ 创建 CloudWatch 指标流（例如 Amazon S3 或 Amazon Kinesis Data Firehose 选项）
+ 收集自定义指标（例如，使用 CloudWatch 代理）
+ 管理日志存储生命周期（例如 Amazon S3 生命周期、CloudWatch 日志组保留）
+ 使用 CloudWatch 日志订阅处理日志数据（例如 Amazon Kinesis、AWS Lambda、Amazon OpenSearch Service）
+ 使用筛选条件和模式语法或 Amazon CloudWatch Logs Insights 搜索日志数据
+ 配置日志数据加密（例如 AWS KMS）

## 任务说明 4.2： 审计、监控和分析日志及指标以检测问题。
<a name="dop-02-task-4-2"></a>

### 掌握以下知识：
<a name="dop-02-task-4-2-knowledge"></a>
+ 异常检测警报（例如 CloudWatch 异常检测）
+ 常见的 CloudWatch 指标和日志（例如 Amazon EC2 的 CPU 使用率、Amazon RDS 的队列长度、应用程序负载均衡器 [ALB] 的 5xx 错误）
+ Amazon Inspector 和常见的评估模板
+ AWS Config 规则
+ AWS CloudTrail 日志事件

### 具备以下技能：
<a name="dop-02-task-4-2-skills"></a>
+ 构建 CloudWatch 控制面板和 Amazon QuickSight 可视化内容
+ 将 CloudWatch 警报与 CloudWatch 指标（标准和自定义）相关联
+ 为不同的服务配置 AWS X-Ray（例如，容器、Amazon API Gateway、Lambda 函数）
+ 分析实时日志流（例如，使用 Amazon Kinesis Data Streams）
+ 使用 AWS 服务分析日志（例如 Amazon Athena、CloudWatch Logs Insights）

## 任务说明 4.3： 为复杂环境自动执行监控和事件管理。
<a name="dop-02-task-4-3"></a>

### 掌握以下知识：
<a name="dop-02-task-4-3-knowledge"></a>
+ 事件驱动的异步设计模式（例如，发送到 Amazon Simple Notification Service [Amazon SNS] 或 Lambda 的 S3 事件通知或 Amazon EventBridge 事件）
+ 各种 AWS 服务的弹性伸缩能力（例如，EC2 自动扩缩组、RDS 存储弹性伸缩、Amazon DynamoDB、Amazon Elastic Container Service [Amazon ECS] 容量提供程序、Amazon Elastic Kubernetes Service [Amazon EKS] Autoscaler）
+ 警报通知和操作功能（例如，发送到 Amazon SNS 或 Lambda 的 CloudWatch 警报、EC2 自动恢复）
+ AWS 服务中的运行状况检查功能（例如 ALB 目标组、Amazon Route 53）

### 具备以下技能：
<a name="dop-02-task-4-3-skills"></a>
+ 为自动扩缩配置相应的解决方案（例如 DynamoDB、EC2 自动扩缩组、RDS 存储自动扩缩、ECS 容量提供程序）
+ 创建 CloudWatch 自定义指标和指标筛选条件、警报和通知（例如 Amazon SNS、Lambda）
+ 配置 S3 事件以处理日志文件（例如，使用 Lambda），并将日志文件传送到另一个目的地（例如 OpenSearch Service、CloudWatch Logs）
+ 配置 EventBridge 以根据特定事件模式发送通知
+ 在 EC2 实例上安装和配置代理（例如 AWS Systems Manager Agent [SSM Agent]、CloudWatch 代理）
+ 配置 AWS Config 规则以修复问题
+ 配置运行状况检查（例如 Route 53、ALB）