

# 内容领域 4： 机器学习实施和操作
<a name="machine-learning-specialty-01-domain4"></a>

**Topics**
+ [任务 4.1： 针对性能、可用性、可扩展性、韧性和容错能力构建 ML 解决方案](#machine-learning-specialty-01-domain4-task1)
+ [任务 4.2： 针对给定问题建议和实施相应的 ML 服务和功能](#machine-learning-specialty-01-domain4-task2)
+ [任务 4.3： 将基本 AWS 安全实践应用于 ML 解决方案](#machine-learning-specialty-01-domain4-task3)
+ [任务 4.4： 部署和运行 ML 解决方案](#machine-learning-specialty-01-domain4-task4)

## 任务 4.1： 针对性能、可用性、可扩展性、韧性和容错能力构建 ML 解决方案
<a name="machine-learning-specialty-01-domain4-task1"></a>
+ 记录和监控 AWS 环境。
  + AWS CloudTrail 和 Amazon CloudWatch
  + 构建错误监控解决方案。
+ 部署到多个 AWS 区域和多个可用区。
+ 创建 AMI 和黄金映像。
+ 创建 Docker 容器。
+ 部署自动扩缩组。
+ 合理调整资源大小（例如：实例、预调配 IOPS、卷）。
+ 执行负载均衡。
+ 遵循 AWS 最佳实践。

## 任务 4.2： 针对给定问题建议和实施相应的 ML 服务和功能
<a name="machine-learning-specialty-01-domain4-task2"></a>
+ AWS 上的 ML（应用程序服务），例如：
  + Amazon Polly
  + Amazon Lex
  + Amazon Transcribe
  + Amazon Q
+ 了解 AWS 服务配额。
+ 确定何时构建自定义模型以及何时使用 Amazon SageMaker 内置算法。
+ 了解 AWS 基础设施（例如：实例类型）以及与成本相关的注意事项。
  + 使用竞价型实例通过 AWS Batch 训练深度学习模型。

## 任务 4.3： 将基本 AWS 安全实践应用于 ML 解决方案
<a name="machine-learning-specialty-01-domain4-task3"></a>
+ AWS Identity and Access Management (IAM)
+ S3 存储桶策略
+ 安全组
+ VPC
+ 加密和匿名化

## 任务 4.4： 部署和运行 ML 解决方案
<a name="machine-learning-specialty-01-domain4-task4"></a>
+ 公开终端节点并与之进行交互。
+ 了解 ML 模型。
+ 执行 A/B 测试。
+ 重新训练管道。
+ 对 ML 模型进行调试和故障排除。
  + 检测和缓解性能下降。
  + 监控模型性能。