内容领域 4: 机器学习实施和操作
任务
任务 4.1: 针对性能、可用性、可扩展性、韧性和容错能力构建 ML 解决方案
-
记录和监控 AWS 环境。
AWS CloudTrail 和 Amazon CloudWatch
构建错误监控解决方案。
部署到多个 AWS 区域和多个可用区。
创建 AMI 和黄金映像。
创建 Docker 容器。
部署自动扩缩组。
合理调整资源大小(例如,实例、预调配 IOPS、卷)。
执行负载均衡。
遵循 AWS 最佳实践。
任务 4.2: 针对给定问题建议和实施相应的 ML 服务和功能
-
AWS 上的 ML(应用程序服务),例如:
Amazon Polly
Amazon Lex
Amazon Transcribe
Amazon Q
了解 AWS 服务配额。
确定何时构建自定义模型以及何时使用 Amazon SageMaker 内置算法。
-
了解 AWS 基础设施(例如,实例类型)以及与成本相关的注意事项。
使用竞价型实例通过 AWS Batch 训练深度学习模型。
任务 4.3: 将基本 AWS 安全实践应用于 ML 解决方案
AWS Identity and Access Management (IAM)
S3 存储桶策略
安全组
VPC
加密和匿名化
任务 4.4: 部署和运行 ML 解决方案
公开终端节点并与之进行交互。
了解 ML 模型。
执行 A/B 测试。
重新训练管道。
-
对 ML 模型进行调试和故障排除。
检测和缓解性能下降。
监控模型性能。