内容领域 4: 机器学习实施和操作 - AWS Certified Machine Learning - Specialty

内容领域 4: 机器学习实施和操作

任务 4.1: 针对性能、可用性、可扩展性、韧性和容错能力构建 ML 解决方案

  • 记录和监控 AWS 环境。

    • AWS CloudTrail 和 Amazon CloudWatch

    • 构建错误监控解决方案。

  • 部署到多个 AWS 区域和多个可用区。

  • 创建 AMI 和黄金映像。

  • 创建 Docker 容器。

  • 部署自动扩缩组。

  • 合理调整资源大小(例如,实例、预调配 IOPS、卷)。

  • 执行负载均衡。

  • 遵循 AWS 最佳实践。

任务 4.2: 针对给定问题建议和实施相应的 ML 服务和功能

  • AWS 上的 ML(应用程序服务),例如:

    • Amazon Polly

    • Amazon Lex

    • Amazon Transcribe

    • Amazon Q

  • 了解 AWS 服务配额。

  • 确定何时构建自定义模型以及何时使用 Amazon SageMaker 内置算法。

  • 了解 AWS 基础设施(例如,实例类型)以及与成本相关的注意事项。

    • 使用竞价型实例通过 AWS Batch 训练深度学习模型。

任务 4.3: 将基本 AWS 安全实践应用于 ML 解决方案

  • AWS Identity and Access Management (IAM)

  • S3 存储桶策略

  • 安全组

  • VPC

  • 加密和匿名化

任务 4.4: 部署和运行 ML 解决方案

  • 公开终端节点并与之进行交互。

  • 了解 ML 模型。

  • 执行 A/B 测试。

  • 重新训练管道。

  • 对 ML 模型进行调试和故障排除。

    • 检测和缓解性能下降。

    • 监控模型性能。