

# 内容领域 2： ML 模型开发
<a name="machine-learning-engineer-associate-01-domain2"></a>

**Topics**
+ [

## 任务 2.1： 选择建模方法
](#machine-learning-engineer-associate-01-domain2-task1)
+ [

## 任务 2.2： 训练和优化模型
](#machine-learning-engineer-associate-01-domain2-task2)
+ [

## 任务 2.3： 分析模型性能
](#machine-learning-engineer-associate-01-domain2-task3)

## 任务 2.1： 选择建模方法
<a name="machine-learning-engineer-associate-01-domain2-task1"></a>

掌握以下知识：
+ ML 算法的功能以及正确用于解决业务问题
+ 如何使用 AWS 人工智能 (AI) 服务（例如，Amazon Translate、Amazon Transcribe、Amazon Rekognition、Amazon Bedrock）来解决特定的业务问题
+ 在模型选择或算法选择过程中如何考虑可解释性
+ Amazon SageMaker AI 内置算法以及各算法的应用场景

具备以下技能：
+ 评估可用数据和问题复杂性，以便确定 ML 解决方案的可行性
+ 比较和选择适当的 ML 模型或算法来解决特定问题
+ 选择内置算法、基础模型和解决方案模板（例如，在 SageMaker JumpStart 和 Amazon Bedrock 中）
+ 根据成本选择模型或算法
+ 选择 AI 服务来解决常见的业务需求问题

## 任务 2.2： 训练和优化模型
<a name="machine-learning-engineer-associate-01-domain2-task2"></a>

掌握以下知识：
+ 训练过程中的要素（例如，epoch、步骤、批次大小）
+ 缩短模型训练时间的方法（例如，提前停止、分布式训练）
+ 影响模型大小的因素
+ 提高模型性能的方法
+ 正则化技术的益处（例如，随机失活、权重衰减、L1 和 L2）
+ 超参数优化技术（例如，随机搜索、贝叶斯优化）
+ 模型超参数及其对模型性能的影响（例如，基于树的模型中的树数量、神经网络中的层数）
+ 将在 SageMaker AI 之外构建的模型集成到 SageMaker AI 中的方法

具备以下技能：
+ 使用 SageMaker AI 内置算法和常用 ML 库开发 ML 模型
+ 使用 SageMaker AI 脚本模式和支持 SageMaker AI 的框架来训练模型（例如 TensorFlow、PyTorch）
+ 使用自定义数据集微调预训练模型（例如 Amazon Bedrock、SageMaker JumpStart）
+ 执行超参数优化（例如，使用 SageMaker AI 自动模型优化 [AMT]）
+ 集成自动超参数优化功能
+ 防止模型过拟合、欠拟合和灾难性遗忘（例如，通过使用正则化技术、特征选择）
+ 组合多个训练模型以提高性能（例如，集成、堆叠、提升）
+ 减小模型大小（例如，通过更改数据类型、修剪、更新特征选择、压缩）
+ 管理模型版本来实现可重复性以及用于审计（例如，使用 SageMaker 模型注册表）

## 任务 2.3： 分析模型性能
<a name="machine-learning-engineer-associate-01-domain2-task3"></a>

掌握以下知识：
+ 模型评估技术和指标（例如，混淆矩阵、热图、F1 分数、准确率、查准率、查全率、均方根误差 [RMSE]、接收方操作特性 [ROC]、ROC 曲线下面积 [AUC]）
+ 创建性能基准的方法
+ 识别模型过拟合和欠拟合的方法
+ SageMaker Clarify 中提供的指标，用于深入了解 ML 训练数据和模型
+ 收敛问题

具备以下技能：
+ 选择和解释评估指标并检测模型偏差
+ 评估在模型性能、训练时间和成本之间的权衡
+ 使用 AWS 服务执行可重复的实验
+ 将影子变体的性能与生产变体的性能进行比较
+ 使用 SageMaker Clarify 解释模型输出
+ 使用 SageMaker 模型调试器调试模型收敛