本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 注释整合
<a name="sms-annotation-consolidation"></a>

一个*注释*是单个工作人员的标注任务的结果。*注释合并*将两个或更多工作人员的注释合并到数据对象的单个标签中。分配给数据集中每个对象的标签是对标签的真实情况的概率估计。数据集中的每个对象通常具有多个注释，但只有一个或一组标签。

您可以决定数据集中的每个对象应该由多少个工作人员进行注释。工作人员越多，越可以提高标签的准确性，但也会增加标注的成本。要了解有关 Ground Truth 定价的更多信息，请参阅[亚马逊 G SageMaker round Truth 定价](https://aws.amazon.com/sagemaker/groundtruth/pricing/)。

如果您使用 Amazon SageMaker AI 控制台创建标签任务，则以下是可以为对象添加注释的工作人员数量的默认值：
+ 文本分类 – 3 个工作人员
+ 图像分类 – 3 个工作人员
+ 边界框 – 5 个工作人员
+ 语义分割 – 3 个工作人员
+ 指定实体识别 – 3 个工作人员

当您使用 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html) 操作时，使用 `NumberOfHumanWorkersPerDataObject` 参数设置对每个数据对象进行注释的工作人员数量。您可以使用控制台或 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateLabelingJob.html) 操作来覆盖对数据对象进行注释的默认工作人员数量。

Ground Truth 为其每个预定义标注任务提供一个注释合并函数：边界框、图像分类、名称实体识别、语义分割和文本分类。这些函数如下所示：
+ 图像和文本分类的多类注释合并对注释使用[期望最大化](https://en.wikipedia.org/wiki/Expectation-maximization_algorithm)方法的变体。它估计每个工作人员的参数，并使用贝叶斯推理方法，根据每个工作人员的类注释来估计真实类。
+ 边界框注释可合并来自多个工作人员的边界框。该函数根据边界框的 [Jaccard 指数](https://en.wikipedia.org/wiki/Jaccard_index)（或交并比）查找来自不同工作人员的最相似的边界框，并计算它们的平均值。
+ 语义分割注释合并将单个图像中的每个像素视为一个多类分类。该函数将来自工作人员的像素注释视为“投票”，并将平滑函数应用于图像以包含来自周围像素的更多信息。
+ 指定实体识别按照 Jaccard 相似度聚类文本选择，并根据模式计算选择边界；如果模式不明确，则计算中值。标签解析为聚类中具有最多分配的实体标签，通过随机选择来中断绑定。

您可以使用其他算法来合并注释。有关信息，请参阅[创建注释整合功能](consolidation-lambda.md)。

# 创建注释整合功能
<a name="consolidation-lambda"></a>

您可以选择使用自己的注释合并函数来确定标注对象的最终标签。编写函数有很多可能的方法，您采用的方法取决于要合并的注释的性质。广义地说，注释函数查看来自工作人员的注释，衡量它们之间的相似性，然后使用某种形式的概率判断来确定最可能的标签应该是怎样的。

如果要使用其他算法创建注释合并函数，可以在任务输出所指向的 Amazon S3 存储桶的 `[project-name]/annotations/worker-response` 文件夹中找到工作人员响应。

## 评测相似性
<a name="consolidation-assessing"></a>

要评估标签之间的相似性，您可以使用下列策略之一，也可以使用满足您的数据标注需要的策略：
+ 对于由离散、互斥的类别（如多类分类）组成的标签空间，评估相似性的过程可能很简单。离散标签要么匹配，要么不匹配。
+ 对于没有离散值的标签空间（例如，边界框注释），请查找广泛的相似性度量。对于边界框，一个此类度量是 Jaccard 指数。此指数衡量两个框的交并比以评估它们的相似程度。例如，如果具有三个注释，则可以使用一个函数确定哪些注释表示同一对象并且应进行合并。

## 评测最可能的标签
<a name="consolidation-probable-label"></a>

考虑到上述策略之一，对合并的标签表示的内容做出某种概率判断。对于离散、互斥的类别，这一过程可能很简单。最常用的一种实现方法是采用注释之间的大多数投票结果。这种方法将各个注释的权重视为相同。

一些方法尝试评估不同的注释者的准确率，并按照正确性概率比例对其注释进行加权。一个此类示例是期望最大化方法，将在多类注释的默认 Ground Truth 合并函数中使用该方法。

有关创建注释合并函数的更多信息，请参阅[使用自定义标签工作流程处理数据 AWS Lambda](sms-custom-templates-step3.md)。