

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 世系跟踪实体
<a name="lineage-tracking-entities"></a>

跟踪实体保留了 end-to-end机器学习工作流程中所有元素的表示形式。您可以使用此表示形式来建立模型治理，重现工作流和维护工作历史记录。

当您创建 SageMaker AI 任务（例如处理作业、训练作业和批量转换作业）时，Amazon SageMaker AI 会自动为试验组件及其关联的试验和实验创建跟踪实体。除了自动跟踪之外，您还可以[手动创建跟踪实体](lineage-tracking-manual-creation.md)，对工作流中的自定义步骤进行建模。有关更多信息，请参阅 [Studio 经典版中的亚马逊 SageMaker 实验](experiments.md)。

SageMaker AI 还会自动为工作流程中的其他步骤创建跟踪实体，因此您可以从头到尾跟踪工作流程。有关更多信息，请参阅 [Amazon SageMaker AI 创建的追踪实体](lineage-tracking-auto-creation.md)。

您可以创建其他实体来补充 SageMaker AI 创建的实体。有关更多信息，请参阅 [手动创建跟踪实体](lineage-tracking-manual-creation.md)。

SageMaker AI 会重复使用任何现有实体，而不是创建新实体。例如，只能有一个具有唯一 `SourceUri` 的构件。

**用于查询世系的关键概念**
+ **世系** - 跟踪机器学习工作流中各实体之间关系的元数据。
+ **QueryLineage**— 检查你的血统并发现实体之间关系的行动。
+ **世系实体** - 构成您的世系的元数据元素。
+ **跨账户世系** - 您的机器学习工作流可能跨多个账户。使用跨账户世系，您可以配置多个账户，以便在共享实体资源之间自动创建世系关联。 QueryLineage 然后甚至可以从这些共享账户中返回实体。

定义了以下跟踪实体：

**实验实体**
+ [试验组件](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrialComponent.html) - 机器学习试验的一个阶段。包括处理作业、训练作业和批量转换作业。
+ [试验](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrial.html) - 试验组件组合，通常会生成一个模型。
+ [实验](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateExperiment.html) - 试验分组，通常侧重于解决特定使用案例。

**世系实体**
+ [试验组件](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrialComponent.html) - 表示世系中的处理、训练和转换作业。也是实验管理的一部分。
+ [上下文](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateContext.html) - 提供其他跟踪或实验实体的逻辑分组。从概念上讲，实验和试验都是上下文。示例包括端点和模型包。
+ [操作](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAction.html) - 表示操作或活动。通常，一项操作至少涉及一个输入构件或输出构件。示例包括工作流步骤和模型部署。
+ [构件](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateArtifact.html) - 表示 URI 可寻址的对象或数据。构件通常是试验组件或操作的输入或输出。示例包括数据集（S3 存储桶 URI）或映像（Amazon ECR 注册表路径）。
+ [关联](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AddAssociation.html) - 链接其他跟踪或实验实体，如训练数据位置与训练作业之间的关联。

  关联具有可选 `AssociationType` 属性。以下值以及每种类型的建议用法可供选择。 SageMaker AI 对其使用没有任何限制：
  + `ContributedTo` - 源对目标做出了贡献或参与促成了目标。例如，训练数据为训练作业做出了贡献。
  + `AssociatedWith` - 源已连接到目标。例如，批准工作流与模型部署相关联。
  + `DerivedFrom` - 目标是对源的修改。例如，处理作业的通道输入的摘要输出派生自原始输入。
  + `Produced` - 源生成了目标。例如，训练作业生成了一个模型构件。
  + `SameAs` - 当在不同账户中使用相同的世系实体时。

**常用属性**
+ **类型属性**

  操作、构件和上下文实体的*类型* 属性分别为 `ActionType`、`ArtifactType` 和 `ContextType`。此属性是一个自定义字符串，可以将有意义的信息与实体相关联，并可用作列表中的筛选器 APIs。
+ **源属性**

  操作、构件和上下文实体都有一个 `Source` 属性。此属性提供了实体所代表的底层 URI。部分示例包括：
  + `UpdateEndpoint` 操作，其中源为 `EndpointArn`。
  + 用于处理作业的映像构件，其中源为 `ImageUri`。
  + 上下文 `Endpoint`，其中源为 `EndpointArn`。
+ **元数据属性**

  操作和构件实体具有可选 `Metadata` 属性，可以提供以下信息：
  + `ProjectId`— 例如，模型所属 SageMaker 的人工智能 MLOps 项目的 ID。
  + `GeneratedBy`— 例如，注册模型包版本的 SageMaker AI 管道执行。
  + `Repository` - 例如，包含算法的存储库。
  + `CommitId` - 例如，算法版本的提交 ID。