

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 系統追跡エンティティ
<a name="lineage-tracking-entities"></a>

追跡エンティティは、エンドツーエンドの機械学習ワークフローのすべての要素の表現を保持します。この表現を使用すると、モデルガバナンスの確立、ワークフローの再現、作業履歴の記録の保持を行うことができます。

Amazon SageMaker AI では、処理ジョブ、トレーニングジョブ、バッチ変換ジョブなどの SageMaker AI ジョブを作成する際に、トライアルコンポーネントとそれに関連するトライアルおよび実験の追跡エンティティが自動的に作成されます。自動追跡以外にも、「[追跡エンティティを手動で作成する](lineage-tracking-manual-creation.md)」でワークフローのカスタムステップをモデル化できます。詳細については、「[Studio Classic の Amazon SageMaker Experiments](experiments.md)」を参照してください。

SageMaker AI は、ワークフロー内の他のステップの追跡エンティティも自動的に作成するため、ワークフローを最初から最後まで追跡できます。詳細については、「[Amazon SageMaker AI 作成の追跡エンティティ](lineage-tracking-auto-creation.md)」を参照してください。

SageMaker AI が作成したエンティティを補足する追加のエンティティを作成することもできます。詳細については、「[追跡エンティティを手動で作成する](lineage-tracking-manual-creation.md)」を参照してください。

SageMaker AI は、新しいエンティティを作成するのではなく、既存のエンティティを再利用します。例えば、固有の `SourceUri` を持つアーティファクトは 1 つしか存在しません。

**系統クエリの主要な概念**
+ **系統** - ML ワークフロー内のさまざまなエンティティ間の関係を追跡するメタデータ。
+ **QueryLineage** - 系統を検査し、エンティティ間の関係を検出するアクション。
+ **系統エンティティ** - 系統を構成するメタデータ要素。
+ **クロスアカウントの系統** - ML ワークフローは、複数のアカウントにまたがることがあります。クロスアカウントの系統を使用すると、共有エンティティリソース間の系統の関連付けを自動的に作成するように複数のアカウントを設定できます。そうすると、QueryLineage で、これらの共有アカウントからもエンティティを返すことができるようになります。

以下の追跡エンティティが定義されます。

**実験エンティティ**
+ [トライアルコンポーネント](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrialComponent.html) - 機械学習トライアルのステージ。処理ジョブ、トレーニングジョブ、バッチ変換ジョブが含まれます。
+ [トライアル](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrial.html) - 一般的にモデルを作成するトライアルコンポーネントの組み合わせ。
+ [実験](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateExperiment.html) - 一般的に特定のユースケースの解決に焦点を当てた一連のトライアル。

**系統エンティティ**
+ [トライアルコンポーネント](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateTrialComponent.html) - 系統内の処理、トレーニング、変換のジョブを表します。実験管理の一部にもなります。
+ [コンテキスト](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateContext.html) - 他の追跡エンティティや実験エンティティの論理グループ化を提供します。概念的に、実験とトライアルはコンテキストになります。エンドポイントやモデルパッケージなどが例として挙げられます。
+ [アクション](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAction.html) - アクションまたはアクティビティを表します。一般に、アクションには、少なくとも 1 つの入力アーティファクトか出力アーティファクトが含まれます。ワークフローステップやモデルのデプロイなどが例として挙げられます。
+ [アーティファクト](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateArtifact.html) - URI アドレス可能なオブジェクトやデータを表します。通常、アーティファクトはトライアルコンポーネントやアクションへの入力または出力になります。データセット (S3 バケット URI) やイメージ (Amazon ECR レジストリパス) などが例として挙げられます。
+ [関連付け](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AddAssociation.html) - トレーニングデータの場所とトレーニングジョブの関連付けのように、他の追跡エンティティや実験エンティティをリンクします。

  関連付けにはオプションの `AssociationType` プロパティがあります。以下の値は、各タイプの推奨使用方法と共に使用できます。SageMaker AI では使用に関する制限はありません。
  + `ContributedTo` - ソースがターゲットに貢献した、またはターゲットの有効化に関与した。例えば、トレーニングジョブに貢献したトレーニングデータ。
  + `AssociatedWith` - ソースがターゲットに接続されている。例えば、モデルデプロイに関連付けられた承認ワークフロー。
  + `DerivedFrom` - ターゲットは、ソースを変更したものである。例えば、元の入力から派生、処理ジョブのチャネル入力のダイジェスト出力。
  + `Produced` - ソースがデスティネーションを生成した。例えば、トレーニングジョブが生成したモデルアーティファクト。
  + `SameAs` - 同じ系統エンティティが異なるアカウントで使用される場合。

**一般的なプロパティ**
+ **Type プロパティ**

  アクション、アーティファクト、コンテキストのエンティティにはそれぞれ、`ActionType`、`ArtifactType`、`ContextType` の Type プロパティがあります。**このプロパティは、意味のある情報をエンティティに関連付けて、List API のフィルターとして使用できるカスタム文字列です。
+ **Source プロパティ**

  アクション、アーティファクト、コンテキストのエンティティには `Source` プロパティがあります。このプロパティは、エンティティによって表される、基になる URI を提供します。いくつか例を挙げます。
  + `UpdateEndpoint` アクション。この場合、ソースは `EndpointArn` になります。
  + 処理ジョブのイメージアーティファクト。この場合、ソースは `ImageUri` になります。
  + `Endpoint` コンテキスト。この場合、ソースは `EndpointArn` になります。
+ **Metadata プロパティ**

  アクションエンティティとアーティファクトエンティティには、オプションの `Metadata` プロパティがあります。このプロパティは、以下のような情報を提供できます。
  + `ProjectId` - モデルが属する SageMaker AI MLOps プロジェクトの ID など。
  + `GeneratedBy` - モデルパッケージのバージョンを登録した SageMaker AI パイプラインの実行など。
  + `Repository` - アルゴリズムを含むリポジトリなど。
  + `CommitId` - アルゴリズムバージョンのコミット ID など。