

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Lake Formation の用語
<a name="how-it-works-terminology"></a>

以下は、本ガイドで使用される重要な用語の一部です。

## データレイク
<a name="terminology-data-lake"></a>

*データレイク*は、Amazon S3 に保存され、データカタログを使用して Lake Formation によって管理される永続的なデータです。通常、データレイクには以下のデータが保存されます。
+ 構造化データと非構造化データ
+ raw データと変換されたデータ

Amazon S3 パスをデータレイク内に配置するには、パスを Lake Formation に*登録する*必要があります。

## データアクセス
<a name="terminology-data-access"></a>

Lake Formation は、AWS Identity and Access Management (IAM) ポリシーを補強する新しい許可/取り消しモデルを通じて、データへのセキュアで詳細なアクセスを提供します。

アナリストとデータサイエンティストは、Amazon Athena などの AWS の分析および機械学習サービスの完全なポートフォリオを使用して、データにアクセスすることができます。設定済みの Lake Formation のセキュリティポリシーは、ユーザーがアクセスを認可されているデータにしかアクセスできないことを確実にするために役立ちます。

## ハイブリッドアクセスモード
<a name="terminology-hybridaccessmode"></a>

ハイブリッドアクセスモードでは、Lake Formation のアクセス許可と IAM や Amazon S3 のアクセス許可の両方を使用して、カタログ化されたデータを保護およびアクセスできます。ハイブリッドアクセスモードを使用すると、データ管理者は、一度に 1 つのデータレイクのユースケースに絞って、選択的かつ段階的に Lake Formation のアクセス許可をオンボーディングできます。

## ブループリント
<a name="terminology-blueprint"></a>

*ブループリント*とは、データレイクに簡単にデータを取り込むことができるデータ管理テンプレートです。Lake Formation は、リレーショナルデータベースや AWS CloudTrail ログなどの事前定義されたソースタイプごとに、いくつかのブループリントを提供します。ブループリントからは、ワークフローを作成できます。ワークフローは、データのロードと更新をオーケストレートするために生成される、AWS Glue のクローラー、ジョブ、およびトリガーで構成されます。ブループリントは、データソース、データターゲット、およびスケジュールを入力として使用して、ワークフローを設定します。

## ワークフロー
<a name="terminology-data-importer"></a>

*ワークフロー*は、一連の関連する AWS Glue ジョブ、クローラ、トリガーをまとめるコンテナです。Lake Formation でワークフローを作成すると、それが AWS Glue サービスで実行されます。Lake Formation は、ワークフローのステータスを単一のエンティティとして追跡できます。

ワークフローを定義するときは、ワークフローの基礎となるブループリントを選択します。その後、ワークフローをオンデマンドで、またはスケジュールに従って実行できます。

Lake Formation で作成するワークフローは、AWS Glue コンソールに DAG (Directed Acyclic Graph) として表示されます。DAG を使用することで、ワークフローの進行状況を追跡し、トラブルシューティングを実行できます。

## Data Catalog
<a name="terminology-data-catalog"></a>

*データカタログ*は、永続的なメタデータストアです。これは、AWS クラウド上でのメタデータの保存、注釈付け、および共有を、Apache Hive メタストアと同じ方法で実行できるマネージドサービスです。異種システムがデータサイロ内のデータを追跡するためのメタデータを保存して検索できる均一なリポジトリを提供し、そのメタデータを使用してデータのクエリと変換を行います。Lake Formation は、AWS Glue Data Catalog を使用して、データレイク、データソース、変換、およびターゲットに関するメタデータを保存します。

データソースとターゲットに関するメタデータは、データベースとテーブルの形式になっています。テーブルは、スキーマ情報、およびロケーション情報などを保存します。データベースはテーブルのコレクションです。Lake Formation は、Data Catalog 内のデータベースとテーブルへのアクセスを制御するための許可の階層を提供します。

各 AWS アカウントには、AWS リージョンごとに 1 つの Data Catalog があります。

## 基盤となるデータ
<a name="terminology-underlying-data"></a>

*基礎となるデータ*は、データカタログのテーブルが指すソースデータまたはデータレイク内のデータを指します。

## プリンシパル
<a name="terminology-principal"></a>

*プリンシパル*は、AWS Identity and Access Management (IAM) のユーザーまたはロール、あるいは Active Directory のユーザーです。

## データレイク管理者
<a name="terminology-admin"></a>

*データレイク管理者*は、あらゆるデータカタログリソースまたはデータの場所に対するアクセス許可を任意のプリンシパル (自分自身を含む) に付与できるプリンシパルです。データレイク管理者は、Data Catalog の最初のユーザーとして指定します。このユーザーは、リソースのより詳細な許可を他のプリンシパルに付与できるようになります。

**注記**  
IAM 管理ユーザー (`AdministratorAccess` AWS マネージドポリシーを持つユーザー) が、自動的にデータレイク管理者になるわけではありません。例えば、IAM 管理ユーザーがカタログオブジェクトに対する Lake Formation 許可を付与できるのは、これを実行する許可が IAM 管理ユーザー付与されている場合のみになります。ただし、IAM 管理ユーザーは、Lake Formation コンソールまたは API を使用して、自分自身をデータレイク管理者として指定できます。

データレイク管理者の能力については、「[黙示的な Lake Formation 許可](implicit-permissions.md)」を参照してください。ユーザーのデータレイク管理者としての指定については、「[データレイク管理者を作成する](initial-lf-config.md#create-data-lake-admin)」を参照してください。