

# データソースに接続する
<a name="work-with-data-stores"></a>

Amazon Athena を使用して、*データセット*内のさまざまな場所にさまざまな形式で保存されているデータをクエリすることができます。このデータセットは、CSV、JSON、Avro、Parquet、またはその他の形式である可能性があります。

クエリを実行するために Athena で使用するテーブルとデータベースは、*メタデータ*に基づいています。メタデータは、データセット内の基になるデータに関するデータです。このメタデータがデータセットを記述する方法を*スキーマ*と呼びます。たとえば、テーブル名、テーブル内の列名、各列のデータ型はメタデータとして保存され、基になるデータセットを記述するスキーマです。Athena では、メタデータを整理するためのシステムを、*データカタログ*または*メタストア*と呼んでいます。データセットとそれを記述するデータカタログの組み合わせを*データソース*と呼びます。

メタデータと基になるデータセットとの関係は、使用するデータソースの種類によって異なります。MySQL、PostgreSQL、SQL Server などのリレーショナルデータソースは、メタデータをデータセットと緊密に統合します。多くの場合これらのシステムでは、データが書き込まれるときにメタデータが書き込まれます。[Hive](https://hive.apache.org) を使用して構築されたものなどの他のデータソースでは、データセットを読み込むときにその場でメタデータを定義できます。データセットは、CSV、JSON、Parquet、または Avro など、さまざまな形式にすることができます。

Athena は AWS Glue Data Catalog をネイティブにサポートします。AWS Glue Data Catalog は、Amazon S3、Amazon Redshift、Amazon DynamoDB などの他のデータセットとデータソースの上に構築されたデータカタログです。Athena は、さまざまなコネクタを使用して他のデータソースに接続することも可能です。

**Topics**
+ [AWS Glue Data Catalog を使用してデータに接続する](data-sources-glue.md)
+ [Amazon Athena フェデレーティッドクエリを使用する](federated-queries.md)
+ [Athena で Amazon DataZone を使用する](datazone-using.md)
+ [外部の Hive メタストアを使用する](connect-to-data-source-hive.md)
+ [データソースを管理する](data-sources-managing.md)