

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Menggunakan tabel Katalog Data untuk sumber data
<a name="edit-jobs-source-catalog-tables"></a>

Untuk semua sumber data kecuali Amazon S3 dan konektor, tabel harus ada di AWS Glue Data Catalog untuk jenis sumber yang Anda pilih. AWS Gluetidak membuat tabel Katalog Data.

**Untuk mengkonfigurasi simpul sumber data berdasarkan tabel Katalog Data**

1. Pergi ke editor visual untuk sebuah tugas baru atau yang sudah disimpan.

1. Pilih simpul sumber data dalam diagram tugas.

1. Pilih tab **Properti sumber data**, dan kemudian masukkan informasi berikut:
   + **Tipe sumber S3**: (Untuk sumber data Amazon S3 saja) Pilih opsi **Pilih tabel Katalog** untuk menggunakan tabel AWS Glue Data Catalog.
   + **Basis data**: Pilih basis data dalam Katalog Data yang berisi tabel sumber yang ingin Anda gunakan untuk tugas ini. Anda dapat menggunakan bidang pencarian untuk mencari basis data berdasarkan namanya.
   + **Tabel**: Pilih tabel yang telah dikaitkan dengan sumber data dari daftar. Tabel ini harus sudah ada dalam AWS Glue Data Catalog. Anda dapat menggunakan bidang pencarian untuk mencari tabel berdasarkan namanya.
   + **Predikat partisi**: (Untuk sumber data Amazon S3 saja) Masukkan ekspresi Boolean berdasarkan Spark SQL yang hanya mencakup kolom pemartisian. Misalnya: `"(year=='2020' and month=='04')"`
   + **Direktori sementara**: (Untuk sumber data Amazon Redshift saja) Masukkan path untuk lokasi direktori kerja di Amazon S3 di mana tugas ETL Anda dapat menulis hasil antara sementara.
   + **Peran yang dikaitkan dengan klaster**: (Untuk sumber data Amazon Redshift saja) Masukkan sebuah peran untuk tugas ETL Anda untuk menggunakan yang berisi izin untuk klaster Amazon Redshift . Lihat informasi yang lebih lengkap di [Izin sumber data dan target data](getting-started-min-privs-job.md#getting-started-min-privs-data).