

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Cara kerja model khusus
<a name="canvas-build-model"></a>

Gunakan Amazon SageMaker Canvas untuk membuat model kustom pada kumpulan data yang telah Anda impor. Gunakan model yang telah Anda buat untuk membuat prediksi pada data baru. SageMaker Canvas menggunakan informasi dalam kumpulan data untuk membangun hingga 250 model dan memilih salah satu yang berkinerja terbaik.

Saat Anda mulai membuat model, Canvas secara otomatis merekomendasikan satu atau lebih *jenis model*. Jenis model termasuk dalam salah satu kategori berikut:
+ **Prediksi numerik** — Ini dikenal sebagai *regresi* dalam pembelajaran mesin. Gunakan tipe model prediksi numerik saat Anda ingin membuat prediksi untuk data numerik. Misalnya, Anda mungkin ingin memprediksi harga rumah berdasarkan fitur seperti luas persegi rumah.
+ **Prediksi kategoris** — Ini dikenal sebagai *klasifikasi* dalam pembelajaran mesin. Saat Anda ingin mengkategorikan data ke dalam grup, gunakan jenis model prediksi kategoris:
  + **Prediksi kategori 2** — Gunakan tipe model prediksi kategori 2 (juga dikenal sebagai *klasifikasi biner* dalam pembelajaran mesin) ketika Anda memiliki dua kategori yang ingin Anda prediksi untuk data Anda. Misalnya, Anda mungkin ingin menentukan apakah pelanggan cenderung melakukan churn.
  + **Prediksi kategori 3\$1** — Gunakan tipe model prediksi kategori 3\$1 (juga dikenal sebagai *klasifikasi multi-kelas* dalam pembelajaran mesin) ketika Anda memiliki tiga atau lebih kategori yang ingin Anda prediksi untuk data Anda. Misalnya, Anda mungkin ingin memprediksi status pinjaman pelanggan berdasarkan fitur seperti pembayaran sebelumnya.
+ **Peramalan deret waktu** — Gunakan perkiraan deret waktu saat Anda ingin membuat prediksi selama periode waktu tertentu. Misalnya, Anda mungkin ingin memprediksi jumlah barang yang akan Anda jual pada kuartal berikutnya. Untuk informasi tentang prakiraan deret waktu, lihat [Prakiraan Deret Waktu di Amazon SageMaker Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-time-series.html).
+ **Prediksi gambar** - Gunakan jenis model prediksi gambar label tunggal (juga dikenal sebagai *klasifikasi gambar label tunggal* dalam pembelajaran mesin) saat Anda ingin menetapkan label ke gambar. Misalnya, Anda mungkin ingin mengklasifikasikan berbagai jenis cacat produksi dalam gambar produk Anda.
+ **Prediksi teks** — Gunakan jenis model prediksi teks multi-kategori (juga dikenal sebagai *klasifikasi teks multi-kelas* dalam pembelajaran mesin) saat Anda ingin menetapkan label ke bagian teks. Misalnya, Anda mungkin memiliki kumpulan data ulasan pelanggan untuk suatu produk, dan Anda ingin menentukan apakah pelanggan menyukai atau tidak menyukai produk tersebut. Anda mungkin meminta model Anda memprediksi apakah bagian teks tertentu adalah`Positive`,`Negative`, atau`Neutral`.

Untuk tabel tipe data input yang didukung untuk setiap jenis model, lihat[Model kustom](canvas-custom-models.md).

**Untuk setiap model data tabular yang Anda buat (yang mencakup model prediksi numerik, kategoris, deret waktu, dan prediksi teks), Anda memilih kolom Target.** **Kolom Target** adalah kolom yang berisi informasi yang ingin Anda prediksi. Misalnya, jika Anda membuat model untuk memprediksi apakah orang telah membatalkan langganan mereka, **kolom Target** berisi titik data yang merupakan status pembatalan seseorang `yes` atau status pembatalan seseorang. `no`

Untuk model prediksi gambar, Anda membuat model dengan kumpulan data gambar yang telah diberi label. Untuk gambar tak berlabel yang Anda berikan, model memprediksi label. Misalnya, jika Anda membuat model untuk memprediksi apakah gambar itu kucing atau kucing, Anda memberikan gambar berlabel kucing atau kucing saat membuat model. Kemudian, model dapat menerima gambar yang tidak berlabel dan memprediksinya sebagai kucing atau kucing.

**Apa yang terjadi ketika Anda membangun model**

Untuk membangun model Anda, Anda dapat memilih **Quick build** atau **Standard build**. **Quick build** memiliki waktu pembuatan yang lebih singkat, tetapi **build Standar** umumnya memiliki akurasi yang lebih tinggi.

Untuk model peramalan tabular dan deret waktu, Canvas menggunakan *downsampling* untuk mengurangi ukuran kumpulan data yang masing-masing lebih besar dari 5 GB atau 30 GB. Canvas downsamples dengan metode stratified sampling. Tabel di bawah ini mencantumkan ukuran downsample menurut jenis model. Untuk mengontrol proses pengambilan sampel, Anda dapat menggunakan Data Wrangler di Canvas untuk mengambil sampel menggunakan teknik pengambilan sampel pilihan Anda. Untuk data deret waktu, Anda dapat mengambil sampel ulang ke titik data agregat. Untuk informasi lebih lanjut tentang pengambilan sampel, lihat[Pengambilan sampel](canvas-transform.md#canvas-transform-sampling). Untuk informasi selengkapnya tentang pengambilan sampel ulang data deret waktu, lihat. [Sampel Ulang Data Seri Waktu](canvas-transform.md#canvas-resample-time-series)

Jika Anda memilih untuk **membuat Quick build** pada kumpulan data dengan lebih dari 50.000 baris, Canvas mengambil sampel data Anda hingga 50.000 baris untuk waktu pelatihan model yang lebih singkat.

Tabel berikut merangkum karakteristik utama dari proses pembuatan model, termasuk waktu pembuatan rata-rata untuk setiap model dan tipe build, ukuran downsample saat membuat model dengan kumpulan data besar, dan jumlah titik data minimum dan maksimum yang harus Anda miliki untuk setiap tipe build.


| Kuota | Prediksi numerik dan kategoris | Peramalan deret waktu | Prediksi gambar | Prediksi teks | 
| --- | --- | --- | --- | --- | 
| Waktu **pembuatan cepat** | 2-20 menit | 2-20 menit | 15-30 menit | 15-30 menit | 
| Waktu **pembuatan standar** | 2-4 jam | 2-4 jam | 2-5 jam | 2-5 jam | 
| Ukuran downsample (ukuran yang diperkecil dari kumpulan data besar setelah sampel bawah Canvas) | 5 GB | 30 GB | N/A | N/A | 
| Jumlah minimum entri (baris) untuk build **Cepat** |  2 kategori: 500 baris 3\$1 kategori, numerik, deret waktu: N/A  | N/A | N/A | N/A | 
| Jumlah minimum entri (baris, gambar, atau dokumen) untuk build **Standar** | 250 | 50 | 50 | N/A | 
| Jumlah maksimum entri (baris, gambar, atau dokumen) untuk build **Cepat** | N/A | N/A | 5000 | 7500 | 
| Jumlah maksimum entri (baris, gambar, atau dokumen) untuk build **Standar** | N/A | 150.000 | 180.000 | N/A | 
| Jumlah kolom maksimum | 1.000 | 1.000 | N/A | N/A | 

Canvas memprediksi nilai dengan menggunakan informasi di sisa kumpulan data, tergantung pada jenis model:
+ **Untuk prediksi kategoris, Canvas menempatkan setiap baris ke dalam salah satu kategori yang tercantum di kolom Target.**
+ **Untuk prediksi numerik, Canvas menggunakan informasi dalam kumpulan data untuk memprediksi nilai numerik di kolom Target.**
+ Untuk peramalan deret waktu, Canvas menggunakan data historis untuk memprediksi nilai **kolom Target** di masa depan.
+ Untuk prediksi gambar, Canvas menggunakan gambar yang telah diberi label untuk memprediksi label untuk gambar yang tidak berlabel.
+ Untuk prediksi teks, Canvas menganalisis data teks yang telah diberi label untuk memprediksi label untuk bagian teks yang tidak berlabel.

**Fitur tambahan untuk membantu Anda membangun model**

Sebelum membuat model Anda, Anda dapat menggunakan Data Wrangler di Canvas untuk menyiapkan data Anda menggunakan 300\$1 transformasi dan operator bawaan. Data Wrangler mendukung transformasi untuk kumpulan data tabel dan gambar. Selain itu, Anda dapat terhubung ke sumber data di luar Canvas, membuat pekerjaan untuk menerapkan transformasi ke seluruh kumpulan data Anda, dan mengekspor data yang telah disiapkan dan dibersihkan sepenuhnya untuk digunakan dalam alur kerja ML di luar Canvas. Untuk informasi selengkapnya, lihat [Persiapan data](canvas-data-prep.md).

Untuk melihat visualisasi dan analitik untuk menjelajahi data Anda dan menentukan fitur mana yang akan disertakan dalam model Anda, Anda dapat menggunakan analisis bawaan Data Wrangler. Anda juga dapat mengakses **Laporan Kualitas Data dan Wawasan** yang menyoroti potensi masalah dengan kumpulan data Anda dan memberikan rekomendasi tentang cara memperbaikinya. Untuk informasi selengkapnya, lihat [Lakukan analisis data eksplorasi (EDA)](canvas-analyses.md).

Selain fungsionalitas persiapan dan eksplorasi data yang lebih canggih yang disediakan melalui Data Wrangler, Canvas menyediakan beberapa fitur dasar yang dapat Anda gunakan:
+ Untuk memfilter data Anda dan mengakses serangkaian transformasi data dasar, lihat[Mempersiapkan data untuk pembuatan model](canvas-prepare-data.md).
+ Untuk mengakses visualisasi dan analitik sederhana untuk eksplorasi fitur, lihat. [Eksplorasi dan analisis data](canvas-explore-data.md)
+ Untuk mempelajari lebih lanjut tentang fitur tambahan seperti melihat pratinjau model, memvalidasi kumpulan data, dan mengubah ukuran sampel acak yang digunakan untuk membuat model, lihat. [Pratinjau model Anda](canvas-preview-model.md)

Untuk kumpulan data tabular dengan beberapa kolom (seperti kumpulan data untuk membangun tipe model peramalan kategoris, numerik, atau deret waktu), Anda mungkin memiliki baris dengan titik data yang hilang. Sementara Canvas membangun model, secara otomatis menambahkan nilai yang hilang. Canvas menggunakan nilai dalam kumpulan data Anda untuk melakukan pendekatan matematis untuk nilai yang hilang. Untuk akurasi model tertinggi, kami sarankan menambahkan data yang hilang jika Anda dapat menemukannya. Perhatikan bahwa fitur data yang hilang tidak didukung untuk prediksi teks atau model prediksi gambar.

**Memulai**

Untuk memulai membangun model kustom, lihat [Membangun model](canvas-build-model-how-to.md) dan ikuti prosedur untuk jenis model yang ingin Anda bangun.

# Pratinjau model Anda
<a name="canvas-preview-model"></a>

**catatan**  
Fungsionalitas berikut hanya tersedia untuk model khusus yang dibangun dengan kumpulan data tabular. Model prediksi teks multi-kategori juga dikecualikan.

SageMaker Canvas memberi Anda alat untuk melihat pratinjau model Anda sebelum Anda mulai membangun. Ini memberi Anda perkiraan skor akurasi dan juga memberi Anda gambaran awal tentang bagaimana setiap kolom dapat memengaruhi model. 

Untuk melihat pratinjau skor model, saat Anda berada di tab **Build** model, pilih **Model pratinjau**.

Pratinjau model menghasilkan prediksi **akurasi Estimasi** tentang seberapa baik model dapat menganalisis data Anda. Keakuratan **build Cepat atau build** **Standar** menunjukkan seberapa baik kinerja model pada data nyata dan umumnya lebih tinggi daripada **akurasi Estimasi**.

Pratinjau model juga memberi Anda skor **Dampak Kolom**, yang dapat menunjukkan pentingnya setiap kolom terhadap prediksi model.

Screenshot berikut menunjukkan pratinjau model dalam aplikasi Canvas.

![\[Screenshot dari tab Build untuk model di Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-build/canvas-build-preview-model.png)


Amazon SageMaker Canvas secara otomatis menangani nilai yang hilang dalam kumpulan data Anda saat membuat model. Ini menyimpulkan nilai yang hilang dengan menggunakan nilai yang berdekatan yang ada dalam dataset.

Jika Anda puas dengan pratinjau model dan ingin melanjutkan pembuatan model, lihat[Membangun model](canvas-build-model-how-to.md).

# Validasi data
<a name="canvas-dataset-validation"></a>

Sebelum membuat model, SageMaker Canvas memeriksa kumpulan data Anda untuk masalah yang mungkin menyebabkan build Anda gagal. Jika SageMaker Canvas menemukan masalah, maka Canvas memperingatkan Anda di halaman **Build** sebelum Anda mencoba membuat model.

Anda dapat memilih **Validasi data** untuk melihat daftar masalah dengan kumpulan data Anda. Anda kemudian dapat menggunakan [fitur persiapan data SageMaker Canvas Data Wrangler](canvas-data-prep.md), atau alat Anda sendiri, untuk memperbaiki kumpulan data Anda sebelum memulai pembuatan. Jika Anda tidak memperbaiki masalah dengan kumpulan data Anda, build Anda gagal.

Jika Anda membuat perubahan pada kumpulan data untuk memperbaiki masalah, Anda memiliki opsi untuk memvalidasi ulang kumpulan data Anda sebelum mencoba membangun. Kami menyarankan Anda memvalidasi ulang dataset Anda sebelum membangun.

Tabel berikut menunjukkan masalah yang diperiksa SageMaker Canvas dalam kumpulan data Anda dan cara mengatasinya.


| Isu | Resolusi | 
| --- | --- | 
|  Jenis model yang salah untuk data Anda  |  Coba jenis model lain atau gunakan kumpulan data yang berbeda.  | 
|  Nilai yang hilang di kolom target Anda  |  Ganti nilai yang hilang, jatuhkan baris dengan nilai yang hilang, atau gunakan kumpulan data yang berbeda.  | 
|  Terlalu banyak label unik di kolom target Anda  |  Verifikasi bahwa Anda telah menggunakan kolom yang benar untuk kolom target Anda, atau gunakan kumpulan data yang berbeda.  | 
|  Terlalu banyak nilai non-numerik di kolom target Anda  |  Pilih kolom target yang berbeda, pilih jenis model lain, atau gunakan kumpulan data yang berbeda.  | 
|  Satu atau beberapa nama kolom berisi garis bawah ganda  |  Ganti nama kolom untuk menghapus garis bawah ganda, dan coba lagi.  | 
|  Tak satu pun dari baris dalam dataset Anda yang lengkap  |  Ganti nilai yang hilang, atau gunakan kumpulan data yang berbeda.  | 
|  Terlalu banyak label unik untuk jumlah baris dalam data Anda  |  Periksa apakah Anda menggunakan kolom target kanan, menambah jumlah baris dalam kumpulan data Anda, mengkonsolidasikan label serupa, atau menggunakan kumpulan data yang berbeda.  | 

# Sampel acak
<a name="canvas-random-sample"></a>

SageMaker Canvas menggunakan metode pengambilan sampel acak untuk mengambil sampel kumpulan data Anda. Metode sampel acak berarti bahwa setiap baris memiliki kesempatan yang sama untuk dipilih untuk sampel. Anda dapat memilih kolom di pratinjau untuk mendapatkan statistik ringkasan untuk sampel acak, seperti mean dan mode.

Secara default, SageMaker Canvas menggunakan ukuran sampel acak 20.000 baris dari kumpulan data Anda untuk kumpulan data dengan lebih dari 20.000 baris. Untuk kumpulan data yang lebih kecil dari 20.000 baris, ukuran sampel default adalah jumlah baris dalam kumpulan data Anda. Anda dapat menambah atau mengurangi ukuran sampel dengan memilih **Sampel acak** di tab **Build** aplikasi SageMaker Canvas. Anda dapat menggunakan slider untuk memilih ukuran sampel yang Anda inginkan, dan kemudian memilih **Perbarui** untuk mengubah ukuran sampel. Ukuran sampel maksimum yang dapat Anda pilih untuk kumpulan data adalah 40.000 baris, dan ukuran sampel minimum adalah 500 baris. Jika Anda memilih ukuran sampel yang besar, pratinjau kumpulan data dan statistik ringkasan mungkin memerlukan beberapa saat untuk dimuat ulang.

Halaman **Build** menampilkan pratinjau 100 baris dari kumpulan data Anda. Jika ukuran sampel adalah ukuran yang sama dengan dataset Anda, maka pratinjau menggunakan 100 baris pertama dari dataset Anda. Jika tidak, pratinjau menggunakan 100 baris pertama dari sampel acak.

# Membangun model
<a name="canvas-build-model-how-to"></a>

Bagian berikut menunjukkan cara membangun model untuk masing-masing jenis utama model kustom.
+ Untuk membangun prediksi numerik, prediksi kategori 2, atau 3\$1 model prediksi kategori, lihat. [Membangun model prediksi numerik atau kategoris kustom](#canvas-build-model-numeric-categorical)
+ Untuk membuat model prediksi gambar label tunggal, lihat. [Membangun model prediksi gambar kustom](#canvas-build-model-image)
+ Untuk membuat model prediksi teks multi-kategori, lihat. [Membangun model prediksi teks kustom](#canvas-build-model-text)
+ Untuk membuat model peramalan deret waktu, lihat[Bangun model peramalan deret waktu](#canvas-build-model-forecasting).

**catatan**  
Jika Anda menemukan kesalahan selama analisis pasca-pembangunan yang memberi tahu Anda untuk meningkatkan kuota untuk `ml.m5.2xlarge` instans, lihat [Meminta](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-requesting-quota-increases.html) Peningkatan Kuota.

## Membangun model prediksi numerik atau kategoris kustom
<a name="canvas-build-model-numeric-categorical"></a>

**Model prediksi numerik dan kategoris mendukung **build Quick dan build Standar**.**

Untuk membangun model prediksi numerik atau kategoris, gunakan prosedur berikut:

1. Buka aplikasi SageMaker Canvas.

1. Di panel navigasi kiri, pilih **Model saya**.

1. Pilih **Model baru**.

1. Dalam kotak dialog **Buat model baru**, lakukan hal berikut:

   1. Masukkan nama di bidang **Nama model**.

   1. Pilih jenis masalah **analisis prediktif**.

   1. Pilih **Buat**.

1. Untuk **Pilih kumpulan data**, pilih kumpulan data Anda dari daftar kumpulan data. Jika Anda belum mengimpor data, pilih **Impor** untuk diarahkan melalui alur kerja data impor.

1. Saat Anda siap untuk mulai membuat model, **pilih Pilih kumpulan data**.

1. Pada tab **Build**, untuk daftar dropdown **kolom Target**, pilih target untuk model yang ingin diprediksi.

1. Untuk **tipe Model**, Canvas secara otomatis mendeteksi jenis masalah untuk Anda. Jika Anda ingin mengubah jenis atau mengonfigurasi pengaturan model lanjutan, pilih **Konfigurasi model**.

   Ketika kotak dialog **Configure model** terbuka, lakukan hal berikut:

   1. Untuk **tipe Model**, pilih jenis model yang ingin Anda bangun.

   1. Setelah Anda memilih jenis model, ada tambahan **Pengaturan lanjutan**. Untuk informasi selengkapnya tentang masing-masing pengaturan lanjutan, lihat[Konfigurasi bangunan model lanjutan](canvas-advanced-settings.md). Untuk mengkonfigurasi pengaturan lanjutan, lakukan hal berikut:

      1. (Opsional) Untuk menu tarik-turun **metrik Objective**, pilih metrik yang ingin dioptimalkan Canvas saat membuat model Anda. Jika Anda tidak memilih metrik, Canvas memilih satu untuk Anda secara default. Untuk deskripsi metrik yang tersedia, lihat. [Referensi metrik](canvas-metrics.md)

      1. Untuk **metode Pelatihan**, pilih mode **Auto**, **Ensemble**, atau **Hyperparameter optimization (HPO**).

      1. Untuk **Algoritma**, pilih algoritma yang ingin Anda sertakan untuk membangun kandidat model.

      1. Untuk **Pemisahan data**, tentukan dalam persentase bagaimana Anda ingin membagi data antara set **Pelatihan dan set** **Validasi**. Set pelatihan digunakan untuk membangun model, sedangkan set validasi digunakan untuk menguji akurasi kandidat model.

      1. Untuk **kandidat Max dan runtime**, lakukan hal berikut:

         1. Tetapkan nilai **kandidat Max**, atau jumlah maksimum kandidat model yang dapat dihasilkan Canvas. Perhatikan bahwa **kandidat Max** hanya tersedia dalam mode HPO.

         1. Tetapkan nilai jam dan menit untuk **runtime pekerjaan Max**, atau jumlah waktu maksimum yang dapat dihabiskan Canvas untuk membangun model Anda. Setelah waktu maksimum, Canvas berhenti membangun dan memilih kandidat model terbaik.

   1. Setelah mengonfigurasi pengaturan lanjutan, pilih **Simpan**.

1. Pilih atau batalkan pilihan kolom dalam data Anda untuk menyertakan atau menjatuhkannya dari build Anda.
**catatan**  
Jika Anda membuat prediksi batch dengan model Anda setelah pembuatan, Canvas menambahkan kolom yang dijatuhkan ke hasil prediksi Anda. Namun, Canvas tidak menambahkan kolom yang dijatuhkan ke prediksi batch Anda untuk model deret waktu.

1. (Opsional) Gunakan alat visualisasi dan analitik yang disediakan Canvas untuk memvisualisasikan data Anda dan menentukan fitur mana yang mungkin ingin Anda sertakan dalam model Anda. Untuk informasi selengkapnya, lihat [Menjelajahi dan menganalisis data Anda](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html).

1. (Opsional) Gunakan transformasi data untuk membersihkan, mengubah, dan menyiapkan data Anda untuk pembuatan model. Untuk informasi selengkapnya, lihat [Mempersiapkan data Anda dengan transformasi lanjutan](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-prepare-data.html). Anda dapat melihat dan menghapus transformasi Anda dengan memilih **Resep model** untuk membuka panel samping **resep Model**.

1. (Opsional) Untuk fitur tambahan seperti melihat pratinjau keakuratan model Anda, memvalidasi kumpulan data Anda, dan mengubah ukuran sampel acak yang diambil Canvas dari kumpulan data Anda, lihat. [Pratinjau model Anda](canvas-preview-model.md)

1. Setelah meninjau data Anda dan membuat perubahan apa pun pada kumpulan data Anda, pilih **Quick build** atau **Standard build** untuk memulai pembuatan model Anda. Tangkapan layar berikut menunjukkan halaman **Build** dan opsi **Quick build** dan **Standard build**.  
![\[Halaman Build untuk model kategori 2 yang menampilkan opsi Quick build dan Standard build.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/build-page-tabular-quick-standard-options.png)

Setelah model Anda mulai membangun, Anda dapat meninggalkan halaman. Ketika model ditampilkan sebagai **Siap** di halaman **Model saya**, model siap untuk analisis dan prediksi.

## Membangun model prediksi gambar kustom
<a name="canvas-build-model-image"></a>

**Model prediksi gambar label tunggal mendukung **build Quick dan build Standar**.**

Untuk membuat model prediksi gambar label tunggal, gunakan prosedur berikut:

1. Buka aplikasi SageMaker Canvas.

1. Di panel navigasi kiri, pilih **Model saya**.

1. Pilih **Model baru**.

1. Dalam kotak dialog **Buat model baru**, lakukan hal berikut:

   1. Masukkan nama di bidang **Nama model**.

   1. Pilih jenis masalah **analisis gambar**.

   1. Pilih **Buat**.

1. Untuk **Pilih kumpulan data**, pilih kumpulan data Anda dari daftar kumpulan data. Jika Anda belum mengimpor data, pilih **Impor** untuk diarahkan melalui alur kerja data impor.

1. Saat Anda siap untuk mulai membuat model, **pilih Pilih kumpulan data**.

1. Pada tab **Build**, Anda melihat **distribusi Label** untuk gambar dalam kumpulan data Anda. **Jenis Model** diatur ke **prediksi gambar Single-label**.

1. Di halaman ini, Anda dapat melihat pratinjau gambar Anda dan mengedit kumpulan data. Jika Anda memiliki gambar yang tidak berlabel, pilih **Edit dataset** dan. [Tetapkan label ke gambar yang tidak berlabel](canvas-edit-image.md#canvas-edit-image-assign) Anda juga dapat melakukan tugas lain saat Anda[Mengedit kumpulan data gambar](canvas-edit-image.md), seperti mengganti nama label dan menambahkan gambar ke kumpulan data.

1. Setelah meninjau data Anda dan membuat perubahan apa pun pada kumpulan data Anda, pilih **Quick build** atau **Standard build** untuk memulai pembuatan model Anda. Screenshot berikut menunjukkan halaman **Build** dari model prediksi gambar yang siap dibuat.  
![\[Halaman Build untuk model prediksi gambar label tunggal.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/build-page-image-model.png)

Setelah model Anda mulai membangun, Anda dapat meninggalkan halaman. Ketika model ditampilkan sebagai **Siap** di halaman **Model saya**, model siap untuk analisis dan prediksi.

## Membangun model prediksi teks kustom
<a name="canvas-build-model-text"></a>

**Model prediksi teks multi-kategori mendukung **build Cepat dan build Standar**.**

Untuk membuat model prediksi teks, gunakan prosedur berikut:

1. Buka aplikasi SageMaker Canvas.

1. Di panel navigasi kiri, pilih **Model saya**.

1. Pilih **Model baru**.

1. Dalam kotak dialog **Buat model baru**, lakukan hal berikut:

   1. Masukkan nama di bidang **Nama model**.

   1. Pilih jenis masalah **analisis Teks**.

   1. Pilih **Buat**.

1. Untuk **Pilih kumpulan data**, pilih kumpulan data Anda dari daftar kumpulan data. Jika Anda belum mengimpor data, pilih **Impor** untuk diarahkan melalui alur kerja data impor.

1. Saat Anda siap untuk mulai membuat model, **pilih Pilih kumpulan data**.

1. Pada tab **Build**, untuk daftar dropdown **kolom Target**, pilih target untuk model yang ingin diprediksi. Kolom target harus memiliki tipe data biner atau kategoris, dan harus ada setidaknya 25 entri (atau baris data) untuk setiap label unik di kolom target.

1. Untuk **tipe Model**, konfirmasikan bahwa jenis model secara otomatis disetel ke **prediksi teks Multi-kategori**.

1. Untuk kolom pelatihan, pilih kolom sumber data teks Anda. Ini harus berupa kolom yang berisi teks yang ingin Anda analisis.

1. Pilih **Quick build** atau **Standard build** untuk mulai membangun model Anda. Screenshot berikut menunjukkan halaman **Build** dari model prediksi teks yang siap dibuat.  
![\[Halaman Build untuk model prediksi teks multi-kategori.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/build-page-text-model.png)

Setelah model Anda mulai membangun, Anda dapat meninggalkan halaman. Ketika model ditampilkan sebagai **Siap** di halaman **Model saya**, model siap untuk analisis dan prediksi.

## Bangun model peramalan deret waktu
<a name="canvas-build-model-forecasting"></a>

Model peramalan deret waktu mendukung **build Cepat dan build** **Standar**.

Untuk membangun model peramalan deret waktu, gunakan prosedur berikut:

1. Buka aplikasi SageMaker Canvas.

1. Di panel navigasi kiri, pilih **Model saya**.

1. Pilih **Model baru**.

1. Dalam kotak dialog **Buat model baru**, lakukan hal berikut:

   1. Masukkan nama di bidang **Nama model**.

   1. Pilih jenis masalah **peramalan deret waktu**.

   1. Pilih **Buat**.

1. Untuk **Pilih kumpulan data**, pilih kumpulan data Anda dari daftar kumpulan data. Jika Anda belum mengimpor data, pilih **Impor** untuk diarahkan melalui alur kerja data impor.

1. Saat Anda siap untuk mulai membuat model, **pilih Pilih kumpulan data**.

1. Pada tab **Build**, untuk daftar dropdown **kolom Target**, pilih target untuk model yang ingin diprediksi.

1. Di bagian **Jenis model**, pilih **Konfigurasi model**.

1. Kotak **Configure model** terbuka. Untuk bagian **Konfigurasi deret waktu**, isi kolom berikut:

   1. Untuk **kolom ID Item**, pilih kolom dalam kumpulan data Anda yang secara unik mengidentifikasi setiap baris. Kolom harus memiliki tipe data`Text`.

   1. (Opsional) Untuk **kolom Grup**, pilih satu atau beberapa kolom kategoris (dengan tipe data`Text`) yang ingin Anda gunakan untuk mengelompokkan nilai peramalan Anda.

   1. Untuk kolom **stempel waktu, pilih kolom** dengan stempel waktu (dalam format datetime). Untuk informasi selengkapnya tentang format datetime yang diterima, lihat. [Prakiraan Deret Waktu di Amazon SageMaker Canvas](canvas-time-series.md)

   1. Untuk bidang **Panjang Forecast**, masukkan periode waktu yang ingin Anda prediksi nilainya. Canvas secara otomatis mendeteksi satuan waktu dalam data Anda.

   1. (Opsional) Aktifkan sakelar **Gunakan jadwal liburan** untuk memilih jadwal liburan dari berbagai negara dan membuat perkiraan Anda dengan data liburan lebih akurat.

1. Di kotak **Configure model**, ada pengaturan tambahan di bagian **Advanced**. Untuk informasi selengkapnya tentang masing-masing pengaturan lanjutan, lihat[Konfigurasi bangunan model lanjutan](canvas-advanced-settings.md). Untuk mengkonfigurasi pengaturan **Lanjutan**, lakukan hal berikut:

   1. Untuk menu tarik-turun **metrik Objective**, pilih metrik yang ingin dioptimalkan Canvas saat membuat model Anda. Jika Anda tidak memilih metrik, Canvas memilih satu untuk Anda secara default. Untuk deskripsi metrik yang tersedia, lihat. [Referensi metrik](canvas-metrics.md)

   1. Jika Anda menjalankan build standar, Anda akan melihat bagian **Algoritma**. Bagian ini untuk memilih algoritme peramalan deret waktu yang ingin Anda gunakan untuk membangun model Anda. Anda dapat memilih subset dari algoritma yang tersedia, atau Anda dapat memilih semuanya jika Anda tidak yakin mana yang akan dicoba.

      Saat menjalankan build standar, Canvas akan membuat model ansambel yang menggabungkan semua algoritme bersama-sama untuk mengoptimalkan akurasi prediksi.
**catatan**  
Jika Anda menjalankan build cepat, Canvas menggunakan algoritme pembelajaran berbasis pohon tunggal untuk melatih model Anda, dan Anda tidak perlu memilih algoritme apa pun.

   1. Untuk **kuantil Forecast**, masukkan hingga 5 nilai kuantil yang dipisahkan koma untuk menentukan batas atas dan bawah perkiraan Anda.

   1. Setelah mengonfigurasi Pengaturan **lanjutan**, pilih **Simpan**.

1. Pilih atau batalkan pilihan kolom dalam data Anda untuk menyertakan atau menjatuhkannya dari build Anda.
**catatan**  
Jika Anda membuat prediksi batch dengan model Anda setelah pembuatan, Canvas menambahkan kolom yang dijatuhkan ke hasil prediksi Anda. Namun, Canvas tidak menambahkan kolom yang dijatuhkan ke prediksi batch Anda untuk model deret waktu.

1. (Opsional) Gunakan alat visualisasi dan analitik yang disediakan Canvas untuk memvisualisasikan data Anda dan menentukan fitur mana yang mungkin ingin Anda sertakan dalam model Anda. Untuk informasi selengkapnya, lihat [Menjelajahi dan menganalisis data Anda](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html).

1. (Opsional) Gunakan transformasi data untuk membersihkan, mengubah, dan menyiapkan data Anda untuk pembuatan model. Untuk informasi selengkapnya, lihat [Mempersiapkan data Anda dengan transformasi lanjutan](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-prepare-data.html). Anda dapat melihat dan menghapus transformasi Anda dengan memilih **Resep model** untuk membuka panel samping **resep Model**.

1. (Opsional) Untuk fitur tambahan seperti melihat pratinjau keakuratan model Anda, memvalidasi kumpulan data Anda, dan mengubah ukuran sampel acak yang diambil Canvas dari kumpulan data Anda, lihat. [Pratinjau model Anda](canvas-preview-model.md)

1. Setelah meninjau data Anda dan membuat perubahan apa pun pada kumpulan data Anda, pilih **Quick build** atau **Standard build** untuk memulai pembuatan model Anda.

Setelah model Anda mulai membangun, Anda dapat meninggalkan halaman. Ketika model ditampilkan sebagai **Siap** di halaman **Model saya**, model siap untuk analisis dan prediksi.

# Konfigurasi bangunan model lanjutan
<a name="canvas-advanced-settings"></a>

Amazon SageMaker Canvas mendukung berbagai pengaturan lanjutan yang dapat Anda konfigurasikan saat membuat model. Halaman berikut mencantumkan semua pengaturan lanjutan bersama dengan informasi tambahan tentang opsi dan konfigurasinya.

**catatan**  
Pengaturan lanjutan berikut saat ini hanya didukung untuk jenis model peramalan numerik, kategoris, dan deret waktu.

## Pengaturan model prediksi numerik dan kategoris tingkat lanjut
<a name="canvas-advanced-settings-predictive"></a>

Canvas mendukung pengaturan lanjutan berikut untuk jenis model prediksi numerik dan kategoris.

### Metrik obyektif
<a name="canvas-advanced-settings-predictive-obj-metric"></a>

Metrik objektif adalah metrik yang Anda ingin Canvas optimalkan saat membangun model Anda. Jika Anda tidak memilih metrik, Canvas memilih satu untuk Anda secara default. Untuk deskripsi metrik yang tersedia, lihat. [Referensi metrik](canvas-metrics.md)

### Metode pelatihan
<a name="canvas-advanced-settings-predictive-method"></a>

Canvas dapat secara otomatis memilih metode pelatihan berdasarkan ukuran dataset, atau Anda dapat memilihnya secara manual. Metode pelatihan berikut tersedia untuk Anda pilih:
+ **Ensembling** — SageMaker AI memanfaatkan AutoGluon perpustakaan untuk melatih beberapa model dasar. Untuk menemukan kombinasi terbaik untuk kumpulan data Anda, mode ansambel menjalankan 5-10 uji coba dengan pengaturan model dan parameter meta yang berbeda. Kemudian, model ini digabungkan menggunakan metode ansambel susun untuk membuat model prediktif yang optimal. Untuk daftar algoritma yang didukung oleh mode ensemble untuk data tabular, lihat bagian berikut. [Algoritma](#canvas-advanced-settings-predictive-algos)
+ **Optimasi Hyperparameter (HPO)** — SageMaker AI menemukan versi terbaik dari sebuah model dengan menyetel hyperparameters menggunakan optimasi Bayesian atau optimasi multi-fidelity saat menjalankan pekerjaan pelatihan pada dataset Anda. Mode HPO memilih algoritme yang paling relevan dengan kumpulan data Anda dan memilih rentang hiperparameter terbaik untuk menyetel model Anda. Untuk menyetel model Anda, mode HPO menjalankan hingga 100 uji coba (default) untuk menemukan pengaturan hiperparameter optimal dalam rentang yang dipilih. Jika ukuran dataset Anda kurang dari 100 MB, SageMaker AI menggunakan optimasi Bayesian. SageMaker AI memilih optimasi multi-fidelity jika dataset Anda lebih besar dari 100 MB.

  Untuk daftar algoritma yang didukung oleh mode HPO untuk data tabular, lihat bagian berikut. [Algoritma](#canvas-advanced-settings-predictive-algos)
+ **Otomatis** — SageMaker AI secara otomatis memilih mode ensembling atau mode HPO berdasarkan ukuran dataset Anda. Jika dataset Anda lebih besar dari 100 MB, SageMaker AI memilih mode HPO. Jika tidak, ia memilih mode ansambel.

### Algoritma
<a name="canvas-advanced-settings-predictive-algos"></a>

Dalam mode **Ensembling**, Canvas mendukung algoritma pembelajaran mesin berikut:
+ [LightGBM](https://docs.aws.amazon.com/sagemaker/latest/dg/lightgbm.html) - Kerangka kerja yang dioptimalkan yang menggunakan algoritma berbasis pohon dengan peningkatan gradien. Algoritma ini menggunakan pohon yang tumbuh dalam lebar, bukan kedalaman, dan sangat dioptimalkan untuk kecepatan.
+ [CatBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/catboost.html)— Kerangka kerja yang menggunakan algoritme berbasis pohon dengan peningkatan gradien. Dioptimalkan untuk menangani variabel kategoris.
+ [XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)— Kerangka kerja yang menggunakan algoritme berbasis pohon dengan peningkatan gradien yang tumbuh secara mendalam, bukan luasnya.
+ [Random Forest](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html) — Algoritma berbasis pohon yang menggunakan beberapa pohon keputusan pada sub-sampel acak data dengan penggantian. Pohon-pohon dibagi menjadi simpul optimal di setiap tingkat. Keputusan setiap pohon dirata-ratakan bersama untuk mencegah overfitting dan meningkatkan prediksi.
+ [Pohon Ekstra](https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.ExtraTreesClassifier.html#sklearn.ensemble.ExtraTreesClassifier) — Algoritma berbasis pohon yang menggunakan beberapa pohon keputusan di seluruh kumpulan data. Pohon-pohon dibelah secara acak di setiap tingkat. Keputusan setiap pohon dirata-ratakan untuk mencegah overfitting dan untuk meningkatkan prediksi. Pohon tambahan menambahkan tingkat pengacakan dibandingkan dengan algoritma hutan acak.
+ [Model Linear](https://scikit-learn.org/stable/modules/classes.html#module-sklearn.linear_model) — Kerangka kerja yang menggunakan persamaan linier untuk memodelkan hubungan antara dua variabel dalam data yang diamati.
+ Obor jaringan saraf — Model jaringan saraf yang diimplementasikan menggunakan [Pytorch](https://pytorch.org/).
+ Neural network fast.ai — Model jaringan saraf yang diimplementasikan menggunakan [fast.ai](https://www.fast.ai/).

Dalam **mode HPO**, Canvas mendukung algoritma pembelajaran mesin berikut:
+ [XGBoost](https://docs.aws.amazon.com/sagemaker/latest/dg/xgboost.html)— Algoritma pembelajaran yang diawasi yang mencoba memprediksi variabel target secara akurat dengan menggabungkan ansambel perkiraan dari serangkaian model yang lebih sederhana dan lebih lemah.
+ Algoritma pembelajaran mendalam — Perceptron multilayer (MLP) dan jaringan saraf tiruan feedforward. Algoritma ini dapat menangani data yang tidak dapat dipisahkan secara linier.

### Pemisahan data
<a name="canvas-advanced-settings-predictive-split"></a>

Anda memiliki opsi untuk menentukan bagaimana Anda ingin membagi kumpulan data Anda antara set pelatihan (bagian dari kumpulan data Anda yang digunakan untuk membangun model) dan kumpulan validasi, (bagian dari kumpulan data Anda yang digunakan untuk memverifikasi akurasi model). Misalnya, rasio split umum adalah pelatihan 80% dan validasi 20%, di mana 80% data Anda digunakan untuk membangun model sementara 20% disimpan untuk mengukur kinerja model. Jika Anda tidak menentukan rasio kustom, Canvas membagi dataset Anda secara otomatis.

### Kandidat maks
<a name="canvas-advanced-settings-predictive-candidates"></a>

**catatan**  
Fitur ini hanya tersedia dalam mode pelatihan HPO.

Anda dapat menentukan jumlah maksimum kandidat model yang dihasilkan Canvas saat membangun model Anda. Kami menyarankan Anda menggunakan jumlah kandidat default, yaitu 100, untuk membangun model yang paling akurat. Jumlah maksimum yang dapat Anda tentukan adalah 250. Mengurangi jumlah kandidat model dapat memengaruhi akurasi model Anda.

### Runtime pekerjaan maks
<a name="canvas-advanced-settings-predictive-runtime"></a>

Anda dapat menentukan runtime pekerjaan maksimum, atau jumlah waktu maksimum yang dihabiskan Canvas untuk membangun model Anda. Setelah batas waktu, Canvas berhenti membangun dan memilih kandidat model terbaik.

Waktu maksimum yang dapat Anda tentukan adalah 720 jam. Kami sangat menyarankan agar Anda mempertahankan runtime pekerjaan maksimum lebih dari 30 menit untuk memastikan bahwa Canvas memiliki cukup waktu untuk menghasilkan kandidat model dan menyelesaikan pembuatan model Anda.

## Pengaturan model peramalan deret waktu lanjutan
<a name="canvas-advanced-settings-time-series"></a>

Untuk model peramalan deret waktu, Canvas mendukung metrik Objective, yang tercantum di bagian sebelumnya.

Model peramalan deret waktu juga mendukung pengaturan lanjutan berikut:

### Pemilihan algoritma
<a name="canvas-advanced-settings-time-series-algos"></a>

Saat Anda membuat model peramalan deret waktu, Canvas menggunakan *ansambel* (atau kombinasi) algoritme statistik dan pembelajaran mesin untuk memberikan perkiraan deret waktu yang sangat akurat. Secara default, Canvas memilih kombinasi optimal dari semua algoritme yang tersedia berdasarkan deret waktu dalam kumpulan data Anda. Namun, Anda memiliki opsi untuk menentukan satu atau lebih algoritme yang akan digunakan untuk model peramalan Anda. Dalam hal ini, Canvas menentukan campuran terbaik hanya dengan menggunakan algoritme yang Anda pilih. Jika Anda tidak yakin tentang algoritma mana yang harus dipilih untuk melatih model Anda, kami sarankan Anda memilih semua algoritme yang tersedia.

**catatan**  
Pemilihan algoritma hanya didukung untuk build standar. Jika Anda tidak memilih algoritme apa pun di pengaturan lanjutan, maka secara default SageMaker AI menjalankan pembuatan cepat dan melatih kandidat model menggunakan algoritme pembelajaran berbasis pohon tunggal. Untuk informasi selengkapnya tentang perbedaan antara build cepat dan build standar, lihat. [Cara kerja model khusus](canvas-build-model.md)

Canvas mendukung algoritma peramalan deret waktu berikut:
+ [Autoregressive Integrated Moving Average (ARIMA)](https://en.wikipedia.org/wiki/Autoregressive_integrated_moving_average) — Model deret waktu stokastik sederhana yang menggunakan analisis statistik untuk menafsirkan data dan membuat prediksi masa depan. Algoritma ini berguna untuk dataset sederhana dengan kurang dari 100 deret waktu.
+ [Convolutional Neural Network - Quantile Regression (CNN-QR)](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-algo-cnnqr.html) - Algoritma pembelajaran eksklusif yang diawasi yang melatih satu model global dari koleksi besar deret waktu dan menggunakan dekoder kuantil untuk membuat prediksi. CNN-QR bekerja paling baik dengan kumpulan data besar yang berisi ratusan deret waktu.
+ [DeepAR\$1](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-recipe-deeparplus.html) — Algoritma pembelajaran yang diawasi dan diawasi untuk memperkirakan deret waktu skalar menggunakan jaringan saraf berulang (RNNs) untuk melatih satu model bersama selama semua deret waktu. DeepAR\$1bekerja paling baik dengan kumpulan data besar yang berisi ratusan rangkaian waktu fitur.
+ [Non-Parametric Time Series (NPTS)](https://docs.aws.amazon.com/forecast/latest/dg/aws-forecast-recipe-npts.html) — Peramal dasar probabilistik yang dapat diskalakan yang memprediksi distribusi nilai future dari deret waktu tertentu dengan mengambil sampel dari pengamatan sebelumnya. NPTS berguna ketika bekerja dengan deret waktu yang jarang atau intermiten (misalnya, memperkirakan permintaan untuk item individual di mana deret waktu memiliki banyak hitungan 0 atau rendah).
+ [Exponential Smoothing (ETS)](https://en.wikipedia.org/wiki/Exponential_smoothing) — Metode peramalan yang menghasilkan perkiraan yang merupakan rata-rata tertimbang dari pengamatan masa lalu di mana bobot pengamatan lama menurun secara eksponensial. Algoritma ini berguna untuk kumpulan data sederhana dengan kurang dari 100 deret waktu dan kumpulan data dengan pola musiman.
+ [Nabi](https://facebook.github.io/prophet/) — Model regresi aditif yang bekerja paling baik dengan deret waktu yang memiliki efek musiman yang kuat dan beberapa musim data historis. Algoritma ini berguna untuk kumpulan data dengan tren pertumbuhan non-linier yang mendekati batas.

### Kuantil Forecast
<a name="canvas-advanced-settings-time-series-quantiles"></a>

Untuk peramalan deret waktu, SageMaker AI melatih 6 kandidat model dengan deret waktu target Anda. Kemudian, SageMaker AI menggabungkan model-model ini menggunakan metode ansambel susun untuk membuat model peramalan optimal untuk metrik objektif tertentu. Setiap model peramalan menghasilkan perkiraan probabilistik dengan menghasilkan perkiraan pada kuantil antara P1 dan P99. Kuantil ini digunakan untuk menjelaskan ketidakpastian perkiraan. Secara default, perkiraan dihasilkan untuk 0.1 (`p10`), 0.5 (`p50`), dan 0.9 (`p90`). Anda dapat memilih untuk menentukan hingga lima kuantil Anda sendiri dari 0,01 (`p1`) hingga 0,99 (`p99`), dengan kenaikan 0,01 atau lebih tinggi.

# Mengedit kumpulan data gambar
<a name="canvas-edit-image"></a>

Di Amazon SageMaker Canvas, Anda dapat mengedit kumpulan data gambar dan meninjau label Anda sebelum membuat model. Anda mungkin ingin melakukan tugas seperti menetapkan label ke gambar yang tidak berlabel atau menambahkan lebih banyak gambar ke kumpulan data. Tugas-tugas ini semua dapat dilakukan dalam aplikasi Canvas, memberi Anda satu tempat untuk memodifikasi dataset Anda dan membangun model.

**catatan**  
Sebelum membuat model, Anda harus menetapkan label ke semua gambar di kumpulan data Anda. Selain itu, Anda harus memiliki setidaknya 25 gambar per label dan minimal dua label. Untuk informasi selengkapnya tentang menetapkan label, lihat bagian di halaman ini yang disebut **Tetapkan label ke gambar yang tidak berlabel**. Jika Anda tidak dapat menentukan label untuk gambar, Anda harus menghapusnya dari kumpulan data Anda. Untuk informasi selengkapnya tentang menghapus gambar, lihat bagian di halaman [Menambahkan atau menghapus gambar dari dataset](#canvas-edit-image-add-delete) ini.

Untuk mulai mengedit kumpulan data gambar, Anda harus berada di tab **Build** saat membuat model prediksi gambar label tunggal.

Halaman baru terbuka yang menunjukkan gambar dalam kumpulan data Anda bersama dengan labelnya. **Halaman ini mengkategorikan kumpulan data gambar Anda ke dalam gambar **Total, Gambar** **berlabel, dan gambar Tidak Berlabel**.** Anda juga dapat meninjau **panduan persiapan Dataset** untuk praktik terbaik dalam membangun model prediksi gambar yang lebih akurat.

Tangkapan layar berikut menunjukkan halaman untuk mengedit kumpulan data gambar Anda.

![\[Tangkapan layar halaman manajemen kumpulan data gambar di Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/dataset-management-page.png)


Dari halaman ini, Anda dapat melakukan tindakan berikut.

## Lihat properti untuk setiap gambar (label, ukuran, dimensi)
<a name="canvas-edit-image-view"></a>

Untuk melihat gambar individual, Anda dapat mencarinya dengan nama file di bilah pencarian. Kemudian, pilih gambar untuk membuka tampilan penuh. Anda dapat melihat properti gambar dan menetapkan kembali label gambar. Pilih **Simpan** saat Anda melihat gambar.

## Menambahkan, mengganti nama, atau menghapus label dalam kumpulan data
<a name="canvas-edit-image-labels"></a>

Canvas mencantumkan label untuk kumpulan data Anda di panel navigasi kiri. Anda dapat menambahkan label baru ke kumpulan data dengan memasukkan label di bidang **Tambahkan teks label**.

**Untuk mengganti nama atau menghapus label dari kumpulan data Anda, pilih ikon **Opsi lainnya** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) di sebelah label dan pilih **Ganti nama** atau Hapus.** Jika Anda mengganti nama label, Anda dapat memasukkan nama label baru dan memilih **Konfirmasi**. Jika Anda menghapus label, label akan dihapus dari semua gambar dalam kumpulan data Anda yang memiliki label tersebut. Setiap gambar dengan label itu dibiarkan tidak berlabel.

## Tetapkan label ke gambar yang tidak berlabel
<a name="canvas-edit-image-assign"></a>

Untuk melihat gambar yang tidak berlabel dalam kumpulan data Anda, pilih **Tidak Berlabel** di panel navigasi kiri. Untuk setiap gambar, pilih dan buka label berjudul **Unlabeled** dan pilih label untuk ditetapkan ke gambar dari daftar dropdown. Anda juga dapat memilih lebih dari satu gambar dan melakukan tindakan ini, dan semua gambar yang dipilih diberi label yang Anda pilih.

## Tetapkan kembali label ke gambar
<a name="canvas-edit-image-reassign"></a>

Anda dapat menetapkan ulang label ke gambar dengan memilih gambar (atau beberapa gambar sekaligus) dan membuka dropdown berjudul dengan label saat ini. Pilih label yang Anda inginkan, dan gambar atau gambar diperbarui dengan label baru.

## Urutkan gambar Anda berdasarkan label
<a name="canvas-edit-image-sort"></a>

Anda dapat melihat semua gambar untuk label tertentu dengan memilih label di panel navigasi kiri.

## Menambahkan atau menghapus gambar dari dataset
<a name="canvas-edit-image-add-delete"></a>

Anda dapat menambahkan lebih banyak gambar ke kumpulan data Anda dengan memilih **Tambahkan gambar** di panel navigasi atas. Anda akan dibawa melalui alur kerja untuk mengimpor lebih banyak gambar. Gambar yang Anda impor ditambahkan ke kumpulan data yang ada.

Anda dapat menghapus gambar dari kumpulan data Anda dengan memilihnya dan kemudian memilih **Hapus** di panel navigasi atas.

**catatan**  
Setelah membuat perubahan apa pun pada kumpulan data Anda, pilih **Simpan kumpulan data** untuk memastikan bahwa Anda tidak kehilangan perubahan.

# Eksplorasi dan analisis data
<a name="canvas-explore-data"></a>

**catatan**  
Anda hanya dapat menggunakan visualisasi dan analitik SageMaker Canvas untuk model yang dibangun di atas kumpulan data tabular. Model prediksi teks multi-kategori juga dikecualikan.

Di Amazon SageMaker Canvas, Anda dapat menjelajahi variabel dalam kumpulan data menggunakan visualisasi dan analitik serta membuat visualisasi dan analitik dalam aplikasi. Anda dapat menggunakan eksplorasi ini untuk mengungkap hubungan antara variabel Anda sebelum membangun model Anda.

Untuk informasi selengkapnya tentang teknik visualisasi di Canvas, lihat[Jelajahi data Anda menggunakan teknik visualisasi](canvas-explore-data-visualization.md).

Untuk informasi selengkapnya tentang analitik di Canvas, lihat[Jelajahi data Anda menggunakan analitik](canvas-explore-data-analytics.md).

# Jelajahi data Anda menggunakan teknik visualisasi
<a name="canvas-explore-data-visualization"></a>

**catatan**  
Anda hanya dapat menggunakan visualisasi SageMaker Canvas untuk model yang dibangun di atas kumpulan data tabel. Model prediksi teks multi-kategori juga dikecualikan.

Dengan Amazon SageMaker Canvas, Anda dapat menjelajahi dan memvisualisasikan data Anda untuk mendapatkan wawasan lanjutan tentang data Anda sebelum membuat model ML Anda. Anda dapat memvisualisasikan menggunakan plot sebar, diagram batang, dan plot kotak, yang dapat membantu Anda memahami data Anda dan menemukan hubungan antara fitur yang dapat memengaruhi akurasi model.

Di tab **Build** aplikasi SageMaker Canvas, pilih **Visualizer data untuk mulai membuat visualisasi** Anda.

Anda dapat mengubah ukuran sampel visualisasi untuk menyesuaikan ukuran sampel acak yang diambil dari kumpulan data Anda. Ukuran sampel yang terlalu besar dapat memengaruhi kinerja visualisasi data Anda, jadi sebaiknya Anda memilih ukuran sampel yang sesuai. Untuk mengubah ukuran sampel, gunakan prosedur berikut.

1. Pilih **sampel Visualisasi**.

1. Gunakan slider untuk memilih ukuran sampel yang Anda inginkan.

1. Pilih **Perbarui** untuk mengonfirmasi perubahan pada ukuran sampel Anda.

**catatan**  
Teknik visualisasi tertentu memerlukan kolom tipe data tertentu. Misalnya, Anda hanya dapat menggunakan kolom numerik untuk sumbu x dan y dari plot pencar.

## Plot pencar
<a name="canvas-explore-data-scatterplot"></a>

**Untuk membuat plot pencar dengan dataset Anda, pilih plot **Scatter di panel Visualisasi**.** Pilih fitur yang ingin Anda plot pada sumbu x dan y dari bagian **Kolom**. Anda dapat menarik dan melepas kolom ke sumbu atau, setelah sumbu dijatuhkan, Anda dapat memilih kolom dari daftar kolom yang didukung.

Anda dapat menggunakan **Color by** untuk mewarnai titik data pada plot dengan fitur ketiga. Anda juga dapat menggunakan **Group by** untuk mengelompokkan data ke dalam plot terpisah berdasarkan fitur keempat.

Gambar berikut menunjukkan plot pencar yang menggunakan **Color by** dan **Group by**. Dalam contoh ini, setiap titik data diwarnai oleh `MaritalStatus` fitur, dan pengelompokan berdasarkan `Department` fitur menghasilkan plot pencar untuk titik data masing-masing departemen.

![\[Screenshot dari plot pencar dalam tampilan Visualizer Data dari aplikasi Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-eda-scatter-plot.png)


## Bagan batang
<a name="canvas-explore-data-barchart"></a>

Untuk membuat diagram batang dengan kumpulan data Anda, pilih **Bagan batang** di panel **Visualisasi**. Pilih fitur yang ingin Anda plot pada sumbu x dan y dari bagian **Kolom**. Anda dapat menarik dan melepas kolom ke sumbu atau, setelah sumbu dijatuhkan, Anda dapat memilih kolom dari daftar kolom yang didukung.

Anda dapat menggunakan **Group by** untuk mengelompokkan diagram batang dengan fitur ketiga. Anda dapat menggunakan **Stack by** untuk menaungi setiap bilah secara vertikal berdasarkan nilai unik dari fitur keempat.

Gambar berikut menunjukkan diagram batang yang menggunakan **Group by** dan **Stack by**. Dalam contoh ini, diagram batang dikelompokkan berdasarkan `MaritalStatus` fitur dan ditumpuk oleh fitur tersebut. `JobLevel` Untuk masing-masing `JobRole` pada sumbu x, ada bilah terpisah untuk kategori unik dalam `MaritalStatus` fitur, dan setiap bilah ditumpuk secara vertikal oleh fitur tersebut`JobLevel`.

![\[Screenshot dari diagram batang dalam tampilan Visualizer Data dari aplikasi Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-eda-bar-chart.png)


## Plot kotak
<a name="canvas-explore-data-boxplot"></a>

Untuk membuat plot kotak dengan dataset Anda, pilih **Plot kotak di panel** **Visualisasi**. Pilih fitur yang ingin Anda plot pada sumbu x dan y dari bagian **Kolom**. Anda dapat menarik dan melepas kolom ke sumbu atau, setelah sumbu dijatuhkan, Anda dapat memilih kolom dari daftar kolom yang didukung.

Anda dapat menggunakan **Group by** untuk mengelompokkan plot kotak dengan fitur ketiga.

Gambar berikut menunjukkan plot kotak yang menggunakan **Group by**. Dalam contoh ini, sumbu x dan y menunjukkan `JobLevel` dan`JobSatisfaction`, masing-masing, dan plot kotak berwarna dikelompokkan berdasarkan fitur. `Department`

![\[Screenshot dari plot kotak dalam tampilan Visualizer Data dari aplikasi Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-eda-box-plot.png)


# Jelajahi data Anda menggunakan analitik
<a name="canvas-explore-data-analytics"></a>

**catatan**  
Anda hanya dapat menggunakan analisis SageMaker Canvas untuk model yang dibangun di atas kumpulan data tabular. Model prediksi teks multi-kategori juga dikecualikan.

Dengan analitik di Amazon SageMaker Canvas, Anda dapat menjelajahi kumpulan data dan mendapatkan wawasan tentang semua variabel sebelum membuat model. Anda dapat menentukan hubungan antar fitur dalam kumpulan data Anda menggunakan matriks korelasi. Anda dapat menggunakan teknik ini untuk meringkas kumpulan data Anda ke dalam matriks yang menunjukkan korelasi antara dua atau lebih nilai. Ini membantu Anda mengidentifikasi dan memvisualisasikan pola dalam kumpulan data tertentu untuk analisis data lanjutan.

Matriks menunjukkan korelasi antara setiap fitur sebagai positif, negatif, atau netral. Anda mungkin ingin menyertakan fitur yang memiliki korelasi tinggi satu sama lain saat membangun model Anda. Fitur yang memiliki sedikit atau tanpa korelasi mungkin tidak relevan dengan model Anda, dan Anda dapat menghapus fitur tersebut saat membuat model Anda.

Untuk memulai dengan matriks korelasi di SageMaker Canvas, lihat bagian berikut.

## Buat matriks korelasi
<a name="canvas-explore-data-analytics-correlation-matrix"></a>

Anda dapat membuat matriks korelasi saat Anda bersiap untuk membangun model di tab **Build** aplikasi SageMaker Canvas.

Untuk petunjuk tentang cara mulai membuat model, lihat[Membangun model](canvas-build-model-how-to.md).

Setelah Anda mulai menyiapkan model dalam aplikasi SageMaker Canvas, lakukan hal berikut:

1. Di tab **Build**, pilih **Visualizer data**.

1. Pilih **Analytics**.

1. Pilih **matriks korelasi**.

Anda akan melihat visualisasi yang mirip dengan tangkapan layar berikut, yang menampilkan hingga 15 kolom kumpulan data yang disusun ke dalam matriks korelasi.

![\[Screenshot dari matriks korelasi dalam aplikasi Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-correlation-matrix-2.png)


Setelah Anda membuat matriks korelasi, Anda dapat menyesuaikannya dengan melakukan hal berikut:

### 1. Pilih kolom Anda
<a name="canvas-explore-data-analytics-correlation-matrix-columns"></a>

Untuk **Kolom**, Anda dapat memilih kolom yang ingin Anda sertakan dalam matriks. Anda dapat membandingkan hingga 15 kolom dari kumpulan data Anda.

**catatan**  
Anda dapat menggunakan tipe kolom numerik, kategoris, atau biner untuk matriks korelasi. Matriks korelasi tidak mendukung datetime atau tipe kolom data teks.

Untuk menambah atau menghapus kolom dari matriks korelasi, pilih dan batal pilihan kolom dari panel **Kolom**. Anda juga dapat menarik dan melepas kolom dari panel langsung ke matriks. Jika kumpulan data Anda memiliki banyak kolom, Anda dapat mencari kolom yang Anda inginkan di bilah **kolom Pencarian**.

**Untuk memfilter kolom berdasarkan tipe data, pilih daftar dropdown dan pilih **Semua**, **Numerik**, atau Categorical.** Memilih **Semua** menampilkan semua kolom dari kumpulan data Anda, sedangkan filter **Numerik** dan **Kategoris** hanya menampilkan kolom numerik atau kategoris dalam kumpulan data Anda. Perhatikan bahwa jenis kolom biner disertakan dalam filter numerik atau kategoris.

Untuk wawasan data terbaik, sertakan kolom target Anda dalam matriks korelasi. Saat Anda memasukkan kolom target Anda dalam matriks korelasi, itu muncul sebagai fitur terakhir pada matriks dengan simbol target.

### 2. Pilih jenis korelasi Anda
<a name="canvas-explore-data-analytics-correlation-matrix-cor-type"></a>

SageMaker Canvas mendukung berbagai *jenis korelasi*, atau metode untuk menghitung korelasi antara kolom Anda.

Untuk mengubah jenis korelasi, gunakan filter **Kolom** yang disebutkan di bagian sebelumnya untuk memfilter jenis kolom dan kolom yang Anda inginkan. Anda akan melihat **tipe Korelasi** di panel samping. **Untuk perbandingan numerik, Anda memiliki opsi untuk memilih **Pearson** atau Spearman.** **Untuk perbandingan kategoris, tipe korelasi ditetapkan sebagai MI.** **Untuk perbandingan kategoris dan campuran, tipe korelasi ditetapkan sebagai Spearman & MI.**

Untuk matriks yang hanya membandingkan kolom numerik, jenis korelasinya adalah Pearson atau Spearman. Ukuran Pearson mengevaluasi hubungan linier antara dua variabel kontinu. Ukuran Spearman mengevaluasi hubungan monotonik antara dua variabel. Untuk Pearson dan Spearman, skala korelasi berkisar antara -1 hingga 1, dengan kedua ujung skala menunjukkan korelasi sempurna (hubungan langsung 1:1) dan 0 menunjukkan tidak ada korelasi. Anda mungkin ingin memilih Pearson jika data Anda memiliki hubungan yang lebih linier (seperti yang diungkapkan oleh [visualisasi plot pencar](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-explore-data.html#canvas-explore-data-scatterplot)). Jika data Anda tidak linier, atau berisi campuran hubungan linier dan monotonik, maka Anda mungkin ingin memilih Spearman.

Untuk matriks yang hanya membandingkan kolom kategoris, jenis korelasi diatur ke Klasifikasi Informasi Mutual (MI). Nilai MI adalah ukuran ketergantungan timbal balik antara dua variabel acak. Ukuran MI berada pada skala 0 hingga 1, dengan 0 menunjukkan tidak ada korelasi dan 1 menunjukkan korelasi sempurna.

Untuk matriks yang membandingkan campuran kolom numerik dan kategoris, tipe korelasi **Spearman & MI adalah kombinasi dari jenis korelasi Spearman dan MI**. Untuk korelasi antara dua kolom numerik, matriks menunjukkan nilai Spearman. Untuk korelasi antara kolom numerik dan kategoris atau dua kolom kategoris, matriks menunjukkan nilai MI.

Terakhir, ingatlah bahwa korelasi tidak selalu menunjukkan sebab-akibat. Nilai korelasi yang kuat hanya menunjukkan bahwa ada hubungan antara dua variabel, tetapi variabel tersebut mungkin tidak memiliki hubungan sebab akibat. Tinjau kolom yang Anda minati dengan cermat untuk menghindari bias saat membangun model Anda.

### 3. Filter korelasi Anda
<a name="canvas-explore-data-analytics-correlation-matrix-filter"></a>

Di panel samping, Anda dapat menggunakan **Filter korelasi** fitur untuk memfilter rentang nilai korelasi yang ingin Anda sertakan dalam matriks. Misalnya, jika Anda ingin memfilter fitur yang hanya memiliki korelasi positif atau netral, Anda dapat mengatur **Min** ke 0 dan **Maks** ke 1 (nilai yang valid adalah -1 hingga 1).

Untuk perbandingan Spearman dan Pearson, Anda dapat mengatur rentang **korelasi Filter** di mana saja dari -1 hingga 1, dengan 0 yang berarti tidak ada korelasi. -1 dan 1 berarti bahwa variabel memiliki korelasi negatif atau positif yang kuat, masing-masing.

Untuk perbandingan MI, rentang korelasi hanya berkisar dari 0 ke 1, dengan 0 berarti tidak ada korelasi dan 1 berarti bahwa variabel memiliki korelasi yang kuat, baik positif maupun negatif.

Setiap fitur memiliki korelasi sempurna (1) dengan dirinya sendiri. Oleh karena itu, Anda mungkin memperhatikan bahwa baris atas matriks korelasi selalu 1. Jika Anda ingin mengecualikan nilai-nilai ini, Anda dapat menggunakan filter untuk mengatur **Max** kurang dari 1.

Perlu diingat bahwa jika matriks Anda membandingkan campuran kolom numerik dan kategoris dan menggunakan jenis korelasi **Spearman & MI**, maka korelasi kategoris *x numerik dan kategoris x* *kategoris (yang menggunakan ukuran MI) berada pada skala 0 hingga 1, sedangkan korelasi numerik x* *numerik* (yang menggunakan ukuran Spearman) berada pada skala -1 hingga 1. Tinjau korelasi minat Anda dengan cermat untuk memastikan bahwa Anda mengetahui jenis korelasi yang digunakan untuk menghitung setiap nilai.

### 4. Pilih metode visualisasi
<a name="canvas-explore-data-analytics-correlation-matrix-viz-method"></a>

Di panel samping, Anda dapat menggunakan **Visualize by** untuk mengubah metode visualisasi matriks. Pilih metode visualisasi **Numerik** untuk menunjukkan nilai korelasi (Pearson, Spearman, atau MI), atau pilih metode visualisasi **Ukuran** untuk memvisualisasikan korelasi dengan titik-titik berukuran dan berwarna yang berbeda. Jika Anda memilih **Ukuran**, Anda dapat mengarahkan kursor ke titik tertentu pada matriks untuk melihat nilai korelasi yang sebenarnya.

### 5. Pilih palet warna
<a name="canvas-explore-data-analytics-correlation-matrix-color"></a>

Di panel samping, Anda dapat menggunakan **Pemilihan warna** untuk mengubah palet warna yang digunakan untuk skala korelasi negatif ke positif dalam matriks. Pilih salah satu palet warna alternatif untuk mengubah warna yang digunakan dalam matriks.

# Mempersiapkan data untuk pembuatan model
<a name="canvas-prepare-data"></a>

**catatan**  
Anda sekarang dapat melakukan persiapan data lanjutan di SageMaker Canvas dengan Data Wrangler, yang memberi Anda antarmuka bahasa alami dan lebih dari 300 transformasi bawaan. Untuk informasi selengkapnya, lihat [Persiapan data](canvas-data-prep.md).

Dataset pembelajaran mesin Anda mungkin memerlukan persiapan data sebelum Anda membuat model Anda. Anda mungkin ingin membersihkan data Anda karena berbagai masalah, yang mungkin termasuk nilai atau outlier yang hilang, dan melakukan rekayasa fitur untuk meningkatkan akurasi model Anda. Amazon SageMaker Canvas menyediakan transformasi data ML yang dapat digunakan untuk membersihkan, mengubah, dan menyiapkan data untuk pembuatan model. Anda dapat menggunakan transformasi ini pada kumpulan data Anda tanpa kode apa pun. SageMaker Canvas menambahkan transformasi yang Anda gunakan ke **resep Model**, yang merupakan catatan persiapan data yang dilakukan pada data Anda sebelum membuat model. Transformasi data apa pun yang Anda gunakan hanya memodifikasi data input untuk pembuatan model dan tidak memodifikasi sumber data asli Anda.

Pratinjau kumpulan data Anda menunjukkan 100 baris pertama dari kumpulan data. Jika kumpulan data Anda memiliki lebih dari 20.000 baris, Canvas mengambil sampel acak 20.000 baris dan mempratinjau 100 baris pertama dari sampel tersebut. Anda hanya dapat mencari dan menentukan nilai dari baris yang dipratinjau, dan fungsionalitas filter hanya menyaring baris yang dipratinjau dan bukan seluruh kumpulan data.

Transformasi berikut tersedia di SageMaker Canvas bagi Anda untuk mempersiapkan data Anda untuk membangun.

**catatan**  
Anda hanya dapat menggunakan transformasi lanjutan untuk model yang dibangun di atas kumpulan data tabel. Model prediksi teks multi-kategori juga dikecualikan.

## Jatuhkan kolom
<a name="canvas-prepare-data-drop"></a>

Anda dapat mengecualikan kolom dari build model Anda dengan menjatuhkannya di tab **Build** aplikasi SageMaker Canvas. Hapus pilihan kolom yang ingin Anda jatuhkan, dan tidak disertakan saat membuat model.

**catatan**  
Jika Anda menjatuhkan kolom dan kemudian membuat [prediksi batch](canvas-make-predictions.md) dengan model Anda, SageMaker Canvas menambahkan kolom yang dijatuhkan kembali ke kumpulan data ouput yang tersedia untuk Anda unduh. Namun, SageMaker Canvas tidak menambahkan kolom yang dijatuhkan kembali untuk model deret waktu.

## Filter baris
<a name="canvas-prepare-data-filter"></a>

Fungsionalitas filter menyaring baris yang dipratinjau (100 baris pertama dari kumpulan data Anda) sesuai dengan kondisi yang Anda tentukan. Baris pemfilteran membuat pratinjau sementara data dan tidak memengaruhi pembuatan model. Anda dapat memfilter untuk melihat pratinjau baris yang memiliki nilai yang hilang, berisi outlier, atau memenuhi kondisi khusus di kolom yang Anda pilih.

### Filter baris dengan nilai yang hilang
<a name="canvas-prepare-data-filter-missing"></a>

Nilai yang hilang adalah kejadian umum dalam kumpulan data pembelajaran mesin. Jika Anda memiliki baris dengan nilai nol atau kosong di kolom tertentu, Anda mungkin ingin memfilter dan melihat pratinjau baris tersebut.

Untuk memfilter nilai yang hilang dari data pratinjau Anda, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Filter by rows** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/filter-icon.png)).

1. Pilih **Kolom** yang ingin Anda periksa untuk nilai yang hilang.

1. Untuk **Operasi**, pilih **Tidak ada**.

SageMaker Filter kanvas untuk baris yang berisi nilai yang hilang di **Kolom** yang Anda pilih dan memberikan pratinjau baris yang difilter.

![\[Tangkapan layar filter dengan operasi nilai yang hilang dalam aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-filter-missing.png)


### Filter baris dengan outlier
<a name="canvas-prepare-data-filter-outliers"></a>

Outlier, atau nilai langka dalam distribusi dan jangkauan data Anda, dapat berdampak negatif pada akurasi model dan menyebabkan waktu pembuatan yang lebih lama. SageMaker Canvas memungkinkan Anda mendeteksi dan memfilter baris yang berisi outlier di kolom numerik. Anda dapat memilih untuk menentukan outlier dengan standar deviasi atau rentang kustom.

Untuk memfilter outlier dalam data Anda, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Filter by rows** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/filter-icon.png)).

1. Pilih **Kolom** yang ingin Anda periksa untuk outlier.

1. Untuk **Operasi**, pilih Is **outlier**.

1. **Atur **rentang Outlier** ke **Deviasi standar** atau rentang Kustom.**

1. Jika Anda memilih **Standar deviasi**, tentukan nilai **SD** (standar deviasi) dari 1-3. Jika Anda memilih **Rentang kustom**, pilih **Persentil** atau **Angka**, lalu tentukan nilai **Min** dan **Maks**.

Opsi **standar deviasi** mendeteksi dan menyaring outlier di kolom numerik menggunakan mean dan standar deviasi. Anda menentukan jumlah standar deviasi suatu nilai harus bervariasi dari rata-rata untuk dianggap sebagai outlier. Misalnya, jika Anda menentukan `3` untuk **SD**, nilai harus jatuh lebih dari 3 standar deviasi dari mean untuk dianggap sebagai outlier.

Opsi **rentang Kustom** mendeteksi dan memfilter outlier di kolom numerik menggunakan nilai minimum dan maksimum. Gunakan metode ini jika Anda mengetahui nilai ambang batas yang membatasi outlier. **Anda dapat mengatur **Jenis** rentang ke **Persentil** atau Angka.** Jika Anda memilih **Persentil**, nilai **Min** dan **Maks** harus menjadi minimum dan maksimum rentang persentil (0-100) yang ingin Anda izinkan. Jika Anda memilih **Angka**, nilai **Min** dan **Maks** harus menjadi nilai numerik minimum dan maksimum yang ingin Anda filter dalam data.

![\[Tangkapan layar filter dengan operasi outlier di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-filter-outlier.png)


### Filter baris berdasarkan nilai kustom
<a name="canvas-prepare-data-filter-custom"></a>

Anda dapat memfilter baris dengan nilai yang memenuhi kondisi khusus. Misalnya, Anda mungkin ingin melihat pratinjau baris yang memiliki nilai harga lebih besar dari 100 sebelum menghapusnya. Dengan fungsi ini, Anda dapat memfilter baris yang melebihi ambang batas yang Anda tetapkan dan melihat pratinjau data yang difilter.

Untuk menggunakan fungsionalitas filter khusus, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Filter by rows** (![\[Filter icon in the SageMaker Canvas application.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/filter-icon.png)).

1. Pilih **Kolom** yang ingin Anda periksa.

1. Pilih jenis **Operasi** yang ingin Anda gunakan, lalu tentukan nilai untuk kondisi yang dipilih.

Untuk **Operasi**, Anda dapat memilih salah satu opsi berikut. Perhatikan bahwa operasi yang tersedia bergantung pada tipe data kolom yang Anda pilih. Misalnya, Anda tidak dapat membuat `is greater than` operasi untuk kolom yang berisi nilai teks.


| Operasi | Tipe data yang didukung | Jenis fitur yang didukung | Fungsi | 
| --- | --- | --- | --- | 
|  Sama dengan  |  Numerik, Teks  | Biner, Kategoris |  Filter baris di mana nilai di **Kolom** sama dengan nilai yang Anda tentukan.  | 
|  Tidak sama dengan  |  Numerik, Teks  | Biner, Kategoris |  Memfilter baris di mana nilai di **Kolom** tidak sama dengan nilai yang Anda tentukan.  | 
|  Kurang dari  |  Numerik  | N/A |  Filter baris di mana nilai di **Kolom** kurang dari nilai yang Anda tentukan.  | 
|  Kurang dari atau sama dengan  |  Numerik  | N/A |  Memfilter baris di mana nilai di **Kolom** kurang dari atau sama dengan nilai yang Anda tentukan.  | 
|  Lebih besar dari  |  Numerik  | N/A |  Filter baris di mana nilai di **Kolom** lebih besar dari nilai yang Anda tentukan.  | 
|  Lebih besar dari atau sama dengan  |  Numerik  | N/A |  Filter baris di mana nilai di **Kolom** lebih besar dari atau sama dengan nilai yang Anda tentukan.  | 
|  Adalah antara  |  Numerik  | N/A |  Memfilter baris di mana nilai di **Kolom** berada di antara atau sama dengan dua nilai yang Anda tentukan.  | 
|  Contains  |  Teks  | Kategoris |  Filter baris di mana nilai di **Kolom** berisi nilai yang Anda tentukan.  | 
|  Starts with  |  Teks  | Kategoris |  Filter baris di mana nilai di **Kolom** dimulai dengan nilai yang Anda tentukan.  | 
|  Ends with  |  Kategoris  | Kategoris |  Filter baris di mana nilai di **Kolom** berakhir dengan nilai yang Anda tentukan.  | 

Setelah Anda mengatur operasi filter, SageMaker Canvas memperbarui pratinjau kumpulan data untuk menunjukkan kepada Anda data yang difilter.

![\[Screenshot dari filter dengan operasi nilai kustom dalam aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-filter-custom.png)


## Fungsi dan operator
<a name="canvas-prepare-data-custom-formula"></a>

Anda dapat menggunakan fungsi matematika dan operator untuk mengeksplorasi dan mendistribusikan data Anda. Anda dapat menggunakan fungsi yang didukung SageMaker Canvas atau membuat rumus Anda sendiri dengan data yang ada dan membuat kolom baru dengan hasil rumus. Misalnya, Anda dapat menambahkan nilai yang sesuai dari dua kolom dan menyimpan hasilnya ke kolom baru.

Anda dapat membuat pernyataan sarang untuk membuat fungsi yang lebih kompleks. Berikut ini adalah beberapa contoh fungsi bersarang yang mungkin Anda gunakan.
+ Untuk menghitung BMI, Anda bisa menggunakan fungsi `weight / (height ^ 2)` tersebut.
+ Untuk mengklasifikasikan usia, Anda dapat menggunakan fungsi `Case(age < 18, 'child', age < 65, 'adult', 'senior')` ini.

Anda dapat menentukan fungsi dalam tahap persiapan data sebelum Anda membangun model Anda. Untuk menggunakan fungsi, lakukan hal berikut.
+ Di tab **Build** aplikasi SageMaker Canvas, pilih **Lihat semua** dan kemudian pilih **Rumus khusus** untuk membuka panel **rumus Kustom**.
+ Di panel **Formula khusus**, Anda dapat memilih **Formula** untuk ditambahkan ke **Resep Model** Anda. Setiap rumus diterapkan ke semua nilai di kolom yang Anda tentukan. Untuk rumus yang menerima dua atau lebih kolom sebagai argumen, gunakan kolom dengan tipe data yang cocok; jika tidak, Anda mendapatkan kesalahan atau `null` nilai di kolom baru. 
+ Setelah Anda menentukan **Formula**, tambahkan nama kolom di bidang **Nama Kolom Baru**. SageMaker Canvas menggunakan nama ini untuk kolom baru yang dibuat.
+ (Opsional) Pilih **Pratinjau** untuk melihat pratinjau transformasi Anda.
+ Untuk menambahkan fungsi ke **Resep Model** Anda, pilih **Tambah**.

SageMaker Canvas menyimpan hasil fungsi Anda ke kolom baru menggunakan nama yang Anda tentukan di **Nama Kolom Baru**. Anda dapat melihat atau menghapus fungsi dari panel **Resep Model**.

SageMaker Canvas mendukung operator berikut untuk fungsi. Anda dapat menggunakan format teks atau format in-line untuk menentukan fungsi Anda.


| Operator | Deskripsi | Jenis data yang didukung | Format teks | Format in-line | 
| --- | --- | --- | --- | --- | 
|  Tambahkan  |  Mengembalikan jumlah nilai  |  Numerik  | Tambahkan (penjualan1, penjualan2) | penjualan1 \$1 penjualan2 | 
|  Kurangi  |  Mengembalikan perbedaan antara nilai-nilai  |  Numerik  | Kurangi (penjualan1, penjualan2) | penjualan1 - penjualan2 | 
|  Lipat gandakan  |  Mengembalikan produk dari nilai-nilai  |  Numerik  | Kalikan (penjualan1, penjualan2) | penjualan1 \$1 penjualan2 | 
|  Membagi  |  Mengembalikan hasil bagi nilai  |  Numerik  | Membagi (penjualan1, penjualan2) | penjualan1/penjualan2 | 
|  Mod  |  Mengembalikan hasil dari operator modulo (sisanya setelah membagi dua nilai)  |  Numerik  | Mod (penjualan1, penjualan2) | penjualan1% penjualan2 | 
|  Abs  | Mengembalikan nilai absolut dari nilai |  Numerik  | Abs (penjualan1) | N/A | 
|  Menegasikan  | Mengembalikan nilai negatif |  Numerik  | Menegasikan (c1) | -c1 | 
|  Exp  |  Mengembalikan e (nomor Euler) dinaikkan ke kekuatan nilai  |  Numerik  | Exp (penjualan1) | N/A | 
|  Log  |  Mengembalikan logaritma (basis 10) dari nilai  |  Numerik  | Log (penjualan1) | N/A | 
|  PjM  |  Mengembalikan logaritma natural (basis e) dari nilai  |  Numerik  | Ln (penjualan1) | N/A | 
|  Pow  |  Mengembalikan nilai yang dinaikkan ke daya  |  Numerik  | Pow (penjualan1, 2) | penjualan1 ^ 2 | 
|  Jika  |  Mengembalikan label benar atau salah berdasarkan kondisi yang Anda tentukan  |  Boolean, Numerik, Teks  | Jika (penjualan1> 7000, 'truelabel, 'falselabel') | N/A | 
|  Atau  |  Mengembalikan nilai Boolean apakah salah satu nilai tertentu atau kondisi adalah benar atau tidak  |  Boolean  | Atau (fullprice, discount) | fullprice \$1\$1 discount | 
|  Dan  |  Mengembalikan nilai Boolean apakah dua nilai atau kondisi yang ditentukan benar atau tidak  |  Boolean  | Dan (penjualan1, penjualan2) | penjualan1 && penjualan2 | 
|  Bukan  |  Mengembalikan nilai Boolean yang merupakan kebalikan dari nilai tertentu atau kondisi  |  Boolean  | Tidak (penjualan1) | \$1 penjualan1 | 
|  Kasus  |  Mengembalikan nilai Boolean berdasarkan pernyataan bersyarat (mengembalikan c1 jika cond1 adalah true, mengembalikan c2 jika cond2 adalah true, else mengembalikan c3)  |  Boolean, Numerik, Teks  | Kasus (cond1, c1, cond2, c2, c3) | N/A | 
|  Sama  |  Mengembalikan nilai Boolean apakah dua nilai sama  |  Boolean, Numerik, Teks  | N/A | c1 = c2c1 == c2 | 
|  Tidak sama  |  Mengembalikan nilai Boolean apakah dua nilai tidak sama  |  Boolean, Numerik, Teks  | N/A | c1\$1 = c2 | 
|  Kurang dari  |  Mengembalikan nilai Boolean apakah c1 kurang dari c2  |  Boolean, Numerik, Teks  | N/A | c1 < c2 | 
|  Lebih besar dari  |  Mengembalikan nilai Boolean apakah c1 lebih besar dari c2  |  Boolean, Numerik, Teks  | N/A | c1 > c2 | 
|  Kurang dari atau sama  |  Mengembalikan nilai Boolean apakah c1 kurang dari atau sama dengan c2  |  Boolean, Numerik, Teks  | N/A | c1 <= c2 | 
|  Lebih besar dari atau sama  |  Mengembalikan nilai Boolean apakah c1 lebih besar dari atau sama dengan c2  |  Boolean, Numerik, Teks  | N/A | c1 >= c2 | 

SageMaker Canvas juga mendukung operator agregat, yang dapat melakukan operasi seperti menghitung jumlah semua nilai atau menemukan nilai minimum dalam kolom. Anda dapat menggunakan operator agregat dalam kombinasi dengan operator standar dalam fungsi Anda. Misalnya, untuk menghitung selisih nilai dari mean, Anda bisa menggunakan fungsi tersebut`Abs(height – avg(height))`. SageMaker Canvas mendukung operator agregat berikut.


| Operator agregat | Deskripsi | format | Contoh | 
| --- | --- | --- | --- | 
|  sum  |  Mengembalikan jumlah semua nilai dalam kolom  | sum | jumlah (c1) | 
|  minimum  |  Mengembalikan nilai minimum kolom  | min | min (c2) | 
|  maksimum  |  Mengembalikan nilai maksimum kolom  | max | maks (c3) | 
|  rata-rata  |  Mengembalikan nilai rata-rata kolom  | rata-rata | rata-rata (c4) | 
|  std  | Mengembalikan standar deviasi sampel kolom | std | std (c1) | 
|  stddev  | Mengembalikan standar deviasi dari nilai-nilai dalam kolom | stddev | stddev (c1) | 
|  perbedaan  | Mengembalikan varians nilai yang tidak bias dalam kolom | perbedaan | varians (c1) | 
|  kira-kira\$1count\$1distinct  | Mengembalikan perkiraan jumlah item yang berbeda dalam kolom | kira-kira\$1count\$1distinct | kira-kira\$1count\$1distinct (c1) | 
|  count  | Mengembalikan jumlah item dalam kolom | count | menghitung (c1) | 
|  first  |  Mengembalikan nilai pertama dari kolom  | first | pertama (c1) | 
|  last  |  Mengembalikan nilai terakhir dari kolom  | last | terakhir (c1) | 
|  stddev\$1pop  | Mengembalikan standar deviasi populasi kolom | stddev\$1pop | stddev\$1pop (c1) | 
|  variance\$1pop  |  Mengembalikan varians populasi dari nilai-nilai dalam kolom  | variance\$1pop | variance\$1pop (c1) | 

## Kelola baris
<a name="canvas-prepare-data-manage"></a>

Dengan transformasi Kelola baris, Anda dapat melakukan pengurutan, acak acak, dan menghapus baris data dari kumpulan data.

### Urutkan baris
<a name="canvas-prepare-data-manage-sort"></a>

Untuk mengurutkan baris dalam kumpulan data dengan kolom tertentu, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola baris** dan kemudian pilih **Urutkan baris**.

1. Untuk **Sort Column**, pilih kolom yang ingin Anda urutkan berdasarkan.

1. Untuk **Urutan Urutan**, pilih **Ascending atau **Descending****.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

### Kocokkan baris
<a name="canvas-prepare-data-manage-shuffle"></a>

Untuk mengacak baris dalam kumpulan data secara acak, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Manage rows** dan kemudian pilih **Shuffle rows**.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

### Jatuhkan baris duplikat
<a name="canvas-prepare-data-manage-drop-duplicate"></a>

Untuk menghapus baris duplikat dalam kumpulan data, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola baris** dan kemudian pilih **Jatuhkan baris duplikat**.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

### Hapus baris dengan nilai yang hilang
<a name="canvas-prepare-data-remove-missing"></a>

Nilai yang hilang adalah kejadian umum dalam kumpulan data pembelajaran mesin dan dapat memengaruhi akurasi model. Gunakan transformasi ini jika Anda ingin menjatuhkan baris dengan nilai nol atau kosong di kolom tertentu.

Untuk menghapus baris yang berisi nilai yang hilang di kolom tertentu, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola baris**.

1. Pilih **Jatuhkan baris dengan nilai yang hilang**.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

SageMaker Kanvas menjatuhkan baris yang berisi nilai yang hilang di **Kolom** yang Anda pilih. Setelah menghapus baris dari dataset, SageMaker Canvas menambahkan transformasi di bagian **resep Model**. Jika Anda menghapus transformasi dari bagian **Resep model**, baris kembali ke kumpulan data Anda.

![\[Tangkapan layar dari baris hapus dengan operasi nilai yang hilang dalam aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-remove-missing.png)


### Hapus baris dengan outlier
<a name="canvas-prepare-data-remove-outliers"></a>

Outlier, atau nilai langka dalam distribusi dan jangkauan data Anda, dapat berdampak negatif pada akurasi model dan menyebabkan waktu pembuatan yang lebih lama. Dengan SageMaker Canvas, Anda dapat mendeteksi dan menghapus baris yang berisi outlier di kolom numerik. Anda dapat memilih untuk menentukan outlier dengan standar deviasi atau rentang kustom.

Untuk menghapus outlier dari data Anda, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola baris**.

1. Pilih **Jatuhkan baris dengan nilai outlier.**

1. Pilih **Kolom** yang ingin Anda periksa untuk outlier.

1. Atur **Operator** ke **Deviasi standar**, Rentang **numerik kustom, atau Rentang** **kuantil kustom**.

1. Jika Anda memilih **Standar deviasi**, tentukan Nilai **standar deviasi** (standar deviasi) dari 1-3. Jika Anda memilih Rentang **numerik khusus atau Rentang** **kuantil khusus, tentukan nilai **Min** dan **Maks** (angka untuk rentang** numerik, atau persentil antara 0— 100% untuk rentang kuantil).

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Opsi **standar deviasi** mendeteksi dan menghapus outlier dalam kolom numerik menggunakan mean dan standar deviasi. Anda menentukan jumlah standar deviasi suatu nilai harus bervariasi dari rata-rata untuk dianggap sebagai outlier. Misalnya, jika Anda menentukan `3` untuk **Standar deviasi**, nilai harus jatuh lebih dari 3 standar deviasi dari rata-rata untuk dianggap sebagai outlier.

Rentang **numerik kustom dan pilihan rentang** **kuantil kustom** mendeteksi dan menghapus outlier dalam kolom numerik menggunakan nilai minimum dan maksimum. Gunakan metode ini jika Anda mengetahui nilai ambang batas yang membatasi outlier. Jika Anda memilih rentang numerik, nilai **Min** dan **Max** harus menjadi nilai numerik minimum dan maksimum yang ingin Anda izinkan dalam data. Jika Anda memilih rentang kuantil, nilai **Min** dan **Maks** harus menjadi minimum dan maksimum rentang persentil (0—100) yang ingin Anda izinkan.

Setelah menghapus baris dari dataset, SageMaker Canvas menambahkan transformasi di bagian **resep Model**. Jika Anda menghapus transformasi dari bagian **Resep model**, baris kembali ke kumpulan data Anda.

![\[Tangkapan layar dari baris hapus dengan operasi outlier di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-remove-outlier.png)


### Hapus baris dengan nilai kustom
<a name="canvas-prepare-data-remove-custom"></a>

Anda dapat menghapus baris dengan nilai yang memenuhi kondisi khusus. Misalnya, Anda mungkin ingin mengecualikan semua baris dengan nilai harga lebih dari 100 saat membuat model Anda. Dengan transformasi ini, Anda dapat membuat aturan yang menghapus semua baris yang melebihi ambang batas yang Anda tetapkan.

Untuk menggunakan transformasi hapus kustom, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola baris**.

1. Pilih **Jatuhkan baris dengan rumus**.

1. Pilih **Kolom** yang ingin Anda periksa.

1. Pilih jenis **Operasi** yang ingin Anda gunakan, lalu tentukan nilai untuk kondisi yang dipilih.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Untuk **Operasi**, Anda dapat memilih salah satu opsi berikut. Perhatikan bahwa operasi yang tersedia bergantung pada tipe data kolom yang Anda pilih. Misalnya, Anda tidak dapat membuat `is greater than` operasi untuk kolom yang berisi nilai teks.


| Operasi | Tipe data yang didukung | Jenis fitur yang didukung | Fungsi | 
| --- | --- | --- | --- | 
|  Adalah sama dengan  |  Numerik, Teks  |  Biner, Kategoris  |  Menghapus baris di mana nilai di **Kolom** sama dengan nilai yang Anda tentukan.  | 
|  Tidak sama dengan  |  Numerik, Teks  |  Biner, Kategoris  |  Menghapus baris di mana nilai di **Kolom** tidak sama dengan nilai yang Anda tentukan.  | 
|  Kurang dari  |  Numerik  | N/A |  Menghapus baris di mana nilai di **Kolom** kurang dari nilai yang Anda tentukan.  | 
|  Kurang dari atau sama dengan  |  Numerik  | N/A |  Menghapus baris di mana nilai di **Kolom** kurang dari atau sama dengan nilai yang Anda tentukan.  | 
|  Lebih besar dari  |  Numerik  | N/A |  Menghapus baris di mana nilai di **Kolom** lebih besar dari nilai yang Anda tentukan.  | 
|  Lebih besar dari atau sama dengan  | Numerik | N/A |  Menghapus baris di mana nilai di **Kolom** lebih besar dari atau sama dengan nilai yang Anda tentukan.  | 
|  Adalah antara  | Numerik | N/A |  Menghapus baris di mana nilai di **Kolom** berada di antara atau sama dengan dua nilai yang Anda tentukan.  | 
|  Contains  |  Teks  | Kategoris |  Menghapus baris di mana nilai di **Kolom** berisi nilai yang Anda tentukan.  | 
|  Starts with  |  Teks  | Kategoris |  Menghapus baris di mana nilai di **Kolom** dimulai dengan nilai yang Anda tentukan.  | 
|  Ends with  |  Teks  | Kategoris |  Menghapus baris di mana nilai di **Kolom** berakhir dengan nilai yang Anda tentukan.  | 

Setelah menghapus baris dari dataset, SageMaker Canvas menambahkan transformasi di bagian **resep Model**. Jika Anda menghapus transformasi dari bagian **Resep model**, baris kembali ke kumpulan data Anda.

![\[Screenshot dari baris hapus dengan operasi nilai kustom di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-remove-custom.png)


## Ubah Nama kolom
<a name="canvas-prepare-data-rename"></a>

Dengan transformasi kolom ganti nama, Anda dapat mengganti nama kolom dalam data Anda. Saat Anda mengganti nama kolom, SageMaker Canvas mengubah nama kolom di input model.

Anda dapat mengganti nama kolom dalam kumpulan data Anda dengan mengklik dua kali pada nama kolom di tab **Build** aplikasi SageMaker Canvas dan memasukkan nama baru. Menekan tombol **Enter** mengirimkan perubahan, dan mengklik di mana saja di luar input membatalkan perubahan. Anda juga dapat mengganti nama kolom dengan mengklik ikon **Opsi lainnya** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)), terletak di akhir baris dalam tampilan daftar atau di akhir sel header dalam tampilan kisi, dan memilih Ganti **nama**.

Nama kolom Anda tidak boleh lebih dari 32 karakter atau memiliki garis bawah ganda (\$1\$1), dan Anda tidak dapat mengganti nama kolom menjadi nama yang sama dengan kolom lain. Anda juga tidak dapat mengganti nama kolom yang dijatuhkan.

Tangkapan layar berikut menunjukkan cara mengganti nama kolom dengan mengklik dua kali nama kolom.

![\[Screenshot mengganti nama kolom dengan metode klik dua kali di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-rename-column.png)


Saat Anda mengganti nama kolom, SageMaker Canvas menambahkan transformasi di bagian **Resep Model**. Jika Anda menghapus transformasi dari bagian **Resep Model**, kolom kembali ke nama aslinya.

## Kelola kolom
<a name="canvas-prepare-data-manage-cols"></a>

Dengan transformasi berikut, Anda dapat mengubah tipe data kolom dan mengganti nilai atau outlier yang hilang untuk kolom tertentu. SageMaker Canvas menggunakan tipe atau nilai data yang diperbarui saat membuat model Anda tetapi tidak mengubah kumpulan data asli Anda. Perhatikan bahwa jika Anda menjatuhkan kolom dari kumpulan data menggunakan [Jatuhkan kolom](#canvas-prepare-data-drop) transformasi, Anda tidak dapat mengganti nilai di kolom tersebut.

### Ganti nilai yang hilang
<a name="canvas-prepare-data-replace-missing"></a>

Nilai yang hilang adalah kejadian umum dalam kumpulan data pembelajaran mesin dan dapat memengaruhi akurasi model. Anda dapat memilih untuk menjatuhkan baris yang memiliki nilai yang hilang, tetapi model Anda lebih akurat jika Anda memilih untuk mengganti nilai yang hilang. Dengan transformasi ini, Anda dapat mengganti nilai yang hilang di kolom numerik dengan rata-rata atau median data dalam kolom, atau Anda juga dapat menentukan nilai khusus untuk mengganti nilai yang hilang. Untuk kolom non-numerik, Anda dapat mengganti nilai yang hilang dengan mode (nilai paling umum) kolom atau nilai khusus.

Gunakan transformasi ini jika Anda ingin mengganti nilai nol atau kosong di kolom tertentu. Untuk mengganti nilai yang hilang di kolom tertentu, lakukan hal berikut. 

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola kolom**.

1. Pilih **Ganti nilai yang hilang**.

1. Pilih **Kolom** di mana Anda ingin mengganti nilai yang hilang.

1. Atur **Mode** ke **Manual** untuk mengganti nilai yang hilang dengan nilai yang Anda tentukan. Dengan pengaturan **Otomatis (default)**, SageMaker Canvas menggantikan nilai yang hilang dengan nilai imputasi yang paling sesuai dengan data Anda. Metode imputasi ini dilakukan secara otomatis untuk setiap model build, kecuali Anda menentukan mode **Manual**.

1. Mengatur **Ganti dengan** nilai:
   + ****Jika kolom Anda numerik, pilih Mean, **Median**, atau Custom.**** **Mean** menggantikan nilai yang hilang dengan mean untuk kolom, dan **Median** menggantikan nilai yang hilang dengan median untuk kolom. Jika Anda memilih **Kustom**, maka Anda harus menentukan nilai kustom yang ingin Anda gunakan untuk mengganti nilai yang hilang.
   + **Jika kolom Anda non-numerik, pilih **Mode** atau Kustom.** **Mode** menggantikan nilai yang hilang dengan mode, atau nilai yang paling umum, untuk kolom. Untuk **Kustom**, tentukan nilai kustom. yang ingin Anda gunakan untuk mengganti nilai yang hilang.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Setelah mengganti nilai yang hilang dalam kumpulan data, SageMaker Canvas menambahkan transformasi di bagian **resep Model**. Jika Anda menghapus transformasi dari bagian **Resep model**, nilai yang hilang kembali ke kumpulan data.

![\[Screenshot dari operasi ganti nilai yang hilang di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-replace-missing.png)


### Ganti outlier
<a name="canvas-prepare-data-replace-outliers"></a>

Outlier, atau nilai langka dalam distribusi dan jangkauan data Anda, dapat berdampak negatif pada akurasi model dan menyebabkan waktu pembuatan yang lebih lama. SageMaker Canvas memungkinkan Anda mendeteksi outlier di kolom numerik dan mengganti outlier dengan nilai yang berada dalam rentang yang diterima dalam data Anda. Anda dapat memilih untuk menentukan outlier dengan standar deviasi atau rentang kustom, dan Anda dapat mengganti outlier dengan nilai minimum dan maksimum dalam rentang yang diterima.

Untuk mengganti outlier dalam data Anda, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Kelola kolom**.

1. Pilih **Ganti nilai outlier.**

1. Pilih **Kolom** di mana Anda ingin mengganti outlier.

1. **Untuk **Tentukan pencilan**, pilih **Deviasi standar**, Rentang **numerik khusus, atau Rentang** kuantil khusus.**

1. Jika Anda memilih **Standar deviasi**, tentukan Nilai **standar deviasi** (standar deviasi) dari 1-3. Jika Anda memilih Rentang **numerik khusus atau Rentang** **kuantil khusus, tentukan nilai **Min** dan **Maks** (angka untuk rentang** numerik, atau persentil antara 0— 100% untuk rentang kuantil).

1. Untuk **Ganti dengan**, pilih rentang **Min/maks.**

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Opsi **standar deviasi** mendeteksi outlier dalam kolom numerik menggunakan mean dan standar deviasi. Anda menentukan jumlah standar deviasi suatu nilai harus bervariasi dari rata-rata untuk dianggap sebagai outlier. Misalnya, jika Anda menentukan 3 untuk **Standar deviasi**, nilai harus jatuh lebih dari 3 standar deviasi dari rata-rata untuk dianggap sebagai outlier. SageMaker Canvas menggantikan outlier dengan nilai minimum atau nilai maksimum dalam kisaran yang diterima. Misalnya, jika Anda mengonfigurasi standar deviasi untuk hanya menyertakan nilai dari 200-300, maka SageMaker Canvas mengubah nilai 198 menjadi 200 (minimum).

Rentang **numerik kustom dan pilihan rentang** **kuantil kustom** mendeteksi outlier dalam kolom numerik menggunakan nilai minimum dan maksimum. Gunakan metode ini jika Anda mengetahui nilai ambang batas yang membatasi outlier. Jika Anda memilih rentang numerik, nilai **Min** dan **Max** harus menjadi nilai numerik minimum dan maksimum yang ingin Anda izinkan. SageMaker Canvas menggantikan nilai apa pun yang berada di luar nilai minimum dan maksimum ke nilai minimum dan maksimum. Misalnya, jika rentang Anda hanya mengizinkan nilai dari 1-100, maka SageMaker Canvas mengubah nilai 102 menjadi 100 (maksimum). Jika Anda memilih rentang kuantil, nilai **Min** dan **Maks** harus menjadi minimum dan maksimum rentang persentil (0—100) yang ingin Anda izinkan.

Setelah mengganti nilai dalam kumpulan data, SageMaker Canvas menambahkan transformasi di bagian **resep Model**. Jika Anda menghapus transformasi dari bagian **Resep model**, nilai asli kembali ke kumpulan data.

![\[Tangkapan layar operasi ganti outlier di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-replace-outlier.png)


### Ubah tipe data
<a name="canvas-prepare-data-change-type"></a>

SageMaker Canvas memberi Anda kemampuan untuk mengubah *tipe data* kolom Anda antara numerik, teks, dan datetime, sementara juga menampilkan *tipe fitur terkait untuk tipe* data tersebut. *Tipe data* mengacu pada format data dan cara penyimpanannya, sedangkan *tipe fitur* mengacu pada karakteristik data yang digunakan dalam algoritma pembelajaran mesin, seperti biner atau kategoris. Ini memberi Anda fleksibilitas untuk secara manual mengubah jenis data di kolom Anda berdasarkan fitur. Kemampuan untuk memilih tipe data yang tepat memastikan integritas dan akurasi data sebelum membangun model. Tipe data ini digunakan saat membuat model.

**catatan**  
Saat ini, mengubah jenis fitur (misalnya, dari biner ke kategoris) tidak didukung.

Tabel berikut mencantumkan semua tipe data yang didukung di Canvas.


| Jenis data | Deskripsi | Contoh | 
| --- | --- | --- | 
| Numerik | Data numerik mewakili nilai numerik | 1, 2, 31.1, 1.2. 1.3 | 
| Teks | Data teks mewakili urutan karakter, seperti nama atau deskripsi | A, B, C, Dapel, pisang, jeruk1A\$1 , 2A\$1 , 3A\$1 | 
| Datetime | Data datetime mewakili tanggal dan waktu dalam format stempel waktu | 2019-07-01 01:00:00, 2019-07-01 02:00:00, 2019-07-01 03:00:00 | 

Tabel berikut mencantumkan semua jenis fitur yang didukung di Canvas.


| Jenis fitur | Deskripsi | Contoh | 
| --- | --- | --- | 
| Biner | Fitur biner mewakili dua nilai yang mungkin | 0, 1, 0, 1, 0 (2 nilai berbeda)benar, salah, benar (2 nilai berbeda) | 
| Kategoris | Fitur kategoris mewakili kategori atau kelompok yang berbeda | apel, pisang, jeruk, apel (3 nilai berbeda)A, B, C, D, E, A, D, C (5 nilai berbeda) | 

Untuk memodifikasi tipe data kolom dalam kumpulan data, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, buka **tampilan Kolom atau tampilan** **Grid** dan pilih dropdown **tipe Data** untuk kolom tertentu.

1. Dalam tarik-turun **tipe Data**, pilih tipe data yang akan dikonversi. Screenshot berikut menunjukkan menu dropdown.  
![\[Menu tarik-turun konversi tipe data untuk kolom, ditampilkan di tab Build.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-prepare-data-change.png)

1. Untuk **Kolom**, pilih atau verifikasi kolom yang ingin Anda ubah tipe datanya.

1. Untuk **tipe data baru**, pilih atau verifikasi tipe data baru yang ingin Anda konversi.

1. Jika **tipe data baru** adalah `Datetime` atau`Numeric`, pilih salah satu opsi berikut di bawah **Menangani nilai yang tidak valid**:

   1. **Ganti dengan nilai kosong** - Nilai tidak valid diganti dengan nilai kosong

   1. **Hapus baris** - Baris dengan nilai tidak valid dihapus dari kumpulan data

   1. **Ganti dengan nilai kustom** - Nilai tidak valid diganti dengan **Nilai Kustom** yang Anda tentukan.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Tipe data untuk kolom Anda sekarang harus diperbarui.

## Siapkan data deret waktu
<a name="canvas-prepare-data-timeseries"></a>

Gunakan fungsionalitas berikut untuk menyiapkan data deret waktu Anda untuk membangun model peramalan deret waktu.

### Sampel ulang data deret waktu
<a name="canvas-prepare-data-resample"></a>

Dengan mengambil sampel ulang data deret waktu, Anda dapat menetapkan interval reguler untuk pengamatan dalam kumpulan data deret waktu Anda. Ini sangat berguna ketika bekerja dengan data deret waktu yang berisi pengamatan dengan jarak yang tidak beraturan. Misalnya, Anda dapat menggunakan resampling untuk mengubah kumpulan data dengan pengamatan yang direkam setiap interval satu jam, dua jam dan tiga jam menjadi interval satu jam reguler di antara pengamatan. Algoritma peramalan membutuhkan pengamatan yang harus dilakukan secara berkala.

Untuk mengambil sampel ulang data deret waktu, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pilih **Time series**.

1. Pilih **Sampel Ulang**.

1. Untuk **kolom Timestamp**, pilih kolom yang ingin Anda terapkan transformasi. Anda hanya dapat memilih kolom dari jenis **Datetime**.

1. Di bagian **Pengaturan frekuensi**, pilih **Frekuensi** dan **Tingkat**. **Frekuensi** adalah satuan frekuensi dan **Rate** adalah interval dari satuan frekuensi yang akan diterapkan pada kolom. Misalnya, memilih `Calendar Day` untuk **nilai Frekuensi** dan `1` untuk **Nilai** menetapkan interval untuk meningkat setiap 1 hari kalender, seperti`2023-03-26 00:00:00`,`2023-03-27 00:00:00`,`2023-03-28 00:00:00`. Lihat tabel setelah prosedur ini untuk daftar lengkap **nilai Frekuensi**. 

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

Tabel berikut mencantumkan semua jenis **Frekuensi** yang dapat Anda pilih saat pengambilan sampel ulang data deret waktu.


| Frekuensi | Deskripsi | Contoh nilai (dengan asumsi Rate adalah 1) | 
| --- | --- | --- | 
|  Hari Kerja  |  Sampel ulang pengamatan di kolom datetime menjadi 5 hari kerja dalam seminggu (Senin, Selasa, Rabu, Kamis, Jumat)  |  2023-03-24 00:00:00 2023-03-27 00:00:00 2023-03-28 00:00:00 2023-03-29 00:00:00 2023-03-30 00:00:00 2023-03-31 00:00:00 2023-04-03 00:00:00  | 
|  Hari Kalender  |  Sampel ulang pengamatan di kolom datetime ke semua 7 hari dalam seminggu (Senin, Selasa, Rabu, Kamis, Jumat, Sabtu, Minggu)  |  2023-03-26 00:00:00 2023-03-27 00:00:00 2023-03-28 00:00:00 2023-03-29 00:00:00 2023-03-30 00:00:00 2023-03-31 00:00:00 2023-04-01 00:00:00  | 
|  Minggu  |  Sampel ulang pengamatan di kolom datetime ke hari pertama setiap minggu  |  2023-03-13 00:00:00 2023-03-20 00:00:00 2023-03-27 00:00:00 2023-04-03 00:00:00  | 
|  Bulan  |  Sampel ulang pengamatan di kolom datetime ke hari pertama setiap bulan  |  2023-03-01 00:00:00 2023-04-01 00:00:00 2023-05-01 00:00:00 2023-06-01 00:00:00  | 
|  Kuartal Tahunan  |  Sampel ulang pengamatan di kolom datetime ke hari terakhir setiap kuartal  |  2023-03-31 00:00:00 2023-06-30 00:00:00 2023-09-30 00:00:00 2023-12-31 00:00:00  | 
|  Tahun  |  Sampel ulang pengamatan di kolom datetime ke hari terakhir setiap tahun  |  2022-12-31 0:00:00 2023-12-31 00:00:00 2024-12-31 00:00:00  | 
|  Jam  |  Sampel ulang pengamatan di kolom datetime ke setiap jam setiap hari  |  2023-03-24 00:00:00 2023-03-24 01:00:00 2023-03-24 02:00:00 2023-03-24 03:00:00  | 
|  Menit  |  Sampel ulang pengamatan di kolom datetime ke setiap menit setiap jam  |  2023-03-24 00:00:00 2023-03-24 00:01:00 2023-03-24 00:02:00 2023-03-24 00:03:00  | 
|  Detik  |  Sampel ulang pengamatan di kolom datetime ke setiap detik setiap menit  |  2023-03-24 00:00:00 2023-03-24 00:00:01 2023-03-24 00:00:02 2023-03-24 00:00:03  | 

Saat menerapkan transformasi resampling, Anda dapat menggunakan opsi **Lanjutan** untuk menentukan bagaimana nilai yang dihasilkan dari kolom lainnya (selain kolom stempel waktu) di kumpulan data Anda dimodifikasi. Ini dapat dicapai dengan menentukan metodologi resampling, yang dapat berupa downsampling atau upsampling untuk kolom numerik dan non-numerik.

*Downsampling* meningkatkan interval antara pengamatan dalam dataset. Misalnya, jika Anda menurunkan sampel pengamatan yang diambil setiap jam atau setiap dua jam, setiap pengamatan dalam kumpulan data Anda dilakukan setiap dua jam. Nilai kolom lain dari pengamatan per jam digabungkan menjadi satu nilai menggunakan metode kombinasi. Tabel berikut menunjukkan contoh data deret waktu downsampling dengan menggunakan mean sebagai metode kombinasi. Data di-downsample dari setiap dua jam menjadi setiap jam.

Tabel berikut menunjukkan pembacaan suhu per jam selama sehari sebelum downsampling.


| Stempel waktu | Suhu (Celcius) | 
| --- | --- | 
| 12:00pm | 30 | 
| 1:00 pagi | 32 | 
| 2:00 pagi | 35 | 
| 3:00 pagi | 32 | 
| 4:00 pagi | 30 | 

Tabel berikut menunjukkan pembacaan suhu setelah downsampling untuk setiap dua jam.


| Stempel waktu | Suhu (Celcius) | 
| --- | --- | 
| 12:00pm | 30 | 
| 2:00 pagi | 33.5 | 
| 2:00 pagi | 35 | 
| 4:00 pagi | 32.5 | 

Untuk menurunkan sampel data deret waktu, lakukan hal berikut:

1. Perluas bagian **Advanced** di bawah **Transformasi Resample**.

1. Pilih **kombinasi non-numerik** untuk menentukan metode kombinasi untuk kolom non-numerik. Lihat tabel di bawah ini untuk daftar lengkap metode kombinasi.

1. Pilih **Kombinasi numerik** untuk menentukan metode kombinasi untuk kolom numerik. Lihat tabel di bawah ini untuk daftar lengkap metode kombinasi.

Jika Anda tidak menentukan metode kombinasi, nilai default adalah `Most Common` untuk kombinasi **Non-numerik dan `Mean` untuk kombinasi** **Numerik**. Tabel berikut mencantumkan metode untuk kombinasi numerik dan non-numerik.


| Metodologi downsampling | Metode kombinasi | Deskripsi | 
| --- | --- | --- | 
| Kombinasi non-numerik | Paling Umum | Nilai agregat di kolom non-numerik dengan nilai yang paling umum terjadi | 
| Kombinasi non-numerik | Terakhir | Nilai agregat di kolom non-numerik dengan nilai terakhir di kolom | 
| Kombinasi non-numerik | Pertama | Nilai agregat di kolom non-numerik dengan nilai pertama di kolom | 
| Kombinasi numerik | Berarti | Nilai agregat di kolom numerik dengan mengambil rata-rata semua nilai di kolom | 
| Kombinasi numerik | Median | Nilai agregat di kolom numerik dengan mengambil median semua nilai di kolom | 
| Kombinasi numerik | Min | Nilai agregat di kolom numerik dengan mengambil minimum semua nilai di kolom | 
| Kombinasi numerik | Maks | Nilai agregat di kolom numerik dengan mengambil maksimum semua nilai di kolom | 
| Kombinasi numerik | Jumlah | Nilai agregat di kolom numerik dengan menambahkan semua nilai di kolom | 
| Kombinasi numerik | Kuantil | Nilai agregat di kolom numerik dengan mengambil kuantil semua nilai di kolom | 

*Upsampling* mengurangi interval antara pengamatan dalam dataset. Misalnya, jika Anda mengambil sampel pengamatan yang diambil setiap dua jam ke dalam pengamatan per jam, nilai kolom lain dari pengamatan per jam diinterpolasi dari yang telah diambil setiap dua jam.

Untuk meningkatkan data deret waktu, lakukan hal berikut:

1. Perluas bagian **Advanced** di bawah **Transformasi Resample**.

1. Pilih estimasi **non-numerik untuk menentukan metode estimasi** untuk kolom non-numerik. Lihat tabel setelah prosedur ini untuk daftar lengkap metode.

1. Pilih **Estimasi numerik** untuk menentukan metode estimasi untuk kolom numerik. Lihat tabel di bawah ini untuk daftar lengkap metode.

1. (Opsional) Pilih **Kolom ID** untuk menentukan kolom IDs yang memiliki pengamatan deret waktu. Tentukan opsi ini jika kumpulan data Anda memiliki dua deret waktu. Jika Anda memiliki kolom yang hanya mewakili satu deret waktu, jangan tentukan nilai untuk bidang ini. Misalnya, Anda dapat memiliki kumpulan data yang memiliki kolom `id` dan`purchase`. `id`Kolom memiliki nilai-nilai berikut:`[1, 2, 2, 1]`. `purchase`Kolom memiliki nilai-nilai berikut`[$2, $3, $4, $1]`. Oleh karena itu, kumpulan data memiliki dua deret waktu—satu deret waktu adalah:`1: [$2, $1]`, dan deret waktu lainnya adalah. `2: [$3, $4]`

**Jika Anda tidak menentukan metode estimasi, nilai defaultnya adalah `Forward Fill` untuk estimasi **non-numerik dan `Linear` untuk estimasi Numerik**.** Tabel berikut mencantumkan metode untuk estimasi.


| Metodologi upsampling | Metode estimasi | Deskripsi | 
| --- | --- | --- | 
| Estimasi non-numerik | Isi Maju | Interpolasi nilai di kolom non-numerik dengan mengambil nilai berurutan setelah semua nilai di kolom | 
| Estimasi non-numerik | Isi Mundur | Interpolasi nilai di kolom non-numerik dengan mengambil nilai berurutan sebelum semua nilai di kolom | 
| Estimasi non-numerik | Tetap Hilang | Interpolasi nilai di kolom non-numerik dengan menunjukkan nilai kosong | 
| Estimasi numerik | Linear, Waktu, Indeks, Nol, S-Linear, Terdekat, Kuadrat, Kubik, Barycentric, Polinomial, Krogh, Polinomial Sepotong, Spline, P-chip, Akima, Cubic Spline, Dari Derivatif | Interpolasi nilai dalam kolom numerik dengan menggunakan interpolator specfied. [Untuk informasi tentang metode interpolasi, lihat panda. DataFrame.interpolate dalam dokumentasi panda](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.interpolate.html). | 

Tangkapan layar berikut menunjukkan Pengaturan **lanjutan** dengan bidang untuk downsampling dan upsampling diisi.

![\[Aplikasi Canvas, dengan panel samping resampling deret waktu yang menunjukkan opsi lanjutan.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-prepare-data-resampling.png)


### Gunakan ekstraksi datetime
<a name="canvas-prepare-data-datetime"></a>

Dengan transformasi ekstraksi datetime, Anda dapat mengekstrak nilai dari kolom datetime ke kolom terpisah. Misalnya, jika Anda memiliki kolom yang berisi tanggal pembelian, Anda dapat mengekstrak nilai bulan ke kolom terpisah dan menggunakan kolom baru saat membuat model Anda. Anda juga dapat mengekstrak beberapa nilai untuk memisahkan kolom dengan satu transformasi.

Kolom datetime Anda harus menggunakan format stempel waktu yang didukung. Untuk daftar format yang didukung SageMaker Canvas, lihat[Prakiraan Deret Waktu di Amazon SageMaker Canvas](canvas-time-series.md). Jika kumpulan data Anda tidak menggunakan salah satu format yang didukung, perbarui kumpulan data Anda untuk menggunakan format stempel waktu yang didukung dan impor ulang ke SageMaker Amazon Canvas sebelum membuat model Anda.

Untuk melakukan ekstraksi datetime, lakukan hal berikut.

1. Di tab **Build** aplikasi SageMaker Canvas, pada bilah transformasi, pilih **Lihat semua**.

1. Pilih **fitur Ekstrak**.

1. Pilih **kolom Timestamp** dari mana Anda ingin mengekstrak nilai.

1. Untuk **Nilai**, pilih satu atau beberapa nilai untuk diekstrak dari kolom. **Nilai yang dapat Anda ekstrak dari kolom stempel waktu adalah **Tahun**, **Bulan**, **Hari**, **Jam**, **Minggu tahun, Hari tahun****, dan Kuartal**.**

1. (Opsional) Pilih **Pratinjau** untuk melihat pratinjau hasil transformasi.

1. Pilih **Tambah** untuk menambahkan transformasi ke **resep Model**.

SageMaker Canvas membuat kolom baru dalam kumpulan data untuk setiap nilai yang Anda ekstrak. Kecuali untuk nilai **Tahun**, SageMaker Canvas menggunakan pengkodean berbasis 0 untuk nilai yang diekstraksi. Misalnya, jika Anda mengekstrak nilai **Bulan**, Januari diekstraksi sebagai 0, dan Februari diekstraksi sebagai 1.

![\[Tangkapan layar kotak ekstraksi datetime di aplikasi SageMaker Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-datetime-extract.png)


Anda dapat melihat transformasi yang tercantum di bagian **Resep model**. Jika Anda menghapus transformasi dari bagian **Resep model**, kolom baru akan dihapus dari kumpulan data.