

Amazon Fraud Detector tidak lagi terbuka untuk pelanggan baru per 7 November 2025. Untuk kemampuan yang mirip dengan Amazon Fraud Detector, jelajahi Amazon SageMaker AutoGluon,, dan AWS WAF.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Simpan data acara Anda secara eksternal dengan Amazon S3
<a name="uploading-event-data-to-an-s3-bucket"></a>

Jika Anda melatih model Wawasan Penipuan Online, Anda dapat memilih untuk menyimpan data acara secara eksternal dengan Amazon S3. Untuk menyimpan data acara di Amazon S3, Anda harus terlebih dahulu membuat file teks dalam format CSV, menambahkan data acara, lalu mengunggah file CSV ke bucket Amazon S3. 

**catatan**  
Jenis model **Wawasan Penipuan Transaksi** dan **Wawasan Pengambilalihan Akun** tidak mendukung kumpulan data yang disimpan secara eksternal dengan Amazon S3

# Buat file CSV
<a name="creating-csv-file"></a>

Amazon Fraud Detector mengharuskan baris pertama file CSV Anda berisi header kolom. Header kolom dalam file CSV Anda harus memetakan ke variabel yang ditentukan dalam jenis acara. Untuk contoh kumpulan data, lihat [Dapatkan dan unggah contoh dataset](step-1-get-s3-data.md) 

Model Online Fraud Insights membutuhkan dataset pelatihan yang memiliki setidaknya 2 variabel dan hingga 100 variabel. Selain variabel acara, kumpulan data pelatihan harus berisi header berikut:
+ EVENT\$1TIMESTAMP - Mendefinisikan kapan peristiwa terjadi
+ EVENT\$1LABEL - Mengklasifikasikan acara sebagai penipuan atau sah. Nilai dalam kolom harus sesuai dengan nilai yang ditentukan dalam jenis acara.

Contoh data CSV berikut mewakili peristiwa pendaftaran historis dari pedagang online: 

```
EVENT_TIMESTAMP,EVENT_LABEL,ip_address,email_address
4/10/2019 11:05,fraud,209.146.137.48,fake_burtonlinda@example.net
12/20/2018 20:04,legit,203.0.112.189,fake_davidbutler@example.org
3/14/2019 10:56,legit,169.255.33.54,fake_shelby76@example.net
1/3/2019 8:38,legit,192.119.44.26,fake_curtis40@example.com
9/25/2019 3:12,legit,192.169.85.29,fake_rmiranda@example.org
```

**catatan**  
File data CSV dapat berisi tanda kutip ganda dan koma sebagai bagian dari data Anda. 

Versi sederhana dari jenis acara yang sesuai diwakili di bawah ini. Variabel peristiwa sesuai dengan header dalam file CSV dan nilai `EVENT_LABEL` sesuai dengan nilai dalam daftar label.

```
(
name = 'sample_registration',
eventVariables = ['ip_address', 'email_address'],
labels = ['legit', 'fraud'],
entityTypes = ['sample_customer']
)
```

## Format Timestamp Acara
<a name="timestamp-formats"></a>

Pastikan stempel waktu acara Anda dalam format yang diperlukan. Sebagai bagian dari proses pembuatan model, tipe model Wawasan Penipuan Online memesan data Anda berdasarkan stempel waktu acara, dan membagi data Anda untuk tujuan pelatihan dan pengujian. Untuk mendapatkan perkiraan kinerja yang adil, model pertama-tama melatih kumpulan data pelatihan, dan kemudian menguji model ini pada kumpulan data pengujian.

Amazon Fraud Detector mendukung date/timestamp format berikut untuk nilai `EVENT_TIMESTAMP` selama pelatihan model:
+ %YYYY-%mm-%ddt%HH: %mm: %SSZ (standar ISO 8601 di UTC hanya tanpa milidetik)

  Contoh: 2019-11-30T 13:01:01 Z 
+ %yyy/%mm/%dd %hh: %mm: %ss (AM/PM)

  Contoh: 2019/11/30 13:01:01 PM, atau 2019/11/30 13:01:01 
+ %mm/%dd/%yyyy %hh: %mm: %ss

  Contoh: 30/11/2019 13:01:01 PM, 11/30/2019 13:01:01 
+ %mm/%dd/%yy %hh: %mm: %ss

  Contoh: 30/11/19 13:01:01 PM, 11/30/19 13:01:01 

Amazon Fraud Detector membuat asumsi berikut saat mengurai date/timestamp format untuk stempel waktu acara:
+ Jika Anda menggunakan standar ISO 8601, itu harus sama persis dengan spesifikasi sebelumnya
+ Jika Anda menggunakan salah satu format lain, ada fleksibilitas tambahan:
  + Selama berbulan-bulan dan berhari-hari, Anda dapat memberikan digit tunggal atau ganda. Misalnya, 1/12/2019 adalah tanggal yang valid.
  + Anda tidak perlu menyertakan hh:mm: ss jika Anda tidak memilikinya (ya, Anda cukup memberikan tanggal). Anda juga dapat memberikan subset hanya jam dan menit (misalnya, hh:mm). Hanya menyediakan jam tidak didukung. Milidetik juga tidak didukung.
  + Jika Anda memberikan AM/PM label, jam 12 jam diasumsikan. Jika tidak ada AM/PM informasi, jam 24 jam diasumsikan.
  + Anda dapat menggunakan “/” atau “-” sebagai pembatas untuk elemen tanggal. “:” diasumsikan untuk elemen stempel waktu.

## Mengambil sampel kumpulan data Anda sepanjang waktu
<a name="sample-your-dataset"></a>

Kami menyarankan Anda memberikan contoh penipuan dan sampel yang sah dari rentang waktu yang sama. Misalnya, jika Anda memberikan peristiwa penipuan dari 6 bulan terakhir, Anda juga harus memberikan acara yang sah yang secara merata mencakup periode waktu yang sama. Jika kumpulan data Anda berisi distribusi penipuan dan peristiwa yang sah yang sangat tidak merata, Anda mungkin menerima kesalahan berikut: *“Distribusi penipuan sepanjang waktu sangat fluktuasi. Tidak dapat membagi kumpulan data dengan benar.”* Biasanya, perbaikan termudah untuk kesalahan ini adalah memastikan bahwa peristiwa penipuan dan peristiwa yang sah diambil sampelnya secara merata di seluruh jangka waktu yang sama. Anda juga mungkin perlu menghapus data jika Anda mengalami lonjakan besar dalam penipuan dalam waktu singkat. 

Jika Anda tidak dapat menghasilkan data yang cukup untuk membuat kumpulan data yang terdistribusi secara merata, salah satu pendekatannya adalah dengan mengacak EVENT\$1TIMESTAMP peristiwa Anda sehingga terdistribusi secara merata. Namun, hal ini sering mengakibatkan metrik kinerja menjadi tidak realistis karena Amazon Fraud Detector menggunakan EVENT\$1TIMESTAMP untuk mengevaluasi model pada subset peristiwa yang sesuai dalam kumpulan data Anda. 

## Nilai nol dan hilang
<a name="null-missing-values"></a>

Amazon Fraud Detector menangani nilai nol dan hilang. Namun, persentase nol untuk variabel harus dibatasi. Kolom EVENT\$1TIMESTAMP dan EVENT\$1LABEL tidak boleh berisi nilai yang hilang.

## Validasi file
<a name="csv-file-validation"></a>

Amazon Fraud Detector akan gagal melatih model jika salah satu kondisi berikut dipicu:
+ Jika CSV tidak dapat diurai
+ Jika tipe data untuk kolom salah

# Unggah data acara Anda ke bucket Amazon S3
<a name="uploading-to-an-s3-bucket"></a>

Setelah Anda membuat file CSV dengan data acara, unggah file ke bucket Amazon S3 Anda.

**Untuk mengunggah ke bucket Amazon S3**

1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon S3 di. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Pilih **Buat bucket**.

   **Buat bucket** membuka wizard.

1. Di **Nama bucket**, masukkan nama yang sesuai dengan DNS untuk bucket Anda.

   Nama kelompok harus:
   + Unik di seluruh Amazon S3.
   + Panjangnya antara 3 dan 63 karakter.
   + Tidak mengandung karakter huruf besar.
   + Mulai dengan huruf kecil atau angka.

   Setelah membuat bucket, Anda tidak dapat mengubah namanya. Untuk informasi tentang penamaan bucket, lihat [Aturan penamaan bucket](https://docs.aws.amazon.com/AmazonS3/latest/userguide/BucketRestrictions.html#bucketnamingrules) di *Panduan Pengguna Layanan Penyimpanan Sederhana Amazon*.
**penting**  
Hindari menyertakan informasi sensitif, seperti nomor akun, dalam nama bucket. Nama ember terlihat di titik URLs itu ke objek di ember.

1. Di **Wilayah**, pilih AWS Wilayah tempat Anda ingin ember berada. Anda harus memilih Wilayah yang sama di mana Anda menggunakan Amazon Fraud Detector, yaitu US East (Virginia N.), US East (Ohio), US West (Oregon), Eropa (Irlandia), Asia Pasifik (Singapura) atau Asia Pasifik (Sydney). 

1. Pada **Pengaturan bucket untuk Blokir Akses Publik**, pilih pengaturan Blokir Akses Publik yang ingin Anda terapkan ke bucket. 

   Kami menyarankan Anda membiarkan semua pengaturan diaktifkan. Untuk informasi selengkapnya tentang memblokir akses publik, lihat [Memblokir akses publik ke penyimpanan Amazon S3 Anda](https://docs.aws.amazon.com/AmazonS3/latest/dev/access-control-block-public-access.html) di *Panduan Pengguna Layanan Penyimpanan Sederhana Amazon*.

1. Pilih **Buat bucket**.

1. Unggah file data pelatihan ke bucket Amazon S3 Anda. Perhatikan jalur lokasi Amazon S3 untuk file pelatihan Anda (misalnya, s3://bucketname/object.csv).