Amazon Fraud Detector tidak lagi terbuka untuk pelanggan baru per 7 November 2025. Untuk kemampuan yang mirip dengan Amazon Fraud Detector, jelajahi Amazon SageMaker AutoGluon,, dan AWS WAF.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Model


Amazon Fraud Detector menggunakan model pembelajaran mesin untuk menghasilkan prediksi penipuan. Setiap model dilatih menggunakan *tipe model*. Jenis model menentukan algoritma dan transformasi yang digunakan untuk melatih model. Pelatihan model adalah proses menggunakan kumpulan data yang Anda berikan untuk membuat model yang dapat memprediksi peristiwa penipuan.

Untuk membuat model, Anda harus terlebih dahulu memilih jenis model dan kemudian menyiapkan dan memberikan data yang akan digunakan untuk melatih model. 

# Pilih jenis model


Jenis model berikut tersedia di Amazon Fraud Detector. Pilih jenis model yang sesuai untuk kasus penggunaan Anda. 
+ **Wawasan Penipuan Online**

  Jenis model *Wawasan Penipuan Online* dioptimalkan untuk mendeteksi penipuan ketika sedikit data historis tersedia tentang entitas yang sedang dievaluasi, misalnya, pelanggan baru yang mendaftar secara online untuk akun baru.
+ **Wawasan Penipuan Transaksi**

  Jenis model *Transaction Fraud Insights* paling cocok untuk mendeteksi kasus penggunaan penipuan di mana entitas yang sedang dievaluasi mungkin memiliki riwayat interaksi yang dapat dianalisis model untuk meningkatkan akurasi prediksi (misalnya, pelanggan yang sudah ada dengan riwayat pembelian sebelumnya).
+ **Wawasan Pengambilalihan Akun**

  Jenis model *Account Takeover Insights* mendeteksi jika akun dikompromikan oleh phishing atau jenis serangan lainnya. Data login dari akun yang disusupi, seperti browser dan perangkat yang digunakan saat login, berbeda dari data login historis yang terkait dengan akun tersebut. 

# Wawasan penipuan online


Online Fraud Insights adalah model pembelajaran mesin yang diawasi, yang berarti menggunakan contoh historis transaksi penipuan dan sah untuk melatih model tersebut. Model Online Fraud Insights dapat mendeteksi penipuan berdasarkan sedikit data historis. Masukan model fleksibel, sehingga Anda dapat menyesuaikannya untuk mendeteksi berbagai risiko penipuan termasuk ulasan palsu, penyalahgunaan promosi, dan penipuan checkout tamu. 

Model Online Fraud Insights menggunakan ansambel algoritma pembelajaran mesin untuk pengayaan data, transformasi, dan klasifikasi penipuan. Sebagai bagian dari proses pelatihan model, Online Fraud Insights memperkaya elemen data mentah seperti alamat IP dan nomor BIN dengan data pihak ketiga seperti geolokasi alamat IP atau bank penerbit untuk kartu kredit. Selain data pihak ketiga, Online Fraud Insights menggunakan algoritma pembelajaran mendalam yang memperhitungkan pola penipuan yang telah terlihat di Amazon dan. AWS Pola penipuan ini menjadi fitur masukan untuk model Anda menggunakan algoritma peningkatan pohon gradien.

Untuk meningkatkan kinerja, Online Fraud Insights mengoptimalkan parameter hiper dari algoritma peningkatan pohon gradien melalui proses optimasi Bayesian. Ini secara berurutan melatih lusinan model yang berbeda dengan parameter model yang bervariasi (seperti jumlah pohon, kedalaman pohon, dan jumlah sampel per daun). Ini juga menggunakan strategi optimasi yang berbeda seperti meningkatkan populasi penipuan minoritas untuk menjaga tingkat penipuan yang sangat rendah.

## Memilih sumber data


Saat melatih model Wawasan Penipuan Online, Anda dapat memilih untuk melatih model pada data peristiwa yang disimpan secara eksternal (di luar Amazon Fraud Detector) atau disimpan dalam Amazon Fraud Detector. Penyimpanan eksternal yang saat ini didukung Amazon Fraud Detector adalah Amazon Simple Storage Service (Amazon S3). Jika Anda menggunakan penyimpanan eksternal, kumpulan data acara harus diunggah sebagai format nilai yang dipisahkan koma (CSV) ke bucket Amazon S3. Opsi penyimpanan data ini disebut dalam konfigurasi pelatihan model sebagai EXTERNAL\$1EVENTS (untuk penyimpanan eksternal) dan INGESTED\$1EVENTS (untuk penyimpanan internal). Untuk informasi selengkapnya tentang sumber data yang tersedia dan cara menyimpan data di dalamnya, lihat[Penyimpanan data acara](event-data-storage.md).

## Mempersiapkan data


Di mana pun Anda memilih untuk menyimpan data acara Anda (Amazon S3 atau Amazon Fraud Detector), persyaratan untuk jenis model Wawasan Penipuan Online adalah sama.

Dataset Anda harus berisi header kolom EVENT\$1LABEL. Variabel ini mengklasifikasikan suatu peristiwa sebagai penipuan atau sah. Saat menggunakan file CSV (penyimpanan eksternal), Anda harus menyertakan EVENT\$1LABEL untuk setiap peristiwa dalam file. Untuk penyimpanan internal, bidang EVENT\$1LABEL bersifat opsional tetapi semua peristiwa harus diberi label untuk disertakan dalam kumpulan data pelatihan. Saat mengonfigurasi pelatihan model, Anda dapat memilih apakah akan mengabaikan peristiwa yang tidak berlabel, mengambil label yang sah untuk peristiwa yang tidak berlabel, atau mengasumsikan label penipuan untuk semua peristiwa yang tidak berlabel. 

## Memilih data


Lihat [Mengumpulkan data acara](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#gather-event-data) untuk informasi tentang memilih data untuk melatih model Wawasan Penipuan Online Anda.

Pelatihan Online Fraud Insights memproses sampel dan mempartisi data historis berdasarkan EVENT\$1TIMESTAMP. Tidak perlu mengambil sampel data secara manual dan melakukannya dapat berdampak negatif pada hasil model Anda.

## Variabel peristiwa


Model Wawasan Penipuan Online membutuhkan setidaknya dua variabel, terlepas dari metadata peristiwa yang diperlukan, yang telah lulus [validasi data](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation) untuk pelatihan model dan memungkinkan hingga 100 variabel per model. Umumnya, semakin banyak variabel yang Anda berikan, semakin baik model dapat membedakan antara penipuan dan peristiwa yang sah. Meskipun model Wawasan Penipuan Online dapat mendukung lusinan variabel, termasuk variabel khusus, kami merekomendasikan menyertakan alamat IP dan alamat email karena variabel ini biasanya paling efektif dalam mengidentifikasi entitas yang sedang dievaluasi. 

## Memvalidasi data


Sebagai bagian dari proses pelatihan, Wawasan Penipuan Online akan memvalidasi kumpulan data untuk masalah kualitas data yang dapat memengaruhi pelatihan model. Setelah memvalidasi data, Amazon Fraud Detector akan mengambil tindakan yang tepat untuk membangun model terbaik. Ini termasuk mengeluarkan peringatan untuk masalah kualitas data potensial, secara otomatis menghapus variabel yang memiliki masalah kualitas data, atau mengeluarkan kesalahan dan menghentikan proses pelatihan model. Untuk informasi selengkapnya, lihat [validasi kumpulan data](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation). 

# Wawasan penipuan transaksi


Jenis model Transaction Fraud Insights dirancang untuk mendeteksi penipuan online, atau card-not-present, transaksi. Transaction Fraud Insights adalah model pembelajaran mesin yang diawasi, yang berarti menggunakan contoh historis transaksi penipuan dan sah untuk melatih model tersebut.

Model Transaction Fraud Insights menggunakan ansambel algoritma pembelajaran mesin untuk pengayaan data, transformasi, dan klasifikasi penipuan. Ini memanfaatkan mesin rekayasa fitur untuk membuat agregat tingkat entitas dan tingkat peristiwa. Sebagai bagian dari proses pelatihan model, Transaction Fraud Insights memperkaya elemen data mentah seperti alamat IP dan nomor BIN dengan data pihak ketiga seperti geolokasi alamat IP atau bank penerbit untuk kartu kredit. Selain data pihak ketiga, Transaction Fraud Insights menggunakan algoritme pembelajaran mendalam yang memperhitungkan pola penipuan yang telah terlihat di Amazon dan Pola penipuan AWS ini menjadi fitur input untuk model Anda menggunakan algoritme peningkatan pohon gradien.

Untuk meningkatkan kinerja, Transaction Fraud Insights mengoptimalkan parameter hiper algoritme peningkatan pohon gradien melalui proses optimasi Bayesian, secara berurutan melatih lusinan model berbeda dengan parameter model yang bervariasi (seperti jumlah pohon, kedalaman pohon, jumlah sampel per daun) serta strategi pengoptimalan yang berbeda seperti meningkatkan populasi penipuan minoritas untuk menangani tingkat penipuan yang sangat rendah.

Sebagai bagian dari proses pelatihan model, mesin rekayasa fitur model Transaction Fraud menghitung nilai untuk setiap entitas unik dalam kumpulan data pelatihan Anda untuk membantu meningkatkan prediksi penipuan. Misalnya, selama proses pelatihan, Amazon Fraud Detector menghitung dan menyimpan terakhir kali entitas melakukan pembelian dan memperbarui nilai ini secara dinamis setiap kali Anda memanggil `GetEventPrediction` atau `SendEvent` API. Selama prediksi penipuan, variabel peristiwa digabungkan dengan entitas lain dan metadata peristiwa untuk memprediksi apakah transaksi tersebut curang.

## Memilih sumber data


Model Transaction Fraud Insights dilatih pada kumpulan data yang disimpan secara internal hanya dengan Amazon Fraud Detector (INGESTED\$1EVENTS). Hal ini memungkinkan Amazon Fraud Detector untuk terus memperbarui nilai terhitung tentang entitas yang Anda evaluasi. Untuk informasi selengkapnya tentang sumber data yang tersedia, lihat [Penyimpanan data acara](event-data-storage.md)

## Mempersiapkan data


Sebelum Anda melatih model Transaction Fraud Insights, pastikan bahwa file data Anda berisi semua header seperti yang disebutkan dalam [Siapkan dataset acara](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#prepare-event-dataset). Model Transaction Fraud Insights membandingkan entitas baru yang diterima dengan contoh entitas penipuan dan sah dalam kumpulan data, sehingga sangat membantu untuk memberikan banyak contoh untuk setiap entitas. 

Amazon Fraud Detector secara otomatis mengubah kumpulan data peristiwa yang disimpan menjadi format yang benar untuk pelatihan. Setelah model menyelesaikan pelatihan, Anda dapat meninjau metrik kinerja dan menentukan apakah Anda harus menambahkan entitas ke kumpulan data pelatihan Anda. 

## Memilih data


Secara default, Insights Penipuan Transaksi melatih seluruh kumpulan data yang disimpan untuk Jenis Peristiwa yang Anda pilih. Anda dapat secara opsional mengatur rentang waktu untuk mengurangi peristiwa yang digunakan untuk melatih model Anda. Saat menetapkan rentang waktu, pastikan bahwa catatan yang digunakan untuk melatih model memiliki waktu yang cukup untuk matang. Artinya, cukup waktu telah berlalu untuk memastikan catatan yang sah dan penipuan telah diidentifikasi dengan benar. Misalnya, untuk penipuan tolak bayar, seringkali dibutuhkan 60 hari atau lebih untuk mengidentifikasi peristiwa penipuan dengan benar. Untuk kinerja model terbaik, pastikan bahwa semua catatan dalam kumpulan data pelatihan Anda sudah matang. 

Tidak perlu memilih rentang waktu yang mewakili tingkat penipuan yang ideal. Amazon Fraud Detector secara otomatis mengambil sampel data Anda untuk mencapai keseimbangan antara tingkat penipuan, rentang waktu, dan jumlah entitas. 

Amazon Fraud Detector mengembalikan kesalahan validasi selama pelatihan model jika Anda memilih rentang waktu yang tidak cukup acara untuk berhasil melatih model. Untuk kumpulan data yang disimpan, bidang EVENT\$1LABEL bersifat opsional, tetapi peristiwa harus diberi label untuk disertakan dalam kumpulan data pelatihan Anda. Saat mengonfigurasi pelatihan model, Anda dapat memilih apakah akan mengabaikan peristiwa yang tidak berlabel, mengambil label yang sah untuk peristiwa yang tidak berlabel, atau mengasumsikan label penipuan untuk peristiwa yang tidak berlabel. 

## Variabel peristiwa


Jenis peristiwa yang digunakan untuk melatih model harus berisi setidaknya 2 variabel, selain dari metadata peristiwa yang diperlukan, yang telah melewati [validasi data](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation) dan dapat berisi hingga 100 variabel. Umumnya, semakin banyak variabel yang Anda berikan, semakin baik model dapat membedakan antara penipuan dan peristiwa yang sah. Meskipun model Transaction Fraud Insight dapat mendukung lusinan variabel, termasuk variabel kustom, kami menyarankan Anda menyertakan alamat IP, alamat email, jenis instrumen pembayaran, harga pesanan, dan BIN kartu. 

## Memvalidasi data


Sebagai bagian dari proses pelatihan, Transaction Fraud Insights memvalidasi kumpulan data pelatihan untuk masalah kualitas data yang mungkin memengaruhi pelatihan model. Setelah memvalidasi data, Amazon Fraud Detector mengambil tindakan yang tepat untuk membangun model terbaik. Ini termasuk mengeluarkan peringatan untuk masalah kualitas data potensial, secara otomatis menghapus variabel yang memiliki masalah kualitas data, atau mengeluarkan kesalahan dan menghentikan proses pelatihan model. Untuk informasi selengkapnya, lihat [Validasi kumpulan data](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation). 

Amazon Fraud Detector akan mengeluarkan peringatan tetapi terus melatih model jika jumlah entitas unik kurang dari 1.500 karena ini dapat memengaruhi kualitas data pelatihan. Jika Anda menerima peringatan, tinjau [metrik kinerja](training-performance-metrics.md).

# Wawasan pengambilalihan akun


Jenis model Account Takeover Insights (ATI) mengidentifikasi aktivitas online penipuan dengan mendeteksi apakah akun dikompromikan melalui pengambilalihan berbahaya, phishing, atau dari kredensi yang dicuri. Account Takeover Insights adalah model pembelajaran mesin yang menggunakan acara login dari bisnis online Anda untuk melatih model tersebut. 

Anda dapat menyematkan model Wawasan Pengambilalihan Akun yang terlatih dalam alur login waktu nyata Anda untuk mendeteksi apakah akun dikompromikan. Model ini menilai berbagai jenis otentikasi dan login. Mereka termasuk login aplikasi web, otentikasi berbasis API, dan single-sign-on (SSO). Untuk menggunakan model Account Takeover Insights, panggil [GetEventPrediction](https://docs.aws.amazon.com/frauddetector/latest/api/API_GetEventPrediction.html)API setelah kredensyal login yang valid ditampilkan. API menghasilkan skor yang mengukur risiko akun dikompromikan. Amazon Fraud Detector menggunakan skor dan aturan yang Anda tetapkan untuk mengembalikan satu atau beberapa hasil untuk peristiwa login. Hasilnya adalah yang Anda konfigurasikan. Berdasarkan hasil yang Anda terima, Anda dapat mengambil tindakan yang tepat untuk setiap login. Artinya, Anda dapat menyetujui atau menantang kredensyal yang disajikan untuk login. Misalnya, Anda dapat menantang kredensialnya dengan meminta PIN akun sebagai verifikasi tambahan.

Anda juga dapat menggunakan model Account Takeover Insights untuk mengevaluasi login akun secara asinkron dan mengambil tindakan pada akun berisiko tinggi. Misalnya, akun berisiko tinggi dapat ditambahkan ke antrian investigasi untuk peninjau manusia untuk menentukan apakah tindakan lebih lanjut perlu diambil, seperti menangguhkan akun.

Model Account Takeover Insights dilatih menggunakan kumpulan data yang berisi peristiwa login historis bisnis Anda. Anda memberikan data ini. Anda dapat secara opsional melabeli akun sebagai sah atau curang. Namun, ini tidak diperlukan untuk melatih model. Model Account Takeover Insights mendeteksi anomali berdasarkan riwayat login akun yang berhasil. Ini juga mempelajari cara mendeteksi anomali dalam perilaku pengguna yang menunjukkan peningkatan risiko peristiwa pengambilalihan akun berbahaya. Misalnya, pengguna yang biasanya masuk dari perangkat dan alamat IP yang sama. Penipu biasanya masuk dari perangkat dan geolokasi yang berbeda. Teknik ini menghasilkan skor risiko dari suatu aktivitas yang anomali, yang biasanya merupakan karakteristik utama dari pengambilalihan akun berbahaya.

Sebelum melatih model Account Takeover Insights, Amazon Fraud Detector menggunakan kombinasi teknik pembelajaran mesin untuk melakukan pengayaan data, agregasi data, dan transformasi data. Kemudian, selama proses pelatihan, Amazon Fraud Detector memperkaya elemen data mentah yang Anda berikan. Contoh elemen data mentah termasuk alamat IP dan agen pengguna. Amazon Fraud Detector menggunakan elemen-elemen ini untuk membuat input tambahan yang menjelaskan data login. Input ini termasuk perangkat, browser, dan input geolokasi. Amazon Fraud Detector juga menggunakan data login yang Anda berikan untuk terus menghitung variabel agregat yang menggambarkan perilaku pengguna sebelumnya. Contoh perilaku pengguna termasuk berapa kali pengguna masuk dari alamat IP tertentu. Menggunakan pengayaan dan agregat tambahan ini, Amazon Fraud Detector dapat menghasilkan kinerja model yang kuat dari sekumpulan kecil input dari peristiwa login Anda.

Model Account Takeover Insights mendeteksi contoh di mana akun yang sah diakses oleh aktor jahat, terlepas dari apakah aktor jahat itu manusia atau robot. Model ini menghasilkan skor tunggal yang menunjukkan risiko relatif kompromi akun. Akun yang mungkin telah disusupi ditandai sebagai akun berisiko tinggi. Anda dapat memproses akun berisiko tinggi dengan salah satu dari dua cara. Anda juga dapat menerapkan verifikasi identitas tambahan. Atau, Anda dapat mengirim akun ke antrian untuk penyelidikan manual. 

## Memilih sumber data


Model Account Takeover Insights dilatih pada kumpulan data yang disimpan secara internal, di Amazon Fraud Detector. Untuk menyimpan data peristiwa login Anda dengan Amazon Fraud Detector, buat file CSV dengan peristiwa login pengguna. Untuk setiap acara, sertakan data login seperti stempel waktu acara, ID pengguna, alamat IP, agen pengguna, dan apakah data login valid. Setelah membuat file CSV, pertama upload file ke Amazon Fraud Detector, dan kemudian gunakan fitur impor untuk menyimpan data. Anda kemudian dapat melatih model Anda menggunakan data yang disimpan. Untuk informasi selengkapnya tentang menyimpan kumpulan data acara Anda dengan Amazon Fraud Detector, lihat [Simpan data acara Anda secara internal dengan Amazon Fraud Detector](storing-event-data-afd.md)

## Mempersiapkan data


Amazon Fraud Detector mengharuskan Anda memberikan data login akun pengguna Anda dalam file nilai yang dipisahkan koma (CSV) yang dikodekan dalam format UTF-8. Baris pertama file CSV Anda harus berisi header file. Header file terdiri dari metadata peristiwa dan variabel peristiwa yang menggambarkan setiap elemen data. Data acara mengikuti header. Setiap baris dalam data acara terdiri dari data dari satu peristiwa login.

Untuk model Wawasan Pengambilalihan Akun, Anda harus menyediakan metadata peristiwa dan variabel peristiwa berikut di baris header file CSV Anda. 

**Metadata acara**

Kami menyarankan Anda memberikan metadata berikut di header file CSV Anda. Metadata acara harus dalam huruf besar.
+ EVENT\$1ID - Sebuah identifier unik untuk acara login.
+ ENTITY\$1TYPE - Entitas yang melakukan peristiwa login, seperti pedagang atau pelanggan.
+ ENTITY\$1ID - Sebuah identifier untuk entitas melakukan peristiwa login. 
+ EVENT\$1TIMESTAMP - Stempel waktu saat peristiwa login terjadi. Stempel waktu harus dalam standar ISO 8601 di UTC.
+ EVENT\$1LABEL (direkomendasikan) - Label yang mengklasifikasikan acara sebagai penipuan atau sah. Anda dapat menggunakan label apa pun, seperti “penipuan”, “legit”, “1", atau “0".

**catatan**  
Metadata peristiwa harus dalam huruf besar. Ini peka huruf besar/kecil.
Label tidak diperlukan untuk acara login. Namun, kami menyarankan Anda menyertakan metadata EVENT\$1LABEL dan memberikan label untuk peristiwa login Anda. Tidak apa-apa jika labelnya tidak lengkap atau sporadis. Jika Anda memberikan label, Amazon Fraud Detector akan menggunakannya untuk menghitung Account Takeover Discovery Rate secara otomatis dan menampilkannya dalam bagan dan tabel kinerja model.

**Variabel peristiwa**

Untuk model Account Takeover Insights, ada variabel wajib (wajib) yang harus Anda sediakan dan variabel opsional. Saat Anda membuat variabel, pastikan untuk menetapkan variabel ke tipe variabel yang tepat. Sebagai bagian dari proses pelatihan model, Amazon Fraud Detector menggunakan tipe variabel yang terkait dengan variabel untuk melakukan pengayaan variabel dan rekayasa fitur.

**catatan**  
Nama variabel peristiwa harus dalam huruf kecil. Mereka peka huruf besar/kecil.

**Variabel wajib**

Variabel berikut diperlukan untuk melatih model Accounts Takeover Insights.


| Kategori | Jenis variabel | Deskripsi | 
| --- | --- | --- | 
| Alamat IP | IP\$1ALAMAT | Alamat IP yang digunakan dalam acara login | 
| Browser dan perangkat | AGEN PENGGUNA | Browser, perangkat, dan OS yang digunakan dalam acara login | 
| Kredensi yang valid | VALIDCRED | Menunjukkan apakah kredensyal yang digunakan untuk login valid | 

**Variabel opsional**

Variabel berikut bersifat opsional untuk melatih model Accounts Takeover Insights.


| Kategori | Tipe | Deskripsi | 
| --- | --- | --- | 
| Browser dan perangkat | SIDIK JARI | Pengidentifikasi unik untuk browser atau sidik jari perangkat | 
| Id Sesi | SESSION\$1ID | Pengidentifikasi untuk sesi otentikasi | 
| Label | EVENT\$1LABEL | Label yang mengklasifikasikan acara sebagai penipuan atau sah. Anda dapat menggunakan label apa pun, seperti “penipuan”, “legit”, “1", atau “0". | 
| Stempel waktu | LABEL\$1TIMESTAMP | Stempel waktu saat label terakhir diperbarui. Ini diperlukan jika EVENT\$1LABEL disediakan. | 

**catatan**  
Anda dapat memberikan nama variabel untuk kedua variabel wajib variabel opsional. Penting bahwa setiap variabel wajib dan opsional ditetapkan ke jenis variabel yang tepat.
Anda dapat memberikan variabel tambahan. Namun, Amazon Fraud Detector tidak akan menyertakan variabel-variabel ini untuk melatih model Accounts Takeover Insights. 

## Memilih data


Mengumpulkan data merupakan langkah penting untuk membuat model Account Takeover Insights Anda. Saat Anda mulai mengumpulkan data login Anda, pertimbangkan persyaratan dan rekomendasi berikut:

**Diperlukan**
+ Berikan setidaknya 1.500 contoh akun pengguna, masing-masing dengan setidaknya dua peristiwa login terkait.
+ Dataset Anda harus mencakup setidaknya 30 hari peristiwa login. Anda nantinya dapat menentukan rentang waktu tertentu dari peristiwa yang akan digunakan untuk melatih model.

**Direkomendasikan**
+ Dataset Anda mencakup contoh peristiwa login yang gagal. Anda dapat secara opsional memberi label login yang gagal ini sebagai “penipuan” atau “sah.”
+ Siapkan data historis dengan acara login yang mencakup lebih dari enam bulan dan sertakan 100 ribu entitas.

Jika Anda tidak memiliki kumpulan data yang sudah memenuhi persyaratan minimum, pertimbangkan streaming data peristiwa ke Amazon Fraud Detector dengan memanggil operasi [SendEvent](https://docs.aws.amazon.com/frauddetector/latest/api/API_SendEvent.html)API.

## Memvalidasi data


Sebelum membuat model Account Takeover Insights, Amazon Fraud Detector memeriksa apakah metadata dan variabel yang Anda sertakan dalam kumpulan data untuk melatih model memenuhi persyaratan ukuran dan format. Untuk informasi selengkapnya, lihat [Validasi kumpulan data](create-event-dataset.md#dataset-validation). Ini juga memeriksa persyaratan lain. Jika dataset tidak lulus validasi, model tidak dibuat. Agar model berhasil dibuat, pastikan untuk memperbaiki data yang tidak lulus validasi sebelum Anda berlatih lagi.

**Kesalahan kumpulan data umum**

Saat memvalidasi kumpulan data untuk melatih model Account Takeover Insights, Amazon Fraud Detector memindai masalah ini dan masalah lainnya dan menimbulkan error jika mengalami satu atau beberapa masalah.
+ File CSV tidak dalam format UTF-8.
+ Header file CSV tidak berisi setidaknya satu dari metadata berikut:`EVENT_ID`,, `ENTITY_ID` atau. `EVENT_TIMESTAMP`
+ Header file CSV tidak berisi setidaknya satu variabel dari jenis variabel berikut:`IP_ADDRESS`,`USERAGENT`, atau`VALIDCRED`. 
+ Ada lebih dari satu variabel yang terkait dengan tipe variabel yang sama. 
+ Lebih dari 0,1% nilai dalam `EVENT_TIMESTAMP` berisi nol atau nilai selain format tanggal dan stempel waktu yang didukung.
+ Jumlah hari antara acara pertama dan terakhir kurang dari 30 hari.
+ Lebih dari 10% variabel tipe `IP_ADDRESS` variabel tidak valid atau null.
+ Lebih dari 50% variabel dari tipe `USERAGENT` variabel mengandung null.
+ Semua variabel dari tipe `VALIDCRED` variabel diatur ke`false`.

# Bangun model


Model Amazon Fraud Detector belajar mendeteksi penipuan untuk jenis peristiwa tertentu. Di Amazon Fraud Detector, pertama-tama Anda membuat model, yang berfungsi sebagai wadah untuk versi model Anda. Setiap kali Anda melatih model, versi baru dibuat. Untuk detail tentang cara membuat dan melatih model menggunakan AWS Konsol, lihat[Langkah 3: Buat model](part-a.md#step-3-create-new-ml-model).

Setiap model memiliki variabel skor model yang sesuai. Amazon Fraud Detector membuat variabel ini atas nama Anda saat Anda membuat model. Anda dapat menggunakan variabel ini dalam ekspresi aturan Anda untuk menafsirkan skor model Anda selama evaluasi penipuan.

## Latih dan terapkan model menggunakan AWS SDK for Python (Boto3)


Versi model dibuat dengan memanggil `CreateModel` dan `CreateModelVersion` operasi. `CreateModel`memulai model, yang bertindak sebagai wadah untuk versi model Anda. `CreateModelVersion`memulai proses pelatihan, yang menghasilkan versi model tertentu. Versi baru dari solusi dibuat setiap kali Anda menelepon`CreateModelVersion`.

Contoh berikut menunjukkan permintaan sampel untuk `CreateModel` API. Contoh ini membuat jenis model *Wawasan Penipuan Online* dan mengasumsikan Anda telah membuat jenis acara. `sample_registration` Untuk detail tambahan tentang membuat jenis acara, lihat[Buat jenis acara](create-event-type.md).

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.create_model (
modelId = 'sample_fraud_detection_model',
eventTypeName = 'sample_registration',
modelType = 'ONLINE_FRAUD_INSIGHTS')
```

Latih versi pertama Anda menggunakan [CreateModelVersion](https://docs.aws.amazon.com//frauddetector/latest/api/API_CreateModelVersion.html)API. Untuk `TrainingDataSource` dan `ExternalEventsDetail` tentukan sumber dan lokasi Amazon S3 dari kumpulan data pelatihan. Untuk `TrainingDataSchema` menentukan bagaimana Amazon Fraud Detector harus menafsirkan data pelatihan, khususnya variabel peristiwa yang akan disertakan dan cara mengklasifikasikan label peristiwa. Secara default, Amazon Fraud Detector mengabaikan peristiwa yang tidak berlabel. Kode contoh ini digunakan `AUTO` `unlabeledEventsTreatment` untuk menentukan bahwa Amazon Fraud Detector memutuskan cara menggunakan peristiwa yang tidak berlabel.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.create_model_version (
modelId = 'sample_fraud_detection_model',
modelType = 'ONLINE_FRAUD_INSIGHTS',
trainingDataSource = 'EXTERNAL_EVENTS',
trainingDataSchema = {
    'modelVariables' : ['ip_address', 'email_address'],
    'labelSchema' : {
        'labelMapper' : {
            'FRAUD' : ['fraud'],
            'LEGIT' : ['legit']
        }
       unlabeledEventsTreatment = 'AUTO'
    }
}, 
externalEventsDetail = {
    'dataLocation' : 's3://bucket/file.csv',
    'dataAccessRoleArn' : 'role_arn'
}
)
```

Permintaan yang berhasil akan menghasilkan versi model baru dengan status`TRAINING_IN_PROGRESS`. Kapan saja selama pelatihan, Anda dapat membatalkan pelatihan dengan menelepon `UpdateModelVersionStatus` dan memperbarui status ke`TRAINING_CANCELLED`. Setelah pelatihan selesai, status versi model akan diperbarui ke`TRAINING_COMPLETE`. Anda dapat meninjau performa model menggunakan konsol Amazon Fraud Detector atau dengan menelepon`DescribeModelVersions`. Untuk informasi lebih lanjut tentang cara menafsirkan skor dan kinerja model, lihat [Skor model](model-scores.md) dan[Metrik kinerja model](training-performance-metrics.md).

 Setelah meninjau kinerja model, aktifkan model untuk membuatnya tersedia untuk digunakan oleh Detektor dalam prediksi penipuan waktu nyata. Amazon Fraud Detector akan menerapkan model di beberapa zona ketersediaan untuk redundansi dengan auto-scaling diaktifkan untuk memastikan model menskalakan dengan jumlah prediksi penipuan yang Anda buat. Untuk mengaktifkan model, panggil `UpdateModelVersionStatus` API dan perbarui statusnya ke`ACTIVE`.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.update_model_version_status (
modelId = 'sample_fraud_detection_model',
modelType = 'ONLINE_FRAUD_INSIGHTS',
modelVersionNumber = '1.00',
status = 'ACTIVE'
)
```

# Skor model


Amazon Fraud Detector menghasilkan skor model yang berbeda untuk jenis model yang berbeda. 

Untuk model **Account Takeover Insights (ATI)**, Amazon Fraud Detector hanya menggunakan nilai agregat (nilai yang dihitung dengan menggabungkan sekumpulan variabel mentah) untuk menghasilkan skor model. Skor -1 dihasilkan untuk peristiwa pertama entitas baru, menunjukkan *risiko yang tidak diketahui*. Ini karena untuk entitas baru, nilai yang digunakan untuk menghitung agregat akan menjadi nol atau nol. Model Account Takeeover Insights (ATI) menghasilkan skor model antara 0 dan 1000 untuk semua peristiwa berikutnya untuk entitas yang sama dan untuk entitas yang ada, di mana 0 menunjukkan *risiko penipuan rendah dan 1000 menunjukkan risiko penipuan* yang *tinggi*. Untuk model ATI, skor model terkait langsung dengan tingkat tantangan (CR). Misalnya, skor 500 sesuai dengan perkiraan tingkat tantangan 5% sedangkan skor 900 sesuai dengan perkiraan tingkat tantangan 0,1%. 

Untuk **model **Online Fraud Insights (OFI)** dan Transaction Fraud Insights (TFI**), Amazon Fraud Detector menggunakan nilai agregat (nilai yang dihitung dengan menggabungkan satu set variabel mentah) dan nilai mentah (nilai yang disediakan untuk variabel) untuk menghasilkan skor model. Skor model bisa antara 0 dan 1000, di mana 0 menunjukkan *risiko penipuan rendah* dan 1000 menunjukkan *risiko penipuan yang tinggi*. Untuk model OFI dan TFI, skor model berhubungan langsung dengan tingkat positif palsu (FPR). Misalnya, skor 600 sesuai dengan perkiraan 10% tingkat positif palsu sedangkan skor 900 sesuai dengan perkiraan 2% tingkat positif palsu. Tabel berikut memberikan rincian tentang bagaimana skor model tertentu berkorelasi dengan perkiraan tingkat positif palsu.


| Skor model | Perkiraan FPR | 
| --- | --- | 
|  975  |  0,50%  | 
|  950  |  1%  | 
|  900  |  2%  | 
|  860  |  3%  | 
|  775  |  5%  | 
|  700  |  7%  | 
|  600  |  10%  | 

# Metrik kinerja model


Setelah pelatihan model selesai, Amazon Fraud Detector memvalidasi kinerja model menggunakan 15% data Anda yang tidak digunakan untuk melatih model. Anda dapat mengharapkan model Amazon Fraud Detector terlatih Anda memiliki kinerja deteksi penipuan dunia nyata yang mirip dengan metrik kinerja validasi.

Sebagai bisnis, Anda harus menyeimbangkan antara mendeteksi lebih banyak penipuan, dan menambahkan lebih banyak gesekan ke pelanggan yang sah. Untuk membantu memilih keseimbangan yang tepat, Amazon Fraud Detector menyediakan alat berikut untuk menilai kinerja model:
+ **Bagan distribusi skor** — Histogram distribusi skor model mengasumsikan contoh populasi 100.000 peristiwa. Sumbu Y kiri mewakili peristiwa yang sah dan sumbu Y kanan mewakili peristiwa penipuan. Anda dapat memilih ambang model tertentu dengan mengklik area bagan. Ini akan memperbarui tampilan yang sesuai dalam matriks kebingungan dan bagan ROC.
+ **Matriks kebingungan** — Merangkum akurasi model untuk ambang skor tertentu dengan membandingkan prediksi model versus hasil aktual. Amazon Fraud Detector mengasumsikan contoh populasi 100.000 peristiwa. Distribusi penipuan dan peristiwa yang sah mensimulasikan tingkat penipuan dalam bisnis Anda.
  + **Positif sejati** — Model memprediksi penipuan dan acara tersebut sebenarnya penipuan.
  + **Positif palsu** — Model memprediksi penipuan tetapi acara tersebut sebenarnya sah.
  + **Negatif sejati** — Model memprediksi sah dan acara tersebut sebenarnya sah.
  + **Negatif palsu** — Model memprediksi sah tetapi acara tersebut sebenarnya penipuan.
  + **True positive rate (TPR)** — Persentase total penipuan yang dideteksi model. Juga dikenal sebagai capture rate. 
  + **Tingkat positif palsu (FPR)** — Persentase dari total peristiwa sah yang salah diprediksi sebagai penipuan.
+ **Receiver Operator Curve (ROC)** — Memplot laju positif sebenarnya sebagai fungsi dari laju positif palsu di atas semua ambang batas skor model yang mungkin. Lihat bagan ini dengan memilih **Metrik Lanjutan**.
+ **Area di bawah kurva (AUC)** — Merangkum TPR dan FPR di semua ambang batas skor model yang mungkin. Model tanpa daya prediksi memiliki AUC 0,5, sedangkan model sempurna memiliki skor 1,0.
+ **Rentang ketidakpastian** — Ini menunjukkan kisaran AUC yang diharapkan dari model. Rentang yang lebih besar (perbedaan batas atas dan bawah AUC > 0.1) berarti ketidakpastian model yang lebih tinggi. Jika rentang ketidakpastian besar (>0.1), pertimbangkan untuk menyediakan lebih banyak peristiwa berlabel dan latih kembali modelnya.

**Untuk menggunakan metrik kinerja model**

1. Mulailah dengan bagan **distribusi Skor** untuk meninjau distribusi skor model untuk penipuan dan peristiwa yang sah. Idealnya, Anda akan memiliki pemisahan yang jelas antara penipuan dan peristiwa yang sah. Ini menunjukkan model dapat secara akurat mengidentifikasi peristiwa mana yang curang dan mana yang sah. Pilih ambang model dengan mengklik area bagan. Anda dapat melihat bagaimana menyesuaikan ambang skor model memengaruhi tingkat positif positif dan positif palsu Anda yang sebenarnya.
**catatan**  
Bagan distribusi skor memplot penipuan dan peristiwa yang sah pada dua sumbu Y yang berbeda. Sumbu Y kiri mewakili peristiwa yang sah dan sumbu Y kanan mewakili peristiwa penipuan.

1. Tinjau **matriks Kebingungan**. Bergantung pada ambang skor model yang Anda pilih, Anda dapat melihat dampak simulasi berdasarkan sampel 100.000 peristiwa. Distribusi penipuan dan peristiwa yang sah mensimulasikan tingkat penipuan dalam bisnis Anda. Gunakan informasi ini untuk menemukan keseimbangan yang tepat antara tingkat positif sejati dan tingkat positif palsu.

1. Untuk detail tambahan, pilih **Metrik Lanjutan**. Gunakan bagan ROC untuk memahami hubungan antara tingkat positif sejati dan tingkat positif palsu untuk ambang skor model apa pun. Kurva ROC dapat membantu Anda menyempurnakan tradeoff antara tingkat positif sejati dan tingkat positif palsu.
**catatan**  
Anda juga dapat meninjau metrik dalam bentuk tabel dengan memilih **Tabel**.  
Tampilan tabel juga menunjukkan **Presisi** metrik. **Presisi** adalah persentase kejadian penipuan yang diprediksi dengan benar sebagai penipuan dibandingkan dengan semua peristiwa yang diprediksi sebagai penipuan.

1. Gunakan metrik kinerja untuk menentukan ambang model optimal untuk bisnis Anda berdasarkan sasaran dan kasus penggunaan deteksi penipuan Anda. Misalnya, jika Anda berencana menggunakan model untuk mengklasifikasikan pendaftaran akun baru sebagai risiko tinggi, sedang, atau rendah, Anda perlu mengidentifikasi dua skor ambang sehingga Anda dapat menyusun tiga ketentuan aturan sebagai berikut:
   + Skor > X berisiko tinggi
   + Skor < X but > Y adalah risiko sedang
   + Skor < Y berisiko rendah

# Pentingnya variabel model


*Kepentingan variabel model* adalah fitur Amazon Fraud Detector yang memberi peringkat variabel model dalam versi model. Setiap variabel model diberikan nilai berdasarkan kepentingan relatifnya terhadap kinerja keseluruhan model Anda. Variabel model dengan nilai tertinggi lebih penting bagi model daripada variabel model lain dalam kumpulan data untuk versi model tersebut, dan terdaftar di bagian atas secara default. Demikian juga, variabel model dengan nilai terendah terdaftar di bagian bawah secara default dan paling tidak penting dibandingkan dengan variabel model lainnya. Dengan menggunakan nilai kepentingan variabel model, Anda dapat memperoleh wawasan tentang input apa yang mendorong kinerja model Anda. 

Anda dapat melihat nilai kepentingan variabel model untuk versi model terlatih di konsol Amazon Fraud Detector atau dengan menggunakan [DescribeModelVersion](https://docs.aws.amazon.com/frauddetector/latest/api/API_DescribeModelVersions.html)API.

Kepentingan variabel model memberikan serangkaian nilai berikut untuk setiap [Variabel](https://docs.aws.amazon.com/frauddetector/latest/api/API_TrainingDataSchema.html#FraudDetector-Type-TrainingDataSchema-modelVariables) yang digunakan untuk melatih [Versi Model](https://docs.aws.amazon.com/frauddetector/latest/api/API_CreateModelVersion.html).
+ **Jenis Variabel**: Jenis variabel (misalnya, alamat IP atau Email). Untuk informasi selengkapnya, lihat [Jenis variabel](variables.md#variable-types). Untuk model Account Takeover Insights (ATI), Amazon Fraud Detector memberikan nilai kepentingan variabel untuk tipe variabel mentah dan agregat. Jenis variabel mentah ditugaskan ke variabel yang Anda berikan. Jenis variabel agregat ditetapkan ke satu set variabel mentah yang telah digabungkan oleh Amazon Fraud Detector untuk menghitung nilai kepentingan agregat.
+ **Nama Variabel**: Nama variabel peristiwa yang digunakan untuk melatih versi model (misalnya,`ip_address`,`email_address`,`are_creadentials_valid`). Untuk tipe variabel agregat, nama semua variabel yang digunakan untuk menghitung nilai kepentingan variabel agregat dicantumkan. 
+ **Nilai Pentingnya Variabel**: Angka yang mewakili kepentingan relatif dari variabel mentah atau agregat terhadap kinerja model. Kisaran tipikal: 0—10

Di konsol Amazon Fraud Detector, nilai kepentingan variabel model ditampilkan sebagai berikut untuk model Online Fraud Insights (OFI) atau Transaction Fraud Insights (TFI). Model Account Takeover Insight (ATI) akan memberikan nilai kepentingan variabel agregat selain nilai kepentingan variabel mentah. Bagan visual memudahkan untuk melihat kepentingan relatif antara variabel dengan garis putus-putus vertikal yang memberikan referensi ke nilai kepentingan variabel peringkat tertinggi. 

![\[Bagan kepentingan variabel model.\]](http://docs.aws.amazon.com/id_id/frauddetector/latest/ug/images/hawksnest-console-mvi-pane.png)


Amazon Fraud Detector menghasilkan nilai kepentingan variabel untuk setiap versi model Fraud Detector tanpa biaya tambahan. 

**penting**  
Versi model yang dibuat sebelum *9 Juli 2021* tidak memiliki nilai kepentingan variabel. Anda harus melatih versi baru model Anda untuk menghasilkan nilai kepentingan variabel model.

## Menggunakan nilai kepentingan variabel model


 Anda dapat menggunakan nilai kepentingan variabel model untuk mendapatkan wawasan tentang apa yang mendorong kinerja model Anda naik atau turun dan variabel mana yang paling berkontribusi. Dan kemudian tweak model Anda untuk meningkatkan kinerja secara keseluruhan. 

Lebih khusus lagi, untuk meningkatkan kinerja model Anda, periksa nilai kepentingan variabel terhadap pengetahuan domain Anda dan masalah debug dalam data pelatihan. Misalnya, jika ID Akun digunakan sebagai masukan ke model dan terdaftar di bagian atas, lihat nilai kepentingan variabelnya. Jika nilai kepentingan variabel secara signifikan lebih tinggi daripada nilai lainnya, maka model Anda mungkin terlalu sesuai dengan pola penipuan tertentu (misalnya, semua peristiwa penipuan berasal dari ID Akun yang sama). Namun, mungkin juga terjadi kebocoran label jika variabel tergantung pada label penipuan. Bergantung pada hasil analisis Anda berdasarkan pengetahuan domain Anda, Anda mungkin ingin menghapus variabel dan melatih dengan kumpulan data yang lebih beragam, atau mempertahankan model apa adanya. 

Demikian pula, lihat variabel peringkat terakhir. Jika nilai kepentingan variabel secara signifikan lebih rendah daripada nilai lainnya, maka variabel model ini mungkin tidak penting dalam melatih model Anda. Anda dapat mempertimbangkan untuk menghapus variabel untuk melatih versi model yang lebih sederhana. Jika model Anda memiliki beberapa variabel, seperti hanya dua variabel, Amazon Fraud Detector masih memberikan nilai kepentingan variabel dan memberi peringkat variabel. Namun, wawasan dalam hal ini akan terbatas. 

**penting**  
Jika Anda melihat variabel yang hilang dalam bagan **kepentingan variabel Model**, itu mungkin karena salah satu alasan berikut. Pertimbangkan untuk memodifikasi variabel dalam kumpulan data Anda dan latih kembali model Anda.   
Hitungan nilai unik untuk variabel dalam kumpulan data pelatihan lebih rendah dari 100.
Lebih besar dari 0,9 nilai untuk variabel hilang dari kumpulan data pelatihan.
Anda perlu melatih versi model baru setiap kali Anda ingin menyesuaikan variabel input model Anda.

## Mengevaluasi nilai kepentingan variabel model


Kami menyarankan Anda mempertimbangkan hal berikut ketika Anda mengevaluasi nilai kepentingan variabel model: 
+ Nilai kepentingan variabel harus selalu dievaluasi dalam kombinasi dengan pengetahuan domain.
+ Periksa nilai kepentingan variabel dari variabel relatif terhadap nilai kepentingan variabel dari variabel lain dalam versi model. Jangan mempertimbangkan nilai kepentingan variabel untuk satu variabel secara independen.
+ Bandingkan nilai kepentingan variabel dari variabel dalam versi model yang sama. Jangan membandingkan nilai kepentingan variabel dari variabel yang sama di seluruh versi model karena nilai kepentingan variabel variabel dalam versi model mungkin berbeda dari nilai variabel yang sama dalam versi model yang berbeda. Jika Anda menggunakan variabel dan kumpulan data yang sama untuk melatih versi model yang berbeda, ini tidak selalu menghasilkan nilai kepentingan variabel yang sama. 

## Melihat peringkat kepentingan variabel model


Setelah pelatihan model selesai, Anda dapat melihat peringkat kepentingan variabel model dari versi model terlatih Anda di konsol Amazon Fraud Detector atau dengan menggunakan [DescribeModelVersion](https://docs.aws.amazon.com/frauddetector/latest/api/API_DescribeModelVersions.html)API.

**Untuk melihat peringkat kepentingan variabel model menggunakan konsol,**

1. Buka AWS Konsol dan masuk ke akun Anda. Arahkan ke Amazon Fraud Detector.

1. Di panel navigasi kiri, pilih **Model**.

1. Pilih model Anda dan kemudian versi model Anda.

1. Pastikan bahwa tab **Ikhtisar** dipilih.

1. Gulir ke bawah untuk melihat panel **kepentingan variabel Model**.

## Memahami bagaimana nilai kepentingan variabel model dihitung


Setelah menyelesaikan setiap pelatihan versi model, Amazon Fraud Detector secara otomatis menghasilkan nilai kepentingan variabel model dan metrik kinerja model. Untuk ini, Amazon Fraud Detector menggunakan SHapley Additive Explanations ([SHAP](https://papers.nips.cc/paper/2017/file/8a20a8621978632d76c43dfd28b67767-Paper.pdf)). SHAP pada dasarnya adalah kontribusi rata-rata yang diharapkan dari variabel model setelah semua kemungkinan kombinasi dari semua variabel model telah dipertimbangkan. 

SHAP pertama-tama memberikan kontribusi dari setiap variabel model untuk prediksi suatu peristiwa. Kemudian, ia mengumpulkan prediksi ini untuk membuat peringkat variabel di tingkat model. Untuk menetapkan kontribusi dari setiap variabel model untuk prediksi, SHAP mempertimbangkan perbedaan dalam output model di antara semua kemungkinan kombinasi variabel. Dengan memasukkan semua kemungkinan termasuk atau menghapus set variabel tertentu untuk menghasilkan output model, SHAP dapat secara akurat mengakses pentingnya setiap variabel model. Ini sangat penting ketika variabel model sangat berkorelasi satu sama lain.

Model ML, dalam banyak kasus, tidak memungkinkan Anda untuk menghapus variabel. Sebagai gantinya, Anda dapat mengganti variabel yang dihapus atau hilang dalam model dengan nilai variabel yang sesuai dari satu atau lebih garis dasar (misalnya, peristiwa non-penipuan). Memilih instance dasar yang tepat bisa jadi sulit, tetapi Amazon Fraud Detector mempermudah hal ini dengan menetapkan baseline ini sebagai rata-rata populasi untuk Anda.

# Impor model SageMaker AI


Anda dapat secara opsional mengimpor model yang SageMaker dihosting AI ke Amazon Fraud Detector. Mirip dengan model, model SageMaker AI dapat ditambahkan ke detektor dan menghasilkan prediksi penipuan menggunakan API. `GetEventPrediction` Sebagai bagian dari `GetEventPrediction` permintaan, Amazon Fraud Detector akan memanggil titik akhir SageMaker AI Anda dan meneruskan hasilnya ke aturan Anda.

Anda dapat mengonfigurasi Amazon Fraud Detector untuk menggunakan variabel peristiwa yang dikirim sebagai bagian dari `GetEventPrediction` permintaan. Jika Anda memilih untuk menggunakan variabel acara, Anda harus memberikan template masukan. Amazon Fraud Detector akan menggunakan template ini untuk mengubah variabel event Anda menjadi payload input yang diperlukan untuk memanggil titik akhir SageMaker AI. Atau, Anda dapat mengonfigurasi model SageMaker AI Anda untuk menggunakan ByteBuffer yang dikirim sebagai bagian dari permintaan. `GetEventPrediction`

Amazon Fraud Detector mendukung pengimporan algoritme SageMaker AI yang menggunakan format input JSON atau CSV dan format keluaran JSON atau CSV. Contoh algoritma SageMaker AI yang didukung termasuk XGBoost, Linear Learner, dan Random Cut Forest.

## Impor model SageMaker AI menggunakan AWS SDK for Python (Boto3)


Untuk mengimpor model SageMaker AI, gunakan `PutExternalModel` API. Contoh berikut mengasumsikan titik akhir SageMaker AI `sagemaker-transaction-model` telah digunakan, `InService` status, dan menggunakan algoritme. XGBoost 

Konfigurasi input menentukan yang akan menggunakan variabel acara untuk membangun input model (`useEventVariables`diatur ke`TRUE`). Format input adalah TEXT\$1CSV, yang diberikan XGBoost membutuhkan input CSV. csvInputTemplate Menentukan bagaimana membangun input CSV dari variabel yang dikirim sebagai bagian dari permintaan. `GetEventPrediction` Contoh ini mengasumsikan Anda telah membuat variabel`order_amt`,`prev_amt`, `hist_amt` dan`payment_type`.

Konfigurasi output menentukan format respons model SageMaker AI, dan memetakan indeks CSV yang sesuai ke variabel Amazon Fraud Detector. `sagemaker_output_score` Setelah dikonfigurasi, Anda dapat menggunakan variabel output dalam aturan. 

**catatan**  
Output dari model SageMaker AI harus dipetakan ke variabel dengan sumber`EXTERNAL_MODEL_SCORE`. Anda tidak dapat membuat variabel ini di konsol menggunakan **Variabel**. Sebagai gantinya, Anda harus membuatnya saat mengonfigurasi impor model Anda.

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.put_external_model (
modelSource = 'SAGEMAKER',
modelEndpoint = 'sagemaker-transaction-model',
invokeModelEndpointRoleArn = 'your_SagemakerExecutionRole_arn',
inputConfiguration = {
    'useEventVariables' : True,
    'eventTypeName' : 'sample_transaction',
    'format' : 'TEXT_CSV',
    'csvInputTemplate' : '{{order_amt}}, {{prev_amt}}, {{hist_amt}}, {{payment_type}}'
},

outputConfiguration = {
    'format' : 'TEXT_CSV',
    'csvIndexToVariableMap' : {
        '0' : 'sagemaker_output_score'
    }
},
    
modelEndpointStatus = 'ASSOCIATED'
)
```

# Hapus model atau versi model


Anda dapat menghapus model dan versi model di Amazon Fraud Detector, asalkan tidak terkait dengan versi detektor. Saat Anda menghapus model, Amazon Fraud Detector menghapus model tersebut secara permanen dan data tidak lagi disimpan di Amazon Fraud Detector.

 Anda juga dapat menghapus model Amazon SageMaker AI jika tidak terkait dengan versi detektor. Menghapus model SageMaker AI memutusnya dari Amazon Fraud Detector, tetapi model tersebut tetap tersedia di SageMaker AI.

**Untuk menghapus versi model**

Anda hanya dapat menghapus versi model yang ada dalam `Ready to deploy` status. Untuk mengubah versi model dari `ACTIVE` `Ready to deploy` status, hapus penerapan versi model.

1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon Fraud Detector di [https://console.aws.amazon.com/frauddetector](https://console.aws.amazon.com/frauddetector).

1. Di panel navigasi kiri konsol Amazon Fraud Detector, pilih **Model**.

1. Pilih model yang berisi versi model yang ingin Anda hapus.

1. Pilih versi model yang ingin Anda hapus.

1. Pilih **Tindakan**, lalu pilih **Hapus**.

1. Masukkan nama versi model, lalu pilih **Hapus versi model**.

**Untuk membatalkan penerapan versi model**

Anda tidak dapat membatalkan penerapan versi model yang digunakan oleh versi detektor apa pun (`ACTIVE`,`INACTIVE`,`DRAFT`). Oleh karena itu, untuk membatalkan penerapan versi model yang digunakan oleh versi detektor, pertama-tama hapus versi model dari versi detektor. 

1. Di panel navigasi kiri konsol Amazon Fraud Detector, pilih **Model**.

1. Pilih model yang berisi versi model yang ingin Anda hapus penerapannya.

1. Pilih versi model yang ingin Anda hapus.

1. Pilih **Tindakan**, lalu pilih **Undeploy versi model**.

**Untuk menghapus model**

Sebelum menghapus model, Anda harus terlebih dahulu menghapus semua versi model dan dikaitkan dengan model.

1. Di panel navigasi kiri konsol Amazon Fraud Detector, pilih **Model**.

1. Pilih model yang ingin Anda hapus.

1. Pilih **Tindakan**, lalu pilih **Hapus**.

1. Masukkan nama model, lalu pilih **Hapus model**.

**Untuk menghapus model SageMaker AI Amazon**

1. Di panel navigasi kiri konsol Amazon Fraud Detector, pilih **Model**.

1. Pilih model SageMaker AI yang ingin Anda hapus.

1. Pilih **Tindakan**, lalu pilih **Hapus model**.

1. Masukkan nama model dan kemudian pilih **Hapus model SageMaker AI**.