

自 2025 年 11 月 7 日起，Amazon Fraud Detector 不再向新客戶開放。對於類似 Amazon Fraud Detector 的功能，請探索 Amazon SageMaker、AutoGluon 和 AWS WAF。

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用批次匯入存放事件資料
<a name="storing-events-batch-import"></a>

使用批次匯入功能，您可以使用主控台、API 或 AWS 開發套件，在 Amazon Fraud Detector 中快速輕鬆地上傳大型歷史事件資料集。若要使用批次匯入，請以 CSV 格式建立包含所有事件資料的輸入檔案，將 CSV 檔案上傳至 Amazon S3 儲存貯體，然後啟動*匯入*任務。Amazon Fraud Detector 會先根據事件類型驗證資料，然後自動匯入整個資料集。匯入資料後，即可用於訓練新模型或重新訓練現有模型。

## 輸入和輸出檔案
<a name="input-output-batch"></a>

輸入 CSV 檔案必須包含符合相關聯事件類型中定義的變數加上四個必要變數的標頭。如需詳細資訊，請參閱[準備儲存的事件資料](prepare-storage-event-data.md)。輸入資料檔案的大小上限為 20 GB (GB) 或約 5000 萬個事件。事件數量將根據您的事件大小而有所不同。如果匯入任務成功，則輸出檔案為空。如果匯入失敗，輸出檔案會包含錯誤日誌。

## 建立 CSV 檔案
<a name="create-csv-stored-data"></a>

Amazon Fraud Detector 只會從逗號分隔值 (CSV) 格式的檔案匯入資料。CSV 檔案的第一列必須包含與相關聯事件類型中定義的變數完全相符的資料欄標頭，以及四個強制性變數：EVENT\$1ID、EVENT\$1TIMESTAMP、ENTITY\$1ID 和 ENTITY\$1TYPE。您也可以選擇性地包含 EVENT\$1LABEL 和 LABEL\$1TIMESTAMP （如果包含 EVENT\$1LABEL，則需要 LABEL\$1TIMESTAMP)。

**定義強制性變數**

強制性變數視為事件中繼資料，必須以大寫指定。事件中繼資料會自動包含在模型訓練中。下表列出強制變數、每個變數的描述，以及變數的必要格式。


| 名稱 | 描述 | 要求 | 
| --- | --- | --- | 
|  EVENT\$1ID  |  事件的識別符。例如，如果您的事件是線上交易，EVENT\$1ID 可能是提供給您客戶的交易參考號碼。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/storing-events-batch-import.html)  | 
|  EVENT\$1TIMESTAMP  |  事件發生時的時間戳記。時間戳記必須在 UTC 的 ISO 8601 標準中。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/storing-events-batch-import.html)  | 
|  ENTITY\$1ID  |  執行事件之實體的識別符。  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/storing-events-batch-import.html)  | 
|  ENTITY\$1TYPE  |  執行事件的實體，例如商家或客戶  |  批次匯入任務需要 ENTITY\$1TYPE  | 
|  EVENT\$1LABEL  |  將事件分類為 `fraudulent`或 `legitimate`  |  如果包含 LABEL\$1TIMESTAMP，則需要 EVENT\$1LABEL  | 
|  LABEL\$1TIMESTAMP  |  事件標籤上次填入或更新的時間戳記  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_tw/frauddetector/latest/ug/storing-events-batch-import.html)  | 

## 將 CSV 檔案上傳至 Amazon S3 以進行批次匯入
<a name="upload-csv-S3-for-batch-import"></a>

使用資料建立 CSV 檔案後，請將檔案上傳至 Amazon Simple Storage Service (Amazon S3) 儲存貯體。

**將事件資料上傳至 Amazon S3 儲存貯體**

1. 登入 AWS 管理主控台 ，並在 [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)：// 開啟 Amazon S3 主控台。

1. 選擇 **Create bucket** (建立儲存貯體)。

   **Create bucket (建立儲存貯體)** 精靈會開啟。

1. 在 **Bucket name (儲存貯體名稱)** 中，為儲存貯體輸入符合 DNS 規範的名稱。

   儲存貯體名稱必須；
   + 在所有 Amazon S3 中都為唯一。
   + 長度必須介於 3 與 63 個字元之間。
   + 不含大寫字元。
   + 以小寫字母或數字開頭。

   建立儲存貯體後，便無法變更其名稱。如需有關命名儲存貯體的資訊，請參閱《*Amazon Simple Storage Service 使用者指南*》中的[儲存貯體命名規則](https://docs.aws.amazon.com/AmazonS3/latest/userguide/BucketRestrictions.html#bucketnamingrules)。
**重要**  
避免在儲存貯體名稱中包含敏感資訊，例如帳戶號碼。在指向儲存貯體中之物件的 URL 中，會顯示儲存貯體名稱。

1. 在**區域中**，選擇您要儲存貯體所在的 AWS 區域。您必須選取您使用 Amazon Fraud Detector 的相同區域，即美國東部 （維吉尼亞北部）、美國東部 （俄亥俄）、美國西部 （奧勒岡）、歐洲 （愛爾蘭）、亞太區域 （新加坡） 或亞太區域 （雪梨）。

1. 在 **Bucket settings for Block Public Access (封鎖公開存取的儲存貯體設定)** 中，選擇要套用至儲存貯體的封鎖公開存取設定。

   建議您將所有設定保持啟用狀態。如需封鎖公開存取的詳細資訊，請參閱《[Amazon Simple Storage Service 使用者指南》中的封鎖對 Amazon S3 儲存體的公開存取](https://docs.aws.amazon.com/AmazonS3/latest/dev/access-control-block-public-access.html)。 **

1. 選擇**建立儲存貯體**。

1. 將訓練資料檔案上傳至您的 Amazon S3 儲存貯體。請注意訓練檔案的 Amazon S3 位置路徑 （例如 s3：//bucketname/object.csv)。

## Amazon Fraud Detector 主控台中的批次匯入事件資料
<a name="batch-import-event-data"></a>

您可以使用 `CreateBatchImportJob` API 或使用 AWS 開發套件，在 Amazon Fraud Detector 主控台中輕鬆匯入大量事件資料集。在繼續之前，請確定您已遵循將資料集準備為 CSV 檔案的指示。請確定您也將 CSV 檔案上傳到 Amazon S3 儲存貯體。

**使用 Amazon Fraud Detector 主控台**

**在主控台中批次匯入事件資料**

1. 開啟 AWS 主控台並登入您的帳戶，然後導覽至 Amazon Fraud Detector。

1. 在左側導覽窗格中，選擇**事件**。

1. 選擇您的事件類型。

1. 選取**儲存的事件**索引標籤。

1. 在**儲存的事件詳細資訊**窗格中，確定**事件擷取**為 **ON**。

1. 在**匯入事件資料**窗格中，選擇**新匯入**。

1. 在**新事件匯入**頁面中，提供下列資訊：
   + 【建議】 保留**此資料集的啟用智慧資料驗證 - 將新**設定為預設設定。
   + 針對**資料的 IAM 角色**，選取您為 Amazon S3 儲存貯體建立的 IAM 角色，該儲存貯體包含您計劃匯入的 CSV 檔案。
   + 針對**輸入資料位置**，輸入您擁有 CSV 檔案的 S3 位置。
   + 如果您想要指定個別位置來存放匯入結果，請按一下用於**輸入和結果的個別資料位置**按鈕，並提供有效的 Amazon S3 儲存貯體位置。
**重要**  
請確定您選取的 IAM 角色具有輸入 Amazon S3 儲存貯體的讀取許可，並將許可寫入輸出 Amazon S3 儲存貯體。

1. 選擇 **開始使用**。

1. **匯入事件資料**窗格中**的狀態**欄會顯示驗證和匯入任務的狀態。當您的資料集先經過驗證，然後匯入時，頂端的橫幅會提供狀態的高階描述。

1. 遵循提供給 的指引[監控資料集驗證和匯入任務的進度](#monitor-progress-sdv)。

### 監控資料集驗證和匯入任務的進度
<a name="monitor-progress-sdv"></a>

如果您使用 Amazon Fraud Detector 主控台執行批次匯入任務，Amazon Fraud Detector 預設會在匯入之前驗證您的資料集。您可以在 Amazon Fraud Detector 主控台**的新事件匯入**頁面中監控驗證和匯入任務的進度和狀態。頁面頂端的橫幅提供驗證問題清單和匯入任務狀態的簡短描述。根據驗證問題清單和匯入任務的狀態，您可能需要採取動作，以確保成功驗證和匯入資料集。

下表根據驗證和匯入操作的結果，提供您必須採取之動作的詳細資訊。


| 橫幅訊息 | 狀態 | 代表什麼意思 | 我應該做什麼 | 
| --- | --- | --- | --- | 
| 資料驗證已開始 | 驗證進行中 | SDV 已開始驗證您的資料集 | 等待狀態變更 | 
| 由於資料集發生錯誤，資料驗證無法繼續。修正資料檔案中的錯誤，並啟動新的匯入任務。如需詳細資訊，請參閱驗證報告 | 驗證失敗 | SDV 已識別資料檔案中的問題。必須解決這些問題，才能成功匯入資料集。 | 在匯入事件資料窗格中，選取任務 ID 並檢視驗證報告。遵循報告中的建議來解決列出的所有錯誤。如需詳細資訊，請參閱[使用驗證報告](#using-sdv-validation-report)。 | 
| 資料匯入已開始。驗證已成功完成 | 匯入進行中 | 您的資料集已通過驗證。AFD 已開始匯入您的資料集 | 等待狀態變更 | 
| 驗證已完成，並出現警告。資料匯入已開始 | 匯入進行中 | 資料集中的部分資料驗證失敗。不過，通過驗證的資料符合匯入的最低資料大小要求。 | 監控橫幅中的訊息，並等待狀態變更 | 
| 您的資料已部分匯入。部分資料未通過驗證且未匯入。如需詳細資訊，請參閱驗證報告。 | 已匯入。狀態會顯示警告圖示。 | 資料檔案中失敗驗證的部分資料並未匯入。已匯入通過驗證的其餘資料。 | 在匯入事件資料窗格中，選取任務 ID 並檢視驗證報告。遵循資料層級警告表格中的建議，以處理列出的警告。您不需要處理所有警告。不過，請確定您的資料集有超過 50% 的資料通過驗證才能成功匯入。解決警告之後，請啟動新的匯入任務。如需詳細資訊，請參閱[使用驗證報告](#using-sdv-validation-report)。 | 
| 由於處理錯誤，資料匯入失敗。啟動新的資料匯入任務 | 匯入失敗 | 由於暫時性執行時間錯誤，匯入失敗 | 啟動新的匯入任務 | 
| 已成功匯入資料 | 已匯入 | 驗證和匯入都成功完成 | 選取匯入任務的任務 ID 以檢視詳細資訊，然後繼續模型訓練 | 

**注意**  
我們建議您在資料集成功匯入 Amazon Fraud Detector 後等待 10 分鐘，以確保系統完全擷取它們。

### 智慧資料驗證報告
<a name="sdv-validation-report"></a>

智慧資料驗證會在驗證完成後建立驗證報告。驗證報告提供 SDV 在資料集中識別的所有問題的詳細資訊，並提供建議的動作來修正最具影響力的問題。您可以使用驗證報告來判斷問題是什麼、問題在資料集中的位置、問題的嚴重性，以及如何修正這些問題。即使驗證成功完成，也會建立驗證報告。在這種情況下，您可以檢視報告，以查看是否有任何列出的問題，如果有的話，請決定您是否要修正其中任何問題。

**注意**  
目前版本的 SDV 會掃描資料集，找出可能導致批次匯入失敗的問題。如果驗證和批次匯入成功，您的資料集仍有可能導致模型訓練失敗的問題。即使驗證和匯入成功，仍建議您檢視驗證報告，並解決報告中列出的任何問題，以成功訓練模型。解決問題後，請建立新的批次匯入任務。

**存取驗證報告**

您可以在驗證完成後，使用下列其中一個選項隨時存取驗證報告：

1. 驗證完成後，並在匯入任務進行時，在頂端橫幅中，選擇**檢視驗證報告**。

1. 匯入任務完成後，在**匯入事件資料**窗格中，選擇剛完成之匯入任務的任務 ID。

#### 使用驗證報告
<a name="using-sdv-validation-report"></a>

匯入任務的驗證報告頁面提供此匯入任務的詳細資訊、找到任何重大錯誤的清單、找到資料集中特定事件 （資料列） 的警告清單，以及包含無效值和每個變數缺少值等資訊的資料集簡短摘要。
+ **匯入任務詳細資訊**

  提供匯入任務的詳細資訊。如果您的匯入任務失敗或資料集已部分匯入，請選擇**移至結果檔案**，以檢視無法匯入之事件的錯誤日誌。
+ **嚴重錯誤**

  提供 SDV 所識別之資料集中最具影響力問題的詳細資訊。此窗格中列出的所有問題都很重要，您必須先解決這些問題，才能繼續匯入。如果您嘗試匯入資料集而不解決關鍵問題，匯入任務可能會失敗。

  若要解決關鍵問題，請遵循針對每個警告提供的建議。在您解決重大錯誤窗格中列出的所有問題之後，請建立新的批次匯入任務。
+ **資料層級警告**

  提供資料集中特定事件 （資料列） 的警告摘要。如果已填入資料層級警告窗格，則資料集中的某些事件驗證失敗，且未匯入。

  對於每個警告，**描述**欄會顯示有問題的事件數量。而**範例事件 IDs** 會提供範例事件 IDs的部分清單，您可以用來做為起點，以找出有問題的其餘事件。使用針對警告提供**的建議**來修正問題。另請使用輸出檔案中的錯誤日誌，以取得有關問題的其他資訊。錯誤日誌會針對批次匯入失敗的所有事件產生。若要存取錯誤日誌，請在**匯入任務詳細資訊**窗格中，選擇**移至結果檔案**。
**注意**  
如果資料集中超過 50% 的事件 （資料列） 驗證失敗，匯入任務也會失敗。在此情況下，您必須先修正資料，才能開始新的匯入任務。
+ **資料集摘要** 

   提供資料集驗證報告的摘要。如果警告數量欄顯示超過 0 個警告，請決定是否需要修正這些警告。如果**警告數目**欄顯示 0 秒，請繼續訓練您的模型。

## 使用適用於 Python 的 AWS 開發套件 (Boto3) 批次匯入事件資料
<a name="batch-import-data-sdk"></a>

下列範例顯示 [CreateBatchImportJob](https://docs.aws.amazon.com//frauddetector/latest/api/API_CreateBatchImportJob.html) API 的範例請求。批次匯入任務必須包含 **jobID**、**inputPath**、**outputPath**、 **eventTypeName** 和 **iamRoleArn**。除非任務處於 CREATE\$1FAILED 狀態，否則 jobID 不能包含過去任務的相同 ID。inputPath 和 outputPath 必須是有效的 S3 路徑。您可以選擇退出在 outputPath 中指定檔案名稱，不過，您仍然需要提供有效的 S3 儲存貯體位置。eventTypeName 和 iamRoleArn 必須存在。IAM 角色必須授予輸入 Amazon S3 儲存貯體的讀取許可，以及輸出 Amazon S3 儲存貯體的寫入許可。

```
import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.create_batch_import_job (
jobId = 'sample_batch_import',
inputPath = 's3://bucket_name/input_file_name.csv',
outputPath = 's3://bucket_name/',
eventTypeName = 'sample_registration',
iamRoleArn: 'arn:aws:iam::************:role/service-role/AmazonFraudDetector-DataAccessRole-*************'
)
```

## 取消批次匯入任務
<a name="cancel-batch-import"></a>

您可以使用 `CancelBatchImportJob` API 或 AWS 開發套件，隨時在 Amazon Fraud Detector 主控台中取消進行中的批次匯入任務。

**若要取消主控台中的批次匯入任務，**

1. 開啟 AWS 主控台並登入您的帳戶，然後導覽至 Amazon Fraud Detector。

1. 在左側導覽窗格中，選擇**事件**。

1. 選擇您的事件類型。

1. 選取**儲存的事件**索引標籤。

1. 在**匯入事件資料**窗格中，選擇您要取消之進行中匯入任務的任務 ID。

1. 在事件任務頁面中，按一下**動作**，然後選取**取消事件匯入**。

1. 選擇**停止事件匯入**以取消批次匯入任務。

### 使用適用於 Python 的 AWS 開發套件 (Boto3) 取消批次匯入任務
<a name="cancel-batch-import-sdk"></a>

下列範例顯示 `CancelBatchImportJob` API 的範例請求。取消匯入任務必須包含進行中批次匯入任務的任務 ID。

```
import boto3
fraudDetector = boto3.client('frauddetector')
fraudDetector.cancel_batch_import_job (
    jobId = 'sample_batch'
)
```