

自 2025 年 11 月 7 日起，Amazon Fraud Detector 不再向新客戶開放。對於類似 Amazon Fraud Detector 的功能，請探索 Amazon SageMaker、AutoGluon 和 AWS WAF。

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 選擇模型類型
<a name="choosing-model-type"></a>

Amazon Fraud Detector 提供下列模型類型。選擇適用於您的使用案例的模型類型。
+ **線上詐騙洞見**

  *線上詐騙洞見*模型類型經過最佳化，可在評估實體的歷史資料很少時偵測詐騙，例如，新客戶在線上註冊新帳戶。
+ **交易詐騙洞見**

  *Transaction Fraud Insights* 模型類型最適合用於偵測正在評估的實體可能有互動歷史記錄的詐騙使用案例，該模型可以分析這些案例來改善預測準確性 （例如，具有過去購買歷史記錄的現有客戶）。
+ **帳戶接管洞見**

  *帳戶接管洞見*模型類型會偵測帳戶是否遭到網路釣魚或其他類型的攻擊入侵。遭入侵帳戶的登入資料，例如登入時所使用的瀏覽器和裝置，與與帳戶相關聯的歷史登入資料不同。

# 線上詐騙洞察
<a name="online-fraud-insights"></a>

Online Fraud Insights 是一種受監督的機器學習模型，這表示它使用詐騙和合法交易的歷史範例來訓練模型。線上詐騙洞見模型可以根據少量的歷史資料偵測詐騙。模型的輸入具有彈性，因此您可以進行調整以偵測各種詐騙風險，包括仿造審查、提升濫用和訪客結帳詐騙。

Online Fraud Insights 模型使用機器學習演算法的組合，進行資料擴充、轉換和詐騙分類。在模型訓練過程中，Online Fraud Insights 會使用第三方資料來豐富原始資料元素，例如 IP 地址和 BIN 號碼，例如 IP 地址的地理位置或信用卡的發行銀行。除了第三方資料之外，線上詐騙洞見還使用深度學習演算法，將 Amazon 和 所見的詐騙模式納入考量 AWS。這些詐騙模式會使用梯度樹提升演算法，成為模型的輸入功能。

為了提高效能，線上 Fraud Insights 會透過貝葉斯最佳化程序來最佳化梯度樹狀提升演算法的超參數。它會依序訓練數十種具有不同模型參數的不同模型 （例如樹的數量、樹的深度，以及每個分葉的樣本數量）。它也會使用不同的最佳化策略，例如加碼少數族群詐騙人口，以處理極低的詐騙率。

## 選取資料來源
<a name="selecting-training-data-source-OFI"></a>

訓練線上詐騙洞見模型時，您可以選擇針對存放在外部 (Amazon Fraud Detector 外部） 或存放在 Amazon Fraud Detector 中的事件資料來訓練模型。Amazon Fraud Detector 目前支援的外部儲存體是 Amazon Simple Storage Service (Amazon S3)。如果您的 使用外部儲存，您的事件資料集必須以逗號分隔值 (CSV) 格式上傳至 Amazon S3 儲存貯體。這些資料儲存選項在模型訓練組態中稱為 EXTERNAL\$1EVENTS （適用於外部儲存） 和 INGESTED\$1EVENTS （適用於內部儲存）。如需可用資料來源以及如何將資料存放在其中的詳細資訊，請參閱 [事件資料儲存](event-data-storage.md)。

## 準備資料
<a name="preparing-training-data-OFI"></a>

無論您選擇在何處存放事件資料 (Amazon S3 或 Amazon Fraud Detector)，線上詐騙洞見模型類型的需求都相同。

您的資料集必須包含資料欄標頭 EVENT\$1LABEL。此變數會將事件分類為詐騙或合法。使用 CSV 檔案 （外部儲存） 時，您必須在檔案中包含每個事件的 EVENT\$1LABEL。對於內部儲存，EVENT\$1LABEL 欄位是選用的，但所有事件都必須標記為包含在訓練資料集內。設定模型訓練時，您可以選擇是否忽略未標記的事件、假設未標記事件的合法標籤，或假設所有未標記事件的詐騙標籤。

## 選取資料
<a name="selecting-training-data-OFI"></a>

如需選擇資料以訓練線上詐騙洞見模型的相關資訊，請參閱[收集事件](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#gather-event-data)資料。

Online Fraud Insights 訓練會根據 EVENT\$1TIMESTAMP 處理範例和分割歷史資料。您不需要手動取樣資料，這樣做可能會對您的模型結果產生負面影響。

## 事件變數
<a name="input-variables-OFI"></a>

除了必要的事件中繼資料之外，線上詐騙洞見模型至少需要兩個變數，這些變數已通過模型訓練[的資料驗證](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)，每個模型最多允許 100 個變數。一般而言，您提供的變數越多，模型越能區分詐騙和合法事件。雖然線上詐騙洞見模型可以支援數十種變數，包括自訂變數，但我們建議您包含 IP 地址和電子郵件地址，因為這些變數通常最有效地識別要評估的實體。

## 驗證資料
<a name="training-data-validations-OFI"></a>

作為訓練程序的一部分，線上詐騙洞見將驗證資料集是否有可能影響模型訓練的資料品質問題。驗證資料之後，Amazon Fraud Detector 會採取適當的動作來建置最佳的可能模型。這包括發出潛在資料品質問題的警告、自動移除具有資料品質問題的變數，或發出錯誤並停止模型訓練程序。如需詳細資訊，請參閱[資料集驗證](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)。

# 交易詐騙洞察
<a name="transaction-fraud-insights"></a>

Transaction Fraud Insights 模型類型旨在偵測線上或card-not-present的交易詐騙。Transaction Fraud Insights 是受監督的機器學習模型，這表示它使用詐騙和合法交易的歷史範例來訓練模型。

Transaction Fraud Insights 模型使用機器學習演算法的組合，以進行資料擴充、轉換和詐騙分類。它利用特徵工程引擎來建立實體層級和事件層級彙總。在模型訓練過程中， Transaction Fraud Insights 會使用第三方資料來豐富原始資料元素，例如 IP 地址和 BIN 號碼，例如 IP 地址的地理位置或信用卡的發行銀行。除了第三方資料之外， Transaction Fraud Insights 還使用深度學習演算法，將 Amazon 所見的詐騙模式納入考量，而 AWS 這些詐騙模式會使用梯度樹增強演算法成為模型的輸入功能。

為了提高效能， Transaction Fraud Insights 會透過貝葉斯最佳化程序最佳化梯度樹提升演算法的超參數，依序訓練數十種具有不同模型參數的不同模型 （例如樹的數量、樹深度、每個葉子的樣本數量），以及不同的最佳化策略，例如加權少數族群以處理極低的詐騙率。

作為模型訓練程序的一部分，交易詐騙模型的功能工程引擎會計算訓練資料集內每個唯一實體的值，以協助改善詐騙預測。例如，在訓練過程中，Amazon Fraud Detector 會計算和儲存實體上次進行購買的時間，並在每次呼叫 `GetEventPrediction`或 `SendEvent` API 時動態更新此值。在詐騙預測期間，事件變數會與其他實體和事件中繼資料結合，以預測交易是否為詐騙。

## 選取資料來源
<a name="selecting-training-data-source-TFI"></a>

Transaction Fraud Insights 模型僅在使用 Amazon Fraud Detector (INGESTED\$1EVENTS) 內部存放的資料集上進行訓練。這可讓 Amazon Fraud Detector 持續更新您正在評估之實體的計算值。如需可用資料來源的詳細資訊，請參閱 [事件資料儲存](event-data-storage.md)

## 準備資料
<a name="preparing-training-data-TFI"></a>

訓練交易詐騙洞見模型之前，請確定您的資料檔案包含[準備事件資料集](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#prepare-event-dataset)中所述的所有標頭。Transaction Fraud Insights 模型會將收到的新實體與資料集中的詐騙和合法實體範例進行比較，因此為每個實體提供許多範例會很有幫助。

Amazon Fraud Detector 會自動將儲存的事件資料集轉換為正確的訓練格式。模型完成訓練後，您可以檢閱效能指標，並判斷是否應將實體新增至訓練資料集。

## 選取資料
<a name="selecting-training-data-TFI"></a>

根據預設，交易詐騙洞見會針對您選取的事件類型，針對您的整個儲存資料集進行訓練。您可以選擇性地設定時間範圍，以減少用於訓練模型的事件。設定時間範圍時，請確保用於訓練模型的記錄有足夠的時間成熟。也就是說，已過足夠的時間，以確保已正確識別合法和詐騙記錄。例如，對於扣款詐騙，通常需要 60 天或更長時間才能正確識別詐騙事件。為了獲得最佳模型效能，請確保訓練資料集中的所有記錄都已成熟。

您不需要選取代表理想詐騙率的時間範圍。Amazon Fraud Detector 會自動取樣您的資料，以在詐騙率、時間範圍和實體計數之間取得平衡。

如果您選擇的事件不足以成功訓練模型的時間範圍，Amazon Fraud Detector 會在模型訓練期間傳回驗證錯誤。對於儲存的資料集，EVENT\$1LABEL 欄位是選用的，但事件必須標記為包含在訓練資料集中。設定模型訓練時，您可以選擇是否忽略未標記的事件、擔任未標記事件的合法標籤，或擔任未標記事件的詐騙標籤。

## 事件變數
<a name="input-variables-TFI"></a>

除了必要的事件中繼資料之外，用於訓練模型的事件類型必須包含至少 2 個變數，這些變數已通過[資料驗證](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)，且最多可包含 100 個變數。一般而言，您提供的變數越多，模型越能區分詐騙和合法事件。雖然 Transaction Fraud Insight 模型可以支援數十個變數，包括自訂變數，但我們建議您包含 IP 地址、電子郵件地址、付款工具類型、訂單價格和卡片 BIN。

## 驗證資料
<a name="training-data-validations-TFI"></a>

在訓練過程中， Transaction Fraud Insights 會驗證訓練資料集是否有可能影響模型訓練的資料品質問題。驗證資料之後，Amazon Fraud Detector 會採取適當的動作來建置最佳的可能模型。這包括發出潛在資料品質問題的警告、自動移除具有資料品質問題的變數，或發出錯誤並停止模型訓練程序。如需詳細資訊，請參閱[資料集驗證](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)。

Amazon Fraud Detector 會發出警告，但如果唯一實體的數量小於 1，500，則繼續訓練模型，因為這可能會影響訓練資料的品質。如果您收到警告，請檢閱[效能指標](training-performance-metrics.md)。

# 帳戶接管洞察
<a name="account-takeover-insights"></a>

帳戶接管洞察 (ATI) 模型類型透過偵測帳戶是否因惡意接管、網路釣魚或登入資料遭竊而遭到入侵，來識別詐騙線上活動。Account Takeover Insights 是一種機器學習模型，使用線上業務的登入事件來訓練模型。

您可以在即時登入流程中嵌入訓練過的帳戶接管洞見模型，以偵測帳戶是否遭到入侵。此模型會評估各種身分驗證和登入類型。其中包括 Web 應用程式登入、API 型身分驗證和single-sign-on(SSO)。若要使用帳戶接管洞見模型，請在顯示有效的登入憑證後呼叫 [GetEventPrediction](https://docs.aws.amazon.com/frauddetector/latest/api/API_GetEventPrediction.html) API。API 會產生分數，以量化帳戶遭到入侵的風險。Amazon Fraud Detector 會使用分數和您定義的規則來傳回登入事件的一或多個結果。結果是您設定的結果。根據您收到的結果，您可以針對每次登入採取適當的動作。也就是說，您可以核准或挑戰為登入提供的登入資料。例如，您可以要求帳戶 PIN 做為額外的驗證來挑戰登入資料。

您也可以使用帳戶接管洞見模型，以非同步方式評估帳戶登入，並對高風險帳戶採取動作。例如，可將高風險帳戶新增至人工檢閱者的調查佇列，以判斷是否需要採取進一步動作，例如暫停帳戶。

帳戶接管洞見模型使用包含您業務歷史登入事件的資料集進行訓練。您提供此資料。您可以選擇將帳戶標記為合法或詐騙。不過，這並非訓練模型的必要條件。帳戶接管洞見模型會根據帳戶成功登入的歷史記錄來偵測異常。它還了解如何偵測使用者行為中的異常，這些異常表示惡意帳戶接管事件的風險增加。例如，通常從同一組裝置和 IP 地址登入的使用者。詐騙者通常會從不同的裝置和地理位置登入。此技術會產生異常活動的風險分數，通常是惡意帳戶接管的主要特徵。

在訓練 Account Takeover Insights 模型之前，Amazon Fraud Detector 會使用機器學習技術的組合來執行資料擴充、資料彙總和資料轉換。然後，在訓練過程中，Amazon Fraud Detector 會充實您提供的原始資料元素。原始資料元素的範例包括 IP 地址和使用者代理程式。Amazon Fraud Detector 使用這些元素來建立描述登入資料的其他輸入。這些輸入包括裝置、瀏覽器和地理位置輸入。Amazon Fraud Detector 也會使用您提供的登入資料，持續運算描述過去使用者行為的彙總變數。使用者行為的範例包括使用者從特定 IP 地址登入的次數。Amazon Fraud Detector 可以使用這些額外的擴充功能和彙總功能，從登入事件的一小組輸入產生強大的模型效能。

Account Takeover Insights 模型會偵測合法帳戶遭惡意行為者存取的執行個體，無論惡意行為者是人類還是機器人。此模型會產生單一分數，指出帳戶遭到入侵的相對風險。可能已遭入侵的帳戶會標記為高風險帳戶。您可以透過兩種方式之一來處理高風險帳戶。您可以強制執行額外的身分驗證。或者，您可以將帳戶傳送至佇列以進行手動調查。

## 選取資料來源
<a name="selection-training-data-source-ATI"></a>

Account Takeover Insights 模型是在 Amazon Fraud Detector 內部存放的資料集上進行訓練。若要使用 Amazon Fraud Detector 存放您的登入事件資料，請使用 使用者的登入事件建立 CSV 檔案。對於每個事件，包括登入資料，例如事件時間戳記、使用者 ID、IP 地址、使用者代理程式，以及登入資料是否有效。建立 CSV 檔案後，請先將檔案上傳至 Amazon Fraud Detector，然後使用匯入功能來存放資料。然後，您可以使用儲存的資料來訓練模型。如需使用 Amazon Fraud Detector 存放事件資料集的詳細資訊，請參閱 [使用 Amazon Fraud Detector 在內部存放事件資料](storing-event-data-afd.md)

## 準備資料
<a name="preparing-training-data-ATI"></a>

Amazon Fraud Detector 要求您以以 UTF-8 格式編碼的逗號分隔值 (CSV) 檔案提供使用者帳戶登入資料。CSV 檔案的第一行必須包含檔案標頭。檔案標頭包含描述每個資料元素的事件中繼資料和事件變數。事件資料遵循 標頭。事件資料中的每一行都包含來自單一登入事件的資料。

對於帳戶接管洞見模型，您必須在 CSV 檔案的標頭列中提供下列事件中繼資料和事件變數。

** 事件中繼資料**

我們建議您在 CSV 檔案標頭中提供下列中繼資料。事件中繼資料必須為大寫字母。
+ EVENT\$1ID - 登入事件的唯一識別符。
+ ENTITY\$1TYPE - 執行登入事件的實體，例如商家或客戶。
+ ENTITY\$1ID - 執行登入事件之實體的識別符。
+ EVENT\$1TIMESTAMP - 發生登入事件時的時間戳記。時間戳記必須在 UTC 的 ISO 8601 標準中。
+ EVENT\$1LABEL （建議） - 將事件分類為詐騙或合法的標籤。您可以使用任何標籤，例如「詐騙」、「合法」、「1」或「0」。

**注意**  
事件中繼資料必須為大寫字母。區分大小寫。
登入事件不需要標籤。不過，我們建議您包含 EVENT\$1LABEL 中繼資料，並提供登入事件的標籤。如果標籤不完整或為零星，就沒問題。如果您提供標籤，Amazon Fraud Detector 將使用它們自動計算帳戶接管探索率，並將其顯示在模型效能圖表和資料表中。

** 事件變數**

對於帳戶接管洞見模型，您必須提供所需的 （強制性） 變數和選用變數。建立變數時，請務必將變數指派給正確的變數類型。作為模型訓練程序的一部分，Amazon Fraud Detector 會使用與 變數相關聯的變數類型來執行變數擴充和功能工程。

**注意**  
事件變數名稱必須為小寫字母。它們區分大小寫。

**強制性變數**

訓練 Accounts Takeover Insights 模型需要下列變數。


| Category | 變數類型 | Description | 
| --- | --- | --- | 
| IP 位址 | IP\$1ADDRESS | 登入事件中使用的 IP 地址 | 
| 瀏覽器和裝置 | USERAGENT | 登入事件中使用的瀏覽器、裝置和作業系統 | 
| 有效的登入資料 | VALIDCRED | 指出用於登入的登入資料是否有效 | 

**選用變數**

下列變數是訓練 Accounts Takeover Insights 模型的選用變數。


| Category | Type | 說明 | 
| --- | --- | --- | 
| 瀏覽器和裝置 | FINGERPRINT | 瀏覽器或裝置指紋的唯一識別符 | 
| 工作階段 ID | SESSION\$1ID | 身分驗證工作階段的識別符 | 
| 標籤 | EVENT\$1LABEL | 將事件分類為詐騙或合法的標籤。您可以使用任何標籤，例如「詐騙」、「合法」、「1」或「0」。 | 
| 時間戳記 | LABEL\$1TIMESTAMP | 上次更新標籤時的時間戳記。如果提供 EVENT\$1LABEL，則此為必要項目。 | 

**注意**  
您可以為兩個強制性變數選用變數提供任何變數名稱。請務必將每個必要和選用變數指派給正確的變數類型。
您可以提供額外的變數。不過，Amazon Fraud Detector 不會包含這些變數來訓練 Accounts Takeover Insights 模型。

## 選取資料
<a name="selecting-training-data-ATI"></a>

收集資料是建立帳戶接管洞見模型的重要步驟。當您開始收集登入資料時，請考慮下列要求和建議：

**必要**
+ 提供至少 1，500 個使用者帳戶範例，每個帳戶至少有兩個相關聯的登入事件。
+ 您的資料集必須至少涵蓋 30 天的登入事件。您可以稍後指定要用來訓練模型之事件的特定時間範圍。

**建議**
+ 您的資料集包含登入事件失敗的範例。您可以選擇將這些失敗的登入標記為「詐騙」或「合法」。
+ 使用跨超過六個月的登入事件準備歷史資料，並包含 100K個實體。

如果您沒有已符合最低要求的資料集，請考慮呼叫 [SendEvent](https://docs.aws.amazon.com/frauddetector/latest/api/API_SendEvent.html) API 操作，將事件資料串流至 Amazon Fraud Detector。

## 驗證資料
<a name="training-data-validations-ATI"></a>

建立帳戶接管洞見模型之前，Amazon Fraud Detector 會檢查資料集中包含用於訓練模型的中繼資料和變數是否符合大小和格式要求。如需詳細資訊，請參閱[資料集驗證](create-event-dataset.md#dataset-validation)。它也會檢查其他需求。如果資料集未通過驗證，則不會建立模型。若要成功建立模型，請務必在再次訓練之前修正未通過驗證的資料。

**常見的資料集錯誤**

驗證資料集以訓練 Account Takeover Insights 模型時，Amazon Fraud Detector 會掃描這些和其他問題，並在遇到一或多個問題時擲回錯誤。
+ CSV 檔案不是 UTF-8 格式。
+ CSV 檔案標頭至少不包含下列其中一個中繼資料：`EVENT_ID`、 `ENTITY_ID`或 `EVENT_TIMESTAMP`。
+ CSV 檔案標頭至少不包含下列變數類型的一個變數：`IP_ADDRESS`、 `USERAGENT`或 `VALIDCRED`。
+ 有一個以上的變數與相同的變數類型相關聯。
+ 中超過 0.1% 的值`EVENT_TIMESTAMP`包含 null 或值，而非支援的日期和時間戳記格式。
+ 第一個和最後一個事件之間的天數少於 30 天。
+ 超過 10% 的變數`IP_ADDRESS`類型為無效或 null。
+ 超過 50% 的變數`USERAGENT`類型包含 null。
+ `VALIDCRED` 變數類型的所有變數都設定為 `false`。