

Amazon Fraud Detector는 2025년 11월 7일부터 신규 고객에게 더 이상 공개되지 않습니다. Amazon Fraud Detector와 유사한 기능을 알아보려면 Amazon SageMaker, AutoGluon 및를 살펴보세요 AWS WAF.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 모델 유형 선택
<a name="choosing-model-type"></a>

Amazon Fraud Detector에서 사용할 수 있는 모델 유형은 다음과 같습니다. 사용 사례에 적합한 모델 유형을 선택합니다.
+ **온라인 사기 인사이트**

  *Online Fraud Insights* 모델 유형은 평가 대상 엔터티에 대한 과거 데이터가 거의 없을 때 사기를 탐지하도록 최적화되어 있습니다. 예를 들어, 새 계정에 온라인으로 등록하는 신규 고객이 이에 해당합니다.
+ **트랜잭션 사기 인사이트**

  *Transaction Fraud Insights* 모델 유형은 평가 중인 엔터티에 예측 정확도를 개선하기 위해 모델이 분석할 수 있는 상호 작용 기록이 있을 수 있는 사기 사용 사례를 탐지하는 데 가장 적합합니다(예: 과거 구매 기록이 있는 기존 고객).
+ **계정 탈취 인사이트**

  *Account Takeover Insights* 모델 유형은 계정이 피싱 또는 다른 유형의 공격으로 인해 손상되었는지 감지합니다. 로그인 시 사용되는 브라우저 및 디바이스와 같이 손상된 계정의 로그인 데이터는 계정과 연결된 과거 로그인 데이터와 다릅니다.

# 온라인 사기 인사이트
<a name="online-fraud-insights"></a>

Online Fraud Insights는 지도 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다. 온라인 사기 인사이트 모델은 적은 기록 데이터를 기반으로 사기를 탐지할 수 있습니다. 모델의 입력은 유연하므로 가짜 리뷰, 프로모션 침해, 게스트 체크아웃 사기 등 다양한 사기 위험을 탐지하도록 조정할 수 있습니다.

Online Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 모델 훈련 프로세스의 일환으로 Online Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 온라인 사기 인사이트는 타사 데이터 외에도 Amazon 및에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용합니다 AWS. 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 대한 입력 기능이 됩니다.

성능을 높이기 위해 Online Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화합니다. 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 잎당 샘플 수)를 사용하여 수십 개의 다양한 모델을 순차적으로 훈련합니다. 또한 소수의 사기 집단을 확대하여 매우 낮은 사기 발생률을 처리하는 등 다양한 최적화 전략을 사용합니다.

## 데이터 소스 선택
<a name="selecting-training-data-source-OFI"></a>

Online Fraud Insights 모델을 훈련할 때 외부(Amazon Fraud Detector 외부)에 저장되거나 Amazon Fraud Detector 내에 저장된 이벤트 데이터에 대해 모델을 훈련하도록 선택할 수 있습니다. Amazon Fraud Detector는 현재 Amazon Simple Storage Service(Amazon S3)를 지원합니다. 에서 외부 스토리지를 사용하는 경우 이벤트 데이터 세트를 쉼표로 구분된 값(CSV) 형식으로 Amazon S3 버킷에 업로드해야 합니다. 이러한 데이터 스토리지 옵션을 모델 훈련 구성 내에서 EXTERNAL\$1EVENTS(외부 스토리지용) 및 INGESTED\$1EVENTS(내부 스토리지용)라고 합니다. 사용 가능한 데이터 소스와 해당 소스에 데이터를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요[이벤트 데이터 스토리지](event-data-storage.md).

## 데이터 준비
<a name="preparing-training-data-OFI"></a>

이벤트 데이터(Amazon S3 또는 Amazon Fraud Detector)를 저장하는 위치에 관계없이 Online Fraud Insights 모델 유형에 대한 요구 사항은 동일합니다.

데이터 세트에는 EVENT\$1LABEL 열 헤더가 포함되어야 합니다. 이 변수는 이벤트를 사기 또는 합법적인 것으로 분류합니다. CSV 파일(외부 스토리지)을 사용하는 경우 파일의 각 이벤트에 EVENT\$1LABEL을 포함해야 합니다. 내부 스토리지의 경우 EVENT\$1LABEL 필드는 선택 사항이지만 훈련 데이터 세트에 포함되도록 모든 이벤트에 레이블을 지정해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대해 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 모든 이벤트에 대해 사기성 레이블을 맡을지 선택할 수 있습니다.

## 데이터 선택
<a name="selecting-training-data-OFI"></a>

온라인 사기 인사이트 모델 훈련을 위한 데이터 선택에 대한 자세한 내용은 [이벤트 데이터 수집](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#gather-event-data)을 참조하세요.

온라인 사기 인사이트 훈련은 EVENT\$1TIMESTAMP를 기반으로 과거 데이터를 샘플링하고 분할합니다. 데이터를 수동으로 샘플링할 필요가 없으며 그렇게 하면 모델 결과에 부정적인 영향을 미칠 수 있습니다.

## 이벤트 변수
<a name="input-variables-OFI"></a>

Online Fraud Insights 모델에는 필요한 이벤트 메타데이터를 제외하고 모델 훈련을 위한 [데이터 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 통과하고 모델당 최대 100개의 변수를 허용하는 최소 2개의 변수가 필요합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. Online Fraud Insights 모델은 사용자 지정 변수를 포함한 수십 개의 변수를 지원할 수 있지만 이러한 변수는 일반적으로 평가 중인 개체를 식별하는 데 가장 효과적이므로 IP 주소와 이메일 주소를 포함하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-OFI"></a>

교육 프로세스의 일환으로 Online Fraud Insights는 데이터 세트에서 모델 교육에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 [데이터 세트 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 참조하세요.

# 트랜잭션 사기 인사이트
<a name="transaction-fraud-insights"></a>

Transaction Fraud Insights 모델 유형은 온라인 또는 card-not-present 거래 사기를 탐지하도록 설계되었습니다. Transaction Fraud Insights는 지도 기계 학습 모델로, 사기 및 합법적인 거래의 과거 예를 사용하여 모델을 교육합니다.

Transaction Fraud Insights 모델은 데이터 보강, 변환 및 사기 분류에 기계 학습 알고리즘 앙상블을 사용합니다. 특성 엔지니어링 엔진을 활용하여 개체 수준 및 이벤트 수준 집계를 생성합니다. 모델 훈련 프로세스의 일환으로 Transaction Fraud Insights는 IP 주소 및 BIN 번호와 같은 원시 데이터 요소를 IP 주소의 지리적 위치 또는 신용 카드 발급 은행과 같은 타사 데이터로 보강합니다. 서드 파티 데이터 외에도 Transaction Fraud Insights는 Amazon에서 관찰된 사기 패턴을 고려하는 딥 러닝 알고리즘을 사용하며 AWS , 이러한 사기 패턴은 그라데이션 트리 부스팅 알고리즘을 사용하여 모델에 입력 기능이 됩니다.

성능을 높이기 위해 Transaction Fraud Insights는 베이지안 최적화 프로세스를 통해 그라데이션 트리 부스팅 알고리즘의 하이퍼 파라미터를 최적화하고, 다양한 모델 파라미터(예: 나무 수, 나무 깊이, 잎당 샘플 수)와 매우 낮은 사기율을 처리하기 위해 소수의 사기 집단에 가중치를 부여하는 등의 다양한 최적화 전략을 사용하여 수십 가지 모델을 순차적으로 훈련합니다.

모델 훈련 프로세스의 일환으로 트랜잭션 사기 모델의 특성 엔지니어링 엔진은 훈련 데이터 세트 내의 각 고유 개체에 대한 값을 계산하여 사기 예측을 개선합니다. 예를 들어 훈련 프로세스 중에 Amazon Fraud Detector는 개체가 마지막으로 구매한 시간을 계산 및 저장하고 `GetEventPrediction` 또는 `SendEvent` API를 호출할 때마다이 값을 동적으로 업데이트합니다. 사기 예측 중에 이벤트 변수는 다른 개체 및 이벤트 메타데이터와 결합되어 트랜잭션이 사기인지 여부를 예측합니다.

## 데이터 소스 선택
<a name="selecting-training-data-source-TFI"></a>

Transaction Fraud Insights 모델은 Amazon Fraud Detector(INGESTED\$1EVENTS)를 사용하여 내부적으로 저장된 데이터 세트에 대해서만 훈련됩니다. 이를 통해 Amazon Fraud Detector는 평가 중인 개체에 대해 계산된 값을 지속적으로 업데이트할 수 있습니다. 사용 가능한 데이터 소스에 대한 자세한 내용은 섹션을 참조하세요. [이벤트 데이터 스토리지](event-data-storage.md) 

## 데이터 준비
<a name="preparing-training-data-TFI"></a>

Transaction Fraud Insights 모델을 훈련하기 전에 [이벤트 데이터 세트 준비](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#prepare-event-dataset)에 언급된 대로 데이터 파일에 모든 헤더가 포함되어 있는지 확인합니다. Transaction Fraud Insights 모델은 수신된 새 엔터티를 데이터 세트의 사기 및 합법적인 엔터티의 예와 비교하므로 각 엔터티에 여러 예제를 제공하는 것이 좋습니다.

Amazon Fraud Detector는 저장된 이벤트 데이터 세트를 훈련을 위한 올바른 형식으로 자동 변환합니다. 모델이 훈련을 완료한 후 성능 지표를 검토하고 훈련 데이터 세트에 개체를 추가해야 하는지 여부를 결정할 수 있습니다.

## 데이터 선택
<a name="selecting-training-data-TFI"></a>

기본적으로 Transaction Fraud Insights는 선택한 이벤트 유형에 대해 저장된 전체 데이터 세트를 훈련합니다. 선택적으로 시간 범위를 설정하여 모델 훈련에 사용되는 이벤트를 줄일 수 있습니다. 시간 범위를 설정할 때 모델 훈련에 사용되는 레코드가 충분히 성숙할 시간을 가졌는지 확인합니다. 즉, 합법적인 레코드와 사기 레코드를 올바르게 식별할 수 있는 충분한 시간이 지났습니다. 예를 들어, 차지백 사기의 경우 사기 이벤트를 올바르게 식별하는 데 60일 이상이 걸리는 경우가 많습니다. 최상의 모델 성능을 위해 훈련 데이터 세트의 모든 레코드가 성숙해야 합니다.

이상적인 사기 발생률을 나타내는 시간 범위를 선택할 필요가 없습니다. Amazon Fraud Detector는 데이터를 자동으로 샘플링하여 사기 발생률, 시간 범위 및 엔터티 수 간의 균형을 맞춥니다.

Amazon Fraud Detector는 모델을 성공적으로 훈련할 이벤트가 충분하지 않은 시간 범위를 선택하면 모델 훈련 중에 검증 오류를 반환합니다. 저장된 데이터 세트의 경우 EVENT\$1LABEL 필드는 선택 사항이지만 훈련 데이터 세트에 포함하려면 이벤트에 레이블을 지정해야 합니다. 모델 훈련을 구성할 때 레이블이 지정되지 않은 이벤트를 무시할지, 레이블이 지정되지 않은 이벤트에 대한 합법적인 레이블을 맡을지, 레이블이 지정되지 않은 이벤트에 대한 사기성 레이블을 맡을지 선택할 수 있습니다.

## 이벤트 변수
<a name="input-variables-TFI"></a>

모델을 훈련하는 데 사용되는 이벤트 유형은 필수 이벤트 메타데이터를 제외하고 [데이터 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 통과하고 최대 100개의 변수를 포함할 수 있는 최소 2개의 변수를 포함해야 합니다. 일반적으로 변수를 많이 제공할수록 모델이 사기와 합법적인 이벤트를 더 잘 구별할 수 있습니다. Transaction Fraud Insight 모델은 사용자 지정 변수를 비롯한 수십 가지 변수를 지원할 수 있지만 IP 주소, 이메일 주소, 결제 수단 유형, 주문 가격 및 카드 BIN을 포함하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-TFI"></a>

훈련 프로세스의 일환으로 Transaction Fraud Insights는 훈련 데이터 세트에서 모델 훈련에 영향을 미칠 수 있는 데이터 품질 문제를 검증합니다. 데이터를 검증한 후 Amazon Fraud Detector는 가능한 최상의 모델을 구축하기 위해 적절한 조치를 취합니다. 여기에는 잠재적 데이터 품질 문제에 대한 경고 실행, 데이터 품질 문제가 있는 변수 자동 제거 또는 오류 실행 및 모델 훈련 프로세스 중지가 포함됩니다. 자세한 내용은 [데이터 세트 검증](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation)을 참조하세요.

Amazon Fraud Detector는 경고를 표시하지만 고유한 개체 수가 1,500개 미만인 경우 모델을 계속 훈련합니다. 이는 훈련 데이터의 품질에 영향을 미칠 수 있기 때문입니다. 경고가 표시되면 [성능 지표](training-performance-metrics.md)를 검토합니다.

# 계정 탈취 인사이트
<a name="account-takeover-insights"></a>

계정 탈취 인사이트(ATI) 모델 유형은 악의적인 탈취, 피싱 또는 도난당한 자격 증명으로 인해 계정이 손상되었는지 감지하여 사기 온라인 활동을 식별합니다. Account Takeover Insights는 온라인 비즈니스의 로그인 이벤트를 사용하여 모델을 교육하는 기계 학습 모델입니다.

실시간 로그인 흐름 내에 훈련된 Account Takeover Insights 모델을 포함하여 계정이 손상되었는지 감지할 수 있습니다. 모델은 다양한 인증 및 로그인 유형을 평가합니다. 여기에는 웹 애플리케이션 로그인, API 기반 인증 및 single-sign-on)가 포함됩니다. Account Takeover Insights 모델을 사용하려면 유효한 로그인 자격 증명이 제공된 후 [GetEventPrediction](https://docs.aws.amazon.com/frauddetector/latest/api/API_GetEventPrediction.html) API를 호출합니다. API는 계정이 손상될 위험을 정량화하는 점수를 생성합니다. Amazon Fraud Detector는 사용자가 정의한 점수와 규칙을 사용하여 로그인 이벤트에 대한 하나 이상의 결과를 반환합니다. 결과는 구성한 결과입니다. 수신한 결과에 따라 각 로그인에 대해 적절한 조치를 취할 수 있습니다. 즉, 로그인에 대해 제공된 자격 증명을 승인하거나 챌린지할 수 있습니다. 예를 들어 추가 확인으로 계정 PIN을 요청하여 자격 증명에 문제를 일으킬 수 있습니다.

Account Takeover Insights 모델을 사용하여 계정 로그인을 비동기적으로 평가하고 고위험 계정에 대해 조치를 취할 수도 있습니다. 예를 들어, 고위험 계정을 조사 대기열에 추가하여 인적 검토자가 계정 일시 중지와 같은 추가 조치를 취해야 하는지 여부를 결정할 수 있습니다.

Account Takeover Insights 모델은 비즈니스의 과거 로그인 이벤트가 포함된 데이터 세트를 사용하여 훈련됩니다. 이 데이터를 제공합니다. 필요에 따라 계정에 합법적인 또는 사기적인 레이블을 지정할 수 있습니다. 그러나 모델을 훈련하는 데는 필요하지 않습니다. Account Takeover Insights 모델은 계정의 성공적인 로그인 기록을 기반으로 이상을 감지합니다. 또한 악의적인 계정 탈취 이벤트의 위험 증가를 암시하는 사용자 동작의 이상을 탐지하는 방법을 알아봅니다. 예를 들어 일반적으로 동일한 디바이스 및 IP 주소 집합에서 로그인하는 사용자입니다. 사기범은 일반적으로 다른 디바이스 및 지리적 위치에서 로그인합니다. 이 기법은 일반적으로 악성 계정 탈취의 주요 특성인 비정상적인 활동의 위험 점수를 생성합니다.

Account Takeover Insights 모델을 훈련하기 전에 Amazon Fraud Detector는 기계 학습 기법의 조합을 사용하여 데이터 보강, 데이터 집계 및 데이터 변환을 수행합니다. 그런 다음 훈련 프로세스 중에 Amazon Fraud Detector는 사용자가 제공하는 원시 데이터 요소를 보강합니다. 원시 데이터 요소의 예로는 IP 주소 및 사용자 에이전트가 있습니다. Amazon Fraud Detector는 이러한 요소를 사용하여 로그인 데이터를 설명하는 추가 입력을 생성합니다. 이러한 입력에는 디바이스, 브라우저 및 지리적 위치 입력이 포함됩니다. 또한 Amazon Fraud Detector는 사용자가 제공한 로그인 데이터를 사용하여 과거 사용자 동작을 설명하는 집계된 변수를 지속적으로 계산합니다. 사용자 동작의 예로는 사용자가 특정 IP 주소에서 로그인한 횟수가 있습니다. Amazon Fraud Detector는 이러한 추가 보강 및 집계를 사용하여 로그인 이벤트의 작은 입력 세트에서 강력한 모델 성능을 생성할 수 있습니다.

Account Takeover Insights 모델은 악의적인 행위자가 인간이든 로봇이든 상관없이 악의적인 행위자가 합법적인 계정에 액세스하는 인스턴스를 감지합니다. 모델은 계정 손상의 상대적 위험을 나타내는 단일 점수를 생성합니다. 손상되었을 수 있는 계정은 고위험 계정으로 플래그가 지정됩니다. 두 가지 방법 중 하나로 고위험 계정을 처리할 수 있습니다. 어느 쪽이든 추가 자격 증명 확인을 적용할 수 있습니다. 또는 수동 조사를 위해 계정을 대기열로 보낼 수 있습니다.

## 데이터 소스 선택
<a name="selection-training-data-source-ATI"></a>

Account Takeover Insights 모델은 Amazon Fraud Detector에 내부적으로 저장된 데이터 세트에 대해 훈련됩니다. Amazon Fraud Detector로 로그인 이벤트 데이터를 저장하려면 사용자의 로그인 이벤트가 포함된 CSV 파일을 생성합니다. 각 이벤트에 대해 이벤트 타임스탬프, 사용자 ID, IP 주소, 사용자 에이전트, 로그인 데이터가 유효한지 여부와 같은 로그인 데이터를 포함합니다. CSV 파일을 생성한 후 먼저 파일을 Amazon Fraud Detector에 업로드한 다음 가져오기 기능을 사용하여 데이터를 저장합니다. 그런 다음 저장된 데이터를 사용하여 모델을 훈련할 수 있습니다. Amazon Fraud Detector를 사용하여 이벤트 데이터 세트를 저장하는 방법에 대한 자세한 내용은 섹션을 참조하세요. [Amazon Fraud Detector를 사용하여 이벤트 데이터를 내부적으로 저장](storing-event-data-afd.md) 

## 데이터 준비
<a name="preparing-training-data-ATI"></a>

Amazon Fraud Detector를 사용하려면 사용자 계정 로그인 데이터를 UTF-8 형식으로 인코딩된 쉼표로 구분된 값(CSV) 파일로 제공해야 합니다. CSV 파일의 첫 번째 줄에는 파일 헤더가 포함되어야 합니다. 파일 헤더는 각 데이터 요소를 설명하는 이벤트 메타데이터와 이벤트 변수로 구성됩니다. 이벤트 데이터는 헤더를 따릅니다. 이벤트 데이터의 각 줄은 단일 로그인 이벤트의 데이터로 구성됩니다.

Accounts Takeover Insights 모델의 경우 CSV 파일의 헤더 라인에 다음 이벤트 메타데이터 및 이벤트 변수를 제공해야 합니다.

** 이벤트 메타데이터**

CSV 파일 헤더에 다음 메타데이터를 제공하는 것이 좋습니다. 이벤트 메타데이터는 대문자여야 합니다.
+ EVENT\$1ID - 로그인 이벤트의 고유 식별자입니다.
+ ENTITY\$1TYPE - 판매자 또는 고객과 같이 로그인 이벤트를 수행하는 엔터티입니다.
+ ENTITY\$1ID - 로그인 이벤트를 수행하는 개체의 식별자입니다.
+ EVENT\$1TIMESTAMP - 로그인 이벤트가 발생한 타임스탬프입니다. 타임스탬프는 UTC의 ISO 8601 표준이어야 합니다.
+ EVENT\$1LABEL(권장) - 이벤트를 사기성 또는 합법적인 것으로 분류하는 레이블입니다. "사기", "권한", "1" 또는 "0"과 같은 모든 레이블을 사용할 수 있습니다.

**참고**  
이벤트 메타데이터는 대문자여야 합니다. 대/소문자를 구분합니다.
로그인 이벤트에는 레이블이 필요하지 않습니다. 그러나 EVENT\$1LABEL 메타데이터를 포함하고 로그인 이벤트에 대한 레이블을 제공하는 것이 좋습니다. 레이블이 불완전하거나 산발적인 경우에도 괜찮습니다. 레이블을 제공하면 Amazon Fraud Detector는 레이블을 사용하여 계정 탈취 검색 속도를 자동으로 계산하고 모델 성능 차트 및 테이블에 표시합니다.

** 이벤트 변수**

Accounts Takeover Insights 모델의 경우 제공해야 하는 필수(필수) 변수와 선택적 변수가 모두 있습니다. 변수를 생성할 때 변수를 올바른 변수 유형에 할당해야 합니다. 모델 훈련 프로세스의 일환으로 Amazon Fraud Detector는 변수와 연결된 변수 유형을 사용하여 변수 보강 및 기능 엔지니어링을 수행합니다.

**참고**  
이벤트 변수 이름은 소문자여야 합니다. 대/소문자를 구분합니다.

**필수 변수**

Accounts Takeover Insights 모델을 훈련하려면 다음 변수가 필요합니다.


| 카테고리 | 변수 유형 | 설명 | 
| --- | --- | --- | 
| IP 주소 | IP\$1ADDRESS | 로그인 이벤트에 사용되는 IP 주소 | 
| 브라우저 및 디바이스 | USERAGENT | 로그인 이벤트에 사용되는 브라우저, 디바이스 및 OS | 
| 유효한 자격 증명 | VALIDCRED | 로그인에 사용된 자격 증명이 유효한지 여부를 나타냅니다. | 

**선택적 변수**

다음 변수는 Accounts Takeover Insights 모델을 훈련할 때 선택 사항입니다.


| 카테고리 | Type | 설명 | 
| --- | --- | --- | 
| 브라우저 및 디바이스 | 지문 | 브라우저 또는 디바이스 지문의 고유 식별자 | 
| 세션 ID | SESSION\$1ID | 인증 세션의 식별자입니다. | 
| Label | EVENT\$1LABEL | 이벤트를 사기 또는 합법적인 것으로 분류하는 레이블입니다. "사기", "권한", "1" 또는 "0"과 같은 모든 레이블을 사용할 수 있습니다. | 
| 타임스탬프 | LABEL\$1TIMESTAMP | 레이블이 마지막으로 업데이트된 타임스탬프입니다. EVENT\$1LABEL이 제공된 경우 필요합니다. | 

**참고**  
두 필수 변수의 선택적 변수에 모든 변수 이름을 제공할 수 있습니다. 각 필수 및 선택적 변수를 올바른 변수 유형에 할당하는 것이 중요합니다.
추가 변수를 제공할 수 있습니다. 그러나 Amazon Fraud Detector에는 Accounts Takeover Insights 모델 훈련을 위한 이러한 변수가 포함되지 않습니다.

## 데이터 선택
<a name="selecting-training-data-ATI"></a>

데이터 수집은 Account Takeover Insights 모델을 생성하는 데 중요한 단계입니다. 로그인 데이터를 수집하기 시작할 때 다음 요구 사항 및 권장 사항을 고려하세요.

**필수**
+ 각각 2개 이상의 연결된 로그인 이벤트가 있는 1,500개 이상의 사용자 계정 예제를 제공합니다.
+ 데이터 세트는 최소 30일의 로그인 이벤트를 포함해야 합니다. 나중에 모델을 훈련하는 데 사용할 이벤트의 특정 시간 범위를 지정할 수 있습니다.

**권장**
+ 데이터 세트에는 실패한 로그인 이벤트의 예가 포함되어 있습니다. 이러한 실패한 로그인에 선택적으로 “사기” 또는 “합법적”으로 레이블을 지정할 수 있습니다.
+ 6개월 이상의 로그인 이벤트로 기록 데이터를 준비하고 100K엔터티를 포함합니다.

최소 요구 사항을 이미 충족하는 데이터 세트가 없는 경우 [SendEvent](https://docs.aws.amazon.com/frauddetector/latest/api/API_SendEvent.html) API 작업을 호출하여 이벤트 데이터를 Amazon Fraud Detector로 스트리밍하는 것이 좋습니다.

## 데이터 검증
<a name="training-data-validations-ATI"></a>

Account Takeover Insights 모델을 생성하기 전에 Amazon Fraud Detector는 모델 훈련을 위해 데이터 세트에 포함된 메타데이터 및 변수가 크기 및 형식 요구 사항을 충족하는지 확인합니다. 자세한 내용은 [데이터세트 검증](create-event-dataset.md#dataset-validation) 단원을 참조하십시오. 또한 다른 요구 사항도 확인합니다. 데이터 세트가 검증을 통과하지 못하면 모델이 생성되지 않습니다. 모델을 성공적으로 생성하려면 다시 훈련하기 전에 검증을 통과하지 못한 데이터를 수정해야 합니다.

**일반적인 데이터 세트 오류**

Account Takeover Insights 모델 훈련을 위해 데이터 세트를 검증할 때 Amazon Fraud Detector는 이러한 문제와 기타 문제를 스캔하고 하나 이상의 문제가 발생하면 오류를 발생시킵니다.
+ CSV 파일은 UTF-8 형식이 아닙니다.
+ CSV 파일 헤더에는 `EVENT_ID`, `ENTITY_ID`또는 메타데이터 중 하나 이상이 포함되어 있지 않습니다`EVENT_TIMESTAMP`.
+ CSV 파일 헤더에는 `IP_ADDRESS`, `USERAGENT`또는 변수 유형 중 하나 이상의 변수가 포함되어 있지 않습니다`VALIDCRED`.
+ 동일한 변수 유형과 연결된 변수가 두 개 이상 있습니다.
+ 에서 값의 0.1% 이상이 지원되는 날짜 및 타임스탬프 형식 이외의 null 또는 값을 `EVENT_TIMESTAMP` 포함합니다.
+ 첫 번째 이벤트와 마지막 이벤트 사이의 일수는 30일 미만입니다.
+ `IP_ADDRESS` 변수 유형 변수의 10% 이상이 유효하지 않거나 null입니다.
+ `USERAGENT` 변수 유형의 변수 중 50% 이상이 null을 포함합니다.
+ 변수 유형의 모든 `VALIDCRED` 변수는 로 설정됩니다`false`.