Amazon Fraud Detector n'est plus ouvert aux nouveaux clients depuis le 7 novembre 2025. Pour des fonctionnalités similaires à Amazon Fraud Detector, explorez Amazon SageMaker AutoGluon, et AWS WAF.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Choisissez un type de modèle
<a name="choosing-model-type"></a>

Les types de modèles suivants sont disponibles dans Amazon Fraud Detector. Choisissez un type de modèle adapté à votre cas d'utilisation. 
+ **Informations sur la fraude en ligne**

  Le type de modèle *Online Fraud Insights* est optimisé pour détecter les fraudes lorsque peu de données historiques sont disponibles sur l'entité évaluée, par exemple lorsqu'un nouveau client s'enregistre en ligne pour un nouveau compte.
+ **Informations sur les fraudes transactionnelles**

  Le type de modèle *Transaction Fraud Insights* convient parfaitement à la détection des cas de fraude dans lesquels l'entité évaluée peut avoir un historique d'interactions que le modèle peut analyser pour améliorer la précision des prédictions (par exemple, un client existant ayant un historique d'achats antérieurs).
+ **Informations sur le rachat de comptes**

  Le modèle *Account Takeover Insights* détecte si un compte a été compromis par hameçonnage ou par un autre type d'attaque. Les données de connexion d'un compte compromis, telles que le navigateur et l'appareil utilisés lors de la connexion, sont différentes des données de connexion historiques associées au compte. 

# Informations sur la fraude en ligne
<a name="online-fraud-insights"></a>

Online Fraud Insights est un modèle d'apprentissage automatique supervisé, ce qui signifie qu'il utilise des exemples historiques de transactions frauduleuses et légitimes pour entraîner le modèle. Le modèle Online Fraud Insights permet de détecter les fraudes sur la base de peu de données historiques. Les entrées du modèle sont flexibles, vous pouvez donc l'adapter pour détecter divers risques de fraude, notamment les faux avis, les abus de promotion et les fraudes liées au paiement des clients. 

Le modèle Online Fraud Insights utilise un ensemble d'algorithmes d'apprentissage automatique pour l'enrichissement, la transformation et la classification des fraudes des données. Dans le cadre du processus de formation modèle, Online Fraud Insights enrichit les éléments de données brutes tels que l'adresse IP et le numéro BIN avec des données tierces telles que la géolocalisation de l'adresse IP ou la banque émettrice d'une carte de crédit. Outre les données de tiers, Online Fraud Insights utilise des algorithmes d'apprentissage en profondeur qui prennent en compte les modèles de fraude observés sur Amazon et AWS. Ces modèles de fraude deviennent des éléments d'entrée de votre modèle à l'aide d'un algorithme de renforcement de l'arborescence des dégradés.

Pour améliorer les performances, Online Fraud Insights optimise les hyperparamètres de l'algorithme de renforcement de l'arbre à gradient via un processus d'optimisation bayésien. Il entraîne de manière séquentielle des dizaines de modèles différents avec différents paramètres de modèle (tels que le nombre d'arbres, la profondeur des arbres et le nombre d'échantillons par feuille). Il utilise également différentes stratégies d'optimisation, telles que la surpondération de la population minoritaire de fraudeurs afin de réduire les taux de fraude.

## Sélection de la source de données
<a name="selecting-training-data-source-OFI"></a>

Lorsque vous entraînez un modèle Online Fraud Insights, vous pouvez choisir d'entraîner le modèle sur des données d'événements stockées en externe (en dehors d'Amazon Fraud Detector) ou stockées dans Amazon Fraud Detector. Le stockage externe actuellement pris en charge par Amazon Fraud Detector est Amazon Simple Storage Service (Amazon S3). Si vous utilisez un stockage externe, votre ensemble de données d'événements doit être chargé au format CSV (valeurs séparées par des virgules) dans un compartiment Amazon S3. Dans la configuration d'apprentissage du modèle, ces options de stockage de données sont appelées EXTERNAL\$1EVENTS (pour le stockage externe) et INGESTED\$1EVENTS (pour le stockage interne). Pour plus d'informations sur les sources de données disponibles et sur la manière d'y stocker des données, consultez[Stockage des données d'événements](event-data-storage.md).

## Préparation des données
<a name="preparing-training-data-OFI"></a>

Quel que soit l'endroit où vous choisissez de stocker les données de vos événements (Amazon S3 ou Amazon Fraud Detector), les exigences relatives au type de modèle Online Fraud Insights sont les mêmes.

Votre ensemble de données doit contenir l'en-tête de colonne EVENT\$1LABEL. Cette variable classe un événement comme frauduleux ou légitime. Lorsque vous utilisez un fichier CSV (stockage externe), vous devez inclure EVENT\$1LABEL pour chaque événement du fichier. Pour le stockage interne, le champ EVENT\$1LABEL est facultatif, mais tous les événements doivent être étiquetés pour être inclus dans un ensemble de données d'entraînement. Lorsque vous configurez votre modèle d'entraînement, vous pouvez choisir d'ignorer les événements non étiquetés, d'utiliser une étiquette légitime pour les événements non étiquetés ou d'utiliser une étiquette frauduleuse pour tous les événements non étiquetés. 

## Sélection de données
<a name="selecting-training-data-OFI"></a>

Consultez la section [Collecter des données sur les événements](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#gather-event-data) pour obtenir des informations sur la sélection des données pour la formation de votre modèle Online Fraud Insights.

Le processus de formation Online Fraud Insights échantillonne et partitionne les données historiques en fonction d'EVENT\$1TIMESTAMP. Il n'est pas nécessaire d'échantillonner les données manuellement, ce qui peut avoir un impact négatif sur les résultats de votre modèle.

## Variables d'événement
<a name="input-variables-OFI"></a>

Le modèle Online Fraud Insights nécessite au moins deux variables, outre les métadonnées d'événement requises, qui ont passé avec succès la [validation des données](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation) pour l'entraînement du modèle et autorisent jusqu'à 100 variables par modèle. En général, plus vous fournissez de variables, mieux le modèle peut différencier la fraude des événements légitimes. Bien que le modèle Online Fraud Insights puisse prendre en charge des dizaines de variables, y compris des variables personnalisées, nous recommandons d'inclure l'adresse IP et l'adresse e-mail, car ces variables sont généralement les plus efficaces pour identifier l'entité évaluée. 

## Validation des données
<a name="training-data-validations-OFI"></a>

Dans le cadre du processus de formation, Online Fraud Insights validera l'ensemble de données pour détecter les problèmes de qualité des données susceptibles d'avoir une incidence sur la formation des modèles. Après avoir validé les données, Amazon Fraud Detector prendra les mesures appropriées pour créer le meilleur modèle possible. Cela inclut l'émission d'avertissements en cas de problèmes potentiels de qualité des données, la suppression automatique des variables présentant des problèmes de qualité des données ou l'émission d'une erreur et l'arrêt du processus d'apprentissage du modèle. Pour plus d'informations, consultez la section [Validation du jeu de données](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation). 

# Informations sur les fraudes transactionnelles
<a name="transaction-fraud-insights"></a>

Le modèle Transaction Fraud Insights est conçu pour détecter les fraudes en ligne ou card-not-present les fraudes transactionnelles. Transaction Fraud Insights est un modèle d'apprentissage automatique supervisé, ce qui signifie qu'il utilise des exemples historiques de transactions frauduleuses et légitimes pour entraîner le modèle.

Le modèle Transaction Fraud Insights utilise un ensemble d'algorithmes d'apprentissage automatique pour l'enrichissement, la transformation et la classification des fraudes des données. Il utilise un moteur d'ingénierie des fonctionnalités pour créer des agrégats au niveau de l'entité et au niveau des événements. Dans le cadre du processus de formation modèle, Transaction Fraud Insights enrichit les éléments de données brutes tels que l'adresse IP et le numéro BIN avec des données tierces telles que la géolocalisation de l'adresse IP ou la banque émettrice d'une carte de crédit. Outre les données tierces, Transaction Fraud Insights utilise des algorithmes d'apprentissage en profondeur qui prennent en compte les modèles de fraude observés sur Amazon. AWS Ces modèles de fraude deviennent des éléments d'entrée de votre modèle à l'aide d'un algorithme de renforcement de l'arborescence des dégradés.

Pour améliorer les performances, Transaction Fraud Insights optimise les hyperparamètres de l'algorithme de renforcement de l'arbre à gradient via un processus d'optimisation bayésien, en formant séquentiellement des dizaines de modèles différents avec différents paramètres de modèle (tels que le nombre d'arbres, la profondeur des arbres, le nombre d'échantillons par feuille) ainsi que différentes stratégies d'optimisation, telles que la surpondération de la population de fraudeurs minoritaire pour réduire les taux de fraude.

Dans le cadre du processus de formation du modèle, le moteur d'ingénierie des fonctionnalités du modèle de fraude transactionnelle calcule des valeurs pour chaque entité unique de votre ensemble de données de formation afin d'améliorer les prévisions de fraude. Par exemple, pendant le processus de formation, Amazon Fraud Detector calcule et enregistre la date du dernier achat effectué par une entité et met à jour cette valeur de manière dynamique chaque fois que vous appelez l'`SendEvent`API `GetEventPrediction` or. Lors d'une prédiction de fraude, les variables d'événement sont combinées avec d'autres métadonnées d'entités et d'événements pour prédire si la transaction est frauduleuse.

## Sélection de la source de données
<a name="selecting-training-data-source-TFI"></a>

Les modèles Transaction Fraud Insights sont entraînés uniquement sur un ensemble de données stocké en interne avec Amazon Fraud Detector (INGESTED\$1EVENTS). Cela permet à Amazon Fraud Detector de mettre à jour en permanence les valeurs calculées concernant les entités que vous évaluez. Pour plus d'informations sur les sources de données disponibles, voir [Stockage des données d'événements](event-data-storage.md)

## Préparation des données
<a name="preparing-training-data-TFI"></a>

Avant de former un modèle Transaction Fraud Insights, assurez-vous que votre fichier de données contient tous les en-têtes, comme indiqué dans [Préparation du jeu de données d'événements](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#prepare-event-dataset). Le modèle Transaction Fraud Insights compare les nouvelles entités reçues aux exemples d'entités frauduleuses et légitimes figurant dans l'ensemble de données. Il est donc utile de fournir de nombreux exemples pour chaque entité. 

Amazon Fraud Detector transforme automatiquement le jeu de données d'événements enregistré dans le format approprié pour la formation. Une fois l'entraînement du modèle terminé, vous pouvez consulter les indicateurs de performance et déterminer si vous devez ajouter des entités à votre jeu de données d'entraînement. 

## Sélection de données
<a name="selecting-training-data-TFI"></a>

Par défaut, Transaction Fraud Insights s'entraîne sur l'intégralité de votre ensemble de données stocké pour le type d'événement que vous sélectionnez. Vous pouvez éventuellement définir une plage de temps afin de réduire le nombre d'événements utilisés pour entraîner votre modèle. Lorsque vous définissez une plage de temps, assurez-vous que les enregistrements utilisés pour entraîner le modèle ont eu suffisamment de temps pour arriver à maturité. En d'autres termes, suffisamment de temps s'est écoulé pour garantir que les dossiers légitimes et frauduleux ont été correctement identifiés. Par exemple, dans le cas d'une fraude liée à la rétrofacturation, il faut souvent 60 jours ou plus pour identifier correctement les événements frauduleux. Pour optimiser les performances du modèle, assurez-vous que tous les enregistrements de votre jeu de données d'entraînement sont matures. 

Il n'est pas nécessaire de sélectionner un intervalle de temps qui représente un taux de fraude idéal. Amazon Fraud Detector échantillonne automatiquement vos données pour trouver un équilibre entre les taux de fraude, la période et le nombre d'entités. 

Amazon Fraud Detector renvoie une erreur de validation lors de l'entraînement du modèle si vous sélectionnez une plage de temps pendant laquelle il n'y a pas suffisamment d'événements pour entraîner un modèle avec succès. Pour les ensembles de données stockés, le champ EVENT\$1LABEL est facultatif, mais les événements doivent être étiquetés pour être inclus dans votre ensemble de données d'entraînement. Lorsque vous configurez votre modèle d'entraînement, vous pouvez choisir d'ignorer les événements non étiquetés, d'utiliser une étiquette légitime pour les événements non étiquetés ou d'utiliser une étiquette frauduleuse pour les événements non étiquetés. 

## Variables d'événement
<a name="input-variables-TFI"></a>

Le type d'événement utilisé pour entraîner le modèle doit contenir au moins 2 variables, outre les métadonnées d'événement requises, qui ont passé avec succès la [validation des données](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation) et peuvent contenir jusqu'à 100 variables. En général, plus vous fournissez de variables, mieux le modèle peut différencier la fraude des événements légitimes. Bien que le modèle Transaction Fraud Insight puisse prendre en charge des dizaines de variables, y compris des variables personnalisées, nous vous recommandons d'inclure l'adresse IP, l'adresse e-mail, le type d'instrument de paiement, le prix de la commande et le BIN de la carte. 

## Validation des données
<a name="training-data-validations-TFI"></a>

Dans le cadre du processus de formation, Transaction Fraud Insights valide l'ensemble de données de formation pour détecter les problèmes de qualité des données susceptibles d'avoir une incidence sur la formation des modèles. Après avoir validé les données, Amazon Fraud Detector prend les mesures appropriées pour créer le meilleur modèle possible. Cela inclut l'émission d'avertissements en cas de problèmes potentiels de qualité des données, la suppression automatique des variables présentant des problèmes de qualité des données ou l'émission d'une erreur et l'arrêt du processus d'apprentissage du modèle. Pour plus d'informations, consultez la section [Validation du jeu de données](https://docs.aws.amazon.com//frauddetector/latest/ug/create-event-dataset.html#dataset-validation). 

Amazon Fraud Detector émettra un avertissement mais continuera à entraîner un modèle si le nombre d'entités uniques est inférieur à 1 500, car cela peut avoir un impact sur la qualité des données de formation. Si vous recevez un avertissement, passez en revue l'[indicateur de performance](training-performance-metrics.md).

# Informations sur le rachat de comptes
<a name="account-takeover-insights"></a>

Le type de modèle Account Takeover Insights (ATI) identifie les activités frauduleuses en ligne en détectant si les comptes ont été compromis par des prises de contrôle malveillantes, par hameçonnage ou par le vol d'informations d'identification. Account Takeover Insights est un modèle d'apprentissage automatique qui utilise les événements de connexion de votre entreprise en ligne pour entraîner le modèle. 

Vous pouvez intégrer un modèle Account Takeover Insights expérimenté dans votre flux de connexion en temps réel afin de détecter si un compte est compromis. Le modèle évalue différents types d'authentification et de connexion. Ils incluent les connexions aux applications Web, les authentifications basées sur les API et single-sign-on (SSO). Pour utiliser le modèle Account Takeover Insights, appelez l'[GetEventPrediction](https://docs.aws.amazon.com/frauddetector/latest/api/API_GetEventPrediction.html)API une fois que des informations de connexion valides ont été présentées. L'API génère un score qui quantifie le risque de compromission du compte. Amazon Fraud Detector utilise le score et les règles que vous avez définis pour renvoyer un ou plusieurs résultats pour les événements de connexion. Les résultats sont ceux que vous avez configurés. En fonction des résultats que vous recevez, vous pouvez prendre les mesures appropriées pour chaque connexion. En d'autres termes, vous pouvez approuver ou contester les informations d'identification présentées pour la connexion. Par exemple, vous pouvez contester les informations d'identification en demandant un code PIN de compte à titre de vérification supplémentaire.

Vous pouvez également utiliser le modèle Account Takeover Insights pour évaluer les connexions aux comptes de manière asynchrone et prendre des mesures sur les comptes à haut risque. Par exemple, un compte à haut risque peut être ajouté à la file d'attente d'investigation pour qu'un réviseur humain puisse déterminer si d'autres mesures doivent être prises, telles que la suspension du compte.

Le modèle Account Takeover Insights est formé à l'aide d'un ensemble de données contenant l'historique des événements de connexion de votre entreprise. Vous fournissez ces données. Vous pouvez éventuellement étiqueter les comptes comme légitimes ou frauduleux. Cependant, cela n'est pas nécessaire pour entraîner le modèle. Le modèle Account Takeover Insights détecte les anomalies sur la base de l'historique des connexions réussies à un compte. Il apprend également à détecter les anomalies dans le comportement d'un utilisateur qui suggèrent un risque accru de prise de contrôle de compte par un acte malveillant. Par exemple, un utilisateur qui se connecte généralement à partir du même ensemble d'appareils et d'adresses IP. Un fraudeur se connecte généralement à partir d'un autre appareil et d'une autre géolocalisation. Cette technique produit un score de risque indiquant qu'une activité est anormale, ce qui est généralement l'une des principales caractéristiques des prises de contrôle de comptes par des personnes malveillantes.

Avant de former un modèle Account Takeover Insights, Amazon Fraud Detector utilise une combinaison de techniques d'apprentissage automatique pour enrichir, agréger et transformer les données. Ensuite, pendant le processus de formation, Amazon Fraud Detector enrichit les éléments de données brutes que vous fournissez. Les exemples d'éléments de données brutes incluent l'adresse IP et l'agent utilisateur. Amazon Fraud Detector utilise ces éléments pour créer des entrées supplémentaires décrivant les données de connexion. Ces entrées incluent l'appareil, le navigateur et les entrées de géolocalisation. Amazon Fraud Detector utilise également les données de connexion que vous fournissez pour calculer en continu des variables agrégées décrivant le comportement passé des utilisateurs. Parmi les exemples de comportement des utilisateurs, citons le nombre de fois où l'utilisateur s'est connecté à partir d'une adresse IP spécifique. Grâce à ces enrichissements et agrégats supplémentaires, Amazon Fraud Detector peut générer de solides performances de modèle à partir d'un petit nombre d'entrées issues de vos événements de connexion.

Le modèle Account Takeover Insights détecte les cas où un mauvais acteur accède à un compte légitime, qu'il s'agisse d'un humain ou d'un robot. Le modèle produit un score unique qui indique le risque relatif de compromission du compte. Les comptes susceptibles d'avoir été compromis sont signalés comme des comptes à haut risque. Vous pouvez traiter les comptes à haut risque de deux manières. Vous pouvez soit imposer une vérification d'identité supplémentaire. Vous pouvez également envoyer le compte dans une file d'attente pour un examen manuel. 

## Sélection de la source de données
<a name="selection-training-data-source-ATI"></a>

Les modèles Account Takeover Insights sont formés sur un ensemble de données stocké en interne, dans Amazon Fraud Detector. Pour stocker les données de vos événements de connexion avec Amazon Fraud Detector, créez un fichier CSV contenant les événements de connexion des utilisateurs. Pour chaque événement, incluez des données de connexion telles que l'horodatage de l'événement, l'ID utilisateur, l'adresse IP, l'agent utilisateur et indiquez si les données de connexion sont valides. Après avoir créé le fichier CSV, téléchargez-le d'abord sur Amazon Fraud Detector, puis utilisez la fonction d'importation pour stocker les données. Vous pouvez ensuite entraîner votre modèle à l'aide des données enregistrées. Pour plus d'informations sur le stockage de votre ensemble de données d'événements avec Amazon Fraud Detector, consultez [Stockez les données de vos événements en interne avec Amazon Fraud Detector](storing-event-data-afd.md)

## Préparation des données
<a name="preparing-training-data-ATI"></a>

Amazon Fraud Detector exige que vous fournissiez les données de connexion de votre compte utilisateur dans un fichier de valeurs séparées par des virgules (CSV) codé au format UTF-8. La première ligne de votre fichier CSV doit contenir un en-tête de fichier. L'en-tête du fichier comprend des métadonnées d'événement et des variables d'événement qui décrivent chaque élément de données. Les données de l'événement suivent l'en-tête. Chaque ligne des données d'événement comprend les données d'un seul événement de connexion.

Pour le modèle Accounts Takeover Insights, vous devez fournir les métadonnées et variables d'événement suivantes dans la ligne d'en-tête de votre fichier CSV. 

**Métadonnées de l'événement**

Nous vous recommandons de fournir les métadonnées suivantes dans l'en-tête de votre fichier CSV. Les métadonnées de l'événement doivent être en majuscules.
+ EVENT\$1ID - Identifiant unique pour l'événement de connexion.
+ ENTITY\$1TYPE - Entité qui exécute l'événement de connexion, telle qu'un commerçant ou un client.
+ ENTITY\$1ID - Identifiant de l'entité effectuant l'événement de connexion. 
+ EVENT\$1TIMESTAMP - L'horodatage auquel l'événement de connexion s'est produit. L'horodatage doit être conforme à la norme ISO 8601 en UTC.
+ EVENT\$1LABEL (recommandé) : étiquette qui classe l'événement comme frauduleux ou légitime. Vous pouvez utiliser n'importe quelle étiquette, telle que « fraude », « légitime », « 1 » ou « 0 ».

**Note**  
Les métadonnées de l'événement doivent être en majuscules. Cela fait la distinction majuscules et minuscules.
Les libellés ne sont pas obligatoires pour les événements de connexion. Cependant, nous vous recommandons d'inclure les métadonnées EVENT\$1LABEL et de fournir des étiquettes pour vos événements de connexion. Ce n'est pas grave si les étiquettes sont incomplètes ou sporadiques. Si vous fournissez des étiquettes, Amazon Fraud Detector les utilisera pour calculer automatiquement le taux de découverte d'un compte et l'affichera dans le graphique et le tableau des performances du modèle.

**Variables d'événement**

Pour le modèle Accounts Takeover Insights, vous devez fournir à la fois des variables obligatoires (obligatoires) et des variables facultatives. Lorsque vous créez vos variables, assurez-vous de les affecter au bon type de variable. Dans le cadre du processus de formation du modèle, Amazon Fraud Detector utilise le type de variable associé à la variable pour effectuer l'enrichissement des variables et l'ingénierie des fonctionnalités.

**Note**  
Les noms des variables d'événement doivent être en minuscules. Ils font la distinction majuscules et minuscules.

**Variables obligatoires**

Les variables suivantes sont requises pour former un modèle Accounts Takeover Insights.


| Catégorie | Type de variable | Description | 
| --- | --- | --- | 
| Adresse IP | IP\$1ADDRESS | Adresse IP utilisée lors de l'événement de connexion | 
| Navigateur et appareil | AGENT UTILISATEUR | Le navigateur, l'appareil et le système d'exploitation utilisés lors de l'événement de connexion | 
| Informations d'identification valides | VALIDCRED | Indique si les informations d'identification utilisées pour la connexion sont valides | 

**Variables facultatives**

Les variables suivantes sont facultatives pour la formation d'un modèle Accounts Takeover Insights.


| Catégorie | Type | Description | 
| --- | --- | --- | 
| Navigateur et appareil | EMPREINTE DIGITALE | L'identifiant unique pour l'empreinte digitale d'un navigateur ou d'un appareil | 
| Identifiant de session | SESSION\$1ID | Identifiant d'une session d'authentification | 
| Étiquette | LABEL\$1ÉVÉNEMENT | Une étiquette qui classe l'événement comme frauduleux ou légitime. Vous pouvez utiliser n'importe quelle étiquette, telle que « fraude », « légitime », « 1 » ou « 0 ». | 
| Horodatage | LABEL\$1TIMESTAMP | Horodatage de la dernière mise à jour de l'étiquette. Cela est obligatoire si EVENT\$1LABEL est fourni. | 

**Note**  
Vous pouvez fournir n'importe quel nom de variable pour les deux variables obligatoires (variables facultatives). Il est important que chaque variable obligatoire et facultative soit affectée au type de variable approprié.
Vous pouvez fournir des variables supplémentaires. Cependant, Amazon Fraud Detector n'inclura pas ces variables pour la formation d'un modèle Accounts Takeover Insights. 

## Sélection de données
<a name="selecting-training-data-ATI"></a>

La collecte de données est une étape importante de la création de votre modèle Account Takeover Insights. Lorsque vous commencez à collecter vos données de connexion, tenez compte des exigences et recommandations suivantes :

**Obligatoire**
+ Fournissez au moins 1 500 exemples de comptes utilisateur, chacun étant associé à au moins deux événements de connexion.
+ Votre jeu de données doit couvrir au moins 30 jours d'événements de connexion. Vous pouvez ultérieurement spécifier la plage de temps spécifique des événements à utiliser pour entraîner le modèle.

**Recommandée**
+ Votre jeu de données inclut des exemples d'événements de connexion infructueux. Vous pouvez éventuellement étiqueter ces connexions infructueuses comme « frauduleuses » ou « légitimes ».
+ Préparez des données historiques avec des événements de connexion s'étalant sur plus de six mois et incluant 100 000 entités.

Si vous ne disposez pas d'un ensemble de données répondant déjà aux exigences minimales, envisagez de diffuser les données d'événements vers Amazon Fraud Detector en appelant l'opération [SendEvent](https://docs.aws.amazon.com/frauddetector/latest/api/API_SendEvent.html)API.

## Validation des données
<a name="training-data-validations-ATI"></a>

Avant de créer votre modèle Account Takeover Insights, Amazon Fraud Detector vérifie si les métadonnées et les variables que vous avez incluses dans votre ensemble de données pour entraîner le modèle répondent aux exigences de taille et de format. Pour de plus amples informations, veuillez consulter [Validation des jeux](create-event-dataset.md#dataset-validation). Il vérifie également les autres exigences. Si le jeu de données ne passe pas la validation, le modèle n'est pas créé. Pour que le modèle soit correctement créé, assurez-vous de corriger les données qui n'ont pas été validées avant de vous entraîner à nouveau.

**Erreurs courantes dans les ensembles de données**

Lors de la validation d'un ensemble de données pour la formation d'un modèle Account Takeover Insights, Amazon Fraud Detector analyse ces problèmes et d'autres et génère une erreur s'il rencontre un ou plusieurs de ces problèmes.
+ Le fichier CSV n'est pas au format UTF-8.
+ L'en-tête du fichier CSV ne contient pas au moins l'une des métadonnées suivantes : `EVENT_ID``ENTITY_ID`, ou`EVENT_TIMESTAMP`.
+ L'en-tête du fichier CSV ne contient pas au moins une variable des types de variables suivants : `IP_ADDRESS``USERAGENT`, ou`VALIDCRED`. 
+ Plusieurs variables sont associées au même type de variable. 
+ Plus de 0,1 % des valeurs contenues dans le champ `EVENT_TIMESTAMP` contiennent des valeurs nulles ou autres que les formats de date et d'horodatage pris en charge.
+ Le nombre de jours entre le premier et le dernier événement est inférieur à 30 jours.
+ Plus de 10 % des `IP_ADDRESS` variables de ce type ne sont pas valides ou sont nulles.
+ Plus de 50 % des variables de ce `USERAGENT` type contiennent des valeurs nulles.
+ Toutes les variables du type de `VALIDCRED` variable sont définies sur`false`.