Amazon Fraud Detector dejará de estar abierto a nuevos clientes a partir del 7 de noviembre de 2025. Para obtener funciones similares a Amazon Fraud Detector, explore Amazon SageMaker, AutoGluon, y AWS WAF.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Almacene los datos de sus eventos de forma externa con Amazon S3
<a name="uploading-event-data-to-an-s3-bucket"></a>

Si está entrenando un modelo de Online Fraud Insights, puede optar por almacenar los datos de sus eventos de forma externa con Amazon S3. Para almacenar los datos del evento en Amazon S3, primero debe crear un archivo de texto en formato CSV, añadir los datos del evento y, a continuación, cargar el archivo CSV en un bucket de Amazon S3. 

**nota**  
Los tipos de modelo **Transaction Fraud Insights** y **Account Takeover Insights** no admiten conjuntos de datos almacenados externamente con Amazon S3.

# Cree un archivo CSV
<a name="creating-csv-file"></a>

Amazon Fraud Detector requiere que la primera fila del archivo CSV contenga encabezados de columna. Los encabezados de las columnas del archivo CSV deben corresponder a las variables definidas en el tipo de evento. Para ver un conjunto de datos de ejemplo, consulte [Obtenga y cargue un conjunto de datos de ejemplo](step-1-get-s3-data.md) 

El modelo Online Fraud Insights requiere un conjunto de datos de capacitación que tenga al menos 2 variables y hasta 100 variables. Además de las variables del evento, el conjunto de datos de formación debe contener los siguientes encabezados:
+ EVENT\$1TIMESTAMP: define cuándo ocurrió el evento
+ EVENT\$1LABEL: clasifica el evento como fraudulento o legítimo. Los valores de la columna deben corresponder a los valores definidos en el tipo de evento.

Los siguientes ejemplos de datos CSV representan el historial de eventos de registro de un comerciante en línea: 

```
EVENT_TIMESTAMP,EVENT_LABEL,ip_address,email_address
4/10/2019 11:05,fraud,209.146.137.48,fake_burtonlinda@example.net
12/20/2018 20:04,legit,203.0.112.189,fake_davidbutler@example.org
3/14/2019 10:56,legit,169.255.33.54,fake_shelby76@example.net
1/3/2019 8:38,legit,192.119.44.26,fake_curtis40@example.com
9/25/2019 3:12,legit,192.169.85.29,fake_rmiranda@example.org
```

**nota**  
El archivo de datos CSV puede contener comillas dobles y comas como parte de los datos. 

A continuación se muestra una versión simplificada del tipo de evento correspondiente. Las variables de evento corresponden a los encabezados del archivo CSV y los valores `EVENT_LABEL` corresponden a los valores de la lista de etiquetas.

```
(
name = 'sample_registration',
eventVariables = ['ip_address', 'email_address'],
labels = ['legit', 'fraud'],
entityTypes = ['sample_customer']
)
```

## Formatos de marca temporal del evento
<a name="timestamp-formats"></a>

Asegúrese de que la marca de tiempo del evento esté en el formato requerido. Como parte del proceso de creación del modelo, el modelo Online Fraud Insights ordena los datos en función de la marca temporal del evento y los divide con fines de formación y pruebas. Para obtener una estimación justa del rendimiento, el modelo primero se entrena en el conjunto de datos de entrenamiento y, a continuación, prueba este modelo en el conjunto de datos de prueba.

Amazon Fraud Detector admite los siguientes date/timestamp formatos para los valores incluidos `EVENT_TIMESTAMP` durante la formación de modelos:
+ %aaay-%mm-%DDt%Hh: %mm: %ssZ (estándar ISO 8601 solo en UTC, sin milisegundos)

  Ejemplo: 2019-11-30T 13:01:01 Z 
+ %aaay/%mm/%dd %hh: %mm: %ss (AM/PM)

  Ejemplos: 30 de noviembre de 2019 a las 13:01:01 p. m., o 30 de noviembre de 2019 a las 13:01:01 
+ %mm/%dd/%aaaa %hh: %mm: %ss

  Ejemplos: 30/11/2019 13:01:01 p.m., 30/11/2019 13:01:01 
+ %mm/%dd/%yy %hh: %mm: %ss

  Ejemplos: 30/11/19 13:01:01 p. m., 30/11/19 13:01:01 

Amazon Fraud Detector hace las siguientes suposiciones al analizar los date/timestamp formatos de las marcas de tiempo de los eventos:
+ Si utiliza la norma ISO 8601, debe coincidir exactamente con la especificación anterior
+ Si utiliza uno de los otros formatos, hay flexibilidad adicional:
  + Para meses y días, puede proporcionar un dígito o doble dígito. Por ejemplo, el 1 de diciembre de 2019 es una fecha válida.
  + No necesitas incluir hh:mm:ss si no los tienes (es decir, puedes simplemente indicar una fecha). También puede proporcionar un subconjunto de solo la hora y los minutos (por ejemplo, hh:mm). No se admite el simple hecho de proporcionar una hora. Tampoco se admiten milisegundos.
  + Si proporciona AM/PM etiquetas, se asume un reloj de 12 horas. Si no hay AM/PM información, se asume que el reloj es de 24 horas.
  + Puede utilizar «/» o «-» como delimitadores para los elementos de fecha. Se utiliza «:» para los elementos de marca de tiempo.

## Muestreo de su conjunto de datos a lo largo
<a name="sample-your-dataset"></a>

Te recomendamos que proporciones ejemplos de fraudes y muestras legítimas del mismo intervalo de tiempo. Por ejemplo, si proporciona eventos de fraude de los últimos 6 meses, también debe proporcionar eventos legítimos que abarquen de manera uniforme el mismo período de tiempo. Si tu conjunto de datos contiene una distribución muy desigual de fraudes y eventos legítimos, es posible que recibas el siguiente error: *«La distribución del fraude a lo largo del tiempo es inaceptablemente fluctuante. No se puede dividir el conjunto de datos correctamente».* Por lo general, la solución más sencilla para este error es garantizar que los eventos de fraude y los eventos legítimos se muestreen de manera uniforme en el mismo período de tiempo. Es posible que también tengas que eliminar los datos si has experimentado un gran aumento del fraude en un período breve. 

Si no puedes generar suficientes datos para crear un conjunto de datos distribuido uniformemente, un enfoque consiste en aleatorizar el EVENT\$1TIMESTAMP de tus eventos de forma que se distribuyan uniformemente. Sin embargo, esto suele provocar que las métricas de rendimiento no sean realistas, ya que Amazon Fraud Detector utiliza EVENT\$1TIMESTAMP para evaluar los modelos en función del subconjunto de eventos correspondiente de su conjunto de datos. 

## Valores nulos y faltantes
<a name="null-missing-values"></a>

Amazon Fraud Detector gestiona los valores nulos y faltantes. Sin embargo, el porcentaje de valores nulos de las variables debe ser limitado. Las columnas EVENT\$1TIMESTAMP y EVENT\$1LABEL no deben contener ningún valor faltante.

## Validación de archivos
<a name="csv-file-validation"></a>

Amazon Fraud Detector no capacitará a un modelo si se produce alguna de las siguientes condiciones:
+ Si el CSV no se puede analizar
+ Si el tipo de datos de una columna es incorrecto

# Sube los datos de tu evento a un bucket de Amazon S3
<a name="uploading-to-an-s3-bucket"></a>

Tras crear un archivo CSV con los datos del evento, cárguelo en su bucket de Amazon S3.

**Para cargar en un bucket de Amazon S3**

1. Inicie sesión en la consola de Amazon S3 Consola de administración de AWS y ábrala en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Elija **Create bucket (Crear bucket)**.

   Se abrirá el asistente **Crear bucket (Crear bucket)**.

1. En **Bucket name (Nombre del bucket)**, escriba un nombre compatible con DNS para el bucket.

   El nombre del bucket debe:
   + Ser único en todo Amazon S3.
   + Tener entre 3 y 63 caracteres.
   + No contiene caracteres en mayúsculas.
   + Comenzar por una letra minúscula o un número.

   Una vez que haya creado el bucket, no podrá modificar su nombre. Para obtener información sobre la denominación de los depósitos, consulte [las reglas de denominación](https://docs.aws.amazon.com/AmazonS3/latest/userguide/BucketRestrictions.html#bucketnamingrules) de los depósitos en la *Guía del usuario de Amazon Simple Storage Service*.
**importante**  
Evite incluir información confidencial, como números de cuenta, en el nombre del bucket. El nombre del depósito está visible en el punto URLs que apunta a los objetos del depósito.

1. En **Región**, elige la AWS región en la que quieres que resida el depósito. Debes seleccionar la misma región en la que utilizas Amazon Fraud Detector, es decir, EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), Europa (Irlanda), Asia-Pacífico (Singapur) o Asia-Pacífico (Sídney). 

1. En **Configuración del bucket para Block Public Access**, elija la configuración de Block Public Access que desee aplicar al bucket. 

   Le recomendamos que deje todos los ajustes activados. Para obtener más información sobre cómo bloquear el acceso público, consulte [Bloquear el acceso público a su almacenamiento de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/dev/access-control-block-public-access.html) en la *Guía del usuario de Amazon Simple Storage Service*.

1. Elija **Crear bucket**.

1. Sube el archivo de datos de entrenamiento a tu bucket de Amazon S3. Anote la ruta de ubicación de Amazon S3 para su archivo de formación (por ejemplo, s3://bucketname/object.csv).