

O Amazon Fraud Detector não está mais aberto a novos clientes a partir de 7 de novembro de 2025. Para recursos semelhantes ao Amazon Fraud Detector SageMaker, explore Amazon AutoGluon, AWS WAF e.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Armazene seus dados de eventos externamente com o Amazon S3
<a name="uploading-event-data-to-an-s3-bucket"></a>

Se você estiver treinando um modelo do Online Fraud Insights, você pode optar por armazenar seus dados de eventos externamente com o Amazon S3. Para armazenar os dados do evento no Amazon S3, você deve primeiro criar um arquivo de texto no formato CSV, adicionar os dados do evento e, em seguida, fazer o upload do arquivo CSV em um bucket do Amazon S3. 

**nota**  
Os tipos de modelo **Transaction Fraud Insights** e **Account Takeover Insights** não oferecem suporte a conjuntos de dados armazenados externamente com o Amazon S3.

# Criar arquivo CSV
<a name="creating-csv-file"></a>

O Amazon Fraud Detector exige que a primeira linha do seu arquivo CSV contenha cabeçalhos de coluna. Os cabeçalhos das colunas em seu arquivo CSV devem ser mapeados para as variáveis definidas no tipo de evento. Para ver um exemplo de conjunto de dados, consulte [Obtenha e faça upload de um conjunto de dados de exemplo](step-1-get-s3-data.md) 

O modelo Online Fraud Insights requer um conjunto de dados de treinamento que tenha pelo menos 2 variáveis e até 100 variáveis. Além das variáveis do evento, o conjunto de dados de treinamento deve conter os seguintes cabeçalhos:
+ EVENT\$1TIMESTAMP - Define quando o evento ocorreu
+ EVENT\$1LABEL - Classifica o evento como fraudulento ou legítimo. Os valores na coluna devem corresponder aos valores definidos no tipo de evento.

A amostra de dados CSV a seguir representa eventos históricos de registro de um lojista on-line: 

```
EVENT_TIMESTAMP,EVENT_LABEL,ip_address,email_address
4/10/2019 11:05,fraud,209.146.137.48,fake_burtonlinda@example.net
12/20/2018 20:04,legit,203.0.112.189,fake_davidbutler@example.org
3/14/2019 10:56,legit,169.255.33.54,fake_shelby76@example.net
1/3/2019 8:38,legit,192.119.44.26,fake_curtis40@example.com
9/25/2019 3:12,legit,192.169.85.29,fake_rmiranda@example.org
```

**nota**  
O arquivo de dados CSV pode conter aspas duplas e vírgulas como parte dos seus dados. 

Uma versão simplificada do tipo de evento correspondente está representada abaixo. As variáveis do evento correspondem aos cabeçalhos no arquivo CSV e os valores em `EVENT_LABEL` correspondem aos valores na lista de rótulos.

```
(
name = 'sample_registration',
eventVariables = ['ip_address', 'email_address'],
labels = ['legit', 'fraud'],
entityTypes = ['sample_customer']
)
```

## Formatos de registro de data e hora do evento
<a name="timestamp-formats"></a>

Certifique-se de que a data e hora do evento esteja no formato exigido. Como parte do processo de criação do modelo, o tipo de modelo Online Fraud Insights ordena seus dados com base na data e hora do evento e divide seus dados para fins de treinamento e teste. Para obter uma estimativa justa do desempenho, o modelo primeiro treina no conjunto de dados de treinamento e depois testa esse modelo no conjunto de dados de teste.

O Amazon Fraud Detector suporta os seguintes date/timestamp formatos para os valores `EVENT_TIMESTAMP` durante o treinamento do modelo:
+ %aaaa-%mm-%DDT%hh: %mm: %sSz (padrão ISO 8601 somente em UTC sem milissegundos)

  Exemplo: 2019-11-30T 13:01:01 Z 
+ %aaa/%mm/%dd %hh: %mm: %s (AM/PM)

  Exemplos: 2019/11/30 13:01:01 PM ou 2019/11/30 13:01:01 
+ %mm/%dd/%aaaa %hh: %mm: %s

  Exemplos: 30/11/2019 13:01:01 PM, 30/11/2019 13:01:01 
+ %mm/%dd/%yy %h: %mm: %s

  Exemplos: 30/11/19 13:01:01 PM, 30/11/19 13:01:01 

O Amazon Fraud Detector faz as seguintes suposições ao analisar date/timestamp formatos para registros de data e hora de eventos:
+ Se você estiver usando o padrão ISO 8601, ele deverá corresponder exatamente à especificação anterior
+ Se você estiver usando um dos outros formatos, há flexibilidade adicional:
  + Por meses e dias, você pode fornecer dígitos simples ou duplos. Por exemplo, 1/12/2019 é uma data válida.
  + Você não precisa incluir hh:mm:ss se não os tiver (ou seja, você pode simplesmente fornecer uma data). Você também pode fornecer um subconjunto de apenas a hora e os minutos (por exemplo, hh:mm). Não há suporte para fornecer apenas uma hora. Milissegundos também não são suportados.
  + Se você fornecer AM/PM etiquetas, presume-se um relógio de 12 horas. Se não houver AM/PM informações, presume-se um relógio de 24 horas.
  + Você pode usar “/” ou “-” como delimitadores para os elementos de data. “:” é assumido para os elementos de carimbo de data/hora.

## Amostragem do seu conjunto de dados ao longo do tempo
<a name="sample-your-dataset"></a>

Recomendamos que você forneça exemplos de fraudes e amostras legítimas do mesmo período. Por exemplo, se você fornecer eventos fraudulentos dos últimos 6 meses, você também deve fornecer eventos legítimos que abranjam uniformemente o mesmo período. Se seu conjunto de dados contiver uma distribuição altamente desigual de fraudes e eventos legítimos, você poderá receber o seguinte erro: *“A distribuição de fraudes ao longo do tempo é inaceitavelmente flutuante. Não é possível dividir o conjunto de dados corretamente.”* Normalmente, a solução mais fácil para esse erro é garantir que os eventos de fraude e os eventos legítimos sejam amostrados uniformemente no mesmo período. Talvez você também precise remover dados se tiver experimentado um grande aumento de fraudes em um curto período de tempo. 

Se você não conseguir gerar dados suficientes para criar um conjunto de dados distribuído uniformemente, uma abordagem é randomizar o EVENT\$1TIMESTAMP de seus eventos para que eles sejam distribuídos uniformemente. No entanto, isso geralmente faz com que as métricas de desempenho não sejam realistas porque o Amazon Fraud Detector usa EVENT\$1TIMESTAMP para avaliar modelos no subconjunto apropriado de eventos em seu conjunto de dados. 

## Valores nulos e faltantes
<a name="null-missing-values"></a>

O Amazon Fraud Detector lida com valores nulos e ausentes. No entanto, a porcentagem de nulos para variáveis deve ser limitada. As colunas EVENT\$1TIMESTAMP e EVENT\$1LABEL não devem conter valores ausentes.

## Validação de arquivos
<a name="csv-file-validation"></a>

O Amazon Fraud Detector falhará em treinar um modelo se alguma das seguintes condições for acionada:
+ Se o CSV não puder ser analisado
+ Se o tipo de dados de uma coluna estiver incorreto

# Faça upload dos dados do seu evento em um bucket do Amazon S3
<a name="uploading-to-an-s3-bucket"></a>

Depois de criar um arquivo CSV com os dados do evento, faça o upload do arquivo para o bucket do Amazon S3.

**Para fazer o upload para um bucket do Amazon S3**

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon S3 em. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Selecione **Create bucket (Criar bucket)**.

   O assistente **Create bucket (Criar bucket)** é aberto.

1. Em **Bucket name (Nome do bucket)**, insira um nome compatível com o DNS para seu bucket.

   O nome do bucket deve:
   + Seja exclusivo em todo o Amazon S3.
   + Ter entre 3 e 63 caracteres.
   + Não contém caracteres maiúsculos.
   + Começar com uma letra minúscula ou um número.

   Depois de criado o bucket, você não pode mudar seu nome. Para obter informações sobre a nomeação de buckets, consulte [Regras de nomenclatura de buckets no Guia](https://docs.aws.amazon.com/AmazonS3/latest/userguide/BucketRestrictions.html#bucketnamingrules) do usuário do *Amazon Simple Storage Service*.
**Importante**  
Evite incluir informações confidenciais, como números de conta, no nome do bucket. O nome do bucket é visível URLs nesse ponto para os objetos no bucket.

1. Em **Região**, escolha a AWS região em que você deseja que o bucket resida. Você deve selecionar a mesma região em que está usando o Amazon Fraud Detector, ou seja, Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Irlanda), Ásia-Pacífico (Cingapura) ou Ásia-Pacífico (Sydney). 

1. Em **Bucket settings for Block Public Access (Configurações de bucket para o Bloqueio de acesso público)**, escolha as configurações de bloqueio de acesso público que deseja aplicar ao bucket. 

   Recomendamos que você deixe todas as configurações ativadas. Para obter mais informações sobre o bloqueio do acesso público, consulte [Bloqueio do acesso público ao seu armazenamento do Amazon S3 no Guia](https://docs.aws.amazon.com/AmazonS3/latest/dev/access-control-block-public-access.html) do *usuário do Amazon Simple Storage Service*.

1. Selecione **Criar bucket**.

1. Faça upload do arquivo de dados de treinamento para seu bucket do Amazon S3. Observe o caminho de localização do Amazon S3 para seu arquivo de treinamento (por exemplo, s3://bucketname/object.csv).