

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Saída e esquemas personalizados
<a name="bda-custom-output-idp"></a>

Ao usar a Automação de Dados do Amazon Bedrock (BDA), você pode ajustar ainda mais suas extrações usando a configuração de saída personalizada. As saídas personalizadas são configuradas com artefatos chamados esquemas. Os esquemas são uma lista de instruções sobre como extrair informações de um arquivo, permitindo a transformação e o ajuste da saída. Para ver informações e uma demonstração detalhada de um esquema, consulte [Esquemas](bda-blueprint-info.md).

A configuração de saída personalizada também funciona com projetos. Quando você transmite um arquivo à BDA e faz referência a um projeto com esquemas configurados, a BDA processa o arquivo usando o esquema apropriado. Isso funciona para até 40 esquemas de documentos, um plano de imagem, um plano de áudio e um plano de vídeo. and/or Ao trabalhar com vários esquemas, a BDA tenta enviar documentos ao esquema que melhor corresponda ao layout esperado. Para ter mais informações sobre projetos e saída personalizada, consulte [Projetos da Automação de Dados do Bedrock](bda-projects.md).

**nota**  
Todos os arquivos processados pela saída personalizada devem seguir as restrições de arquivo da BDA. Para ter informações sobre restrições de arquivo, consulte “Pré-requisitos da BDA”.

# Esquemas
<a name="bda-blueprint-info"></a>

Os esquemas são artefatos que podem ser usados para configurar a lógica de negócios do processamento de arquivos. Cada esquema consiste em uma lista de nomes de campo que você pode extrair, no formato de dados no qual você deseja que a resposta do campo seja extraída, como string, número ou booliano, e no contexto de linguagem natural para cada campo que você pode usar para especificar regras de normalização e validação de dados. É possível criar um esquema para cada classe de arquivo que você deseja processar, como um W2, um contracheque ou uma carteira de identidade. Os esquemas podem ser criados no console ou usando a API. Cada blueprint que você cria é um AWS recurso com seu próprio ID de blueprint e ARN.

Ao usar um esquema para extração, é possível usar um esquema de catálogo ou um esquema personalizado já criado. Se você já sabe qual tipo de arquivo deseja extrair, os esquemas do catálogo são um ponto de partida predefinido. É possível criar esquemas personalizados para arquivos que não estão no catálogo. Ao criar um esquema, você pode usar vários métodos, como usar um esquema gerado por meio do prompt do esquema, criá-lo manualmente adicionando campos individuais ou criar o JSON de um esquema usando o editor JSON. Esses esquemas podem ser salvos em sua conta e compartilhados.

**nota**  
Os esquemas de áudio não podem ser criados por meio de prompts do esquema.

O tamanho máximo de um esquema é 100 mil caracteres, formatado em JSON. Para blueprints que devem ser usados com a [InvokeDataAutomationAsync](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomationAsync.html)API, o máximo de campos por blueprint é 100. Para blueprints que devem ser usados com a [InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API, o máximo de campos por blueprint é 15.

**nota**  
Ao usar esquemas, é possível usar prompts, seja em campos ou para a criação de esquemas. Permita que somente fontes confiáveis controlem a entrada do prompt. Amazon Bedrock não é responsável por validar a intenção do plano.

## Demonstração de um esquema
<a name="bda-blueprint-walkthrough"></a>

Vamos dar um exemplo de um documento de identificação, como um passaporte, e analisar um esquema para esse documento.

![\[Exemplo de passaporte com campos padrão, demonstrando o layout e os campos de dados que serão extraídos.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/passport2.png)


Veja aqui um exemplo de esquema para esse documento de identificação criado no console.

![\[Layout da tabela das definições dos campos do passaporte, com várias categorias, mostrando um exemplo de esquema.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bdapassport.png)


Em essência, um esquema é uma estrutura de dados que contém campos, que, por sua vez, contêm as informações extraídas pela saída personalizada da BDA. Na tabela de extração, há dois tipos de campo, explícitos e implícitos. As extrações explícitas são usadas para obter informações claramente definidas que podem ser vistas no documento. As extrações implícitas são usadas para informações que precisam ser transformadas de acordo com a forma como aparecem no documento. Por exemplo, você pode remover os traços de um número de previdência social, convertendo 111-22-3333 em 111223333. Os campos contêm determinados componentes básicos:
+ Nome do campo: um nome que você pode fornecer para cada campo que deseja extrair do documento. É possível usar o nome que você usa para o campo em seu sistema subsequente, como `Place_Birth` ou `Place_of_birth`.
+ Descrição: é uma entrada que oferece contexto em linguagem natural para cada campo no esquema para descrever as regras de normalização ou validação de dados a serem seguidas. Por exemplo, `Date of birth in YYYY-MM-DD format` ou `Is the year of birth before 1992?`. Também é possível usar o prompt como uma forma de iterar no esquema e melhorar a precisão da resposta da BDA. Fornecer um prompt detalhado que descreva o campo do que você precisa ajuda os modelos subjacentes a melhorar a respectiva precisão. Os prompts podem ter até 300 caracteres.
+ Resultados: as informações extraídas pela BDA com base no prompt e no nome do campo.
+ Tipo: o formato de dados que você deseja que a resposta do campo use. Nós permitimos string, número, booliano, matriz de string e matriz de números.
+ Pontuação de confiança: a porcentagem de certeza que a BDA tem de que sua extração é precisa. Os esquemas de áudio e imagem não retornam uma pontuação de confiança.
+ Tipos de extração: o tipo de extração, explícita ou inferida.
+ Número da página: em qual página do documento o resultado foi encontrado. Os esquemas de áudio e vídeo não exibem o número da página.

Além dos campos simples, a saída personalizada da BDA oferece várias opções para casos de uso que você pode encontrar na extração de documentos: campos de tabela, grupos e tipos personalizados. 

**Campos da tabela**  
Ao criar um campo, você pode optar por criar um campo de tabela em vez de um campo básico. Você pode nomear o campo e fornecer um prompt, como ocorre com outros campos. Também é possível fornecer campos de coluna. Esses campos têm nome, descrição e tipo de coluna. Quando mostrado na tabela de extração, um campo de tabela tem os resultados da coluna agrupados abaixo do nome da tabela. Os campos de tabela podem ter no máximo 15 subcampos.

**Groups (Grupos)**  
Um grupo é uma estrutura usada para organizar vários resultados em um único local dentro da extração. Ao criar um grupo, você atribui um nome a ele e pode criar e colocar campos nele. Esse grupo, que está marcado na tabela de extrações, lista os respectivos campos abaixo dele. 

**Tipos personalizados**  
Você pode criar um tipo personalizado ao editar um esquema no playground de esquemas. Qualquer campo pode ser de um tipo personalizado. Esse tipo tem um nome exclusivo e solicita a criação dos campos que compõem a detecção. Um exemplo seria criar um tipo personalizado chamado “Address” e incluir nele os campos “zip\$1code”, “city\$1name”, “street\$1name” e “state”. Em seguida, ao processar um documento, você pode usar o tipo personalizado em um campo “company\$1address”. Esse campo exibe então todas as informações agrupadas em linhas abaixo do tipo personalizado. É possível ter até trinta campos de tipo personalizado por esquema.

# Criar esquemas
<a name="bda-idp"></a>

## Como criar esquemas para saídas personalizadas
<a name="how-to-create-blueprints"></a>

Amazon Bedrock O Data Automation (BDA) permite que você crie esquemas personalizados para qualquer tipo de arquivo que o BDA possa extrair. É possível usar esquemas para definir o formato de saída e a lógica de extração desejados para os arquivos de entrada. Ao criar projetos personalizados, você pode personalizar a saída da BDA para atender a seus requisitos específicos.

Em um projeto, você pode aplicar:
+ Vários esquemas de documentos (até 40). Isso permite processar diferentes tipos de documento no mesmo projeto, cada um com uma lógica de extração personalizada.
+ Uma imagem de esquema. Isso garante consistência no processamento de imagens em um projeto.
+ Um esquema de áudio.
+ Um esquema de vídeo.

### Criar esquemas
<a name="creating-blueprints-methods"></a>

 Há dois métodos para criar esquemas na BDA: 
+ Usar o prompt do esquema
+ Criar o esquema manualmente

#### Usar o prompt do esquema
<a name="creating-blueprints-methods-assistant"></a>

 O prompt do esquema oferece uma interface guiada e baseada em linguagem natural para criar esquemas. Para criar um esquema usando o prompt: 

1.  Navegue até a seção **Esquemas** no console da BDA.

1.  Clique em **Criar esquema** e selecione **Use o prompt do esquema**.

1.  Escolha o tipo de dados (documento, imagem, áudio ou vídeo) para o esquema.

1.  Descreva os campos e os dados que você deseja extrair em linguagem natural. Por exemplo: “Extraia o nome do fornecedor, o número da fatura e o valor total das faturas”.

1.  O prompt gerará um esquema com base na sua descrição.

1.  Analise o esquema gerado e faça os ajustes necessários. Os prompts do esquema baseiam-se em um único turno, o que significa que você precisará inserir novamente todas as informações para alterar o prompt, não apenas novas informações.

1.  Salve e dê um nome ao esquema.

##### Exemplo de prompt de esquema
<a name="w2aac28b8c14c11b3b9b7b7"></a>

A seção a seguir mostra um exemplo de prompt de esquema para um esquema de áudio. Para esse caso de uso, queremos criar um esquema para extrair informações de uma conversa entre um cliente e um representante de atendimento ao cliente. A captura de tela abaixo mostra a janela de prompt no console.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/audio-bpa-prompt.png)


Na parte inferior da captura de tela, você pode ver o prompt gerado por IA com base na entrada na caixa. Podemos ver como os campos que mencionamos são processados. Em seguida, podemos ver o esquema criado com base no prompt.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/audio-bpa-example.png)


Aqui, podemos ver as informações que esperamos processar da conversa. Se achar que os campos estão adequados, você pode começar a processar um arquivo de áudio imediatamente. Se quiser editar o esquema, precisará criar uma duplicata em vez de editar diretamente. Também é possível ajustar o prompt para outros resultados.

#### Criar esquemas manualmente
<a name="creating-blueprints-methods-id"></a>

 Para usuários mais avançados ou aqueles que precisam de controle refinado, é possível criar esquemas manualmente: 

1.  Navegue até a seção **Esquemas** no console da BDA.

1.  Clique em **Criar esquema** e selecione **Criar manualmente**.

1.  Escolha o tipo de dados (documento, imagem, áudio ou vídeo) para o esquema.

1.  Defina os campos que você deseja extrair, especificando tipos de dados, formatos e quaisquer regras de validação.

1.  Defina configurações adicionais, como divisão de documentos ou ajuste de layout.

1.  Salve e dê um nome ao esquema.

Também é possível usar o editor JSON de esquemas para criar ou modificar um esquema. Isso permite que você ajuste o JSON do esquema diretamente por meio do editor de texto.

### Adicionar esquemas a projetos
<a name="adding-blueprints-projects"></a>

Os projetos servem como contêineres para os fluxos de trabalho de processamento de conteúdo multimodais, enquanto os esquemas definem a lógica de extração desses fluxos de trabalho. Você adiciona esquemas aos projetos para aplicá-los aos arquivos processados com esses projetos.

 Para adicionar um esquema a um projeto: 

1.  Navegue até a seção **Projetos** no console da BDA.

1.  Selecione o projeto ao qual deseja adicionar o esquema.

1.  Clique em **Adicionar esquema** ou **Gerenciar esquemas**.

1.  Escolha o esquema que você deseja adicionar na lista de esquemas disponíveis.

1.  Defina todas as configurações específicas do projeto para o esquema.

1.  Salve as alterações em seu projeto.

### Definir campos
<a name="bda-images-defining-fields"></a>

Para começar, você pode criar um campo para identificar as informações que deseja extrair ou gerar, como product\$1type. Para cada campo, você precisa fornecer descrição, tipo de dados e tipo de inferência.

Para definir um campo, especifique os seguintes parâmetros:
+ *Description:* fornece uma explicação em linguagem natural sobre o que o campo representa. Essa descrição ajuda a entender o contexto e a finalidade do campo, contribuindo para a extração precisa dos dados.
+ *Type*: especifica o tipo de dados do valor do campo. A BDA permite os seguintes tipos:
  + string: para valores baseados em texto.
  + número: para valores numéricos.
  + booliano: valores verdadeiros ou falsos.
  + matriz: para campos que podem ter vários valores do mesmo tipo (p. ex., uma matriz de strings ou uma matriz de números).
+ *Inference Type:* instrui a BDA sobre como lidar com a geração de resposta do valor do campo. Para imagens, a BDA permite apenas o tipo de inferência inferida. Isso significa que a BDA infere o valor do campo com base nas informações presentes na imagem.

Para vídeo, os campos também contêm a opção de granularidade. Para ter mais informações sobre essa característica, consulte “Criar esquemas para vídeos”.

A imagem a seguir mostra o módulo “Adicionar campos” no Amazon Bedrock console com os seguintes exemplos de campos e valores:
+ Nome do campo: product\$1type
+ Tipo: string
+ Instrução: qual é o principal produto ou serviço anunciado; por exemplo, roupas, eletrônicos, alimentos e bebidas etc.? 
+ Tipo de extração: inferido.

![\[Amazon Bedrock UI mostrando menus suspensos e campo de texto para especificar campos de imagem.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-console-add-fields-new.png)


Veja abaixo um exemplo da aparência dessa mesma definição de campo em um esquema JSON para a API:

```
"product_type":{
"type": "string",
"inferenceType": "inferred",
"description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?"
}
```

Neste exemplo:
+  O tipo está definido como string, indicando que o valor do campo product\$1type deve ser baseado em texto.
+ inferenceType está definido como inferido, instruindo a BDA a inferir o valor com base nas informações presentes na imagem.
+ A descrição fornece contexto adicional, esclarecendo que o campo deve identificar o tipo de produto na imagem. Os valores de exemplo para o campo product\$1type são: roupas, eletrônicos e alimentos ou bebidas.

Ao especificar esses parâmetros para cada campo, você fornece à BDA as informações necessárias para extrair e gerar insights de suas imagens.

### Criar versões do projeto
<a name="blueprints-project-verions"></a>

Ao trabalhar com projetos, você pode criar uma versão de um esquema. Uma versão é um snapshot imutável de um esquema, preservando as respectivas configurações atuais e a lógica de extração. Essa versão do esquema pode ser transmitida em uma solicitação para iniciar o processamento de dados, garantindo que a BDA processe os documentos de acordo com a lógica especificada no esquema no momento em que a versão foi criada. 

É possível criar uma versão usando a operação `CreateBlueprintVersion`.

O console do Amazon Bedrock também permite que você crie e salve esquemas. Ao salvar um esquema, um ID é atribuído a ele. Em seguida, você pode publicar o esquema, o que cria uma versão de snapshot desse esquema que não pode ser editada. Por exemplo, se o blueprint associado ao seu projeto for “DocBlueprint”, a versão do projeto criado será “DocBlueprint\$11”. Você não poderá fazer mais alterações em “DocBlueprint\$11”, mas ainda poderá editar o blueprint básico. Se você fizer alterações no blueprint e publicar novamente, uma nova versão será criada, como “DocBlueprint\$12”. As versões do esquema podem ser duplicadas e usadas como base para um novo esquema.

# Utilizar esquemas para realizar diferentes tarefas de IDP
<a name="idp-cases"></a>

Os esquemas são uma ferramenta extremamente versátil para processamento de documentos. As seções a seguir abordam a criação de esquemas com várias metas de processamento de documentos inteligente (IDP) em mente. Além disso, esta seção oferece uma visão mais detalhada das particularidades da criação de esquemas para documentos em geral.

# Criar esquemas para classificação
<a name="idp-cases-classification"></a>

Com a BDA, é possível classificar documentos atribuindo uma classe de documentos e fornecendo uma descrição ao criar um esquema. A classe de documentos serve como uma categorização abrangente do tipo de documento, enquanto a descrição fornece detalhes mais granulares sobre o conteúdo e os elementos esperados dentro dessa classe de documentos. Recomendamos que a descrição especifique o tipo usual de dados encontrados nos documentos, bem como outras informações relevantes, como a finalidade do documento e as entidades esperadas. 

Exemplos de classes de documentos e das respectivas descrições:


| Classe de documentos | Descrição | 
| --- | --- | 
|  Fatura  |  Uma fatura é um documento que contém a lista de serviços prestados ou itens comprados de uma empresa por uma pessoa ou outra empresa. Ela contém determinados detalhes, como quando o pagamento vence e quanto é devido.  | 
|  Contracheque  |  Esse documento emitido pelo empregador ao funcionário contém salários recebidos pelo funcionário por um determinado período. Geralmente contém o detalhamento de cada um dos itens de dedução fiscal e de renda.  | 
|  Recibos  |  Um documento confirmando que uma pessoa recebeu dinheiro ou bens em pagamento após uma venda ou outra transferência de bens ou prestação de serviço. Todos os recibos devem conter a data da compra.  | 
|  W2  |  Um formulário fiscal para registrar a renda pessoal recebida de um empregador em um ano fiscal.  | 

Depois de criar os campos do esquema, siga estas etapas:

1. Na página “Criar esquema”, escolha **Salvar e sair do prompt do esquema**.

1. Em “Nome do esquema”, insira um nome para o esquema.

1. Em “Classe do documento”, insira um nome de classe que represente o tipo de documento que você deseja classificar.

1. No campo “Descrição”, forneça uma descrição detalhada do tipo de documento. Inclua informações sobre os tipos de dados e elementos comumente encontrados nesses documentos, como pessoa, empresa, endereços, detalhes do produto ou qualquer outra informação relevante.

1. Escolha “Publicar esquema”.

Depois de criar o esquema, você pode usá-lo para classificar documentos durante a inferência fornecendo um ou mais IDs de esquema na solicitação de API InvokeDataAutomationAsync.

A BDA usa a classe e a descrição do documento fornecidas em cada um dos esquemas para categorizar e processar os documentos com precisão. Quando você envia um documento para processamento, a BDA analisa o conteúdo e o compara com a lista de esquemas fornecidos. O documento é então classificado e processado com base nas instruções do campo do esquema para produzir a saída na estrutura desejada.

# Criar esquemas para extração
<a name="idp-cases-extraction"></a>

A BDA permite que você defina os campos de dados específicos que você deseja extrair de seus documentos ao criar um esquema. Isso funciona como um conjunto de instruções que orientam a BDA sobre quais informações procurar e como interpretá-las.

**Definir campos**  
Para começar, você pode criar uma propriedade para cada campo que exija extração, como employee\$1id ou product\$1name. Para cada campo, você precisa fornecer descrição, tipo de dados e tipo de inferência.

Para definir um campo para extração, você precisa especificar os seguintes parâmetros:
+ Nome do campo: fornece uma explicação legível sobre o que o campo representa. Essa descrição ajuda a entender o contexto e a finalidade do campo, contribuindo para a extração precisa dos dados.
+ Instrução: oferece uma explicação em linguagem natural do que o campo representa. Essa descrição ajuda a entender o contexto e a finalidade do campo, contribuindo para a extração precisa dos dados.
+ Type: especifica o tipo de dados do valor do campo. A BDA aceita os seguintes tipos de dados:
  + string: para valores baseados em texto.
  + número: para valores numéricos.
  + boolean: Para valores true/false 
  + matriz: para campos que podem ter vários valores do mesmo tipo (p. ex., uma matriz de strings ou uma matriz de números).
+ Tipo de inferência: instrui a BDA sobre como lidar com a extração do valor do campo. Os tipos de inferência aceitos são:
  + Explícito: a BDA deve extrair o valor diretamente do documento.
  + Inferido: a BDA deve inferir o valor com base nas informações presentes no documento.

Veja abaixo um exemplo de definição de campo:

------
#### [ Console ]

![\[Console mostrando como adicionar “Nome do campo” e “Instrução”. “Type” está definido como “String” e “Extraction type” está definido como “Explicit”.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

Neste exemplo:
+ O tipo está definido como string, indicando que o valor do campo product\$1name deve ser baseado em texto.
+ inferenceType está definido como Explicit, instruindo a BDA a extrair o valor diretamente do documento sem nenhuma transformação ou validação.
+ A instrução fornece contexto adicional, esclarecendo que o campo deve conter o nome curto do produto sem detalhes adicionais.

Ao especificar esses parâmetros para cada campo, você fornece à BDA as informações necessárias para extrair e interpretar com precisão os dados desejados de seus documentos.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  Nome completo do candidato  |  Explícito  |  string  | 
|  DateOfBirth  |  Data de nascimento do funcionário  |  Explícito  |  string  | 
|  Vendas  |  Receitas brutas ou vendas  |  Explícito  |  número  | 
|  Statement\$1starting\$1balance  |  Saldo no início do período  |  Explícito  |  número  | 

**Campos de vários valores**  
Nos casos em que um campo pode conter vários valores, é possível definir matrizes ou tabelas.

**Lista de campos**  
Para campos que contêm uma lista de valores, é possível definir matriz como tipo de dados. 

Neste exemplo, "OtherExpenses" é definido como uma matriz de sequências de caracteres, permitindo que o BDA extraia vários itens de despesas para esse campo.

------
#### [ Console ]

![\[Console mostrando como adicionar “Nome do campo” e “Instrução”. “Type” está definido como “String” e “Extraction type” está definido como “Explicit”.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**Tabelas**  
Se o documento contiver dados tabulares, você poderá definir uma estrutura de tabela dentro do esquema.

Neste exemplo, “SERVICES\$1TABLE” é definido como um tipo de tabela, com determinados campos de coluna, como nome do produto, descrição, quantidade, preço unitário e valor.

------
#### [ Console ]

![\[Console mostrando como adicionar “Nome do campo” e “Instrução”. “Type” está definido como “Table”, “Extraction type” está definido como “Explicit” e os campos específicos da coluna que são adicionados são mostrados.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

Ao definir esquemas abrangentes com descrições de campo, tipos de dados e tipos de inferência apropriados, você pode garantir que a BDA extraia com precisão as informações desejadas dos documentos, independentemente de variações na formatação ou representação.

# Criar esquemas para normalização
<a name="idp-cases-normalization"></a>

A BDA oferece recursos de normalização que permitem converter e padronizar os dados extraídos de acordo com seus requisitos específicos. Essas tarefas de normalização podem ser categorizadas em normalização de chaves e normalização de valores.

**Normalização de chaves**  
Em muitos casos, os campos do documento podem ter variações na forma como são representados ou rotulados. Por exemplo, o campo “Cadastro de Pessoa Física” pode aparecer como “CPF”, “Identidade fiscal”, “número de identificação de contribuinte fiscal” ou outras variações semelhantes. Para enfrentar esse desafio, a BDA oferece a normalização de chaves, que permite que você forneça instruções sobre as variações em suas definições de campo.

Ao utilizar a normalização de chaves, você pode orientar a BDA a reconhecer e mapear diferentes representações do mesmo campo em uma chave padronizada. Esse recurso garante que os dados sejam extraídos e organizados de forma consistente, independentemente das variações presentes nos documentos originais.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  LastName  |  Sobrenome da pessoa.  |  Explícito  |  String  | 
|  BirthNum  |  Número do documento ou número do arquivo da certidão de nascimento.  |  Explícito  |  String  | 
|  OtherIncome  |  Outra renda, incluindo crédito ou reembolso de imposto federal e estadual sobre gasolina ou combustível.  |  Explícito  |  Número  | 
|  BusinessName  |  Nome da empresa, contratante ou entidade que declara imposto de renda.  |  Explícito  |  String  | 
|  power factor  |  Fator de potência ou multiplicador usado para esse item de linha de uso.  |  Explícito  |  String  | 
|  BirthPlace  |  Nome do hospital ou da instituição onde a pessoa nasceu.  |  Explícito  |  String  | 
|  Cause of Injury  |  Causa da lesão ou doença ocupacional e como ela está relacionada ao trabalho.  |  Explícito  |  String  | 

Para campos com conjuntos de valores ou enumerações predefinidos, você pode fornecer os valores ou intervalos esperados na instrução do campo. Recomendamos que você inclua as variações entre aspas, conforme mostrado nos exemplos.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  LICENSE\$1CLASS  |  O código de classe com uma única letra, como “A”, “B” ou “C.”  |  Explícito  |  String  | 
|  sex  |  O sexo. “M” ou “F”.  |  Explícito  |  String  | 
|  InformantType  |  O tipo de informação. “Pais” ou “Outro”.  |  Explícito  |  String  | 
|  INFORMATION COLLECTION CHANNEL  |  UMA DAS SEGUINTES: “ENTREVISTA PRESENCIAL”, “ENTREVISTA POR TELEFONE”, “FAX OU CORREIO”, “E-MAIL OU INTERNET”.  |  Explícito  |  String  | 

**Normalização de valores**  
A normalização de valores é uma tarefa fundamental nos pipelines de processamento de dados, em que os dados extraídos precisam ser transformados em um formato consistente e padronizado. Esse processo garante que os sistemas posteriores possam consumir e processar os dados sem problemas de compatibilidade ou ambiguidades.

Usando os recursos de normalização da BDA, você pode padronizar formatos, converter unidades de medida e converter valores em tipos de dados específicos.

Para tarefas de normalização de valores, o tipo extração inferida deve ser usado, pois o valor pode não corresponder exatamente ao texto bruto ou ao OCR do documento depois de normalizado. Por exemplo, um valor de data como “06/25/2022" que precisa ser formatado como “AAAA-MM-DD” será extraído como “2022-06-25" após a normalização, não correspondendo, portanto, à saída de OCR do documento.

Padronizar formatos: você pode converter valores em formatos predefinidos, como códigos abreviados, esquemas de numeração ou formatos de data específicos. Isso permite que você garanta a consistência na representação de dados aderindo aos padrões do setor ou a convenções organizacionais.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  ssn  |  O SSN, formatado como XXX-XX-XXX  |  Inferido  |  String  | 
|  STATE  |  O código de duas letras do estado.  |  Inferido  |  String  | 
|  EXPIRATION\$1DATE  |  A data de expiração no formato YYYY-MM-DD  |  Inferido  |  String  | 
|  DATE\$1OF\$1BIRTH  |  A data de nascimento do motorista em YYYY-MM-DD formato  |  Inferido  |  String  | 
|  CHECK\$1DATE  |  A data em que o cheque foi assinado. Reformatar para YYYY-MM-DD  |  Inferido  |  String  | 
|  PurchaseDate  |  Data de compra do veículo em mm/dd/yy formato  |  Inferido  |  String  | 

Você também pode converter valores em uma unidade de medida padrão ou em um tipo de dados específico ao lidar com determinados cenários, como não aplicável.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  WEIGHT  |  Peso convertido em libras.  |  Inferido  |  Número  | 
|  HEIGHT  |  Altura convertida em polegadas.  |  Inferido  |  Número  | 
|  nonqualified\$1plans\$1income  |  O valor no campo 11. 0 se N/A.  |  Inferido  |  Número  | 

# Criar esquemas para transformação
<a name="idp-cases-transformation"></a>

A BDA permite que você divida e reestruture campos de dados de acordo com requisitos específicos. Esse recurso permite que você transforme os dados extraídos em um formato que se alinhe melhor com seus sistemas subsequentes ou necessidades analíticas. 

Em muitos casos, os documentos podem conter campos que combinam várias informações em um único campo. A BDA permite que você divida esses campos em campos independentes e individuais para facilitar a manipulação e análise de dados. Por exemplo, se um documento contiver o nome de uma pessoa como um único campo, você poderá dividi-lo em campos separados para nome, segundo nome, sobrenome e sufixo.

Para tarefas de transformação, o tipo de extração pode ser definido como explícito ou inferido, dependendo se o valor precisa ser normalizado. 


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  FIRST\$1NAME  |  O nome.  |  Explícito  |  String  | 
|  MIDDLE\$1NAME  |  O segundo nome ou inicial.  |  Explícito  |  String  | 
|  LAST\$1NAME  |  O sobrenome do motorista.  |  Explícito  |  String  | 
|  SUFFIX  |  O sufixo, como PhD, MSc. etc  |  Explícito  |  String  | 

Outro exemplo é com blocos de endereço que podem aparecer como um único campo.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  Rua  |  Qual é o endereço da rua  |  Explícito  |  String  | 
|  Cidade  |  Qual é a cidade  |  Explícito  |  String  | 
|  Estado  |  Qual é o estado?  |  Explícito  |  String  | 
|  ZipCode  |  Qual é o código postal do endereço?  |  Explícito  |  String  | 

É possível definir esses campos como campos completamente individuais ou criar um tipo personalizado. Os tipos personalizados são aqueles que você pode reutilizar em campos diferentes. No exemplo abaixo, criamos um tipo personalizado “NameInfo”, que usamos para “EmployeeName” e “ManagerName”.

![\[Console mostrando como adicionar detalhes do tipo personalizado. Mostra também as subpropriedades adicionadas ao tipo personalizado.\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bdacustomtype.png)


# Criar esquemas para validação
<a name="idp-cases-validation"></a>

A Automação de Dados do Bedrock (BDA) permite que você defina regras de validação para garantir a precisão dos dados extraídos. Essas regras de validação podem ser incorporadas aos seus esquemas, permitindo que a BDA realize várias verificações nos dados extraídos. A BDA permite que você crie validações personalizadas adaptadas aos requisitos específicos de sua empresa ou setor. Veja a seguir alguns exemplos de validação para mostrar o alcance desse recurso.

**Validações numéricas**  
As validações numéricas são usadas para verificar se os dados numéricos extraídos estão dentro de um intervalo especificado de valores ou atendem a determinados critérios. Essas validações podem ser aplicadas a determinados campos, como valores, quantidades ou qualquer outro dado numérico.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  BalanceGreaterCheck  |  O saldo anterior é superior a \$1 1.000?  |  Inferido  |  Booliano  | 
|  O lucro bruto é igual à diferença entre vendas e COGS?  |  Pergunta de validação  |  Inferido  |  Booliano  | 
|  is\$1gross\$1pay\$1valid  |  O salário bruto no acumulado do ano é o valor monetário mais alto no contracheque?  |  Inferido  |  Booliano  | 

**Validações de data/hora**  
As validações de data/hora são usadas para verificar se os dados de data/hora extraídos estão dentro de um intervalo especificado de valores ou atendem a determinados critérios. Essas validações podem ser aplicadas a determinados campos, como prazos, datas de expiração ou vencimento ou quaisquer outros dados relacionados a data/hora.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  was\$1injury\$1reported\$1after\$11\$1month  |  A lesão foi relatada ao empregador mais de um mês após a data da lesão?  |  Inferido  |  Booliano  | 
|  is\$1overdue  |  A declaração está atrasada? O prazo do pagamento do saldo expirou?  |  Inferido  |  Booliano  | 
|  is\$1delivery\$1date\$1valid  |  A data de entrega será nos próximos trinta dias?  |  Inferido  |  Booliano  | 

**Validações de string/formato**  
As validações de string/formato são usadas para verificar se os dados extraídos aderem a um formato específico ou correspondem a padrões predefinidos. Essas validações podem ser aplicadas a determinados campos, como nomes, endereços ou qualquer outro dado textual que exija validação de formato.


| Campo | Instrução | Tipo de extração | Tipo | 
| --- | --- | --- | --- | 
|  routing\$1number\$1valid  |  Verdadeiro se o número de roteamento bancário tiver nove dígitos.  |  Inferido  |  Booliano  | 
|  Is\$1NumMeterIDsListed  |  Há mais de cinco IDs de medição listados na fatura?  |  Inferido  |  Booliano  | 

Com os recursos de validação personalizados da BDA, você pode criar regras de validação complexas que combinam várias condições, cálculos ou operações lógicas para garantir que os dados extraídos atendam aos critérios desejados. Essas validações podem envolver verificações em vários campos, cálculos ou qualquer outra lógica personalizada específica para seus processos de negócios ou requisitos regulatórios.

Ao incorporar essas regras de validação em seus esquemas, a BDA pode validar automaticamente os dados extraídos, garantindo a precisão e conformidade com seus requisitos específicos. Esse recurso permite que você acione análises humanas quando as validações falharem.

# Criar esquemas para imagens
<a name="bda-idp-images"></a>

A Automação de Dados do Amazon Bedrock (BDA) permite que você crie esquemas personalizados para modalidades de imagem. É possível usar esquemas para definir o formato de saída e a lógica de extração desejados para os arquivos de entrada. Ao criar projetos personalizados, você pode personalizar a saída da BDA para atender a seus requisitos específicos. Em um projeto, é possível aplicar um único esquema de imagem.

## Definir campos de dados para imagens
<a name="bda-images-defining-data-fields"></a>

A BDA permite que você crie um esquema para definir os campos específicos que deseja identificar em suas imagens. Isso funciona como um conjunto de instruções que orientam o BDA sobre quais informações extrair e gerar de suas imagens.

### Exemplos de campos de esquema para imagens de anúncios
<a name="w2aac28b8c14c11b9b5b5"></a>

Veja a seguir alguns exemplos de campos de esquema para analisar imagens de anúncios.




|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | 
| product\$1type | Qual é o principal produto ou serviço anunciado? Ex: roupas, eletrônicos, alimentos e bebidas | inferida | string | 
| colocação\$1de\$1produto | Como o produto é colocado na imagem do anúncio, por exemplo, centralizado, em segundo plano, segurado por uma pessoa etc.? | inferida | string | 
| tamanho\$1do\$1produto | O tamanho do produto é pequeno se o tamanho for menor que 30% da imagem, médio se estiver entre 30 a 60% e grande se for maior que 60% da imagem | inferida | string | 
| estilo\$1de\$1imagem | Classifique o estilo da imagem do anúncio. Por exemplo, imagem do produto, estilo de vida, retrato, retrô, infográfico, nenhuma das opções acima. | inferida | string | 
| fundo da imagem | O fundo pode ser “cor sólida, paisagem natural, interno, externo ou abstrato.  | inferida | string | 
| oferta\$1promocional | O anúncio inclui descontos, ofertas ou mensagens promocionais? | inferida | booleano | 

### Exemplos de campos de esquema para pesquisa de mídia
<a name="w2aac28b8c14c11b9b5b7"></a>

Veja a seguir alguns exemplos de campos de esquema para gerar metadados de imagens para pesquisa de mídia.




|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | 
| contagem de pessoas | Quantas pessoas estão na imagem? | inferida | número | 
| classificação interna\$1externa | A imagem é interna ou externa? | inferida | string | 
| classificação\$1de\$1cena | Classifique a configuração ou o ambiente da imagem. Ex: Espaços urbanos, rurais, naturais, históricos, residenciais, comerciais, recreativos, públicos | inferida | string | 
| identificação\$1animal | A imagem contém algum animal? | inferida | booleano | 
| tipo\$1animal | Que tipo de animais estão presentes na imagem? | inferida | string | 
| identificação\$1de\$1cor | A imagem é colorida ou em preto e branco? | inferida | string | 
| identificação\$1veículo | Há algum veículo visível na imagem? | inferida | string | 
| tipo\$1de\$1veículo | Que tipo de veículo está presente na imagem? | inferida | string | 
| identificação\$1de\$1marca d'água | Há alguma marca d'água visível na imagem? | inferida | booleano | 

# Criar esquemas para áudio
<a name="creating-blueprint-audio"></a>

De modo semelhante aos esquemas de imagem, só é possível ter um esquema de áudio por projeto.

Abaixo são apresentados alguns exemplos de campo para processamento de áudio.

## Exemplos de campos de esquema para arquivos de áudio
<a name="example-audio-fields"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | 
| transcript\$1summary | Generate a concise abstractive summary of the conversation, focusing on the main topics and key themes. Ensure accuracy by summarizing only what is explicitly discussed, without adding specific details not present in the conversation. Keeping the response within 100 words. | inferred | string | 
| topics | The main topics of the audio transcript, listed as single words. | inferred | [string] (Array of strings) | 
| category | The category of the audio (not the topic). Choose from General conversation, Media, Hospitality, Speeches, Meetings, Education, Financial, Public sector, Healthcare, Sales, Audiobooks, Podcasts, 911 calls, Other. | inferred | string | 
| spoken\$1named\$1entities | Any named entities (typically proper nouns) explicitly mentioned in the audio transcript including locations, brand names, company names, product names, services, events, organizations, etc. Do not include names of people, email addresses or common nouns.  | extractive | [string] (Array of strings) | 

## Exemplos de campos de esquema para analytics conversacional
<a name="example-audio-analytics"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | 
| call\$1summary | Summarize the caller-agent conversation in under 100 words. Start with the caller's request, then the agent's response and actions, ending with outcomes or follow-ups. Include key details like emails, links, or callbacks. For multiple issues, summarize each with its outcome and next steps. | inferred | string | 
| call\$1categories | The category (or categories) of the call. Choose one or more from Billing, Tech support, Customer service, Account support, Sales, Complaints, Product issues, Service issues, General inquiries, Other. | inferred | [string] (Array of strings) | 
| spoken\$1locations | Locations explicitly mentioned in the conversation, including cities, states, and countries. | extractive | [string] | 
| call\$1opening | Did the agent greet the caller and introduce themselves at the beginning of the call?  | extractive | boolean | 

# Criar esquemas para vídeo
<a name="creating-blueprint-video"></a>

Os esquemas para arquivos de vídeo têm algumas qualidades exclusivas em comparação com outros esquemas, principalmente com relação à criação de campos. Os esquemas de vídeo têm um parâmetro chamado granularidade, que permite definir um campo como vídeo ou capítulo. Quando o campo estiver definido como vídeo, ele será detectado em todo o vídeo. Por exemplo, se você quiser um resumo de todo o clipe, defina a granularidade desse campo como vídeo. 

Já um campo com granularidade definida como capítulo exibirá uma resposta para cada capítulo do vídeo. O campo exibirá um valor para cada capítulo do vídeo. Dando continuidade ao exemplo anterior, se você quisesse um resumo de cada parte de um vídeo, você definiria a granularidade como capítulo.

Ao criar um campo de granularidade de capítulo, é possível definir um tipo de dados exclusivo, uma matriz de entidades. Por exemplo, se você quiser detectar os objetos visualmente proeminentes em seu vídeo, é possível criar um campo chamado `key-visual-objects` e definir o tipo como uma matriz de entidades. Esse campo então exibiria o nome das entidades em um objeto de matriz.

Abaixo são apresentados alguns exemplos de campo para processamento de vídeo. Todos os campos nos esquemas de vídeo são considerados inferidos, exceto entidades e matrizes de entidades.

## Exemplos de campos de esquema para pesquisa de mídia
<a name="example-video-fields-search"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | Granularity | 
| key-visual-objects | Please detect all the visually prominent objects in the video | extractive | Array of entities | [ "chapter" ] | 
| keywords | Searchable terms that capture key themes, cast, plot elements, and notable aspects of TV shows and movies to enhance content discovery. | inferred | Array of strings | ["video"] | 
| genre | The genre of the content. | inferred | string | ["video"] | 
| video-type | Identify the type of video content | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Exemplos de campos de esquema para destaques de palestra principal
<a name="example-video-fields-keynote"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | Granularity | 
| broadcast-setting | The physical setting or environment where the broadcast or training session is taking place. | inferred | enums["conference hall", "classroom", "outdoor venue", "Others", "Not applicable to the video"] | [ "video" ] | 
| broadcast-audience-engagement | The level of engagement or interaction between the speakers and the audience. | inferred | enums["interactive", "passive", "Not applicable to the video"] | ["video"] | 
| broadcast-visual-aids | A list of notable visual aids or materials used during the presentation, such as slides, diagrams, or demonstrations. | inferred | Array of strings | ["video"] | 
| broadcast-audience-size | The size of the audience present at the event. | inferred | enums["large crowd", "medium crowd", "small group", "Not applicable to this video"] | [ "chapter" ] | 
| broadcast-presentation-topics | A list of key topics, subjects, or themes covered in the presentation or training session. | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Exemplos de campos de esquema para análise de anúncios
<a name="example-video-fields-ad"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrução | Tipo de extração | Tipo | Granularity | 
| ads-video-ad-categories | The ad categories for the video | inferred | enums["Health and Beauty", "Weight Loss", "Food and Beverage", "Restaurants", "Political", "Cryptocurrencies and NFT", "Money Lending and Finance", "Tobacco", "Other", "Video is not an advertisement"] | [ "video" ] | 
| ads-video-language | The primary language of the advertisement | inferred | string | ["video"] | 
| ads-video-primary-brand | The main brand or company being advertised in the video. | inferred | string | ["video"] | 
| ads-video-main-message | The primary message or tagline conveyed in the advertisement | inferred | string | [ "video" ] | 
| ads-video-message-clarity | How clear and understandable the main message of the advertisement is | inferred | enums: ["clear", "ambiguous", "Not applicable to the video"] | [ "video" ] | 
| ads-video-target-audience-interests | Specific interests or hobbies that the target audience is likely to have | inferred | Array of strings | [ "video" ] | 
| ads-video-product-type | The category or type of product being advertised | inferred | enums: ["electronics", "apparel", "food\$1and\$1beverage", "automotive", "home\$1appliances", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-placement | The way the product is positioned or showcased in the advertisement | inferred | enums: ["front\$1and\$1center", "background", "held\$1by\$1person", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-features | The key features or specifications of the advertised product highlighted in the video | inferred | Array of strings | [ "video" ] | 
| ads-video-number-of-products | The number of distinct products or variations featured in the advertisement | inferred | number | [ "video" ] | 

O vídeo também permite uma variedade de tipos de entidade, o que ajuda a identificar e localizar entidades específicas no conteúdo do vídeo. Esse recurso exibe uma matriz de entidades detectadas. Abaixo é apresentado um exemplo de uma matriz de entidades no esquema de um cliente:

```
  "field_name": {
        "items": {
            "$ref": "bedrock-data-automation#/definitions/Entity"
        },
        "type": "array",
        "instruction": "Please detect all the visually prominent objects in the video",
        "granularity": [
            "chapter"
        ]
    }
```

**nota**  
`bedrock-data-automation#/definitions/Entity` é um tipo de serviço pertencente à BDA. Para analisar os resultados, use o esquema a seguir.

```
       {
        "$schema": "http://json-schema.org/draft-07/schema#",
        "$id": "bedrock-data-automation",
        "type": "object",
        "definitions": {
            "BoundingBox": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "left": {
                        "type": "number"
                    },
                    "top": {
                        "type": "number"
                    },
                    "width": {
                        "type": "number"
                    },
                    "height": {
                        "type": "number"
                    }
                }
            },
            "Entity": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "label": {
                        "type": "string"
                    },
                    "bounding_box": {
                        "$ref": "bedrock-data-automation#/definitions/BoundingBox"
                    },
                    "confidence": {
                        "type": "number"
                    }
                }
            }
        },
        "properties": {}
    }
```

# Otimize seus projetos com a verdade fundamental
<a name="bda-optimize-blueprint-info"></a>

Você pode melhorar a precisão do blueprint fornecendo exemplos de ativos de conteúdo com os resultados corretos esperados. **A otimização de instruções do Blueprint usa seus exemplos para refinar as instruções em linguagem natural nos campos do blueprint, o que melhora a precisão dos resultados da inferência.**

A otimização de instruções do Blueprint funciona melhor quando você precisa extrair valores específicos que aparecem diretamente em seus documentos, como números de faturas, valores de contratos ou campos de formulários fiscais. Recomendamos fornecer de 3 a 10 exemplos de ativos que representem os documentos que você processa na produção, especialmente aqueles em que você encontrou desafios de precisão.

**Como funciona a otimização de instruções do blueprint**  
A otimização de instruções do Blueprint analisa as diferenças entre os resultados esperados e os resultados iniciais da inferência. O serviço refina iterativamente as instruções em linguagem natural para cada campo do seu plano até que as instruções produzam resultados mais precisos em seus ativos de exemplo. Esse processo é concluído em minutos, sem exigir nenhum treinamento ou ajuste fino do modelo.

Ao iniciar o processo de otimização, você fornece seus recursos de exemplo e os dados reais fundamentais correspondentes — os valores corretos que você espera extrair para cada campo. A otimização de instruções do Blueprint compara esses valores com os resultados da inferência e ajusta as descrições dos campos para melhorar a precisão. Após a conclusão da otimização, você recebe métricas de precisão que mostram a melhoria da precisão, incluindo taxas de correspondência exatas e pontuações de F1 medidas em relação à sua verdade básica.

**O que você precisa antes de começar a otimizar seus projetos**  
**Um plano com campos definidos**. Crie um blueprint usando o console ou a API. Seu blueprint deve incluir os nomes dos campos e as descrições iniciais dos dados que você deseja extrair.

**Exemplo de ativos de conteúdo**. Reúna de 3 a 10 ativos de documentos que representem sua carga de trabalho de produção em documentos. Escolha exemplos que contenham todos os campos em seu blueprint.

**Resultados esperados para seus exemplos**. Prepare os valores corretos que você deseja extrair de cada ativo de exemplo. Você pode inserir esses valores manualmente durante a otimização ou carregá-los usando um arquivo de manifesto.

**Uma localização do bucket S3**. Especifique um bucket do S3 onde você deseja armazenar seus ativos de exemplo e dados reais fundamentais. Você pode fornecer seu próprio bucket ou permitir que o serviço crie um para você.

**Step-by-step processo para otimizar seu plano**  
Para otimizar seu blueprint, comece na página de detalhes do blueprint no console Amazon Bedrock Data Automation. Observe que isso só está disponível para sua modalidade de documento.

Etapa 1. Selecione **Otimizar blueprint** para iniciar o fluxo de trabalho de otimização.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-blueprint-optimize-button.png)


Etapa 2. **Faça upload de seus recursos de exemplo**. Escolha até 10 ativos de conteúdo do seu dispositivo local ou de um local do S3. O serviço carrega seus ativos e exibe miniaturas de cada arquivo. Se você otimizou esse blueprint anteriormente, poderá adicionar novos exemplos ou remover os existentes.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-optimize-files-selector.png)


Etapa 3. **Forneça a verdade básica para cada ativo**. Selecione um ativo para abrir o editor Ground Truth. O editor exibe a visualização prévia do documento à esquerda e uma tabela simplificada dos campos do blueprint à direita. Para cada campo, insira o valor correto que você espera extrair na coluna Ground Truth.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-optimize-files-ground-truth.png)


Etapa 4: ****Para acelerar a entrada da verdade fundamental, selecione **Preenchimento automático** para executar a inferência inicial em seus ativos e preencher automaticamente a coluna Verdade Fundamental a partir dos valores em sua coluna Resultados.**** Edite todos os valores incorretos antes de continuar.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-optimize-ground-truth-edit.png)


Etapa 5. **Inicie a otimização**. Depois de concluir a entrada da verdade básica para todos os ativos selecionados, escolha **Iniciar otimização**. A automação de dados analisa seus exemplos e refina as instruções em linguagem natural para cada campo. Um indicador de progresso mostra o status da otimização com mensagens como “Lendo seus ativos” e “Iterando as instruções em linguagem natural do esquema”.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-start-optimization-button.png)


Etapa 6. **Analise as métricas de avaliação**. Quando a otimização for concluída, a seção **Métricas** exibirá métricas de precisão para seu blueprint. As métricas comparam o desempenho antes e depois da otimização. Analise a pontuação geral da F1, a pontuação de confiança e a taxa de correspondência exata para avaliar se o plano atende aos seus requisitos de precisão.

A guia **Métricas por arquivo de amostra** mostra a precisão em nível de campo para cada ativo de exemplo. Use essas métricas para identificar quais campos melhoraram e quais campos podem precisar de exemplos adicionais ou refinamento manual.

![\[alt text not found\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/bda/bda-optimize-metrics.png)


Etapa 7. **Otimização completa**. Se as métricas de avaliação atenderem aos seus requisitos, selecione **Salvar plano otimizado** para promover o plano otimizado para produção. Seu blueprint agora usa as instruções refinadas de linguagem natural para todas as futuras solicitações de inferência.

**Reotimize seu plano**  
Você pode reotimizar um plano a qualquer momento para melhorar ainda mais a precisão. Volte para a página de detalhes do blueprint e selecione **Otimizar blueprint**. O serviço exibe os ativos que você usou anteriormente para otimização, juntamente com seus valores reais básicos.

Para reotimizar, você pode adicionar novos exemplos de ativos, editar valores reais básicos para ativos existentes ou remover ativos que não representam mais sua carga de trabalho. Quando você **seleciona Iniciar otimização**, a otimização da instrução do blueprint é calculada em relação às suas instruções atuais do blueprint versus às novas instruções.

**Editar um blueprint após a otimização**  
Se você adicionar ou remover campos de um blueprint otimizado, o serviço removerá o histórico de otimização e os exemplos de ativos associados. Antes de editar, baixe o arquivo de manifesto que contém a localização dos ativos e os rótulos de verdade básica. O arquivo de manifesto usa o formato JSON e inclui todos os campos e valores reais básicos de sua otimização anterior. Para preservar seu trabalho de otimização, faça o upload do arquivo de manifesto ao reotimizar o blueprint editado. A automação de dados aplica automaticamente valores reais básicos aos campos correspondentes. Os campos que não existem mais no blueprint são removidos do manifesto. Novos campos não têm valores reais básicos até que você os forneça.

**Gerencie os custos de otimização**  
A otimização de instruções do Blueprint consome incorre nos custos de inferência da mesma forma que você faria se editasse manualmente suas instruções em linguagem natural e as testasse iterativamente em cada documento de amostra. Para um cálculo aproximado, o número de páginas que você fornecer como exemplos será o número de páginas que serão cobradas à medida que você otimiza seu plano. Cada execução de otimização processa seus ativos de exemplo várias vezes para refinar as instruções. Para minimizar os custos, comece com 3 a 5 exemplos para sua otimização inicial. Adicione mais exemplos ao inspecionar as métricas de avaliação e achar que precisa de melhorias adicionais na precisão.

Além disso, as instruções otimizadas em linguagem natural tendem a ser mais longas e detalhadas do que as instruções originais, o que pode aumentar os custos de inferência em tempo de execução.