

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Salida personalizada y esquemas
<a name="bda-custom-output-idp"></a>

Al utilizar Automatización de Datos de Amazon Bedrock (BDA), puede refinar aún más sus extracciones mediante una configuración de salida personalizada. Las salidas personalizadas se configuran con artefactos denominados esquemas. Los esquemas son una lista de instrucciones sobre cómo extraer información del archivo, lo que permite transformar y ajustar la salida. Para obtener más información y un tutorial detallado de un esquema, consulte [Proyectos](bda-blueprint-info.md).

La configuración de salida personalizada también funciona junto con los proyectos. Al pasar un archivo a BDA y hacer referencia a un proyecto con esquemas configurados, BDA procesará el archivo con el esquema correspondiente. Esto funciona para un máximo de 40 planos de documentos, un plano de imagen, un plano de audio y un plano de vídeo. and/or Al trabajar con varios esquemas, BDA intenta enviar los documentos al esquema que mejor se adapte al diseño esperado. Para obtener más información sobre los proyectos y la salida personalizada, consulte [Proyectos de Automatización de Datos de Bedrock](bda-projects.md).

**nota**  
Todos los archivos procesados mediante una salida personalizada deben seguir las restricciones de archivos de BDA. Para obtener más información sobre las restricciones de archivos, consulte los requisitos previos de BDA.

# Proyectos
<a name="bda-blueprint-info"></a>

Los esquemas son artefactos que puede utilizar para configurar la lógica empresarial de procesamiento de archivos. Cada esquema consta de una lista de nombres de campo que puede extraer, el formato de datos en el que desea que se extraiga la respuesta del campo, como una cadena, un número o un valor booleano, así como el contexto en lenguaje natural de cada campo, que puede usar para especificar las reglas de normalización y validación de datos. Puede crear un esquema para cada clase de archivo que desee procesar, como un W2, un comprobante de pago o una tarjeta de identificación. Los esquemas se pueden crear en la consola o con la API. Cada plano que cree es un AWS recurso con su propio identificador de plano y ARN.

Al utilizar un esquema para la extracción, puede utilizar un esquema del catálogo o un esquema creado de forma personalizada. Si ya sabe el tipo de archivo del que desea extraer información, los esquemas del catálogo proporcionan un punto de partida predefinido. Puede crear esquemas personalizados para los archivos que no están en el catálogo. Al crear un esquema, puede utilizar varios métodos, como generar un esquema mediante un petición de esquema, crearlo manualmente añadiendo campos individuales o creando el JSON de un esquema mediante el editor de JSON. Puede guardar estos esquemas en su cuenta y compartirlos.

**nota**  
Los esquemas de audio no se pueden crear mediante peticiones de esquema.

El tamaño máximo de un esquema es de 100 000 caracteres, con formato JSON. En el caso de los planos que se vayan a utilizar con la [InvokeDataAutomationAsync](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomationAsync.html)API, el número máximo de campos por plano es de 100. En el caso de los blueprints que se vayan a utilizar con la [InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API, el número máximo de campos por blueprint es de 15.

**nota**  
Al usar esquemas, es posible que utilice peticiones, ya sea en los campos o para la creación de esquemas. Permita que solo fuentes confiables controlen la entrada rápida. Amazon Bedrock no es responsable de validar la intención del plano.

## Tutorial de esquema
<a name="bda-blueprint-walkthrough"></a>

Tomemos un ejemplo de un documento de identidad, como un pasaporte, y veamos un esquema para este documento.

![\[Ejemplo de pasaporte con campos estándar, que muestra el diseño y los campos de datos que se extraerán.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/passport2.png)


Este es un ejemplo de esquema para este documento de identidad que creamos en la consola.

![\[Diseño de tabla de las definiciones de los campos del pasaporte, con varias categorías, que muestra un ejemplo de esquema.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdapassport.png)


Básicamente, un esquema es una estructura de datos que contiene campos que, a su vez, contienen la información extraída por la salida personalizada de BDA. Hay dos tipos de campos, explícitos e implícitos, ubicados en la tabla de extracción. Las extracciones explícitas se utilizan para la información claramente indicada que se puede ver en el documento. Las extracciones implícitas se utilizan para la información que debe transformarse con respecto a la forma en que aparece en el documento. Por ejemplo, puede eliminar los guiones de un número de seguridad social convirtiéndolos de 111-22-3333 a 111223333. Los campos contienen ciertos componentes básicos:
+ Nombre de campo: es un nombre que puede proporcionar para cada campo que desee extraer del documento. Puede usar el nombre que usa para el campo en su sistema posterior, como `Place_Birth` o `Place_of_birth`.
+ Descripción: se trata de una entrada que proporciona un contexto en lenguaje natural para cada campo del esquema a fin de describir las reglas de normalización o validación de datos que se deben seguir. Por ejemplo, `Date of birth in YYYY-MM-DD format` o `Is the year of birth before 1992?`. También puede utilizar la petición como una forma de iterar sobre el esquema y mejorar la precisión de la respuesta de BDA. Proporcionar una petición detallada que describa el campo que necesita ayuda a los modelos subyacentes a mejorar su precisión. Las peticiones pueden tener una longitud de hasta 300 caracteres.
+ Resultados: la información extraída por BDA en función de la petición y el nombre del campo.
+ Tipo: el formato de datos que desea que utilice la respuesta del campo. Se admiten cadenas, números, valores booleanos, matrices de cadena y matrices de números.
+ Puntuación de confianza: el porcentaje de certeza que tiene BDA de que la extracción es precisa. Los planos de audio e imagen no devuelven una puntuación de confianza.
+ Tipos de extracción: el tipo de extracción, explícita o inferida.
+ Número de página: página del documento en la que se encontró el resultado. Los esquemas de audio y vídeo no devuelven un número de página.

Además de los campos simples, la salida personalizada de BDA ofrece varias opciones para los casos de uso que puede encontrar en la extracción de documentos: campos de tablas, grupos y tipos personalizados. 

**Campos de tabla**  
Al crear un campo, puede elegir crear un campo de tabla en lugar de un campo básico. Puede asignar un nombre al campo y proporcionar una petición, como con los otros campos. También puede proporcionar campos de columna. Estos campos tienen un nombre de columna, una descripción de columna y un tipo de columna. Cuando se muestran en la tabla de extracción, un campo de tabla tiene los resultados de la columna agrupados bajo el nombre de la tabla. Los campos de tabla solo pueden tener un máximo de 15 subcampos.

**Groups**  
Un grupo es una estructura que se utiliza para organizar varios resultados en una sola ubicación dentro de la extracción. Al crear un grupo, se le asigna un nombre, y se pueden crear y colocar campos en ese grupo. Este grupo está marcado en la tabla de extracciones y, debajo de él, se muestran los campos que están dentro del grupo. 

**Tipos personalizados**  
Puede crear un tipo personalizado mientras edita un esquema en el sitio de pruebas de esquemas. Cualquier campo puede ser de tipo personalizado. Este tipo tiene un nombre único y solicita la creación de los campos que componen la detección. Un ejemplo sería crear un tipo personalizado denominado Dirección e incluir en él los campos “zip\$1code”, “city\$1name”, “street\$1name” y “state”. Luego, al procesar un documento, podría usar el tipo personalizado en el campo “company\$1address”. A continuación, ese campo devuelve toda la información, agrupada en filas debajo del tipo personalizado. Puede tener hasta 30 campos de texto personalizados por esquema.

# Creación de esquemas
<a name="bda-idp"></a>

## Cómo crear esquemas para salidas personalizadas
<a name="how-to-create-blueprints"></a>

Amazon Bedrock La automatización de datos (BDA) le permite crear planos personalizados para cualquier tipo de archivo que BDA pueda extraer. Puede usar esquemas para definir el formato de salida y la lógica de extracción deseados para los archivos de entrada. Al crear esquemas personalizados, puede personalizar la salida de BDA de acuerdo con sus requisitos específicos.

Dentro de un proyecto, puede aplicar:
+ Varios esquemas de documentos, hasta 40. Esto le permite procesar diferentes tipos de documentos dentro del mismo proyecto, cada uno con su propia lógica de extracción personalizada.
+ Un esquema de imagen. Esto garantiza la coherencia en el procesamiento de imágenes dentro de un proyecto.
+ Un esquema de audio.
+ Un esquema de vídeo.

### Creación de esquemas
<a name="creating-blueprints-methods"></a>

 Existen dos métodos para crear esquemas en BDA: 
+ Uso de la petición de esquema
+ Creación manual del esquema

#### Uso de la petición de esquema
<a name="creating-blueprints-methods-assistant"></a>

 La petición de esquema proporciona una interfaz guiada y basada en lenguaje natural para crear esquemas. Para crear un esquema mediante la petición: 

1.  Desplácese hasta la sección **Esquemas** en la consola de BDA.

1.  Haga clic en **Crear esquema y** seleccione **Usar petición de esquema**.

1.  Elija el tipo de datos (documento, imagen, audio o vídeo) para su esquema.

1.  Describa los campos y los datos que desea extraer en lenguaje natural. Por ejemplo: “Extraer el número de factura, el importe total y el nombre del proveedor de las facturas”.

1.  La petición generará un esquema basado en su descripción.

1.  Revise el esquema generado y haga los ajustes necesarios. Las peticiones de esquema se basan en un solo turno, lo que significa que tendrá que volver a introducir toda la información para modificar la petición, no solo la información nueva.

1.  Guarde el esquema y asígnele un nombre.

##### Ejemplo de petición de esquema
<a name="w2aac28b8c14c11b3b9b7b7"></a>

En la siguiente sección se ofrece un ejemplo de una petición de esquema para un esquema de audio. Para este caso de uso, queremos crear un esquema para extraer información de una conversación entre un cliente y un representante del servicio de atención al cliente. En la siguiente captura de pantalla se muestra la ventana de petición en la consola.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/audio-bpa-prompt.png)


En la parte inferior de la captura de pantalla puede ver la petición generada por IA en función de la información introducida en el cuadro. Podemos ver cómo se procesan los campos que mencionamos. A continuación, podemos ver el esquema creado a partir de la petición.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/audio-bpa-example.png)


Aquí podemos ver la información que esperamos procesar de la conversación. Si los campos ya tienen la precisión que desea, puede empezar a procesar un archivo de audio inmediatamente. Si quiere editar el esquema, tendrá que crear un duplicado en lugar de editarlo directamente. También puede ajustar la petición para obtener otros resultados.

#### Creación manual de esquemas
<a name="creating-blueprints-methods-id"></a>

 Los usuarios más avanzados o aquellos que requieren un control detallado pueden crear los esquemas manualmente: 

1.  Desplácese hasta la sección **Esquemas** en la consola de BDA.

1.  Haga clic en **Crear esquema** y seleccione **Crear manualmente**.

1.  Elija el tipo de datos (documento, imagen, audio o vídeo) para su esquema.

1.  Defina los campos que desee extraer, especificando los tipos de datos, los formatos y las reglas de validación.

1.  Realice ajustes adicionales, como la división del documento o el tratamiento del diseño.

1.  Guarde el esquema y asígnele un nombre.

También puede usar el editor JSON de esquemas para crear o modificar un esquema. Esto le permite ajustar el JSON del esquema directamente a través del editor de texto.

### Adición de esquemas a los proyectos
<a name="adding-blueprints-projects"></a>

Los proyectos actúan como contenedores para los flujos de trabajo de procesamiento de contenido multimodales, mientras que los esquemas definen la lógica de extracción de esos flujos de trabajo. Los esquemas se agregan a los proyectos para aplicarlos a los archivos que se procesan con ese proyecto.

 Cómo añadir un esquema a un proyecto: 

1.  Desplácese hasta la sección **Proyectos** en la consola de BDA.

1.  Seleccione el proyecto al que desea agregar el esquema.

1.  Haga clic en **Agregar esquema** o **Administrar esquemas**.

1.  Elija el esquema que desee añadir de la lista de esquemas disponibles.

1.  Realice los ajustes específicos del proyecto para el esquema.

1.  Guarde los cambios en el proyecto.

### Definición de campos
<a name="bda-images-defining-fields"></a>

Para empezar, puede crear un campo para identificar la información que desea extraer o generar, como product\$1type. Para cada campo, debe proporcionar una descripción, un tipo de datos y un tipo de inferencia.

Para definir un campo, debe especificar los siguientes parámetros:
+ *Descripción:* proporciona una explicación en lenguaje natural de lo que representa el campo. Esta descripción ayuda a comprender el contexto y el propósito del campo, lo que contribuye a la extracción precisa de los datos.
+ *Tipo*: especifica el tipo de datos del valor del campo. BDA admite los siguientes tipos:
  + cadena: para valores basados en texto
  + número: para valores numéricos
  + booleano: para valores verdadero o falso
  + matriz: para campos que pueden tener varios valores del mismo tipo (por ejemplo, una matriz de cadenas o una matriz de números)
+ *Tipo de inferencia:* indica a BDA cómo gestionar la generación de respuestas del valor del campo. En el caso de las imágenes, BDA solo admite el tipo de inferencia inferido. Esto significa que BDA deduce el valor del campo en función de la información presente en la imagen.

En el caso de los vídeos, los campos también incluyen la granularidad como opción. Para obtener más información sobre esta característica, consulte Creación de esquemas para vídeos.

La siguiente imagen muestra el módulo «Añadir campos» de la Amazon Bedrock consola con los siguientes campos y valores de ejemplo:
+ Nombre del campo: product\$1type
+ Tipo: cadena
+ Instrucción: ¿cuál es el producto o servicio principal que se va a anunciar, por ejemplo, ropa, productos electrónicos, alimentos y bebidas, etc.? 
+ Tipo de extracción: inferida.

![\[Amazon Bedrock La interfaz de usuario muestra los menús desplegables y un campo de texto para especificar los campos de imagen.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-console-add-fields-new.png)


Este es un ejemplo del aspecto que tiene la misma definición de campo en un esquema JSON, para la API:

```
"product_type":{
"type": "string",
"inferenceType": "inferred",
"description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?"
}
```

En este ejemplo:
+  El tipo se establece en cadena, lo que indica que el valor del campo product\$1type debe estar basado en texto.
+ inferenceType está configurado como inferido, lo que indica a BDA que deduzca el valor en función de la información presente en la imagen.
+ La descripción proporciona un contexto adicional al indicar que el campo debe identificar el tipo de producto de la imagen. Los valores de ejemplo del campo product\$1type son: ropa, productos electrónicos y alimentos o bebidas.

Al especificar estos parámetros para cada campo, proporciona a BDA la información necesaria para extraer y generar información de forma precisa a partir de sus imágenes.

### Creación de versiones del proyecto
<a name="blueprints-project-verions"></a>

Al trabajar con proyectos, puede crear una versión de un esquema. Una versión es una instantánea inmutable de un esquema que conserva sus configuraciones y lógica de extracción actuales. Esta versión del esquema se puede enviar como una solicitud para empezar a procesar los datos, lo que garantiza que BDA procese los documentos de acuerdo con la lógica especificada en el esquema en el momento de crear la versión. 

Puede crear una versión mediante la operación `CreateBlueprintVersion`.

La consola de Amazon Bedrock también le permite crear y guardar esquemas. Al guardar un esquema, se le asigna un ID. A continuación, puede publicar el esquema, lo que crea una instantánea de ese esquema que no se puede editar. Por ejemplo, si el plano asociado a su proyecto es «DocBlueprint», la versión del proyecto creada será «DocBlueprint\$11». No podrá realizar más cambios en «DocBlueprint\$11», pero sí podrá editar el esquema base. Si realiza cambios en el esquema y vuelve a publicarlo, se creará una nueva versión, como «DocBlueprint\$12». Las versiones de los esquemas se pueden duplicar y utilizar como base para un nuevo esquema.

# Uso de esquemas para realizar diferentes tareas de IDP
<a name="idp-cases"></a>

Los esquemas son una herramienta extremadamente versátil para el procesamiento de documentos. En las siguientes secciones se analiza la creación de esquemas teniendo en cuenta varios objetivos relacionados con IDP. Además, en esta sección se proporciona información más detallada sobre las particularidades de la creación de esquemas para documentos en general.

# Creación de esquemas para la clasificación
<a name="idp-cases-classification"></a>

Con BDA, puede clasificar los documentos asignando una clase de documento y proporcionando una descripción al crear un esquema. La clase de documento sirve como una clasificación general del tipo de documento, mientras que la descripción proporciona detalles sobre el contenido y los elementos esperados dentro de esa clase de documentos. Le recomendamos que la descripción especifique el tipo de datos típico que se encuentra en los documentos junto con otra información relevante, como el propósito del documento y las entidades esperadas. 

Algunos ejemplos de clases de documentos y sus descripciones son las siguientes:


| Clase de documento | Descripción | 
| --- | --- | 
|  Factura  |  Una factura es un documento que contiene la lista de los servicios prestados o los artículos comprados a una empresa por una persona u otra empresa. Contiene detalles como cuándo vence el pago y cuánto se debe.  | 
|  Recibo de pago  |  Este documento emitido por un empleador a un empleado contiene el salario recibido por un empleado durante un período determinado. Por lo general, contiene el desglose de cada una de las partidas de ingresos y deducciones fiscales.  | 
|  Recibos  |  Documento en el que se reconoce que una persona ha recibido dinero o bienes como pago tras una venta u otra transferencia de bienes o prestación de un servicio. Todos los recibos deben llevar la fecha de compra.  | 
|  W2  |  Este es un formulario de impuestos para declarar los ingresos personales recibidos de un empleador en un año fiscal  | 

Después de crear los campos del esquema, siga estos pasos:

1. En la página Crear esquema, seleccione **Guardar y salir de la petición del esquema**.

1. En Nombre del esquema, introduzca un nombre para el esquema.

1. En Clase de documento, introduzca un nombre de clase que represente el tipo de documento que desea clasificar.

1. En el campo Descripción, proporcione una descripción detallada del tipo de documento. Incluya información sobre el tipo de datos y los elementos que suelen encontrarse en estos documentos, como la persona, la empresa, las direcciones, los detalles del producto o cualquier otra información relevante.

1. Seleccione Publicar esquema.

Después de crear el esquema, puede usarlo para clasificar los documentos durante la inferencia proporcionando uno o más identificadores de esquema en la solicitud de la API InvokeDataAutomationAsync.

BDA utiliza la clase y la descripción del documento que se proporcionan en cada uno de los esquemas para clasificar y procesar los documentos con precisión. Al enviar un documento para su procesamiento, BDA analiza su contenido y lo compara con la lista de esquemas proporcionada. A continuación, el documento se clasifica y procesa según las instrucciones de los campos del esquema para producir la salida en la estructura deseada.

# Creación de esquemas para extracción
<a name="idp-cases-extraction"></a>

BDA le permite definir los campos de datos específicos que desea extraer de sus documentos mediante la creación de un esquema. Actúa como un conjunto de instrucciones que guían a BDA sobre qué información buscar y cómo interpretarla.

**Definición de campos**  
Para empezar, puede crear una propiedad para cada campo que deba extraerse, como employee\$1id o product\$1name. Para cada campo, debe proporcionar una descripción, un tipo de datos y un tipo de inferencia.

Para definir un campo para su extracción, debe especificar los siguientes parámetros:
+ Nombre del campo: proporciona una explicación legible para los humanos de lo que representa el campo. Esta descripción ayuda a comprender el contexto y el propósito del campo, lo que contribuye a la extracción precisa de los datos.
+ Instrucción: proporciona una explicación en lenguaje natural de lo que representa el campo. Esta descripción ayuda a comprender el contexto y el propósito del campo, lo que contribuye a la extracción precisa de los datos.
+ Tipo: especifica el tipo de datos del valor del campo. BDA admite los siguientes tipos de datos:
  + cadena: para valores basados en texto
  + número: para valores numéricos
  + boolean: Para valores true/false 
  + matriz: para campos que pueden tener varios valores del mismo tipo (por ejemplo, una matriz de cadenas o una matriz de números)
+ Tipo de inferencia: indica a BDA cómo tratar la extracción del valor del campo. Los tipos de inferencia admitidos son:
  + Explícita: BDA debe extraer el valor directamente del documento.
  + Inferida: BDA debe deducir el valor en función de la información presente en el documento.

A continuación se incluye un ejemplo de definición de campos con todos los parámetros:

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Cadena” y el “Tipo de extracción” se establece en “Explícita”.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

En este ejemplo:
+ El tipo se establece en una cadena, lo que indica que el valor del campo product\$1type debe estar basado en texto.
+ inferenceType está establecido en Explícito, lo que indica a BDA que extraiga el valor directamente del documento sin ninguna transformación ni validación.
+ La instrucción proporciona un contexto adicional y aclara que el campo debe contener el nombre abreviado del producto sin ningún detalle adicional.

Al especificar estos parámetros para cada campo, proporciona a BDA la información necesaria para extraer e interpretar los datos deseados de forma precisa de sus documentos.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  Nombre completo del solicitante  |  Explícita  |  cadena  | 
|  DateOfBirth  |  Fecha de nacimiento del empleado  |  Explícita  |  cadena  | 
|  Ventas  |  Ingresos o ventas brutos  |  Explícita  |  número  | 
|  Statement\$1starting\$1balance  |  Saldo al inicio del período  |  Explícita  |  número  | 

**Campos de varios valores**  
En los casos en que un campo pueda contener varios valores, puede definir matrices o tablas.

**Lista de campos**  
Para los campos que contienen una lista de valores, puede definir un tipo de datos de matriz. 

En este ejemplo, «OtherExpenses» se define como una matriz de cadenas que permite a BDA extraer varias partidas de gastos para ese campo.

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Matriz de cadenas” y el “Tipo de extracción” se establece en “Explícita”.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**Tablas**  
Si el documento contiene datos tabulares, puede definir una estructura de tabla dentro del esquema.

En este ejemplo, “SERVICES\$1TABLE” se define como un tipo de tabla, con campos de columnas como el nombre del producto, la descripción, la cantidad, el precio unitario y el importe.

------
#### [ Console ]

![\[Consola que muestra cómo añadir “Nombre de campo” e “Instrucción”. El “Tipo” se establece en “Tabla” y el “Tipo de extracción” se establece en “Explícita”, y muestra los campos específicos de la columna que se añaden.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

Al definir esquemas completos con las descripciones de campo, los tipos de datos y los tipos de inferencia adecuados, puede asegurarse de que BDA extraiga con precisión la información deseada de sus documentos, independientemente de las variaciones en el formato o la representación.

# Creación de esquemas para normalización
<a name="idp-cases-normalization"></a>

BDA proporciona capacidades de normalización que le permiten convertir y estandarizar los datos extraídos de acuerdo con sus requisitos específicos. Estas tareas de normalización se pueden clasificar en normalización de claves y normalización de valores.

**Normalización de claves**  
En muchos casos, los campos del documento pueden tener variaciones en la forma en que se representan o etiquetan. Por ejemplo, el campo “Número de la seguridad social” puede aparecer como “SSN”, “Número de identificación fiscal”, “NSS” u otras variantes similares. Para abordar este desafío, BDA ofrece la normalización de claves, que le permite proporcionar instrucciones sobre las variaciones en las definiciones de sus campos.

Con la normalización de claves, puede guiar a BDA para que reconozca y asigne diferentes representaciones del mismo campo a una clave estandarizada. Esta característica garantiza que los datos se extraigan y organicen de forma coherente, independientemente de las variaciones presentes en los documentos de origen.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  LastName  |  Apellidos de una persona  |  Explícita  |  Cadena  | 
|  BirthNum  |  Número de documento o número de expediente del certificado de nacimiento  |  Explícita  |  Cadena  | 
|  OtherIncome  |  Otros ingresos, incluidos los créditos o reembolsos fiscales federales y estatales sobre la gasolina o el combustible  |  Explícita  |  Número  | 
|  BusinessName  |  Nombre de la empresa, contratista o entidad que rellena el formulario W9  |  Explícita  |  Cadena  | 
|  factor de potencia  |  Factor de potencia o multiplicador utilizado para este elemento de línea de uso  |  Explícita  |  Cadena  | 
|  BirthPlace  |  Nombre del hospital o institución donde nació el niño  |  Explícita  |  Cadena  | 
|  Causa de la lesión  |  Causa de la lesión o enfermedad ocupacional, incluida la forma en que está relacionada con el trabajo  |  Explícita  |  Cadena  | 

En el caso de los campos con conjuntos de valores o enumeraciones predefinidos, puede proporcionar los valores o intervalos esperados en la instrucción del campo. Se recomienda incluir las variaciones entre comillas, tal y como se muestra en los ejemplos.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  LICENSE\$1CLASS  |  El código de clase de una sola letra: “A”, “B” o “C”  |  Explícita  |  Cadena  | 
|  sex  |  El sexo: “M” o “F”  |  Explícita  |  Cadena  | 
|  InformantType  |  El tipo de información: “Principal” u “Otro”  |  Explícita  |  Cadena  | 
|  CANAL DE RECOPILACIÓN DE INFORMACIÓN  |  UNO DE LOS SIGUIENTES: “ENTREVISTA CARA A CARA”, “ENTREVISTA TELEFÓNICA”, “FAX O CORREO”, “CORREO ELECTRÓNICO O INTERNET”  |  Explícita  |  Cadena  | 

**Normalización de valores**  
La normalización de valores es una tarea clave en las canalizaciones de procesamiento de datos, donde los datos extraídos deben transformarse en un formato uniforme y estandarizado. Este proceso garantiza que los sistemas posteriores puedan consumir y procesar los datos de manera fluida, sin problemas de compatibilidad ni ambigüedades.

Al utilizar las funciones de normalización de BDA, puede estandarizar formatos, convertir unidades de medida y convertir valores en tipos de datos específicos.

Para las tareas de normalización de valores, se debe utilizar el tipo de extracción inferida, ya que es posible que el valor no coincida exactamente con el texto sin procesar o con el OCR del documento una vez normalizado. Por ejemplo, un valor de fecha como “06/25/2022” que deba tener el formato “AAAA-MM-DD” se extraerá como “2022-06-25” tras la normalización, por lo que no coincidirá con el resultado de OCR del documento.

Estandarizar los formatos: puede convertir valores a formatos predefinidos, como códigos abreviados, esquemas de numeración o formatos de fecha específicos. Esto le permite garantizar la coherencia en la representación de los datos al cumplir los estándares del sector o las convenciones de la organización.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  ssn  |  El SSN, formateado como XXX-XX-XXX  |  Inferida  |  Cadena  | 
|  STATE  |  El código de dos letras del estado  |  Inferida  |  Cadena  | 
|  EXPIRATION\$1DATE  |  La fecha de caducidad en formato YYYY-MM-DD  |  Inferida  |  Cadena  | 
|  DATE\$1OF\$1BIRTH  |  La fecha de nacimiento del conductor en formato YYYY-MM-DD  |  Inferida  |  Cadena  | 
|  CHECK\$1DATE  |  La fecha en que se firmó el cheque. Reformatear a YYYY-MM-DD  |  Inferida  |  Cadena  | 
|  PurchaseDate  |  Fecha de compra del vehículo en formato mm/dd/yy  |  Inferida  |  Cadena  | 

También puede convertir valores en una unidad de medida estándar o en un tipo de datos específico gestionando escenarios como No aplicable.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  WEIGHT  |  Peso convertido a libras  |  Inferida  |  Número  | 
|  HEIGHT  |  Altura convertida a pulgadas  |  Inferida  |  Número  | 
|  nonqualified\$1plans\$1income  |  El valor del campo 11. 0 si es N/A.  |  Inferida  |  Número  | 

# Creación de esquemas para transformación
<a name="idp-cases-transformation"></a>

BDA le permite dividir y reestructurar los campos de datos según sus necesidades específicas. Esta capacidad le permite transformar los datos extraídos en un formato que se adapte mejor a sus necesidades de análisis o de sistemas posteriores. 

En muchos casos, los documentos pueden contener campos que combinan varios datos en un solo campo. BDA le permite dividir estos campos en campos separados distintos para facilitar la manipulación y el análisis de los datos. Por ejemplo, si un documento contiene el nombre de una persona como un solo campo, puede dividirlo en campos separados para el nombre, el segundo nombre, el apellido y el sufijo.

Para las tareas de transformación, el tipo de extracción se puede definir como Explícita o Inferida, en función de si es necesario normalizar el valor. 


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  FIRST\$1NAME  |  El nombre  |  Explícita  |  Cadena  | 
|  MIDDLE\$1NAME  |  El segundo nombre o la inicial  |  Explícita  |  Cadena  | 
|  LAST\$1NAME  |  El apellido del conductor  |  Explícita  |  Cadena  | 
|  SUFFIX  |  El sufijo, como PhD, MSc, etc.  |  Explícita  |  Cadena  | 

Otro ejemplo son los bloques de direcciones que pueden aparecer como un solo campo


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  Calle  |  ¿Cuál es la dirección?  |  Explícita  |  Cadena  | 
|  Ciudad  |  ¿Cuál es la ciudad?  |  Explícita  |  Cadena  | 
|  Estado  |  ¿Cuál es el estado?  |  Explícita  |  Cadena  | 
|  ZipCode  |  ¿Cuál es el código postal de la dirección?  |  Explícita  |  Cadena  | 

Puede definir estos campos como campos completamente individuales o crear un tipo personalizado. Los tipos personalizados son aquellos que puede reutilizar para diferentes campos. En el siguiente ejemplo, creamos un tipo personalizado “NameInfo” que utilizamos para “EmployeeName” y “ManagerName”.

![\[Consola que muestra cómo añadir detalles de tipo personalizado. También muestra las subpropiedades añadidas al tipo personalizado.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bdacustomtype.png)


# Creación de esquemas para validación
<a name="idp-cases-validation"></a>

BDA le permite definir reglas de validación para garantizar la precisión de los datos extraídos. Estas reglas de validación se pueden incorporar a sus esquemas, lo que permite a la BDA realizar diversas comprobaciones de los datos extraídos. BDA le permite crear validaciones personalizadas adaptadas a los requisitos específicos de su empresa o sector. A continuación se muestran algunos ejemplos de validaciones para ilustrar el alcance de esta capacidad.

**Validaciones numéricas**  
Las validaciones numéricas se utilizan para comprobar si los datos numéricos extraídos se encuentran dentro de un intervalo de valores específico o si cumplen ciertos criterios. Estas validaciones se pueden aplicar a campos como importes, cantidades o cualquier otro dato numérico.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  BalanceGreaterCheck  |  ¿El saldo anterior es superior a 1000 USD?  |  Inferida  |  Booleano  | 
|  ¿El beneficio bruto es igual a la diferencia entre ventas y COGS?  |  Pregunta de validación  |  Inferida  |  Booleano  | 
|  is\$1gross\$1pay\$1valid  |  ¿Es el salario bruto hasta la fecha el valor más alto en dólares del recibo de pago?  |  Inferida  |  Booleano  | 

**Validaciones de fecha y hora**  
Las validaciones de fecha y hora se utilizan para comprobar si los datos de fecha y hora extraídos se encuentran dentro de un intervalo específico o si cumplen ciertos criterios. Estas validaciones se pueden aplicar a campos como las fechas de vencimiento, las fechas de caducidad o cualquier otro dato relacionado con la fecha y la hora.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  was\$1injury\$1reported\$1after\$11\$1month  |  ¿Se informó al empleador de la lesión más de un mes después de la fecha de la lesión?  |  Inferida  |  Booleano  | 
|  is\$1overdue  |  ¿El extracto está retrasado? ¿Ha vencido la fecha de pago del saldo?  |  Inferida  |  Booleano  | 
|  is\$1delivery\$1date\$1valid  |  ¿La fecha de entrega es en los próximos 30 días?  |  Inferida  |  Booleano  | 

**Validaciones de cadenas o formatos**  
Las validaciones de cadenas o formatos se utilizan para comprobar si los datos extraídos se adhieren a un formato específico o si coinciden con patrones predefinidos. Estas validaciones se pueden aplicar a campos como nombres, direcciones o cualquier otro dato textual que requiera la validación del formato.


| Campo | Instrucciones | Tipo de extracción | Tipo | 
| --- | --- | --- | --- | 
|  routing\$1number\$1valid  |  True si el número de ruta bancaria tiene nueve dígitos  |  Inferida  |  Booleano  | 
|  Is\$1NumMeterIDsListed  |  ¿Hay más de cinco identificadores de medición en la factura?  |  Inferida  |  Booleano  | 

Con las capacidades de validación personalizadas de BDA, puede crear reglas de validación complejas que combinen varias condiciones, cálculos u operaciones lógicas para garantizar que los datos extraídos cumplan los criterios deseados. Estas validaciones pueden incluir comprobaciones cruzadas, cálculos o cualquier otra lógica personalizada específica para sus procesos empresariales o requisitos normativos.

Al incorporar estas reglas de validación en sus esquemas, BDA puede validar automáticamente los datos extraídos, garantizando su precisión y el cumplimiento de sus requisitos específicos. Esta capacidad le permite activar revisiones humanas cuando las validaciones han fallado.

# Creación de esquemas para imágenes
<a name="bda-idp-images"></a>

Automatización de Datos de Amazon Bedrock (BDA) le permite crear esquemas personalizados para las modalidades de imagen. Puede usar esquemas para definir el formato de salida y la lógica de extracción deseados para los archivos de entrada. Al crear esquemas personalizados, puede personalizar la salida de BDA de acuerdo con sus requisitos específicos. Dentro de un proyecto, puede aplicar un esquema de una sola imagen.

## Definición de campos de datos para imágenes
<a name="bda-images-defining-data-fields"></a>

BDA le permite definir los campos específicos que desea identificar en sus imágenes mediante la creación de un esquema. Actúa como un conjunto de instrucciones que guían a BDA sobre la información que debe extraer y generar a partir de sus imágenes.

### Ejemplos de campos de esquemas para imágenes publicitarias
<a name="w2aac28b8c14c11b9b5b5"></a>

A continuación, se ofrecen algunos ejemplos de campos de esquemas para analizar imágenes publicitarias.




|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrucción | Tipo de extracción | Tipo | 
| product\$1type | ¿Cuál es el producto o servicio principal que se anuncia? Por ejemplo: ropa, electrónica, alimentos y bebidas | inferido | cadena | 
| colocación\$1del producto | ¿Cómo se coloca el producto en la imagen del anuncio, por ejemplo, centrado, en segundo plano, sostenido por una persona, etc.? | inferido | cadena | 
| tamaño\$1producto | El tamaño del producto es pequeño si el tamaño es inferior al 30% de la imagen, mediano si está entre el 30 y el 60% y grande si ocupa más del 60% de la imagen | inferido | cadena | 
| estilo\$1imagen | Clasifica el estilo de imagen del anuncio. Por ejemplo, imagen del producto, estilo de vida, retrato, retro, infografía, ninguno de los anteriores. | inferido | cadena | 
| imagen\$1fondo | El fondo puede ser de «color sólido, paisaje natural, interior, exterior o abstracto.  | inferido | cadena | 
| oferta\$1promocional | ¿El anuncio incluye descuentos, ofertas o mensajes promocionales? | inferido | booleano | 

### Ejemplos de campos de esquemas para la búsqueda de contenido multimedia
<a name="w2aac28b8c14c11b9b5b7"></a>

Estos son algunos ejemplos de campos de esquemas para generar metadatos a partir de imágenes para la búsqueda de contenido multimedia.




|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrucción | Tipo de extracción | Tipo | 
| conteo de personas | ¿Cuántas personas aparecen en la imagen? | inferido | número | 
| clasificación interior\$1exterior\$1 | ¿La imagen está en interiores o exteriores? | inferido | cadena | 
| clasificación\$1de escenas | Clasifique la configuración o el entorno de la imagen. Por ejemplo: espacios urbanos, rurales, naturales, históricos, residenciales, comerciales, recreativos o públicos | inferido | cadena | 
| identificación\$1animal | ¿La imagen contiene algún animal? | inferido | booleano | 
| tipo\$1animal | ¿Qué tipo de animales aparecen en la imagen? | inferido | cadena | 
| identificación\$1color | ¿La imagen está en color o en blanco y negro? | inferido | cadena | 
| identificación\$1del\$1vehículo | ¿Hay algún vehículo visible en la imagen? | inferido | cadena | 
| tipo\$1vehículo | ¿Qué tipo de vehículo aparece en la imagen? | inferido | cadena | 
| identificación\$1marca de agua | ¿Hay alguna marca de agua visible en la imagen? | inferido | booleano | 

# Creación de esquemas para audio
<a name="creating-blueprint-audio"></a>

Al igual que los esquemas de imagen, solo puede tener un esquema de audio por proyecto.

A continuación, se muestran algunos campos de ejemplo para el procesamiento de audio.

## Ejemplos de campos de esquema para archivos de audio
<a name="example-audio-fields"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrucciones | Tipo de extracción | Tipo | 
| transcript\$1summary | Generate a concise abstractive summary of the conversation, focusing on the main topics and key themes. Ensure accuracy by summarizing only what is explicitly discussed, without adding specific details not present in the conversation. Keeping the response within 100 words. | inferred | string | 
| topics | The main topics of the audio transcript, listed as single words. | inferred | [string] (Array of strings) | 
| category | The category of the audio (not the topic). Choose from General conversation, Media, Hospitality, Speeches, Meetings, Education, Financial, Public sector, Healthcare, Sales, Audiobooks, Podcasts, 911 calls, Other. | inferred | string | 
| spoken\$1named\$1entities | Any named entities (typically proper nouns) explicitly mentioned in the audio transcript including locations, brand names, company names, product names, services, events, organizations, etc. Do not include names of people, email addresses or common nouns.  | extractive | [string] (Array of strings) | 

## Ejemplos de campos de esquema para el análisis conversacional
<a name="example-audio-analytics"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Campo | Instrucciones | Tipo de extracción | Tipo | 
| call\$1summary | Summarize the caller-agent conversation in under 100 words. Start with the caller's request, then the agent's response and actions, ending with outcomes or follow-ups. Include key details like emails, links, or callbacks. For multiple issues, summarize each with its outcome and next steps. | inferred | string | 
| call\$1categories | The category (or categories) of the call. Choose one or more from Billing, Tech support, Customer service, Account support, Sales, Complaints, Product issues, Service issues, General inquiries, Other. | inferred | [string] (Array of strings) | 
| spoken\$1locations | Locations explicitly mentioned in the conversation, including cities, states, and countries. | extractive | [string] | 
| call\$1opening | Did the agent greet the caller and introduce themselves at the beginning of the call?  | extractive | boolean | 

# Creación de esquemas para vídeo
<a name="creating-blueprint-video"></a>

Los esquemas de archivos de vídeo tienen algunas cualidades únicas en comparación con otros esquemas, especialmente en la creación sobre el terreno. Los esquemas de vídeo tienen un parámetro denominado granularidad, que permite establecer un campo como Vídeo o Capítulo. Si el campo está configurado como vídeo, se detectará en todo el vídeo. Por ejemplo, si desea obtener un resumen de todo el clip, debería establecer la granularidad de ese campo en vídeo. 

Por el contrario, un campo con la granularidad establecida en Capítulo devolverá una respuesta para cada capítulo del vídeo. El campo devolverá un valor para cada capítulo de vídeo. Siguiendo con el ejemplo anterior, si quiere obtener un resumen de cada parte de un vídeo, debe establecer la granularidad en capítulo.

Al crear un campo de granularidad de capítulo, puede establecer un tipo de datos único, una matriz de entidades. Por ejemplo, si desea detectar los objetos visualmente destacados en el vídeo, puede crear un campo llamado `key-visual-objects` y configurar el tipo como una matriz de entidades. A continuación, este campo devolvería los nombres de las entidades en un objeto de matriz.

A continuación, se muestran algunos campos de ejemplo para el procesamiento de vídeo. Todos los campos de los esquemas de vídeo se consideran inferidos, excepto las entidades y las matrices de entidades.

## Ejemplos de campos de esquemas para la búsqueda de contenido multimedia
<a name="example-video-fields-search"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrucciones | Tipo de extracción | Tipo | Granularity (Grado de detalle) | 
| key-visual-objects | Please detect all the visually prominent objects in the video | extractive | Array of entities | [ "chapter" ] | 
| keywords | Searchable terms that capture key themes, cast, plot elements, and notable aspects of TV shows and movies to enhance content discovery. | inferred | Array of strings | ["video"] | 
| genre | The genre of the content. | inferred | string | ["video"] | 
| video-type | Identify the type of video content | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Ejemplos de campos de esquemas para los aspectos destacados de las presentaciones principales
<a name="example-video-fields-keynote"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrucciones | Tipo de extracción | Tipo | Granularity (Grado de detalle) | 
| broadcast-setting | The physical setting or environment where the broadcast or training session is taking place. | inferred | enums["conference hall", "classroom", "outdoor venue", "Others", "Not applicable to the video"] | [ "video" ] | 
| broadcast-audience-engagement | The level of engagement or interaction between the speakers and the audience. | inferred | enums["interactive", "passive", "Not applicable to the video"] | ["video"] | 
| broadcast-visual-aids | A list of notable visual aids or materials used during the presentation, such as slides, diagrams, or demonstrations. | inferred | Array of strings | ["video"] | 
| broadcast-audience-size | The size of the audience present at the event. | inferred | enums["large crowd", "medium crowd", "small group", "Not applicable to this video"] | [ "chapter" ] | 
| broadcast-presentation-topics | A list of key topics, subjects, or themes covered in the presentation or training session. | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Ejemplos de campos de esquemas para análisis de anuncios
<a name="example-video-fields-ad"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Campo | Instrucciones | Tipo de extracción | Tipo | Granularity (Grado de detalle) | 
| ads-video-ad-categories | The ad categories for the video | inferred | enums["Health and Beauty", "Weight Loss", "Food and Beverage", "Restaurants", "Political", "Cryptocurrencies and NFT", "Money Lending and Finance", "Tobacco", "Other", "Video is not an advertisement"] | [ "video" ] | 
| ads-video-language | The primary language of the advertisement | inferred | string | ["video"] | 
| ads-video-primary-brand | The main brand or company being advertised in the video. | inferred | string | ["video"] | 
| ads-video-main-message | The primary message or tagline conveyed in the advertisement | inferred | string | [ "video" ] | 
| ads-video-message-clarity | How clear and understandable the main message of the advertisement is | inferred | enums: ["clear", "ambiguous", "Not applicable to the video"] | [ "video" ] | 
| ads-video-target-audience-interests | Specific interests or hobbies that the target audience is likely to have | inferred | Array of strings | [ "video" ] | 
| ads-video-product-type | The category or type of product being advertised | inferred | enums: ["electronics", "apparel", "food\$1and\$1beverage", "automotive", "home\$1appliances", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-placement | The way the product is positioned or showcased in the advertisement | inferred | enums: ["front\$1and\$1center", "background", "held\$1by\$1person", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-features | The key features or specifications of the advertised product highlighted in the video | inferred | Array of strings | [ "video" ] | 
| ads-video-number-of-products | The number of distinct products or variations featured in the advertisement | inferred | number | [ "video" ] | 

El vídeo también admite una variedad de tipos de entidades, lo que ayuda a identificar y localizar entidades específicas dentro del contenido de vídeo. Esta característica devuelve una matriz de entidades detectadas. A continuación, se muestra un ejemplo de un conjunto de entidades en el esquema de un cliente:

```
  "field_name": {
        "items": {
            "$ref": "bedrock-data-automation#/definitions/Entity"
        },
        "type": "array",
        "instruction": "Please detect all the visually prominent objects in the video",
        "granularity": [
            "chapter"
        ]
    }
```

**nota**  
`bedrock-data-automation#/definitions/Entity` es un tipo de servicio propiedad de BDA. Para analizar los resultados, puede utilizar el siguiente esquema.

```
       {
        "$schema": "http://json-schema.org/draft-07/schema#",
        "$id": "bedrock-data-automation",
        "type": "object",
        "definitions": {
            "BoundingBox": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "left": {
                        "type": "number"
                    },
                    "top": {
                        "type": "number"
                    },
                    "width": {
                        "type": "number"
                    },
                    "height": {
                        "type": "number"
                    }
                }
            },
            "Entity": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "label": {
                        "type": "string"
                    },
                    "bounding_box": {
                        "$ref": "bedrock-data-automation#/definitions/BoundingBox"
                    },
                    "confidence": {
                        "type": "number"
                    }
                }
            }
        },
        "properties": {}
    }
```

# Optimice sus planos con la verdad fundamental
<a name="bda-optimize-blueprint-info"></a>

Puede mejorar la precisión de los planos proporcionando activos de contenido de ejemplo con los resultados esperados correctos. **La optimización de las instrucciones del plan utiliza los ejemplos para refinar las instrucciones en lenguaje natural de los campos del plan, lo que mejora la precisión de los resultados de la inferencia.**

La optimización de las instrucciones de los planos funciona mejor cuando se necesitan extraer valores específicos que aparecen directamente en los documentos, como los números de facturas, los importes de los contratos o los campos de los formularios de impuestos. Te recomendamos proporcionar de 3 a 10 ejemplos de activos que representen los documentos que procesas durante la producción, especialmente aquellos en los que hayas tenido problemas de precisión.

**Cómo funciona la optimización de las instrucciones básicas**  
La optimización de las instrucciones de Blueprint analiza las diferencias entre los resultados esperados y los resultados de la inferencia inicial. El servicio refina de forma iterativa las instrucciones en lenguaje natural para cada campo del plano hasta que las instrucciones produzcan resultados más precisos en todos los activos de ejemplo. Este proceso se completa en cuestión de minutos sin requerir ningún tipo de entrenamiento o ajuste del modelo.

Al iniciar el proceso de optimización, proporciona los activos de ejemplo y los datos reales correspondientes, es decir, los valores correctos que espera extraer para cada campo. La optimización de las instrucciones del plan compara estos valores con los resultados de las inferencias y ajusta las descripciones de los campos para mejorar la precisión. Una vez finalizada la optimización, recibirá métricas de precisión que muestran la mejora en la precisión, incluidas las tasas de coincidencia exactas y las puntuaciones de F1 comparadas con su realidad básica.

**Lo que necesita antes de empezar a optimizar sus planos**  
**Un plano con campos definidos**. Cree un plano mediante la consola o la API. El plano debe incluir los nombres de los campos y las descripciones iniciales de los datos que desee extraer.

**Ejemplos de activos de contenido.** Reúna de 3 a 10 activos de documentos que representen su carga de trabajo de producción en documentos. Elija ejemplos que contengan todos los campos del plano.

**Resultados esperados para sus ejemplos**. Prepare los valores correctos que desee extraer de cada activo de ejemplo. Puede introducir estos valores manualmente durante la optimización o cargarlos mediante un archivo de manifiesto.

**Una ubicación de depósito de S3**. Especifique un depósito de S3 en el que desee almacenar los activos de ejemplo y los datos reales sobre el terreno. Puede proporcionar su propio depósito o permitir que el servicio cree uno por usted.

**Step-by-step proceso para optimizar su plan**  
Para optimizar su plan, comience desde la página de detalles del plan en la consola de Amazon Bedrock Data Automation. Tenga en cuenta que esto solo está disponible para su modalidad de documento.

Paso 1. Seleccione **Optimizar el esquema para iniciar** el flujo de trabajo de optimización.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-blueprint-optimize-button.png)


Paso 2. **Cargue sus activos de ejemplo.** Elige hasta 10 activos de contenido desde tu dispositivo local o desde una ubicación S3. El servicio carga sus activos y muestra miniaturas de cada archivo. Si previamente optimizó este esquema, puede añadir nuevos ejemplos o eliminar los existentes.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-optimize-files-selector.png)


Paso 3. **Proporcione información básica sobre cada activo**. Selecciona un activo para abrir el editor de información básica. El editor muestra la vista previa del documento a la izquierda y una tabla simplificada con los campos del plano a la derecha. Para cada campo, introduce el valor correcto que esperas extraer en la columna Ground Truth.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-optimize-files-ground-truth.png)


Paso 4. **Para acelerar la introducción de la verdad fundamental, seleccione **Rellenar automáticamente** para realizar una inferencia inicial sobre sus activos y rellenar automáticamente la columna **Ground Truth a partir de los valores de la** columna Resultados.** Edita los valores incorrectos antes de continuar.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-optimize-ground-truth-edit.png)


Paso 5. **Inicie la optimización**. Una vez que hayas introducido la información básica sobre todos los activos seleccionados, selecciona **Iniciar la optimización**. La automatización de datos analiza sus ejemplos y perfecciona las instrucciones en lenguaje natural para cada campo. Un indicador de progreso muestra el estado de la optimización con mensajes como «Lectura de los activos» e «Iteración siguiendo instrucciones en lenguaje natural predefinidas».

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-start-optimization-button.png)


Paso 6. **Revise las métricas de evaluación**. Cuando se complete la optimización, la sección **Métricas** mostrará las métricas de precisión de su plan. Las métricas comparan el rendimiento antes y después de la optimización. Revise la puntuación general de F1, la puntuación de confianza y la tasa de coincidencia exacta para evaluar si el modelo cumple con sus requisitos de precisión.

La pestaña **Métricas por archivo de muestra muestra** la precisión a nivel de campo para cada activo de ejemplo. Utilice estas métricas para identificar qué campos han mejorado y qué campos pueden necesitar ejemplos adicionales o ajustes manuales.

![\[alt text not found\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/bda-optimize-metrics.png)


Paso 7. **Optimización completa**. Si las métricas de evaluación cumplen con sus requisitos, seleccione **Guardar plano optimizado** para llevar el modelo optimizado a la producción. Su plan ahora utiliza las refinadas instrucciones en lenguaje natural para todas las solicitudes de inferencia futuras.

**Vuelva a optimizar su plano**  
Puede volver a optimizar un plano en cualquier momento para mejorar aún más la precisión. **Vuelva a la página de detalles del plano y seleccione Optimizar el plano.** El servicio muestra los activos que utilizó anteriormente para la optimización junto con sus valores reales básicos.

Para volver a optimizarlos, puede añadir nuevos ejemplos de activos, editar los valores reales de los activos existentes o eliminar los activos que ya no representan su carga de trabajo. Al seleccionar **Iniciar la optimización**, la optimización de las instrucciones del plan calcula en relación con las instrucciones del plan actual y las nuevas.

**Edite un plano después de la optimización**  
Si añade o elimina campos de un esquema optimizado, el servicio elimina el historial de optimización y los activos de ejemplo asociados. Antes de editarlos, descargue el archivo de manifiesto que contiene las ubicaciones de sus activos y las etiquetas de veracidad del terreno. El archivo de manifiesto utiliza el formato JSON e incluye todos los campos y valores reales de la optimización anterior. Para preservar su trabajo de optimización, cargue el archivo de manifiesto cuando vuelva a optimizar el esquema editado. La automatización de datos aplica automáticamente los valores de verdad fundamentales a los campos coincidentes. Los campos que ya no existen en el esquema se eliminan del manifiesto. Los campos nuevos no tienen valores de verdad fundamentales hasta que los proporciones.

**Gestione los costes de optimización**  
La optimización de las instrucciones de Blueprint implica los costes de inferencia, como lo haría si editara manualmente las instrucciones en lenguaje natural y las probara iterativamente con cada documento de muestra. A modo de cálculo aproximado, el número de páginas que suministre como ejemplo será el número de páginas que se cobrarán a medida que optimice el plano. Cada ejecución de optimización procesa los activos de ejemplo varias veces para refinar las instrucciones. Para minimizar los costes, comience con 3 o 5 ejemplos para la optimización inicial. Añada más ejemplos cuando inspeccione las métricas de evaluación y considere que necesita mejoras adicionales de precisión.

Además, las instrucciones optimizadas en lenguaje natural suelen ser más largas y detalladas que las instrucciones originales, lo que puede aumentar los costes de inferencia en tiempo de ejecución.