

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Cómo funciona Automatización de Datos de Bedrock
<a name="bda-how-it-works"></a>

Automatización de Datos de Bedrock (BDA) le permite configurar la salida en función de sus necesidades de procesamiento para un tipo de datos específico: documentos, imágenes, vídeo o audio. BDA puede generar una salida estándar o una salida personalizada. A continuación, se presentan algunos conceptos clave para entender cómo funciona BDA. Si es un usuario nuevo, comience con la información sobre la salida estándar.
+ Salida estándar: al enviar un archivo a BDA sin más información, se obtiene la salida estándar predeterminada, que consiste en la información que se requiere habitualmente y que se basa en el tipo de datos. Entre los ejemplos se incluyen transcripciones de audio, resúmenes de escenas de vídeo y resúmenes de documentos. Estos resultados se pueden ajustar a su caso de uso mediante proyectos para modificarlos. Para obtener más información, consulte [Salida estándar en Automatización de Datos de Bedrock](bda-standard-output.md).
+ Salida personalizada: solo para documentos, audio e imágenes. Elija una salida personalizada para definir exactamente qué información desea extraer mediante un esquema. Un esquema consiste en una lista de los campos esperados que se desean recuperar de un archivo. Cada campo representa un fragmento de información que debe extraerse para adaptarse a su caso de uso específico. Puede crear sus propios esquemas o seleccionar esquemas predefinidos del catálogo de esquemas de BDA. Para obtener más información, consulte [Salida personalizada y esquemas](bda-custom-output-idp.md).
+ Proyectos: un proyecto es un recurso de BDA que le permite modificar y organizar las configuraciones de salida. Cada proyecto puede contener configuraciones de salida estándar para documentos, imágenes, vídeo y audio, así como esquemas de salida personalizados para documentos, audio e imágenes. Los proyectos hacen referencia a la llamada a la API `InvokeDataAutomationAsync` para indicar a BDA cómo procesar los archivos. Para obtener más información sobre los proyectos y sus casos de uso, consulte [Proyectos de Automatización de Datos de Bedrock](bda-projects.md).

# Proyectos de Automatización de Datos de Bedrock
<a name="bda-projects"></a>

Una forma de procesar archivos mediante Automatización de Datos de Amazon Bedrock (BDA) es crear un proyecto. Un proyecto es un conjunto de configuraciones de salida estándar y personalizadas. Los proyectos requieren salidas estándar, pero las salidas personalizadas son opcionales. Cuando se llama a la API `InvokeDataAutomationAsync` con un ARN de proyecto, el archivo se procesa automáticamente con los ajustes de configuración definidos en ese proyecto. A continuación, se genera el resultado en función de la configuración del proyecto.

A un proyecto se le puede asignar una etapa, que puede ser `LIVE` o `DEVELOPMENT`. Cada etapa es una versión única y mutable del proyecto. Esto significa que puede editar o probar con la etapa `DEVELOPMENT` y procesar las solicitudes de los clientes utilizando la etapa `LIVE`. No se puede acceder a los proyectos de `DEVELOPMENT` desde la consola, y se deben cambiar e invocar a través de la API.

Un proyecto le permite usar un único recurso para varios tipos de archivos. Por ejemplo, un archivo de audio enviado a BDA con el nombre de proyecto ABC se procesará utilizando la configuración de salida de audio estándar del proyecto ABC. Un documento enviado a BDA con el nombre de proyecto ABC se procesará utilizando la configuración de salida de documento estándar de ABC.

Los proyectos le ofrecen una mayor flexibilidad a la hora de configurar la salida estándar. Cada salida estándar tiene su propio conjunto de opciones configurables, como transcripciones o resúmenes, y los proyectos le permiten cambiar esas opciones para adaptarlas mejor a su caso de uso. También puede configurar un proyecto con esquemas de documentos, audio e imágenes para definir una salida personalizada. Un proyecto configurado para generar una salida personalizada también generará una salida estándar automáticamente.

En las siguientes secciones veremos algunos ejemplos del uso de proyectos.

## Uso de proyectos con salida estándar
<a name="bda-standard-example"></a>

Consideremos un caso de uso en el que solo le interesa extraer resúmenes de las transcripciones de sus archivos de audio y vídeo completos. De forma predeterminada, cuando envía archivos de audio y vídeo a BDA, recibe los resúmenes de las transcripciones junto con las transcripciones completas, los resúmenes de nivel de escena, el texto detectado y otra información. En este caso de uso, no querrá dedicar tiempo y recursos adicionales a recopilar información que no necesita. Para este caso de uso, puede configurar un proyecto de salida estándar para habilitar solo la característica de resumen para los archivos de audio y vídeo.

Para ello, utilice la API o la consola, cree un proyecto y modifique la configuración de salida estándar para audio y vídeo. En el caso del vídeo, active **Resumen completo del vídeo**, pero asegúrese de que las demás extracciones (por ejemplo, la transcripción completa del audio, los resúmenes de escenas, la moderación del contenido, etc.) estén desactivadas. Repita esta configuración para el audio. Tras configurar el proyecto para que solo genere resúmenes, guárdelo y anote los nombres de los recursos de Amazon (ARN) del proyecto. Este ARN se puede utilizar para la operación `InvokeDataAutomationAsync` para procesar los archivos a escala. Al pasar un archivo de audio o vídeo a BDA y especificar el ARN de este proyecto, recibirá una salida únicamente de los resúmenes de cada uno de los archivos. Tenga en cuenta que en este ejemplo no se realizó ninguna configuración para los documentos o las imágenes. Esto significa que si pasa una imagen o un documento a BDA con el ARN de ese proyecto, recibirá la salida estándar predeterminada para esos archivos.

## Uso de proyectos con salida personalizada y salida estándar
<a name="bda-mixed-example"></a>

Para este caso de uso, vamos a suponer que desea generar resúmenes de salida estándar para documentos y archivos de audio, y también extraer campos personalizados de sus documentos. Después de crear un proyecto, configure la salida de audio estándar para activar **Resumen completo de audio** y asegúrese de que no estén habilitadas otras extracciones. Repita esta configuración de salida estándar para los documentos. A continuación, puede configurar la salida personalizada de los documentos añadiendo un esquema nuevo o uno preexistente del catálogo global de BDA. Los documentos que se pasen a BDA mediante el ARN de este proyecto generarán la salida estándar, los resúmenes completos de los documentos y la salida del esquema para los campos personalizados definidos. Los archivos de audio que se pasen a BDA mediante el ARN de este proyecto generarán resúmenes completos.

Al procesar documentos, es posible que desee utilizar varios esquemas para los distintos tipos de documentos que se pasen al proyecto. Un proyecto puede tener hasta 40 esquemas de documentos adjuntos. BDA compara automáticamente los documentos con el esquema correspondiente que esté configurado en el proyecto y genera una salida personalizada a partir de ese esquema. Además, es posible que desee pasar los documentos en bloque. Si pasa un archivo que contiene varios documentos, puede elegir dividir el documento al crear el proyecto. Si decide hacerlo, BDA analiza el archivo y lo divide en documentos individuales según el contexto. A continuación, esos documentos individuales se comparan con el esquema correcto para su procesamiento.

Actualmente, las imágenes solo admiten una única definición de esquema por proyecto. Los tipos de archivos de imagen JPG y PNG pueden tratarse como imágenes o documentos escaneados en función de su contenido. Se recomienda crear un esquema personalizado para las imágenes cuando procese la salida personalizada de los documentos, de modo que BDA proporcione la salida deseada para los archivos de imagen que contienen texto.

Los archivos de audio también admiten una única definición de esquema por proyecto.

# División de documentos al usar proyectos
<a name="bda-document-splitting"></a>

Amazon Bedrock La automatización de datos (BDA) permite dividir documentos cuando se utiliza la Amazon Bedrock API. Cuando está habilitada, la división permite a BDA tomar un PDF que contiene varios documentos lógicos y dividirlo en documentos independientes para su procesamiento. 

Una vez finalizada la división, cada segmento del documento dividido se procesa de forma independiente. Esto significa que un documento de entrada puede contener diferentes tipos de documentos. Por ejemplo, si tiene un PDF que contiene tres extractos bancarios y un formulario W2, al activar la división se intentaría dividirlo en cuatro documentos independientes que se procesarían de forma individual.

La división automática de BDA admite archivos de hasta 3000 páginas y admite documentos individuales de hasta 20 páginas cada uno.

La opción de dividir documentos está desactivada de forma predeterminada, pero se puede activar cuando se utiliza la API. A continuación, se muestra un ejemplo de cómo crear un proyecto con el divisor activado. Los puntos suspensivos representan esquemas adicionales proporcionados al proyecto.

```
   response = client.create_data_automation_project(
    projectName=project_name,
    projectDescription="Provide a project description",
    projectStage='LIVE',
    standardOutputConfiguration=output_config,
    customOutputConfiguration={
    'blueprints': [
        {
        'blueprintArn': Blueprint ARN,
        'blueprintStage': 'LIVE'
        },
        ...
        ]
        },
         overrideConfiguration={'document': {'splitter': {'state': 'ENABLED'}}}
)
```

La parte que permite el proceso de división es la línea overrideConfiguration. Esta línea configura el divisor y permite pasar varios documentos dentro del mismo archivo.

Los documentos se dividen según los límites semánticos del documento. 

La división de los documentos se produce independientemente de la aplicación de los esquemas, y los documentos que se dividan se corresponderán con el esquema más cercano. Para obtener más información sobre cómo BDA realiza la correspondencia de esquemas, consulte [Descripción de la correspondencia de esquemas](#bda-blueprint-matching).

## Descripción de la correspondencia de esquemas
<a name="bda-blueprint-matching"></a>

La correspondencia de esquemas se basa en los siguientes elementos:
+  Nombre del esquema 
+  Descripción del esquema 
+  Campos del esquema 

Al procesar documentos, puede proporcionar varios esquemas con los que realizar una correspondencia. Esto permite procesar diferentes tipos de documentos con los esquemas adecuados. Puede proporcionar varios planos IDs al invocar la API de automatización de datos, y BDA intentará hacer coincidir cada documento con el plan que mejor se adapte. Esto permite procesar tipos de documentos mixtos en un único lote. Esto resulta útil cuando se espera que los documentos sean de diferentes tipos (por ejemplo, extractos bancarios, facturas o pasaportes).

Si necesita esquemas distintos porque los formatos de los documentos son muy diferentes o requieren peticiones especializadas, crear un esquema por tipo de documento puede ayudar a establecer una correspondencia. Para obtener más información sobre cómo crear esquemas útiles, consulte [Prácticas recomendadas para crear esquemas](#bda-blueprint-best-practices).

## Prácticas recomendadas para crear esquemas
<a name="bda-blueprint-best-practices"></a>

 Siga las prácticas recomendadas que se indican a continuación para sacar el máximo partido de sus esquemas: 
+ Sea explícito y detallado en los nombres y descripciones de los esquemas para facilitar la correspondencia. 
+ Al proporcionar varios esquemas pertinentes, BDA puede seleccionar el que mejor se ajuste. Cree esquemas distintos para formatos de documentos muy diferentes. 
+ Considere la posibilidad de crear planos especializados para cada vendor/document fuente, si necesita la máxima precisión
+ No incluya dos esquemas del mismo tipo en un proyecto (por ejemplo, dos esquemas de W2). La información del propio documento y del esquema se utiliza para procesar los documentos, y si se incluyen varios esquemas del mismo tipo en un proyecto, se reducirá el rendimiento. 

Gracias a la división de documentos y la correspondencia de varios esquemas, BDA puede gestionar con mayor flexibilidad conjuntos de documentos variados y, al mismo tiempo, aplicar la lógica de extracción más adecuada a cada documento.

# Desactivación de modalidades y enrutamiento de tipos de archivos
<a name="bda-routing-enablement"></a>

De forma predeterminada, los proyectos de BDA procesan los tipos de archivos compatibles, clasificándolos según diferentes modalidades semánticas. Al crear o editar su proyecto, puede modificar las modalidades que se van a procesar y los tipos de archivos que se van a enviar a cada modalidad. En esta sección, analizaremos la activación y desactivación de diferentes modalidades, el enrutamiento de los archivos a modalidades específicas y el procedimiento de enrutamiento predeterminado de BDA.

## Desactivación del procesamiento de modalidades
<a name="bda-modality-enablement"></a>

Al crear un proyecto, es posible que tenga un caso de uso que no incluya el procesamiento de todo tipo de archivos. Por ejemplo, es posible que desee procesar solo documentos y archivos de audio. Si ese es el caso, no querrá que BDA envíe un JPEG para MP4 procesarlo como imagen o como vídeo. La habilitación de modalidades le permite desactivar determinadas modalidades en un proyecto, seleccionando las respuestas del procesamiento de BDA.

**Desactivación de las modalidades con la consola de BDA**  
Cuando se utiliza la consola de BDA, la activación de las modalidades se realiza mediante una lista de verificación, en la que puede simplemente seleccionar o cancelar la selección de cada modalidad mientras edita o crea su proyecto. Estas opciones se encuentran en la pestaña Configuración avanzada. Debe seleccionarse al menos una modalidad para un proyecto.

![\[Modality enablement options with checkboxes for document, image, video, and audio.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/modalityenableconsole.png)


**Desactivación de las modalidades con la API de BDA**  
Cuando se utiliza la API de BDA, la habilitación de modalidades se realiza mediante el elemento de solicitud `overrideConfiguration`, ubicado en la operación `CreateDataAutomation`. Cada modalidad tiene una sección asociada en la que puede declarar la modalidad `ENABLED` o `DISABLED`. A continuación, se muestra un ejemplo del elemento `overrideConfiguration` en el que solo están habilitadas las modalidades de documento y audio. De forma predeterminada, la marca `modalityProcessing` tiene el valor `ENABLED`.

```
"overrideConfiguration" : {
    "document": {
        "splitter": {
            "state": ENABLED
        },
        "modalityProcessing": {
            "state": ENABLED
        },
    },
    "image": {
        "modalityProcessing": {
            "state": DISABLED
        }
    },
    "video": {
        "modalityProcessing": {
            "state": DISABLED 
        }
    },
    "audio": {
        "modalityProcessing": {
            "state": ENABLED
        }
    },
    ...
}
```

Los puntos suspensivos al final de esta sección indican la eliminación del elemento `modalityRouting`, algo que analizaremos con más detalle en la siguiente sección.

## Enrutamiento de archivos a determinados tipos de procesamiento
<a name="bda-modality-routing"></a>

Ciertos tipos de archivos se pueden enrutar a diferentes modalidades, en función de una serie de factores. Con el enrutamiento por modalidad, puede configurar ciertos tipos de archivos para que se enruten manualmente a cierta modalidad de procesamiento. JPEGs y se PNGs puede enrutar al procesamiento de documentos o imágenes. MP4s y se MOVs puede enrutar al procesamiento de vídeo o audio.

**Enrutamiento con la consola de BDA**  
En la pestaña Configuración avanzada, al crear o editar un esquema, puede decidir añadir una nueva modalidad de enrutamiento manual. Esto le permite seleccionar uno de los cuatro tipos de archivos disponibles y, a continuación, a qué modalidad de procesamiento se enrutarán. A continuación, se muestra una captura de pantalla de la consola, con una modalidad de enrutamiento manual que envía los archivos PNG a la modalidad de procesamiento de documentos.

**nota**  
La configuración de los archivos JPEG se aplica tanto a los archivos “.jpeg” como a los “.jpg”. Los ajustes de MP4 configuración se aplican a los archivos «.mp4" y «.m4v».

![\[Imagen de la consola de AWS que muestra un par de menús desplegables etiquetados como tipo de archivo y destino de modalidad, seleccionados como PNG y Documento.\]](http://docs.aws.amazon.com/es_es/bedrock/latest/userguide/images/bda/manualrouting.png)


**Enrutamiento con la API de BDA**  
Al igual que la habilitación de modalidad, el enrutamiento de modalidades se realiza a través del elemento de solicitud `overrideConfiguration`. A continuación, se muestra un ejemplo de la parte `modalityRouting` de `overrideConfiguration`. En este ejemplo se supone que todas las modalidades están habilitadas y se redirigen los archivos JPEG y PNG a la modalidad de documento MP4 y los archivos MOV a la modalidad de audio.

```
...
   "modalityRouting": {
        "jpeg": DOCUMENT, 
        "png": DOCUMENT,  
        "mp4": AUDIO,     
        "mov": AUDIO      
    }
}
```

Los puntos suspensivos que aparecen al principio del ejemplo indican que se ha eliminado el resto de `overrideConfiguration`, que veremos con más detalle en la sección sobre la habilitación de modalidades y la funcionalidad de división de documentos.

## Enrutamiento estándar para la API InvokeDataAutomationAsync
<a name="bda-standard-routing-async"></a>

Si no configura sus propios procedimientos de enrutamiento, BDA utiliza un conjunto estándar de procedimientos basados en el tipo de archivo para determinar a qué modalidad enrutará. En la tabla siguiente se muestran los procedimientos predeterminados.

PNGs y JPEGs enumerar Semantic Classifer como comportamiento predeterminado. Esto significa que BDA analizará los indicadores de si el archivo enviado es o no una imagen o un documento utilizando modelos internos y realizará el enrutamiento automáticamente.


| Tipos de archivos | Comportamiento de enrutamiento predeterminado | 
| --- | --- | 
|  PNG  |  Clasificador semántico; imagen o documento  | 
|  JPEG  |  Clasificador semántico; imagen o documento  | 
|  PDF, TIFF  |  Documento  | 
|  MP4, MOV  |  Video  | 
|  AMR, FLAC, M4A, OGG, WEBM MP3, WAV  |  Audio  | 

## InvokeDataAutomation Enrutamiento estándar para la API
<a name="bda-standard-routing-sync"></a>

La [InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API también analizará los indicadores de si el archivo PNG o JPEG enviado es o no una imagen o un documento utilizando modelos internos y realizará el enrutamiento automáticamente. En la tabla siguiente se muestran los procedimientos predeterminados.

PNGs e JPEGs incluye el clasificador semántico como comportamiento predeterminado. Esto significa que BDA analizará los indicadores de si el archivo enviado es o no una imagen o un documento utilizando modelos internos y realizará el enrutamiento automáticamente. Los archivos PDF y TIFF se enviarán a la modalidad de documentos para su procesamiento. InvokeDataAutomation Actualmente, la API no admite archivos de audio y vídeo.


| Tipos de archivos | Comportamiento de enrutamiento predeterminado | 
| --- | --- | 
|  PNG  |  Clasificador semántico; imagen o documento  | 
|  JPEG  |  Clasificador semántico; imagen o documento  | 
|  PDF, TIFF  |  Documento  | 