

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Paso 3: Formatear el resultado del análisis de entidades como metadatos de Amazon Kendra
<a name="tutorial-search-metadata-format-output"></a>

Para convertir las entidades extraídas por Amazon Comprehend al formato de metadatos requerido por un índice de Amazon Kendra, ejecute un script de Python 3. Los resultados de la conversión se almacenan en la carpeta `metadata` del bucket de Amazon S3.

Para obtener más información sobre el formato y la estructura de los metadatos de Amazon Kendra, consulte [Metadatos de documentos de S3](https://docs.aws.amazon.com/kendra/latest/dg/s3-metadata.html).

**Topics**
+ [Descargar y extraer el resultado de Amazon Comprehend](#tutorial-search-metadata-format-output-download-extract)
+ [Cargar la salida en el bucket de S3](#tutorial-search-metadata-format-output-upload)
+ [Conversión de la salida al formato de metadatos de Amazon Kendra](#tutorial-search-metadata-format-output-script)
+ [Limpieza del bucket de Amazon S3](#tutorial-search-metadata-format-output-cleanup)

## Descargar y extraer el resultado de Amazon Comprehend
<a name="tutorial-search-metadata-format-output-download-extract"></a>

Para formatear la salida del análisis de entidades de Amazon Comprehend, primero debe descargar el archivo `output.tar.gz` de análisis de entidades de Amazon Comprehend y extraer el archivo de análisis de entidades.

### Para descargar y extraer el archivo de salida (Consola)
<a name="tutorial-search-metadata-download-extract-console"></a>

1. En el panel de navegación de la consola Amazon Comprehend, vaya a **Trabajos de análisis**.

1. Elija su trabajo de análisis de entidades `data-entities-analysis`. 

1. En **Salida**, elija el enlace que aparece junto a la **ubicación de los datos de salida**. Esto lo redirige al archivo `output.tar.gz` de su bucket de S3.

1. En la página **Información general**, seleccione **Descargar**.
**sugerencia**  
El resultado de todos los trabajos de análisis de Amazon Comprehend tiene el mismo nombre. Cambiar el nombre de su archivo le ayudará a rastrearlo más fácilmente.

1. Descomprime y extrae el archivo Amazon Comprehend descargado en tu dispositivo.

### Para descargar y extraer el archivo de salida (AWS CLI)
<a name="tutorial-search-metadata-download-extract-cli"></a>

1. Para acceder al nombre de la carpeta generada automáticamente por Amazon Comprehend en su bucket de S3 y que contiene los resultados del trabajo de análisis de entidades, utilice el comando: [describe-entities-detection-job](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/comprehend/describe-entities-detection-job.html)

------
#### [ Linux ]

   ```
   aws comprehend describe-entities-detection-job \
             --job-id entities-job-id \
             --region aws-region
   ```

   Donde:
   + *entities-job-id*está guardado `comprehend-job-id` desde, [Paso 2: Ejecutar un trabajo de análisis de entidades en Amazon Comprehend](tutorial-search-metadata-entities-analysis.md)
   + *aws-region*es tu AWS región.

------
#### [ macOS ]

   ```
   aws comprehend describe-entities-detection-job \
             --job-id entities-job-id \
             --region aws-region
   ```

   Donde:
   + *entities-job-id*está guardado `comprehend-job-id` desde[Paso 2: Ejecutar un trabajo de análisis de entidades en Amazon Comprehend](tutorial-search-metadata-entities-analysis.md),
   + *aws-region*es tu AWS región.

------
#### [ Windows ]

   ```
   aws comprehend describe-entities-detection-job ^
             --job-id entities-job-id ^
             --region aws-region
   ```

   Donde:
   + *entities-job-id*está guardado `comprehend-job-id` desde[Paso 2: Ejecutar un trabajo de análisis de entidades en Amazon Comprehend](tutorial-search-metadata-entities-analysis.md),
   + *aws-region*es tu AWS región.

------

1. Del objeto `OutputDataConfig` de la descripción del trabajo de su entidad, copie y guarde el valor `S3Uri` como `comprehend-S3uri` en un editor de texto.
**nota**  
El `S3Uri` valor tiene un formato similar a*s3://amzn-s3-demo-bucket/.../output/output.tar.gz*.

1. Para descargar el archivo de salida de las entidades, utilice el comando [copy](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html):

------
#### [ Linux ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Donde:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*es el `S3Uri` valor que guardaste como`comprehend-S3uri`,
   + *path/*es el directorio local en el que desea guardar la salida.

------
#### [ macOS ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Donde:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*es el `S3Uri` valor que guardaste`comprehend-S3uri`,
   + *path/*es el directorio local en el que desea guardar la salida.

------
#### [ Windows ]

   ```
   aws s3 cp s3://amzn-s3-demo-bucket/.../output/output.tar.gz path/output.tar.gz
   ```

   Donde:
   + *s3://amzn-s3-demo-bucket/.../output/output.tar.gz*es el `S3Uri` valor que guardaste`comprehend-S3uri`,
   + *path/*es el directorio local en el que desea guardar la salida.

------

1. Para extraer la salida de las entidades, ejecute el siguiente comando en una ventana de terminal:

------
#### [ Linux ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Donde:
   + *path/*es la ruta de acceso al `output.tar.gz` archivo descargado en su dispositivo local.

------
#### [ macOS ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Donde:
   + *path/*es la ruta de acceso al `output.tar.gz` archivo descargado en su dispositivo local.

------
#### [ Windows ]

   ```
   tar -xf path/output.tar.gz -C path/
   ```

   Donde:
   + *path/*es la ruta de acceso al `output.tar.gz` archivo descargado en su dispositivo local.

------

Al final de este paso, deberías tener un archivo en tu dispositivo llamado `output` con una lista de las entidades identificadas por Amazon Comprehend.

## Cargar la salida en el bucket de S3
<a name="tutorial-search-metadata-format-output-upload"></a>

Tras descargar y extraer el archivo de análisis de entidades de Amazon Comprehend, debe cargar el archivo `output` extraído en su bucket de Amazon S3.

### Para cargar el archivo de salida extraído de Amazon Comprehend (Consola)
<a name="tutorial-search-metadata-upload-output-console"></a>

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En la sección **Buckets**, haga clic en su bucket y, a continuación, elija **Cargar**.

1. En **Archivos y carpetas**, elija **Añadir archivos**.

1. En el cuadro de diálogo, navegue hasta el archivo `output` extraído en su dispositivo, selecciónelo y elija **Abrir**.

1. Mantenga la configuración predeterminada de **Destino**, **Permisos** y **Propiedades**.

1. Seleccione **Cargar**.

### Para cargar el archivo de salida extraído de Amazon Comprehend (AWS CLI)
<a name="tutorial-search-metadata-upload-output-cli"></a>

1. Para cargar el archivo `output` extraído a su bucket, utilice el comando [copy](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/cp.html):

------
#### [ Linux ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Donde:
   + *path/*es la ruta de acceso local al archivo extraído, `output`
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ macOS ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Donde:
   + *path/*es la ruta de acceso local al archivo extraído, `output`
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ Windows ]

   ```
   aws s3 cp path/output s3://amzn-s3-demo-bucket/output
   ```

   Donde:
   + *path/*es la ruta de acceso local al archivo extraído, `output`
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------

1. Para asegurarse de que el archivo `output` se ha cargado correctamente en su bucket de S3, compruebe su contenido mediante el comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------

## Conversión de la salida al formato de metadatos de Amazon Kendra
<a name="tutorial-search-metadata-format-output-script"></a>

Para convertir la salida de Amazon Comprehend en metadatos de Amazon Kendra, ejecute un script de Python 3. Si utiliza la consola, utilice este AWS CloudShell paso.

### Ejecución del script de Python 3 (consola)
<a name="tutorial-search-metadata-format-output-console"></a>

1. Descargue el archivo comprimido [converter.py.zip](https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip) en su dispositivo.

1. Extraiga el archivo `converter.py` Python 3.

1. Inicie sesión en la [consola AWS de administración](https://aws.amazon.com/console/) y asegúrese de que su AWS región esté configurada en la misma región que su bucket de S3 y su trabajo de análisis de Amazon Comprehend.

1. Elija el **AWS CloudShell icono** o escríbalo **AWS CloudShell**en el cuadro de **búsqueda** de la barra de navegación superior para iniciar un entorno.
**nota**  
Cuando se AWS CloudShell abre por primera vez en una nueva ventana del navegador, aparece un panel de bienvenida con una lista de las funciones principales. El intérprete de comandos está listo para la interacción después de cerrar este panel y aparece el símbolo del sistema.

1. Una vez que el terminal esté preparado, seleccione **Acciones** en el panel de navegación y, a continuación, seleccione **Cargar archivo** en el menú.

1. En el cuadro de diálogo que se abre, seleccione **Seleccionar archivo** y, a continuación, elige el archivo `converter.py` de Python 3 descargado de su dispositivo. Seleccione **Cargar**.

1. En el AWS CloudShell entorno, introduzca el siguiente comando:

   ```
   python3 converter.py
   ```

1. Cuando la interfaz del intérprete de comandos le pida que **introduzca el nombre del bucket de S3**, introduzca el nombre del bucket de S3 y pulse Entrar.

1. Cuando la interfaz intérprete de comandos le pida que **introduzca la ruta completa del archivo de salida de Comprehend**, introduzca **output** y pulse Entrar.

1. Cuando la interfaz de intérprete de comandos le pida que **introduzca la ruta completa del archivo a su carpeta de metadatos**, introduzca **metadata/** y pulse Entrar .

**importante**  
Para que los metadatos tengan el formato correcto, los valores de entrada de los pasos 8 a 10 deben ser exactos.

### Para ejecutar el script de Python 3 (AWS CLI)
<a name="tutorial-search-metadata-format-output-cli"></a>

1. Para descargar el archivo `converter.py` para Python 3, ejecute el siguiente comando en una ventana de terminal:

------
#### [ Linux ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Donde:
   + *path/*es la ruta del archivo a la ubicación en la que desea guardar el archivo comprimido.

------
#### [ macOS ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Donde:
   + *path/*es la ruta de acceso a la ubicación en la que desea guardar el archivo comprimido.

------
#### [ Windows ]

   ```
   curl -o path/converter.py.zip https://docs.aws.amazon.com/kendra/latest/dg/samples/converter.py.zip
   ```

   Donde:
   + *path/*es la ruta de acceso a la ubicación en la que desea guardar el archivo comprimido.

------

1. Para extraer el archivo Python 3, ejecute el siguiente comando en la ventana del terminal:

------
#### [ Linux ]

   ```
   unzip path/converter.py.zip -d path/
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------
#### [ macOS ]

   ```
   unzip path/converter.py.zip -d path/
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------
#### [ Windows ]

   ```
   tar -xf path/converter.py.zip -C path/
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------

1. Asegúrese de que Boto3 esté instalado en el dispositivo; para ello, ejecute el siguiente comando.

------
#### [ Linux ]

   ```
   pip3 show boto3
   ```

------
#### [ macOS ]

   ```
   pip3 show boto3
   ```

------
#### [ Windows ]

   ```
   pip3 show boto3
   ```

------
**nota**  
Si no tiene Boto3 instalado, ejecute `pip3 install boto3` para instalarlo.

1. Para ejecutar el script de Python 3 para convertir el archivo `output`, ejecute el siguiente comando.

------
#### [ Linux ]

   ```
   python path/converter.py
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------
#### [ macOS ]

   ```
   python path/converter.py
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------
#### [ Windows ]

   ```
   python path/converter.py
   ```

   Donde:
   + *path/*es la ruta de acceso al archivo guardado. `converter.py.zip`

------

1. Cuando se AWS CLI le pida que lo haga`Enter the name of your S3 bucket`, introduzca el nombre de su depósito de S3 y pulse enter.

1. Cuando se AWS CLI le pida que lo haga`Enter the full filepath to your Comprehend output file`, introduzca **output** y pulse enter.

1. Cuando se AWS CLI le pida que lo haga`Enter the full filepath to your metadata folder`, introduzca **metadata/** y pulse enter.

**importante**  
Para que los metadatos tengan el formato correcto, los valores de entrada de los pasos 5 a 7 deben ser exactos.

Al final de este paso, los metadatos formateados se depositan en la carpeta `metadata` del bucket de S3.

## Limpieza del bucket de Amazon S3
<a name="tutorial-search-metadata-format-output-cleanup"></a>

Dado que el índice de Amazon Kendra sincroniza todos los archivos almacenados en un bucket, le recomendamos que limpie su bucket de Amazon S3 para evitar resultados de búsqueda redundantes.

### Para limpiar su bucket de Amazon S3 (Consola)
<a name="tutorial-search-metadata-cleanup-bucket-console"></a>

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, elija su bucket y, a continuación, seleccione la carpeta de salida del análisis de entidades de Amazon Comprehend, el archivo `.temp` de análisis de entidades de Amazon Comprehend y el archivo `output` de Amazon Comprehend extraído.

1. En la pestaña **Descripción general**, seleccione **Eliminar**.

1. En **Eliminar objetos**, elija ¿**Eliminar objetos permanentemente?** e ingrese **permanently delete** en el campo de entrada de texto.

1. Elija **Eliminar objetos**.

### Para limpiar su bucket de Amazon S3 (AWS CLI)
<a name="tutorial-search-metadata-cleanup-bucket-cli"></a>

1. Para eliminar todos los archivos y carpetas de su bucket de S3, excepto las carpetas `data` y `metadata`, utilice el comando [remove](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/rm.html) en la AWS CLI:

------
#### [ Linux ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ macOS ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ Windows ]

   ```
   aws s3 rm s3://amzn-s3-demo-bucket/ --recursive --exclude "data/*" --exclude "metadata/*"
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------

1. Para asegurarse de que los objetos se han eliminado correctamente de su bucket de S3, compruebe su contenido utilizando el comando [list](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/s3/ls.html):

------
#### [ Linux ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ macOS ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------
#### [ Windows ]

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/
   ```

   Donde:
   + amzn-s3-demo-bucket es el nombre del bucket de S3.

------

Al final de este paso, ha convertido el resultado del análisis de entidades de Amazon Comprehend en metadatos de Amazon Kendra. Ahora está listo para crear un índice de Amazon Kendra.