

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Sortie personnalisée et plans
<a name="bda-custom-output-idp"></a>

Lorsque vous utilisez l’automatisation des données Amazon Bedrock (BDA), vous pouvez optimiser davantage vos extractions à l’aide d’une configuration de sortie personnalisée. Les sorties personnalisées sont configurées avec des artefacts appelés plans. Les plans sont une liste d’instructions expliquant comment extraire des informations de votre fichier, permettant la transformation et l’ajustement de la sortie. Pour plus d’informations et une présentation détaillée d’un plan, consultez [Plans](bda-blueprint-info.md).

La configuration de sortie personnalisée fonctionne également avec les projets. Lorsque vous transmettez un fichier à BDA et que vous référencez un projet avec un ou plusieurs plans configurés, BDA traite le fichier à l’aide du plan approprié. Cela fonctionne pour un maximum de 40 plans de documents, un plan image, un plan audio, un plan vidéo. and/or Lorsque vous utilisez plusieurs plans, BDA essaie d’envoyer les documents vers le plan qui correspond le mieux à la disposition attendue. Pour plus d’informations sur les projets et la sortie personnalisée, consultez [Projets d’automatisation des données Bedrock](bda-projects.md).

**Note**  
Tous les fichiers traités par sortie personnalisée doivent respecter les restrictions relatives aux fichiers pour BDA. Pour plus d’informations sur les restrictions relatives aux fichiers, consultez Conditions préalables BDA.

# Plans
<a name="bda-blueprint-info"></a>

Les plans sont des artefacts vous permettant de configurer votre logique métier de traitement de fichiers. Chaque plan comprend une liste de noms de champs que vous pouvez extraire, le format de données dans lequel vous souhaitez que la réponse pour le champ soit extraite (par exemple chaîne, nombre ou booléen), ainsi que le contexte en langage naturel de chaque champ vous permettant de spécifier les règles de normalisation et de validation des données. Vous pouvez créer un plan pour chaque classe de fichier que vous souhaitez traiter, comme un formulaire W2, un talon de paie ou une carte d’identité. Vous pouvez créer des plans à l’aide de la console ou de l’API. Chaque plan que vous créez est une AWS ressource dotée de son propre ID de plan et de son propre ARN.

Lorsque vous utilisez un plan à des fins d’extraction, vous pouvez utiliser un plan de catalogue ou un plan personnalisé. Si vous connaissez déjà le type de fichier que vous souhaitez extraire, les plans de catalogue constituent un point de départ prédéfini. Vous pouvez créer des plans personnalisés pour les fichiers qui ne figurent pas dans le catalogue. Vous pouvez créez un plan à l’aide de plusieurs méthodes, comme un plan généré au moyen de l’invite de plan, une création manuelle en ajoutant des champs individuels ou la création du code JSON d’un plan à l’aide de l’éditeur JSON. Ces plans peuvent être enregistrés sur votre compte et partagés.

**Note**  
Les plans audio ne peuvent pas être créés au moyen d’invites de plan.

La taille maximale d’un plan est de 100 000 caractères, au format JSON. Pour les plans destinés à être utilisés avec l'[InvokeDataAutomationAsync](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomationAsync.html)API, le nombre maximum de champs par plan est de 100. Pour les Blueprints destinés à être utilisés avec l'[InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API, le nombre maximum de champs par Blueprint est de 15.

**Note**  
Lorsque vous utilisez des plans, vous pouvez vous retrouver à utiliser des invites, soit dans les champs, soit à des fins de création de plans. Autorisez uniquement les sources fiables à contrôler la saisie rapide. Amazon Bedrock n'est pas responsable de la validation de l'intention du plan.

## Présentation d’un plan
<a name="bda-blueprint-walkthrough"></a>

Prenons l’exemple d’un document d’identité tel qu’un passeport et examinons un plan pour ce document.

![\[Exemple de passeport avec des champs standard, illustrant la disposition et les champs de données extraits.\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/passport2.png)


Voici un exemple de plan pour ce document d’identité que nous avons créé sur la console.

![\[Disposition sous forme de table des définitions des champs du passeport, avec diverses catégories, montrant un exemple de plan.\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bdapassport.png)


À la base, un plan est une structure de données contenant des champs, qui contiennent à leur tour les informations extraites par la sortie personnalisée de BDA. La table d’extraction comporte deux types de champs : explicites et implicites. Les extractions explicites permettent d’obtenir des informations clairement énoncées qui peuvent être consultées dans le document. Les extractions implicites sont utilisées pour les informations qui doivent être transformées par rapport à la façon dont elles s’affichent dans le document. Par exemple, vous pouvez supprimer les tirets d’un numéro de sécurité sociale, en passant de 111-22-3333 à 111223333. Les champs contiennent certains éléments de base :
+ Nom du champ : il s’agit d’un nom que vous pouvez fournir pour chaque champ que vous souhaitez extraire du document. Vous pouvez utiliser le nom que vous utilisez pour le champ dans votre système en aval, par exemple `Place_Birth` ou `Place_of_birth`.
+ Description : il s’agit d’une entrée qui fournit un contexte en langage naturel pour chaque champ du plan, afin de décrire les règles de normalisation ou de validation des données à suivre. Par exemple, `Date of birth in YYYY-MM-DD format` ou `Is the year of birth before 1992?`. Vous pouvez également itérer sur le plan et améliorer la précision de la réponse de BDA à l’aide de l’invite. La fourniture d’une invite détaillée décrivant le champ dont vous avez besoin aide les modèles sous-jacents à améliorer leur précision. Les invites peuvent comporter jusqu’à 300 caractères.
+ Résultats : informations extraites par BDA en fonction de l’invite et du nom du champ.
+ Type : format de données que vous souhaitez utiliser pour la réponse pour le champ. Nous prenons en charge les chaînes, les nombres, les booléens, les tableaux de chaînes et les tableaux de nombres.
+ Score de confiance : pourcentage de certitude dont dispose BDA quant à l’exactitude de votre extraction. Les plans audio et image ne renvoient pas de score de confiance.
+ Types d’extractions : type d’extraction, explicite ou inféré.
+ Numéro de page : page du document sur laquelle le résultat a été trouvé. Les plans audio et vidéo ne renvoient pas de numéro de page.

Outre les champs simples, la sortie personnalisée de BDA propose plusieurs options pour les cas d’utilisation que vous pourriez rencontrer lors de l’extraction de documents : champs de table, groupes et types personnalisés. 

**Champs de table**  
Lorsque vous créez un champ, vous pouvez choisir de créer un champ de table plutôt qu’un champ de base. Vous pouvez donner un nom au champ et fournir une invite, comme pour les autres champs. Vous pouvez également fournir des champs de colonne. Ces champs ont un nom de colonne, une description de colonne et un type de colonne. Lorsqu’ils s’affichent dans la table d’extraction, les résultats des colonnes d’un champ de table sont regroupés sous le nom de la table. Les champs de table peuvent comporter 15 sous-champs au maximum.

**Groupes**  
Un groupe est une structure permettant d’organiser plusieurs résultats en un seul endroit au sein de votre extraction. Lorsque vous créez un groupe, vous lui donnez un nom et vous pouvez créer et placer des champs dans ce groupe. Ce groupe est marqué dans votre table des extractions et répertorie en dessous les champs qui se trouvent dans le groupe. 

**Types personnalisés**  
Vous pouvez créer un type personnalisé lors de la modification d’un plan dans le terrain de jeu de plan. Tous les champs peuvent être de type personnalisé. Ce type porte un nom unique et invite à créer les champs qui constituent la détection. Par exemple, vous pouvez créer un type personnalisé nommé Address et y inclure les champs « zip\$1code », « city\$1name », « street\$1name » et « state ». Ensuite, lors du traitement d’un document, vous pouvez utiliser le type personnalisé dans un champ « company\$1address ». Ce champ renvoie ensuite toutes les informations, regroupées en lignes sous le type personnalisé. Vous pouvez avoir jusqu’à 30 champs de type personnalisé par plan.

# Création de plans
<a name="bda-idp"></a>

## Création de plans pour des sorties personnalisées
<a name="how-to-create-blueprints"></a>

Amazon Bedrock L'automatisation des données (BDA) vous permet de créer des plans personnalisés pour tous les types de fichiers que BDA peut extraire. Vous pouvez définir le format de sortie et la logique d’extraction souhaités pour vos fichiers d’entrée à l’aide de plans. En créant des plans personnalisés, vous pouvez adapter la sortie de BDA pour répondre à vos besoins spécifiques.

Dans le cadre d’un projet, vous pouvez appliquer :
+ plusieurs plans de document, jusqu’à 40, ce qui vous permet de traiter différents types de documents au sein d’un même projet, chacun ayant sa propre logique d’extraction personnalisée ;
+ un plan d’image, ce qui garantit la cohérence du traitement des images au sein d’un projet ;
+ un plan audio ;
+ un plan vidéo.

### Création de plans
<a name="creating-blueprints-methods"></a>

 Deux méthodes permettent de créer des plans dans BDA : 
+ Utilisation de l’invite de plan
+ Création manuelle d’un plan

#### Utilisation de l’invite de plan
<a name="creating-blueprints-methods-assistant"></a>

 L’invite de plan fournit une interface guidée en langage naturel pour créer des plans. Pour créer un plan à l’aide de l’invite : 

1.  Accédez à la section **Plans** de la console BDA.

1.  Cliquez sur **Créer un plan** et sélectionnez **Utiliser l’invite du plan**.

1.  Choisissez le type de données (document, image, fichier audio ou vidéo) pour votre plan.

1.  Décrivez les champs et les données que vous souhaitez extraire en langage naturel. Par exemple : « Extraire le numéro de facture, le montant total et le nom du fournisseur des factures. »

1.  L’invite génère alors un plan basé sur votre description.

1.  Vérifiez le plan généré et effectuez les ajustements nécessaires. Les invites de plan sont basées sur un seul tour. Autrement dit, vous devrez ressaisir toutes les informations pour modifier votre invite, et non uniquement les nouvelles.

1.  Enregistrez et nommez votre plan.

##### Exemple d’invite de plan
<a name="w2aac28b8c14c11b3b9b7b7"></a>

La section suivante présente un exemple d’invite de plan pour un plan audio. Pour ce cas d’utilisation, nous souhaitons créer un plan pour extraire des informations d’une conversation entre un client et un conseiller du service client. La capture d’écran ci-dessous illustre la fenêtre d’invite sur la console.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/audio-bpa-prompt.png)


En bas de la capture d’écran, vous pouvez voir l’invite générée par l’IA en fonction de la saisie dans la case. Nous pouvons voir comment les champs que nous mentionnons sont traités. Ensuite, nous pouvons examiner le plan créé à partir de l’invite.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/audio-bpa-example.png)


Ici, nous pouvons examiner les informations que nous nous attendons à traiter à partir de la conversation. Si les champs vous conviennent, vous pouvez commencer à traiter un fichier audio immédiatement. Si vous souhaitez modifier votre plan, vous devez créer un duplicata au lieu de le modifier directement. Vous pouvez également ajuster votre invite pour d’autres résultats.

#### Création manuelle de plans
<a name="creating-blueprints-methods-id"></a>

 Pour les utilisateurs plus expérimentés ou ceux qui ont besoin d’un contrôle précis, vous pouvez créer des plans manuellement : 

1.  Accédez à la section **Plans** de la console BDA.

1.  Cliquez sur **Créer un plan** et sélectionnez **Créer manuellement**.

1.  Choisissez le type de données (document, image, fichier audio ou vidéo) pour votre plan.

1.  Définissez les champs que vous souhaitez extraire, en spécifiant les types de données, les formats et toute règle de validation.

1.  Configurez des paramètres supplémentaires tels que le fractionnement des documents ou la gestion de la disposition.

1.  Enregistrez et nommez votre plan.

Vous pouvez également créer ou modifier un plan à l’aide de l’éditeur JSON de plans. Ainsi, vous pouvez ajuster le code JSON du plan directement au moyen d’un éditeur de texte.

### Ajout de plans à des projets
<a name="adding-blueprints-projects"></a>

Les projets servent de conteneurs pour vos flux de travail de traitement de contenu multimodaux, tandis que les plans définissent la logique d’extraction de ces flux de travail. Vous ajoutez un plan à un projet pour appliquer le plan aux fichiers que vous traitez dans le cadre de ce projet.

 Pour ajouter un plan à un projet : 

1.  Accédez à la section **Projets** de la console BDA.

1.  Sélectionnez le projet auquel vous souhaitez ajouter le plan.

1.  Cliquez sur **Ajouter un plan** ou sur **Gérer les plans**.

1.  Choisissez le plan que vous souhaitez ajouter dans la liste des plans disponibles.

1.  Configurez tous les paramètres spécifiques au projet pour le plan.

1.  Enregistrez les modifications apportées à votre projet.

### Définition de champs
<a name="bda-images-defining-fields"></a>

Pour commencer, vous pouvez créer un champ pour identifier les informations que vous souhaitez extraire ou générer, par exemple product\$1type. Pour chaque champ, vous devez fournir une description, un type de données et un type d’inférence.

Pour définir un champ, vous devez spécifier les paramètres suivants :
+ *Description :* fournit une explication en langage naturel de ce que représente le champ. Cette description aide à comprendre le contexte et l’objectif du champ, ce qui facilite l’extraction précise des données.
+ *Type :* spécifie le type de données de la valeur du champ. BDA prend en charge les types suivants :
  + chaîne : pour les valeurs textuelles
  + nombre : pour les valeurs numériques
  + booléen : pour les valeurs true ou false
  + tableau : pour les champs qui peuvent avoir plusieurs valeurs du même type (par ex. un tableau de chaînes ou de nombres)
+ *Type d’inférence :* indique à BDA comment gérer la génération de réponses de la valeur du champ. Pour les images, BDA ne prend en charge que le type d’inférence Inféré. Autrement dit, BDA déduit la valeur du champ en fonction des informations présentes dans l’image.

Pour les vidéos, les champs contiennent également la granularité en option. Pour plus d’informations sur cette caractéristique, consultez Création de plans pour les vidéos.

L'image suivante montre le module « Ajouter des champs » dans la Amazon Bedrock console avec les exemples de champs et de valeurs suivants :
+ Nom du champ : product\$1type
+ Type : Chaîne
+ Instruction : Quel est le principal produit ou service annoncé, par ex. Vêtements, Appareils électroniques, Aliments et boissons, etc. ? 
+ Type d’extraction : Inféré.

![\[Amazon Bedrock Interface utilisateur affichant des menus déroulants et des champs de texte pour spécifier les champs d'image.\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-console-add-fields-new.png)


Voici un exemple de ce à quoi ressemble cette même définition de champ dans un schéma JSON, pour l’API :

```
"product_type":{
"type": "string",
"inferenceType": "inferred",
"description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?"
}
```

Dans cet exemple :
+  Le type est défini sur Chaîne, ce qui indique que la valeur du champ product\$1type doit être textuelle.
+ Le type d’inférence (inferenceType) est défini sur Inféré, ce qui indique à BDA de déduire la valeur en fonction des informations présentes dans l’image.
+ La description fournit un contexte supplémentaire, précisant que le champ doit identifier le type de produit dans l’image. Voici des exemples de valeurs pour le champ product\$1type : Vêtements, Appareils électroniques et Aliments ou boissons.

En spécifiant ces paramètres pour chaque champ, vous fournissez à BDA les informations nécessaires pour extraire et générer des insights précis à partir de vos images.

### Création de versions de projet
<a name="blueprints-project-verions"></a>

Lorsque vous travaillez sur des projets, vous pouvez créer une version d’un plan. Une version est un instantané immuable d’un plan, préservant ses configurations et sa logique d’extraction actuelles. Cette version du plan peut être transmise dans le cadre d’une demande de début de traitement des données, ce qui garantit que BDA traite les documents conformément à la logique spécifiée dans le plan lors de la création de la version. 

Vous pouvez créer une version à l’aide de l’opération `CreateBlueprintVersion`.

La console Amazon Bedrock vous permet également de créer et d’enregistrer des plans. Lorsque vous enregistrez un plan, un identifiant lui est affecté. Vous pouvez ensuite publier le plan, ce qui entraîne la création d’une version instantanée non modifiable de ce plan. Par exemple, si le plan associé à votre projet est « DocBlueprint », la version du projet créée sera « DocBlueprint \$11 ». Vous ne pourrez plus apporter de modifications à « DocBlueprint \$11 », mais vous pouvez toujours modifier le plan de base. Si vous apportez des modifications au plan et que vous le publiez à nouveau, une nouvelle version sera créée, telle que « DocBlueprint \$12 ». Les versions du plan peuvent être dupliquées et utilisées comme base pour un nouveau plan.

# Tirez parti des plans pour réaliser différentes tâches IDP
<a name="idp-cases"></a>

Les plans sont un outil extrêmement polyvalent pour le traitement des documents. Les sections suivantes traitent de la création de plans en tenant compte des différents objectifs de traitement intelligent des documents. En outre, cette section fournit un meilleur aperçu des détails de la création de plans pour les documents en général.

# Création de plans pour la classification
<a name="idp-cases-classification"></a>

Avec BDA, vous pouvez classer des documents en leur attribuant une classe de documents et en fournissant une description lorsque vous créez un plan. La classe de document sert à catégoriser de manière générale le type de document, tandis que la description fournit des détails plus précis sur le contenu et les éléments attendus dans cette classe de documents. Nous recommandons que votre description précise le type de données typique trouvé dans les documents ainsi que d’autres informations pertinentes telles que l’objectif du document et les entités attendues. 

Voici des exemples de classes de documents et de leurs descriptions :


| Classe de document | Description | 
| --- | --- | 
|  Invoice  |  Une facture est un document qui contient la liste des services rendus ou des articles achetés auprès d’une entreprise par une personne ou une autre entreprise. Il contient des détails tels que la date d’échéance du paiement et le montant dû.  | 
|  Fiche de paie  |  Ce document délivré par un employeur à un salarié contient le salaire reçu par un salarié pour une période donnée. Il contient généralement le détail de chacun des éléments de revenus et de déductions fiscales.  | 
|  Reçus  |  Document attestant qu’une personne a reçu de l’argent ou des biens en paiement à la suite d’une vente ou d’un autre transfert de marchandises ou de la fourniture d’un service. Tous les reçus doivent comporter la date d’achat.  | 
|  W2  |  Il s’agit d’un formulaire fiscal permettant de déclarer les revenus personnels perçus auprès d’un employeur au cours d’un exercice fiscal  | 

Après avoir créé les champs de votre plan, procédez comme suit :

1. Sur la page Création d’un plan, choisissez **Sauvegarder et quitter l’invite du plan**.

1. Dans Nom du plan, entrez le nom de votre plan.

1. Pour Classe de document, entrez un nom de classe qui représente le type de document que vous souhaitez classer.

1. Dans le champ Description, fournissez une description détaillée du type de document. Incluez des informations sur le type de données et les éléments couramment présents dans ces documents, tels que les personnes, les entreprises, les adresses, les détails des produits ou toute autre information pertinente.

1. Choisissez Publier le plan.

Après avoir créé le plan, vous pouvez l’utiliser pour classer les documents lors de l’inférence en fournissant un ou plusieurs ID de plan dans la demande d’API InvokeDataAutomationAsync.

BDA utilise la classe de document et la description fournies dans chacun des plans pour classer et traiter les documents avec précision. Lorsque vous soumettez un document pour traitement, BDA analyse son contenu et le compare à la liste des plans fournis. Le document est ensuite classé et traité en fonction des instructions du champ du plan afin de produire le résultat dans la structure souhaitée.

# Création de plans pour l’extraction
<a name="idp-cases-extraction"></a>

BDA vous permet de définir les champs de données spécifiques que vous souhaitez extraire de vos documents lors de la création d’un plan. Il s’agit d’un ensemble d’instructions qui guident BDA sur les informations à rechercher et sur la façon de les interpréter.

**Définition de champs**  
Pour commencer, vous pouvez créer une propriété pour chaque champ nécessitant une extraction, telle que employee\$1id ou product\$1name. Pour chaque champ, vous devez fournir une description, un type de données et un type d’inférence.

Afin de définir un champ pour l’extraction, vous devez spécifier les paramètres suivants :
+ Nom du champ : fournit une explication lisible par l’homme de ce que représente le champ. Cette description aide à comprendre le contexte et l’objectif du champ, ce qui facilite l’extraction précise des données.
+ Instruction : fournit une explication en langage naturel de ce que représente le champ. Cette description aide à comprendre le contexte et l’objectif du champ, ce qui facilite l’extraction précise des données.
+ Type : spécifie le type de données de la valeur du champ. BDA prend en charge les types de données suivants :
  + chaîne : pour les valeurs textuelles
  + nombre : pour les valeurs numériques
  + booléen : pour les valeurs true/false 
  + tableau : pour les champs qui peuvent avoir plusieurs valeurs du même type (par ex. un tableau de chaînes ou de nombres)
+ Type d’inférence : indique à BDA comment gérer l’extraction de la valeur du champ. Les types d’inférence pris en charge sont les suivants :
  + Explicite : BDA doit extraire la valeur directement du document.
  + Inféré : BDA doit déduire la valeur sur la base des informations présentes dans le document.

Voici un exemple de définition de champ avec tous les paramètres :

------
#### [ Console ]

![\[Écran de la console montrant comment ajouter un « nom de champ » et une « instruction ». Le champ « Type » est défini sur « Chaîne » et le champ « Type d’extraction » sur « Explicite ».\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bdaadd.png)


------
#### [ API ]

```
"product_name":{
   "type":"string",
   "inferenceType":"Explicit",
   "description":"The short name of the product without any extra details"
}
```

------

Dans cet exemple :
+ Le type est défini sur Chaîne, ce qui indique que la valeur du champ product\$1name doit être textuelle.
+ Le type d’inférence (inferenceType) est défini sur Explicite, ce qui indique à BDA d’extraire la valeur directement du document sans aucune transformation ni validation.
+ L’instruction fournit un contexte supplémentaire, en précisant que le champ doit contenir le nom abrégé du produit sans aucun détail supplémentaire.

En spécifiant ces paramètres pour chaque champ, vous fournissez à BDA les informations nécessaires pour extraire et générer les données désirées de vos documents.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  ApplicantsName  |  Nom complet du demandeur  |  Explicite  |  chaîne  | 
|  DateOfBirth  |  Date de naissance de l’employé  |  Explicite  |  chaîne  | 
|  Ventes  |  Recettes ou ventes brutes  |  Explicite  |  number  | 
|  Statement\$1starting\$1balance  |  Solde en début de période  |  Explicite  |  number  | 

**Champs à valeurs multiples**  
Dans les cas où un champ peut contenir plusieurs valeurs, vous pouvez définir des tableaux ou des tables.

**Liste de champs**  
Pour les champs contenant une liste de valeurs, vous pouvez définir un type de données Tableau. 

Dans cet exemple, « OtherExpenses » est défini comme un tableau de chaînes, permettant à BDA d'extraire plusieurs postes de dépenses pour ce champ.

------
#### [ Console ]

![\[Écran de la console montrant comment ajouter un « nom de champ » et une « instruction ». Le champ « Type » est défini sur « Tableau de chaînes » et le champ « Type d’extraction » sur « Explicite ».\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bdaarray.png)


------
#### [ API ]

```
"OtherExpenses":{
   "type":"array",
   "inferenceType":"Explicit",
   "description":"Other business expenses not included in fields 8-26 or field 30",
   "items":{
      "type":"string"
   }
}
```

------

**Tables**  
Si votre document contient des données tabulaires, vous pouvez définir une structure de tableau dans le schéma.

Dans cet exemple, « SERVICES\$1TABLE » est défini comme un type de table, avec des champs de colonne tels que le nom du produit, la description, la quantité, le prix unitaire et le montant.

------
#### [ Console ]

![\[Écran de la console montrant comment ajouter un « nom de champ » et une « instruction ». Le champs « Type » est défini sur « Tableau » et le champ « Type d’extraction » sur « Explicite » et affiche les champs spécifiques aux colonnes qui sont ajoutés.\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bdatable.png)


------
#### [ API ]

```
"definitions":{
   "LINEITEM":{
      "properties":{
         "quantity":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "unit price":{
            "type":"number",
            "inferenceType":"Explicit"
         },
         "amount":{
            "type":"number",
            "inferenceType":"Explicit",
            "description":"Unit Price * Quantity"
         },
         "product name":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The short name of the product without any extra details"
         },
         "product description":{
            "type":"string",
            "inferenceType":"Explicit",
            "description":"The full item list description text"
         }
      }
   }
},
"properties":{
   "SERVICES_TABLE":{
      "type":"array",
      "description":"Line items table listing all the items / services charged in the invoice including quantity, price, amount, product / service name and description.",
      "items":{
         "$ref":"#/definitions/LINEITEM"
      }
   },
   "...
        ..."
]
```

------

En définissant des schémas complets avec des descriptions de champs, des types de données et des types d’inférence appropriés, vous pouvez vous assurer que BDA extrait précisément les informations souhaitées de vos documents, quelles que soient les variations de mise en forme ou de représentation.

# Création de plans pour la normalisation
<a name="idp-cases-normalization"></a>

BDA fournit des fonctionnalités de normalisation qui vous permettent de convertir et de standardiser les données extraites en fonction de vos besoins spécifiques. Ces tâches de normalisation peuvent être classées en deux catégories : normalisation des clés et normalisation des valeurs.

**Normalisation des clés**  
Dans de nombreux cas, les champs du document peuvent présenter des variations dans la façon dont ils sont représentés ou étiquetés. Par exemple, le champ « Numéro de sécurité sociale » peut apparaître sous la forme « SSN », « Numéro fiscal », « TIN » ou d’autres variantes similaires. Pour relever ce défi, BDA propose la normalisation des clés, qui vous permet de fournir des instructions sur les variations au sein de vos définitions de champs.

En tirant parti de la normalisation des clés, vous pouvez aider BDA à reconnaître et à mapper différentes représentations d’un même champ à une clé standardisée. Cette fonctionnalité garantit que les données sont extraites et organisées de manière cohérente, quelles que soient les variations présentes dans les documents sources.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  LastName  |  Nom ou prénom de la personne  |  Explicite  |  String  | 
|  BirthNum  |  Numéro de document ou numéro de dossier du certificat de naissance  |  Explicite  |  String  | 
|  OtherIncome  |  Autres revenus, y compris le crédit ou le remboursement de la taxe fédérale et étatique sur l’essence ou le carburant  |  Explicite  |  Number  | 
|  BusinessName  |  Nom de l’entreprise, de l’entrepreneur ou de l’entité remplissant le formulaire W9  |  Explicite  |  String  | 
|  facteur de puissance  |  Facteur de puissance ou multiplicateur utilisé pour cet élément de la ligne d’utilisation  |  Explicite  |  String  | 
|  BirthPlace  |  Nom de l’hôpital ou de l’établissement où l’enfant est né  |  Explicite  |  String  | 
|  Cause de la blessure  |  Cause de la blessure ou de la maladie professionnelle, y compris son lien avec le travail  |  Explicite  |  String  | 

Pour les champs comportant des jeux de valeurs ou des énumérations prédéfinis, vous pouvez fournir les valeurs ou les plages attendues dans les instructions de champ. Nous vous recommandons d’inclure les variations entre guillemets, comme indiqué dans les exemples.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  CLASSE\$1LICENCE  |  Code de classe à une seule lettre, soit « A », « B » ou « C »  |  Explicite  |  String  | 
|  Sexe  |  Sexe. « M » ou « F »  |  Explicite  |  String  | 
|  InformantType  |  Type d’information. « Parent » ou « Autre »  |  Explicite  |  String  | 
|  CANAL DE COLLECTE D’INFORMATIONS  |  L’UN DES SUIVANTS : « ENTRETIEN EN FACE À FACE », « ENTRETIEN TÉLÉPHONIQUE », « TÉLÉCOPIE OU COURRIER », « E-MAIL OU INTERNET »  |  Explicite  |  String  | 

**Normalisation des valeurs**  
La normalisation des valeurs est une tâche essentielle dans les pipelines de traitement de données, où les données extraites doivent être transformées dans un format cohérent et standardisé. Ce processus garantit que les systèmes en aval peuvent consommer et traiter les données de manière fluide, sans rencontrer de problèmes de compatibilité ou d’ambiguïtés.

Les fonctionnalités de normalisation de BDA vous permettent de standardiser les formats, de convertir des unités de mesure et de convertir des valeurs en types de données spécifiques.

Pour les tâches de normalisation des valeurs, le type d’extraction Inféré doit être utilisé, car la valeur peut ne pas correspondre exactement au texte brut ou à l’OCR du document une fois celui-ci normalisé. Par exemple, une valeur de date telle que « 25/06/2022 » qui doit être au format « AAAA-MM-JJ » sera extraite sous la forme « 2022-06-25 » après normalisation, ne correspondant donc pas à la sortie OCR du document.

Standardiser les formats : vous pouvez convertir des valeurs dans des formats prédéfinis, tels que des codes raccourcis, des schémas de numérotation ou des formats de date spécifiques. Cela vous permet de garantir la cohérence de la représentation des données en respectant les normes du secteur ou les conventions organisationnelles.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  ssn  |  Le SSN, formaté comme XXX-XX-XXX  |  Inféré  |  String  | 
|  STATE  |  Code à deux lettres de l’État  |  Inféré  |  String  | 
|  DATE\$1EXPIRATION  |  La date d'expiration au YYYY-MM-DD format  |  Inféré  |  String  | 
|  DATE\$1NAISSANCE  |  La date de naissance du conducteur au YYYY-MM-DD format  |  Inféré  |  String  | 
|  DATE\$1VÉRIFICATION  |  Date à laquelle le chèque a été signé. Reformater en YYYY-MM-DD  |  Inféré  |  String  | 
|  PurchaseDate  |  Date d'achat du véhicule au mm/dd/yy format  |  Inféré  |  String  | 

Vous pouvez également convertir des valeurs en une unité de mesure standard ou en un type de données spécifique en gérant des scénarios tels que Non applicable.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  POIDS  |  Poids converti en livres  |  Inféré  |  Number  | 
|  HAUTEUR  |  Hauteur convertie en pouces  |  Inféré  |  Number  | 
|  revenus\$1plans non\$1qualifiés  |  Valeur du champ 11. 0 si N/A.  |  Inféré  |  Number  | 

# Création de plans de transformation
<a name="idp-cases-transformation"></a>

BDA vous permet de diviser et de restructurer les champs de données répondant à des exigences spécifiques. Cette fonctionnalité vous permet de transformer les données extraites dans un format mieux adapté à vos systèmes en aval ou à vos besoins analytiques. 

Dans de nombreux cas, les documents peuvent contenir des champs qui combinent plusieurs informations dans un seul champ. BDA vous permet de diviser ces champs en champs individuels distincts pour faciliter la manipulation et l’analyse des données. Par exemple, si un document contient le nom d’une personne dans un champ unique, vous pouvez le diviser en champs distincts pour le prénom, le deuxième prénom, le nom de famille et le suffixe.

Pour les tâches de transformation, le type d’extraction peut être défini comme Explicite ou Inféré, selon que la valeur doit être normalisée ou non. 


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  FIRST\$1NAME  |  Le prénom  |  Explicite  |  Chaîne  | 
|  MIDDLE\$1NAME  |  Le deuxième prénom ou l’initiale  |  Explicite  |  Chaîne  | 
|  LAST\$1NAME  |  Le nom du pilote.  |  Explicite  |  Chaîne  | 
|  SUFFIX  |  Le suffixe, tel que PhD, MSc, etc.  |  Explicite  |  Chaîne  | 

Un autre exemple est celui des blocs d’adresses qui peuvent apparaître sous forme de champ unique.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  Street  |  Quelle est l’adresse  |  Explicite  |  Chaîne  | 
|  Ville  |  Quelle est la ville  |  Explicite  |  Chaîne  | 
|  État  |  Quel est l’état ?  |  Explicite  |  Chaîne  | 
|  ZipCode  |  Quel est le code postal de l’adresse ?  |  Explicite  |  Chaîne  | 

Vous pouvez définir ces champs comme des champs complètement individuels ou créer un type personnalisé. Les types personnalisés sont des types que vous pouvez réutiliser pour différents champs. Dans l’exemple ci-dessous, nous créons un type personnalisé « NameInfo » que nous utilisons pour « EmployeeName » et « ManagerName ».

![\[Console montrant comment ajouter des détails de type personnalisé. Elle montre également les sous-propriétés ajoutées au type personnalisé.\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bdacustomtype.png)


# Création de plans pour la validation
<a name="idp-cases-validation"></a>

BDA vous permet de définir des règles de validation pour garantir l’exactitude des données extraites. Ces règles de validation peuvent être intégrées à vos plans, ce qui permet à BDA d’effectuer diverses vérifications sur les données extraites. BDA vous permet de créer des validations personnalisées adaptées aux exigences spécifiques de votre entreprise ou de votre secteur d’activité. Vous trouverez ci-dessous quelques exemples de validations illustrant l’étendue de cette fonctionnalité.

**Validations numériques**  
Les validations numériques sont utilisées pour vérifier si les données numériques extraites se situent dans une plage de valeurs spécifiée ou répondent à certains critères. Ces validations peuvent être appliquées à des champs tels que les montants, les quantités ou toute autre donnée numérique.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  BalanceGreaterCheck  |  Le solde précédent est-il supérieur à 1 000 \$1 ?  |  Inféré  |  Booléen  | 
|  Le bénéfice brut est-il égal à la différence entre les ventes et le COGS ?  |  Question de validation  |  Inféré  |  Booléen  | 
|  is\$1gross\$1pay\$1valid  |  Le salaire brut depuis le début de l’année est-il le montant le plus élevé indiqué sur le bulletin de paie ?  |  Inféré  |  Booléen  | 

**Validations de date et d’heure**  
Les validations de date et d’heure sont utilisées pour vérifier si les données de date ou d’heure extraites se situent dans une plage spécifique ou répondent à certains critères. Ces validations peuvent être appliquées à des champs tels que les dates d’échéance, les dates d’expiration ou toute autre donnée liée à la date et l’heure.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  was\$1injury\$1reported\$1after\$11\$1month  |  La blessure a-t-elle été signalée à l’employeur plus d’un mois après la date de l’accident ?  |  Inféré  |  Booléen  | 
|  is\$1overdue  |  Le relevé est-il en retard ? La date d’échéance du solde est-elle dépassée ?  |  Inféré  |  Booléen  | 
|  is\$1delivery\$1date\$1valid  |  La date de livraison est-elle prévue dans les 30 prochains jours ?  |  Inféré  |  Booléen  | 

**Validations de chaîne et de format**  
Les validations de chaîne et de format sont utilisées pour vérifier si les données extraites respectent un format spécifique ou correspondent à des modèles prédéfinis. Ces validations peuvent être appliquées à des champs tels que les noms, les adresses ou toute autre donnée textuelle nécessitant une validation de format.


| Champ | Instruction | Type d’extraction | Type | 
| --- | --- | --- | --- | 
|  routing\$1number\$1valid  |  Vrai si le numéro d’acheminement bancaire comporte 9 chiffres  |  Inféré  |  Booléen  | 
|  Is\$1NumMeterIDsListed  |  Y a-t-il plus de 5 identifiants répertoriés sur la facture ?  |  Inféré  |  Booléen  | 

Grâce aux fonctionnalités de validation personnalisées de BDA, vous pouvez créer des règles de validation complexes qui combinent plusieurs conditions, calculs ou opérations logiques pour garantir que les données extraites répondent aux critères souhaités. Ces validations peuvent impliquer des vérifications croisées, des calculs ou toute autre logique personnalisée spécifique à vos processus métier ou aux exigences réglementaires.

En incorporant ces règles de validation dans vos plans, BDA peut automatiquement valider les données extraites, garantissant ainsi leur exactitude et leur conformité à vos exigences spécifiques. Cette fonctionnalité vous permet de déclencher des révisions humaines lorsque les validations ont échoué.

# Création de plans pour les images
<a name="bda-idp-images"></a>

L’automatisation des données Amazon Bedrock (BDA) vous permet de créer des plans personnalisés pour les modalités d’image. Vous pouvez définir le format de sortie et la logique d’extraction souhaités pour vos fichiers d’entrée à l’aide de plans. En créant des plans personnalisés, vous pouvez adapter la sortie de BDA pour répondre à vos besoins spécifiques. Au sein d’un projet, vous pouvez appliquer un seul plan d’image.

## Définition de champs de données pour les images
<a name="bda-images-defining-data-fields"></a>

BDA vous permet de définir les champs spécifiques que vous souhaitez identifier à partir de vos images en créant un plan. Il s’agit d’un ensemble d’instructions qui indiquent à BDA les informations à extraire et générer à partir de vos images.

### Exemples de champs de plan pour les images publicitaires
<a name="w2aac28b8c14c11b9b5b5"></a>

Voici quelques exemples de champs de plan pour analyser les images publicitaires :




|  |  |  |  | 
| --- |--- |--- |--- |
| Champ | Instructions | Type d'extraction | Type | 
| type\$1produit | Quel est le principal produit ou service annoncé ? Ex : Vêtements, appareils électroniques, alimentation et boissons | déduit | chaîne | 
| placement du produit | Comment le produit est-il placé dans l'image publicitaire, par exemple, centré, en arrière-plan, tenu par une personne, etc. ? | déduit | chaîne | 
| taille\$1produit | La taille du produit est petite si la taille est inférieure à 30 % de l'image, moyenne si elle est comprise entre 30 et 60 % et grande si elle est supérieure à 60 % de l'image | déduit | chaîne | 
| image\$1style | Classez le style d'image de l'annonce. Par exemple, image du produit, style de vie, portrait, rétro, infographie, rien de tout cela. | déduit | chaîne | 
| image\$1arrière-plan | L'arrière-plan peut être « couleur unie », paysage naturel, intérieur, extérieur ou abstrait.  | déduit | chaîne | 
| offre\$1promotionnelle | La publicité inclut-elle des remises, des offres ou des messages promotionnels ? | déduit | boolean | 

### Exemples de champs de plan pour la recherche de médias
<a name="w2aac28b8c14c11b9b5b7"></a>

Voici quelques exemples de champs de plan permettant de générer des métadonnées à partir d’images pour la recherche de médias :




|  |  |  |  | 
| --- |--- |--- |--- |
| Champ | Instructions | Type d'extraction | Type | 
| comptage de personnes | Combien de personnes y a-t-il sur l'image ? | déduit | number | 
| classification intérieure\$1extérieure | L'image est-elle intérieure ou extérieure ? | déduit | chaîne | 
| classification des scènes | Classez le paramètre ou l'environnement de l'image. Ex : Espaces urbains, ruraux, naturels, historiques, résidentiels, commerciaux, récréatifs, publics | déduit | chaîne | 
| identification\$1animale | L'image contient-elle des animaux ? | déduit | boolean | 
| type\$1animal | Quels types d'animaux sont présents sur l'image ? | déduit | chaîne | 
| identification\$1couleur | L'image est-elle en couleur ou en noir et blanc ? | déduit | chaîne | 
| identification du véhicule | Y a-t-il un véhicule visible sur l'image ? | déduit | chaîne | 
| type\$1véhicule | Quel type de véhicule est présent sur l'image ? | déduit | chaîne | 
| identification en filigrane | Y a-t-il un filigrane visible sur l'image ? | déduit | boolean | 

# Création de plans pour l’audio
<a name="creating-blueprint-audio"></a>

Comme pour les plans d’image, vous ne pouvez avoir qu’un seul plan audio par projet.

Vous trouverez ci-dessous quelques exemples de champs pour le traitement audio.

## Exemples de champs de plan pour les fichiers audio
<a name="example-audio-fields"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Champ | Instruction | Type d’extraction | Type | 
| transcript\$1summary | Generate a concise abstractive summary of the conversation, focusing on the main topics and key themes. Ensure accuracy by summarizing only what is explicitly discussed, without adding specific details not present in the conversation. Keeping the response within 100 words. | inferred | string | 
| topics | The main topics of the audio transcript, listed as single words. | inferred | [string] (Array of strings) | 
| category | The category of the audio (not the topic). Choose from General conversation, Media, Hospitality, Speeches, Meetings, Education, Financial, Public sector, Healthcare, Sales, Audiobooks, Podcasts, 911 calls, Other. | inferred | string | 
| spoken\$1named\$1entities | Any named entities (typically proper nouns) explicitly mentioned in the audio transcript including locations, brand names, company names, product names, services, events, organizations, etc. Do not include names of people, email addresses or common nouns.  | extractive | [string] (Array of strings) | 

## Exemples de champs de plan pour l’analytique conversationnelle
<a name="example-audio-analytics"></a>


|  |  |  |  | 
| --- |--- |--- |--- |
| Champ | Instruction | Type d’extraction | Type | 
| call\$1summary | Summarize the caller-agent conversation in under 100 words. Start with the caller's request, then the agent's response and actions, ending with outcomes or follow-ups. Include key details like emails, links, or callbacks. For multiple issues, summarize each with its outcome and next steps. | inferred | string | 
| call\$1categories | The category (or categories) of the call. Choose one or more from Billing, Tech support, Customer service, Account support, Sales, Complaints, Product issues, Service issues, General inquiries, Other. | inferred | [string] (Array of strings) | 
| spoken\$1locations | Locations explicitly mentioned in the conversation, including cities, states, and countries. | extractive | [string] | 
| call\$1opening | Did the agent greet the caller and introduce themselves at the beginning of the call?  | extractive | boolean | 

# Création de plans pour la vidéo
<a name="creating-blueprint-video"></a>

Les plans pour les fichiers vidéo présentent quelques qualités uniques par rapport aux autres plans, en particulier dans le domaine de la création de champs. Les plans vidéo comportent un paramètre appelé granularité, qui vous permet de définir un champ sur Vidéo ou Chapitre. Lorsque le champ est défini sur vidéo, il est détecté sur l’ensemble de la vidéo. Par exemple, si vous souhaitez obtenir un résumé de l’intégralité du clip, vous devez définir la granularité de ce champ sur vidéo. 

Un champ dont la granularité est définie sur Chapitre renverra à la place une réponse pour chaque chapitre de la vidéo. Le champ renverra une valeur pour chaque chapitre de la vidéo. En reprenant l’exemple précédent, si vous souhaitez obtenir un résumé de chaque partie d’une vidéo, vous devez définir la granularité sur chapitre.

Lorsque vous créez un champ de granularité de chapitre, vous pouvez définir un type de données unique, un tableau d’entités. Par exemple, si vous souhaitez détecter les objets visuellement visibles dans votre vidéo, vous pouvez créer un champ appelé `key-visual-objects` et définir son type comme étant un tableau d’entités. Ce champ renverrait alors les noms des entités dans un objet de tableau.

Vous trouverez ci-dessous quelques exemples de champs pour le traitement vidéo. Tous les champs des plans vidéo sont considérés comme inférés, à l’exception des entités et des tableaux d’entités.

## Exemples de champs de plans pour la recherche de médias
<a name="example-video-fields-search"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Champ | Instruction | Type d’extraction | Type | Granularité | 
| key-visual-objects | Please detect all the visually prominent objects in the video | extractive | Array of entities | [ "chapter" ] | 
| keywords | Searchable terms that capture key themes, cast, plot elements, and notable aspects of TV shows and movies to enhance content discovery. | inferred | Array of strings | ["video"] | 
| genre | The genre of the content. | inferred | string | ["video"] | 
| video-type | Identify the type of video content | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Exemples de champs de plans pour les points forts du discours liminaire
<a name="example-video-fields-keynote"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Champ | Instruction | Type d’extraction | Type | Granularité | 
| broadcast-setting | The physical setting or environment where the broadcast or training session is taking place. | inferred | enums["conference hall", "classroom", "outdoor venue", "Others", "Not applicable to the video"] | [ "video" ] | 
| broadcast-audience-engagement | The level of engagement or interaction between the speakers and the audience. | inferred | enums["interactive", "passive", "Not applicable to the video"] | ["video"] | 
| broadcast-visual-aids | A list of notable visual aids or materials used during the presentation, such as slides, diagrams, or demonstrations. | inferred | Array of strings | ["video"] | 
| broadcast-audience-size | The size of the audience present at the event. | inferred | enums["large crowd", "medium crowd", "small group", "Not applicable to this video"] | [ "chapter" ] | 
| broadcast-presentation-topics | A list of key topics, subjects, or themes covered in the presentation or training session. | inferred | enums: ["Movie", "TV series", "News", "Others"] | [ "video" ] | 

## Exemples de champs de plans pour l’analyse des publicités
<a name="example-video-fields-ad"></a>


|  |  |  |  |  | 
| --- |--- |--- |--- |--- |
| Champ | Instruction | Type d’extraction | Type | Granularité | 
| ads-video-ad-categories | The ad categories for the video | inferred | enums["Health and Beauty", "Weight Loss", "Food and Beverage", "Restaurants", "Political", "Cryptocurrencies and NFT", "Money Lending and Finance", "Tobacco", "Other", "Video is not an advertisement"] | [ "video" ] | 
| ads-video-language | The primary language of the advertisement | inferred | string | ["video"] | 
| ads-video-primary-brand | The main brand or company being advertised in the video. | inferred | string | ["video"] | 
| ads-video-main-message | The primary message or tagline conveyed in the advertisement | inferred | string | [ "video" ] | 
| ads-video-message-clarity | How clear and understandable the main message of the advertisement is | inferred | enums: ["clear", "ambiguous", "Not applicable to the video"] | [ "video" ] | 
| ads-video-target-audience-interests | Specific interests or hobbies that the target audience is likely to have | inferred | Array of strings | [ "video" ] | 
| ads-video-product-type | The category or type of product being advertised | inferred | enums: ["electronics", "apparel", "food\$1and\$1beverage", "automotive", "home\$1appliances", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-placement | The way the product is positioned or showcased in the advertisement | inferred | enums: ["front\$1and\$1center", "background", "held\$1by\$1person", "other", "Not applicable to the video"] | [ "video" ] | 
| ads-video-product-features | The key features or specifications of the advertised product highlighted in the video | inferred | Array of strings | [ "video" ] | 
| ads-video-number-of-products | The number of distinct products or variations featured in the advertisement | inferred | number | [ "video" ] | 

La vidéo prend également en charge un ensemble de types d’entités qui permettent d’identifier et de localiser des entités spécifiques dans le contenu vidéo. Cette fonctionnalité renvoie un tableau d’entités détectées. Vous trouverez ci-dessous un exemple de tableau d’entités dans un plan client :

```
  "field_name": {
        "items": {
            "$ref": "bedrock-data-automation#/definitions/Entity"
        },
        "type": "array",
        "instruction": "Please detect all the visually prominent objects in the video",
        "granularity": [
            "chapter"
        ]
    }
```

**Note**  
`bedrock-data-automation#/definitions/Entity` est un type de service appartenant à BDA. Pour analyser vos résultats, utilisez le schéma suivant.

```
       {
        "$schema": "http://json-schema.org/draft-07/schema#",
        "$id": "bedrock-data-automation",
        "type": "object",
        "definitions": {
            "BoundingBox": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "left": {
                        "type": "number"
                    },
                    "top": {
                        "type": "number"
                    },
                    "width": {
                        "type": "number"
                    },
                    "height": {
                        "type": "number"
                    }
                }
            },
            "Entity": {
                "type": "object",
                "additionalProperties": false,
                "properties": {
                    "label": {
                        "type": "string"
                    },
                    "bounding_box": {
                        "$ref": "bedrock-data-automation#/definitions/BoundingBox"
                    },
                    "confidence": {
                        "type": "number"
                    }
                }
            }
        },
        "properties": {}
    }
```

# Optimisez vos plans grâce à Ground Truth
<a name="bda-optimize-blueprint-info"></a>

Vous pouvez améliorer la précision du plan en fournissant des exemples de ressources de contenu avec les bons résultats attendus. **L'optimisation des instructions du plan utilise vos exemples pour affiner les instructions en langage naturel dans les champs de votre plan, ce qui améliore la précision de vos résultats d'inférence.**

L'optimisation des instructions du plan fonctionne mieux lorsque vous devez extraire des valeurs spécifiques qui apparaissent directement dans vos documents, telles que les numéros de facture, les montants des contrats ou les champs des formulaires fiscaux. Nous vous recommandons de fournir 3 à 10 exemples de ressources représentant les documents que vous traitez en production, en particulier ceux pour lesquels vous avez rencontré des problèmes de précision.

**Comment fonctionne l'optimisation des instructions du plan**  
L'optimisation des instructions Blueprint analyse les différences entre les résultats attendus et les résultats d'inférence initiaux. Le service affine de manière itérative les instructions en langage naturel pour chaque champ de votre plan jusqu'à ce que les instructions produisent des résultats plus précis pour vos exemples de ressources. Ce processus s'effectue en quelques minutes sans nécessiter de formation ou de réglage précis du modèle.

Lorsque vous lancez votre processus d'optimisation, vous fournissez vos exemples d'actifs et les données de base correspondantes, c'est-à-dire les valeurs correctes que vous souhaitez extraire pour chaque champ. L'optimisation des instructions Blueprint compare ces valeurs aux résultats d'inférence et ajuste les descriptions des champs pour améliorer la précision. Une fois l'optimisation terminée, vous recevez des indicateurs de précision qui montrent l'amélioration de la précision, notamment les taux de correspondance exacts et les scores F1 mesurés par rapport à votre réalité de terrain.

**Ce dont vous avez besoin avant de commencer à optimiser vos plans**  
**Un plan avec des champs définis.** Créez un plan à l'aide de la console ou de l'API. Votre plan doit inclure les noms des champs et les descriptions initiales des données que vous souhaitez extraire.

**Exemples de ressources de contenu**. Rassemblez 3 à 10 actifs documentaires qui représentent votre charge de travail de production sur les documents. Choisissez des exemples contenant tous les champs de votre plan.

**Résultats attendus pour vos exemples**. Préparez les valeurs correctes que vous souhaitez extraire de chaque exemple de ressource. Vous pouvez saisir ces valeurs manuellement lors de l'optimisation ou les télécharger à l'aide d'un fichier manifeste.

**Emplacement d'un compartiment S3**. Spécifiez un compartiment S3 dans lequel vous souhaitez stocker vos exemples d'actifs et vos données de base. Vous pouvez fournir votre propre bucket ou autoriser le service à en créer un pour vous.

**Step-by-step processus pour optimiser votre plan**  
Pour optimiser votre plan, commencez par la page détaillée du plan dans la console Amazon Bedrock Data Automation. Notez que cela n'est disponible que pour votre modalité de document.

Étape 1. Sélectionnez **Optimiser le plan** pour démarrer le flux de travail d'optimisation.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-blueprint-optimize-button.png)


Étape 2. **Téléchargez vos exemples de ressources**. Choisissez jusqu'à 10 ressources de contenu depuis votre appareil local ou depuis un emplacement S3. Le service télécharge vos actifs et affiche des miniatures pour chaque fichier. Si vous avez déjà optimisé ce plan, vous pouvez ajouter de nouveaux exemples ou supprimer des exemples existants.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-optimize-files-selector.png)


Étape 3. **Fournissez des informations de base pour chaque actif**. Sélectionnez une ressource pour ouvrir l'éditeur Ground Truth. L'éditeur affiche l'aperçu de votre document sur la gauche et un tableau simplifié des champs de votre plan sur la droite. Pour chaque champ, entrez la valeur correcte que vous souhaitez extraire dans la colonne Ground Truth.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-optimize-files-ground-truth.png)


Étape 4 : **Pour accélérer la saisie de la vérité sur le terrain, sélectionnez **Remplissage automatique** pour effectuer une première inférence sur vos actifs et remplir automatiquement la colonne **Ground Truth** à partir des valeurs de votre colonne Résultats.** Modifiez les valeurs incorrectes avant de continuer.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-optimize-ground-truth-edit.png)


Étape 5. **Lancez l'optimisation**. Une fois que vous avez terminé la saisie des informations de base pour tous les actifs sélectionnés, choisissez **Commencer l'optimisation**. L'automatisation des données analyse vos exemples et affine les instructions en langage naturel pour chaque champ. Un indicateur de progression indique l'état de l'optimisation avec des messages tels que « Lire vos ressources » et « Itérer selon les instructions en langage naturel du plan ».

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-start-optimization-button.png)


Étape 6. Passez en **revue les indicateurs d'évaluation**. Une fois l'optimisation terminée, la section **Mesures** affiche les mesures de précision de votre plan. Les métriques comparent les performances avant et après l'optimisation. Passez en revue le score F1 global, le score de confiance et le taux de correspondance exact pour déterminer si le plan répond à vos exigences de précision.

L'onglet **Mesures par fichier d'exemple** indique la précision au niveau du champ pour chaque exemple d'actif. Utilisez ces indicateurs pour identifier les champs améliorés et ceux qui peuvent nécessiter des exemples supplémentaires ou un affinement manuel.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/bda/bda-optimize-metrics.png)


Étape 7. **Optimisation complète**. Si les mesures d'évaluation répondent à vos exigences, sélectionnez **Enregistrer le plan optimisé** pour promouvoir le plan optimisé en production. Votre plan utilise désormais les instructions affinées en langage naturel pour toutes les futures demandes d'inférence.

**Réoptimisez votre plan**  
Vous pouvez réoptimiser un plan à tout moment pour améliorer encore la précision. Retournez à la page détaillée du plan et sélectionnez **Optimiser le plan**. Le service affiche les actifs que vous avez précédemment utilisés pour l'optimisation ainsi que leurs valeurs fondamentales.

Pour réoptimiser, vous pouvez ajouter de nouveaux exemples d'actifs, modifier les valeurs de base des actifs existants ou supprimer des actifs qui ne représentent plus votre charge de travail. Lorsque vous sélectionnez **Démarrer l'optimisation, l'optimisation** des instructions du plan est calculée par rapport à vos instructions de plan actuelles par rapport aux nouvelles instructions.

**Modifier un plan après l'optimisation**  
Si vous ajoutez ou supprimez des champs dans un plan optimisé, le service supprime l'historique d'optimisation et les exemples de ressources associés. Avant de procéder à la modification, téléchargez le fichier manifeste qui contient l'emplacement de vos actifs et les étiquettes Ground Truth. Le fichier manifeste utilise le format JSON et inclut tous les champs et valeurs de vérité de base de votre optimisation précédente. Pour préserver votre travail d'optimisation, téléchargez le fichier manifeste lorsque vous réoptimisez le plan modifié. L'automatisation des données applique automatiquement des valeurs de vérité sur le terrain aux champs correspondants. Les champs qui n'existent plus dans le plan sont supprimés du manifeste. Les nouveaux champs n'ont pas de valeurs de vérité fondamentale tant que vous ne les avez pas fournies.

**Gérez les coûts d'optimisation**  
L'optimisation des instructions du plan entraîne des coûts d'inférence, comme vous le feriez si vous modifiiez manuellement vos instructions en langage naturel et les testiez de manière itérative par rapport à chaque exemple de document. Pour un calcul approximatif, le nombre de pages que vous fournissez à titre d'exemple sera le nombre de pages qui seront facturées au fur et à mesure que vous optimiserez votre plan. Chaque exécution d'optimisation traite plusieurs fois vos exemples de ressources afin d'affiner les instructions. Pour minimiser les coûts, commencez par 3 à 5 exemples pour votre optimisation initiale. Ajoutez d'autres exemples lorsque vous inspectez les indicateurs d'évaluation et que vous pensez avoir besoin d'améliorations supplémentaires en termes de précision.

En outre, les instructions en langage naturel optimisées ont tendance à être plus longues et plus détaillées que les instructions d'origine, ce qui peut augmenter les coûts d'inférence d'exécution.