

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Résolution des entités AWS Glossaire
<a name="glossary"></a>

## Amazon Resource Name (ARN)
<a name="arn-definition"></a>

Identifiant unique pour les AWS ressources. Les ARN sont nécessaires lorsque vous devez spécifier une ressource sans ambiguïté dans l'ensemble, par exemple dans les Résolution des entités AWS politiques Résolution des entités AWS, les balises Amazon Relational Database Service (Amazon RDS) et les appels d'API.

## Type d'attribut
<a name="attribute-type-defn"></a>

Type d'attribut pour le champ de saisie. Lorsque vous [créez un mappage de schéma](create-schema-mapping.md), vous sélectionnez le **type d'attribut** dans une liste préconfigurée de valeurs telles que le **nom**, l'**adresse**, le **numéro de téléphone** ou l'**adresse e-mail**. Le type d'attribut indique Résolution des entités AWS le type de données que vous présentez, ce qui permet de les classer et de les normaliser correctement.

## Traitement automatique
<a name="incremental-processing"></a>

Une option de cadence de traitement pour une tâche de flux de travail correspondante qui permet de l'exécuter automatiquement lorsque votre saisie de données change. 

Cette option n'est disponible que pour le [rapprochement basé sur des règles](#rule-based-matching-defn).

Par défaut, la cadence de traitement d'une tâche de flux de travail correspondante est définie sur [**Manuel**](#manual-processing), ce qui permet de l'exécuter à la demande. Vous pouvez configurer le traitement **automatique** pour exécuter automatiquement la tâche de flux de travail correspondante lorsque votre saisie de données change. Cela permet de maintenir à jour les résultats de votre flux de travail correspondant.

## AWS KMS key ARN
<a name="kms-arn-defn"></a>

Il s'agit de votre AWS KMS Amazon Resource Name (ARN) pour le chiffrement au repos. Si elle n'est pas fournie, le système utilisera une clé KMS Résolution des entités AWS gérée.

## Flux de travail par lots
<a name="batch-defn"></a>

Processus qui s'exécute à intervalles planifiés pour faire correspondre et résoudre les données d'un ensemble de données complet. Les flux de travail par lots Résolution des entités AWS sont mieux utilisés pour la configuration initiale, les actualisations complètes périodiques et les scénarios impliquant des modifications importantes dans les ensembles de données source et cible.

## Texte clair
<a name="cleartext-defn"></a>

Données qui ne sont pas protégées par cryptographie.

## Niveau de confiance (ConfidenceLevel)
<a name="confidence-level-defn"></a>

Pour la correspondance ML, il s'agit du niveau de confiance appliqué Résolution des entités AWS lorsque ML identifie un ensemble d'enregistrements correspondants. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Déchiffrement
<a name="decryption-defn"></a>

Le processus qui consiste à remettre les données chiffrées dans leur forme d'origine. Le déchiffrement ne peut être effectué que si vous avez accès à la clé secrète.

## Chiffrement
<a name="encryption-defn"></a>

Processus consistant à coder des données sous une forme qui semble aléatoire à l'aide d'une valeur secrète appelée clé. Il est impossible de déterminer le texte brut d'origine sans accéder à la clé.

## Nom du groupe
<a name="group-name-defn"></a>

Le **nom du groupe** fait référence à l'ensemble des champs de saisie et peut vous aider à regrouper les données analysées à des fins de correspondance.

Par exemple, s'il existe trois champs de saisie : **first\_name****middle\_name**, et**last\_name**, vous pouvez les regrouper en saisissant le **nom du groupe** comme **full\_name** pour la correspondance et la sortie.

## Hachage
<a name="hash-defn"></a>

Le hachage consiste à appliquer un algorithme cryptographique qui produit une chaîne de caractères unique et irréversible de taille fixe, appelée hachage. Résolution des entités AWS utilise le protocole de hachage 256 bits (SHA256) de l'algorithme de hachage sécurisé et produit une chaîne de caractères de 32 octets. Dans Résolution des entités AWS, vous pouvez choisir de hacher ou non les valeurs des données dans votre sortie.

## Protocole de hachage () HashingProtocol
<a name="hash-protocol-defn"></a>

Résolution des entités AWS utilise le protocole de hachage 256 bits (SHA256) de l'algorithme de hachage sécurisé et produit une chaîne de caractères de 32 octets. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Méthode de mappage des ID
<a name="id-mapping-method-defn"></a>

Comment souhaitez-vous que le mappage des identifiants soit effectué. 

Il existe deux méthodes de mappage des identifiants : 
+ Rule-based — Méthode par laquelle vous utilisez des règles de correspondance pour traduire des données de première partie d'une source vers une cible dans un flux de travail de mappage d'identifiants.
+ Services du fournisseur : méthode par laquelle vous utilisez un service fournisseur pour traduire des données codées par des tiers d'une source vers une cible dans un flux de travail de mappage d'identifiants.

  Résolution des entités AWS est actuellement prise en charge en LiveRamp tant que méthode de mappage d'identifiants basée sur les services des fournisseurs. Vous devez être abonné à LiveRamp through AWS Data Exchange pour utiliser cette méthode. Pour de plus amples informations, veuillez consulter [Étape 1 : Abonnez-vous à un service fournisseur sur AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service).

## Workflow de mappage des identifiants
<a name="id-mapping-workflow-defn"></a>

Une tâche de traitement de données qui mappe les données d'une source de données d'entrée vers une cible de données d'entrée en fonction de la méthode de mappage d'ID spécifiée. Il produit une table de mappage des identifiants. Ce flux de travail vous oblige à spécifier la [méthode de mappage des identifiants](#id-mapping-method-defn) et les données d'entrée que vous souhaitez traduire d'une source vers une cible. 

Vous pouvez configurer un flux de travail de mappage d'identifiants pour qu'il s'exécute seul Compte AWS ou en deux Comptes AWS.

## Espace de noms ID
<a name="id-namespace-defn"></a>

Une ressource Résolution des entités AWS qui contient des métadonnées expliquant les ensembles de données sur plusieurs Comptes AWS et expliquant comment utiliser ces ensembles de données dans un flux de travail de [mappage d'identifiants](#id-mapping-workflow-defn).

Il existe deux types d'espaces de noms d'ID : `SOURCE` et`TARGET`. `SOURCE`Contient des configurations pour les données sources qui seront traitées dans un flux de travail de mappage d'identifiants. `TARGET`Contient une configuration des données cibles vers laquelle toutes les sources seront résolues. Pour définir les données d'entrée que vous souhaitez résoudre entre deux Comptes AWS, créez une source d'espace de noms ID et une cible d'espace de noms ID pour traduire vos données d'un ensemble (`SOURCE`) à un autre (). `TARGET`

Une fois que vous et un autre membre avez créé des espaces de noms d'identification et exécuté un flux de travail de mappage d'identifiants, vous pouvez rejoindre une collaboration AWS Clean Rooms pour exécuter une jointure multitable sur la table de mappage d'identifiants et analyser les données.

Pour plus d’informations, consultez le [Guide de l’utilisateur AWS Clean Rooms](https://docs.aws.amazon.com/clean-rooms/latest/userguide/what-is.html).

## Flux de travail incrémentiel
<a name="incremental-defn"></a>

Processus qui met uniquement en correspondance et résout les enregistrements nouveaux ou mis à jour depuis la dernière exécution, plutôt que de traiter l'ensemble de données dans son intégralité. Les flux de travail incrémentiels Résolution des entités AWS sont mieux utilisés pour les mises à jour fréquentes afin de maintenir l'actualité des données lorsque seule une petite partie du jeu de données a changé.

## Champ de saisie
<a name="input-field-defn"></a>

Un champ de saisie correspond au nom d'une colonne de votre table de données AWS Glue d'entrée.

## ARN de la source d'entrée (InputSourceARN)
<a name="input-source-arn-defn"></a>

Le nom de ressource Amazon (ARN) qui a été généré pour une entrée de AWS Glue table. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Correspondance par machine learning
<a name="ml-matching-defn"></a>

La mise en correspondance basée sur l'apprentissage automatique (ML matching) permet de trouver des correspondances entre vos données qui peuvent être incomplètes ou ne pas avoir exactement la même apparence. La correspondance ML est un processus prédéfini qui tentera de faire correspondre les enregistrements de toutes les données que vous entrez. La correspondance ML renvoie un [ID de correspondance](#match-id-defin) et un [niveau de confiance](#confidence-level-defn) pour chaque ensemble de données correspondant.

## Traitement manuel
<a name="manual-processing"></a>

Option de cadence de traitement pour une tâche de flux de travail correspondante qui permet de l'exécuter à la demande. 

Cette option est définie par défaut et est disponible à la fois pour la correspondance basée sur des [règles et pour la correspondance basée](#rule-based-matching-defn) [sur l'apprentissage automatique](#ml-matching-defn).

## Many-to-Many appariement
<a name="many-to-many-defin"></a>

Many-to-many matching compare plusieurs instances de données similaires. Les valeurs des champs de saisie auxquels la même clé de correspondance a été attribuée seront comparées les unes aux autres, qu'elles se trouvent dans le même champ de saisie ou dans des champs de saisie différents. 

Par exemple, vous pouvez avoir plusieurs champs de saisie de numéros de téléphone, tels `home_phone` que `mobile_phone` et qui ont la même touche de correspondance « Téléphone ». Utilisez la correspondance plusieurs-à-plusieurs pour comparer les données du champ de `mobile_phone` saisie aux données du champ de `mobile_phone` saisie et aux données du champ de `home_phone` saisie. 

Les règles de correspondance évaluent les données de plusieurs champs de saisie avec la même clé de correspondance avec une opération (ou), et la correspondance un-à-plusieurs compare les valeurs de plusieurs champs de saisie. Cela signifie que si une combinaison `mobile_phone` ou une `home_phone` correspondance entre deux enregistrements, la touche de correspondance « Téléphone » renverra une correspondance. Pour la touche de correspondance « Téléphone » pour trouver une correspondance, `Record One mobile_phone = Record Two mobile_phone` OU `Record One mobile_phone = Record Two home_phone` OU `Record One home_phone = Record Two home_phone` OU`Record One home_phone = Record Two mobile_phone`.

## Identifiant du match (MatchID)
<a name="match-id-defin"></a>

Pour la correspondance basée sur des règles et la correspondance ML, il s'agit de l'ID généré Résolution des entités AWS et appliqué à chaque ensemble d'enregistrements appariés. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Clé de correspondance (MatchKey)
<a name="match-key-defn"></a>

La touche Match indique les Résolution des entités AWS champs de saisie à considérer comme des données similaires et ceux à considérer comme des données différentes. Cela permet de configurer Résolution des entités AWS automatiquement des règles de correspondance basées sur des règles et de comparer des données similaires stockées dans différents champs de saisie. 

S'il existe plusieurs types d'informations de numéro de téléphone, comme un `mobile_phone` champ de `home_phone` saisie et un champ de saisie dans vos données, vous pouvez leur attribuer la touche correspondante « Téléphone ». [La correspondance basée sur des règles peut ensuite être configurée pour comparer les données à l'aide des instructions « ou » dans tous les champs de saisie avec la touche de correspondance « Téléphone » (voir les définitions de [One-to-One correspondance et Many-to-Many de correspondance](#one-to-one-matching-defn) dans la section Matching Workflow).](#many-to-many-defin) 

Si vous souhaitez que la correspondance basée sur des règles prenne en compte les différents types d'informations de numéro de téléphone de manière complètement séparée, vous pouvez créer des touches de correspondance plus spécifiques telles que « Mobile\_Phone » et « Home\_Phone ». Ensuite, lors de la configuration d'un flux de travail de correspondance, vous pouvez spécifier comment chaque touche de correspondance téléphonique sera utilisée dans le cadre de la correspondance basée sur des règles. 

Si non MatchKey est spécifié pour un champ de saisie particulier, il ne peut pas être utilisé pour la mise en correspondance mais peut être effectué tout au long du processus de correspondance et peut être sorti si vous le souhaitez.

## Nom de clé de correspondance
<a name="match-key-name-defn"></a>

Le nom attribué à une clé Match.

## Règle de correspondance (MatchRule)
<a name="match-rule-defn"></a>

Pour le rapprochement basé sur des règles, il s'agit du numéro de règle appliqué qui a généré un ensemble d'enregistrements appariés. Cela fait partie des [métadonnées de flux de travail correspondantes](#matching-workflow-metadata) qui seront incluses dans la sortie.

## Correspondance
<a name="matching-definition"></a>

Processus consistant à combiner et à comparer des données provenant de différents champs d'entrée, tables ou bases de données et à déterminer lesquelles de ces données sont similaires (ou « correspondent ») en fonction de certains critères de correspondance (par exemple, par le biais de règles ou de modèles de correspondance).

## Flux de travail correspondant
<a name="matching-workflow-definition"></a>

Le processus que vous avez configuré pour spécifier les données d'entrée à associer et la manière dont la correspondance doit être effectuée.

## Description du flux de travail correspondant
<a name="matching-workflow-description"></a>

Description facultative du flux de travail correspondant que vous pouvez choisir de saisir. Les descriptions vous aident à différencier les flux de travail correspondants si vous en créez plusieurs.

## Nom du flux de travail correspondant
<a name="matching-workflow-name"></a>

Nom du flux de travail correspondant que vous spécifiez. 

**Note**  
Les noms de flux de travail correspondants doivent être uniques. Ils ne peuvent pas porter le même nom, sinon une erreur sera renvoyée.

## Metadonnées de flux de travail correspondantes
<a name="matching-workflow-metadata"></a>

Informations générées et sorties par Résolution des entités AWS lors d'une tâche de flux de travail correspondante. Ces informations sont requises lors de la sortie.

## Normalisation (ApplyNormalization)
<a name="normalization-defn"></a>

Choisissez si vous souhaitez normaliser les données d'entrée telles que définies dans le schéma. La normalisation normalise les données en supprimant les espaces et les caractères spéciaux supplémentaires et en normalisant le format en minuscules. 

Par exemple, si le type d'attribut d'un champ de saisie est [Full phone](#normalization-rule-phone) et que les valeurs de la table de saisie sont mises en forme`(123) 456-7890`, les valeurs Résolution des entités AWS seront normalisées en`1234567890`.

**Note**  
La normalisation n'est prise en charge que pour le type de groupe pour [le nom](#normalization-rule-name), [l'adresse](#normalization-rule-address), le [téléphone](#normalization-rule-phone) et le [courrier électronique](#normalization-rule-email). 

Les sections suivantes décrivent nos règles de normalisation standard. 

Pour une ML-based correspondance spécifique, voir[Normalisation (ApplyNormalization) — ML-based uniquement](#normalization-ML-defn).

**Topics**
+ [Nom](#normalization-rule-name)
+ [E-mail](#normalization-rule-email)
+ [Téléphone](#normalization-rule-phone)
+ [Adresse](#normalization-rule-address)
+ [Haché](#normalization-rule-hashed)
+ [Source\_ID](#normalization-rule-source-id)

### Nom
<a name="normalization-rule-name"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe de **noms**.   
Le type de groupe **Nom** apparaît sous forme de **nom complet** dans la console et `NAME` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe **Name** :   
Dans la console, attribuez les sous-types suivants au groupe de **noms complets** : **prénom, deuxième **prénom**** **et nom** de famille.
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `NAME` **GroupName** : `NAME_FIRST``NAME_MIDDLE`, et. `NAME_LAST`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\_ACCENT** = Convertit une lettre accentuée en lettre normale
+ **REMOVE\_ALL\_NON\_ALPHA = Supprime tous les caractères non alphabétiques [a-z**] A-Z

### E-mail
<a name="normalization-rule-email"></a>

**Note**  
La normalisation est prise en charge pour le type de groupe de **courrier électronique**.   
Le type de groupe d'**e-mails** apparaît sous forme d'**adresse e-mail** dans la console et `EMAIL_ADDRESS` dans l'API.
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\_ACCENT** = Convertit une lettre accentuée en lettre normale
+ **EMAIL\_ADDRESS\_UTIL\_NORM** = Supprime tous les points (.) du nom d'utilisateur, supprime tout ce qui se trouve après un signe plus (\+) dans le nom d'utilisateur et normalise les variations de domaine courantes
+ **REMOVE\_ALL\_NON\_EMAIL\_CHARS = Supprime tous les caractères** non alphanumériques [a-z] et [.@-] A-Z0-9

### Téléphone
<a name="normalization-rule-phone"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe **téléphonique**.  
Le type de groupe **téléphonique** apparaît sous la forme **Téléphone complet** dans la console et `PHONE` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe **téléphonique** :   
Dans la console, attribuez les sous-types suivants au groupe **téléphonique complet** : **numéro de téléphone** et **code de pays du téléphone**.
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `PHONE` **GroupName** : `PHONE_NUMBER` et. `PHONE_COUNTRYCODE`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **REMOVE\_ALL\_NON\_NUMERIC = Supprime tous les caractères non numériques [0-9]**
+ **REMOVE\_ALL\_LEADING\_ZEROES = Supprime tous les zéros** en tête
+ **ENSURE\_PREFIX\_WITH\_MAP, « phonePrefixMap" = Examine chaque numéro de téléphone** et essaie de le comparer aux modèles du téléphone. PrefixMap Si une correspondance est trouvée, la règle ajoutera ou modifiera le préfixe du numéro de téléphone pour s'assurer qu'il est conforme au format standardisé spécifié sur la carte.

### Adresse
<a name="normalization-rule-address"></a>

**Note**  
La normalisation n'est prise en charge que pour le type de groupe d'**adresses**.   
Le type de groupe d'**adresses** apparaît sous la forme **Adresse complète** dans la console et `ADDRESS ` dans l'API.  
Si vous souhaitez normaliser les sous-types du type de groupe d'**adresses** :   
Dans la console, attribuez les sous-types suivants au groupe d'**adresses complètes** : **Adresse postale 1**, **Adresse postale 2** : nom de l'**adresse 3, nom** de **la ville**, **État**, **pays** et **code postal t**
Dans l'[CreateSchemaMapping](https://docs.aws.amazon.com/entityresolution/latest/apireference/API_CreateSchemaMapping.html)API, attribuez les **types** suivants au `ADDRESS` **GroupName** :`ADDRESS_STREET1`,`ADDRESS_STREET2`,`ADDRESS_STREET3`, `ADDRESS_CITY` `ADDRESS_STATE``ADDRESS_COUNTRY`, et. `ADDRESS_POSTALCODE`
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ **CONVERT\_ACCENT** = Convertit une lettre accentuée en lettre normale
+ **REMOVE\_ALL\_NON\_ALPHA = Supprime tous les caractères non alphabétiques [a-z**] A-Z
+ **[RENAME\_WORDS en utilisant ADDRESS\_RENAME\_WORD\_MAP = remplacez les mots de la chaîne d'adresse par des mots de ADDRESS\_RENAME\_WORD\_MAP](#ADDRESS_RENAME_WORD_MAP)**
+ **[RENAME\_DELIMITERS en utilisant ADDRESS\_RENAME\_DELIMITER\_MAP = remplacez les délimiteurs dans la chaîne d'adresse par la chaîne ADDRESS\_RENAME\_DELIMITER\_MAP](#ADDRESS_RENAME_DELIMITER_MAP)**
+ **[RENAME\_DIRECTIONS en utilisant ADDRESS\_RENAME\_DIRECTION\_MAP = remplacez les délimiteurs dans la chaîne d'adresse par la chaîne ADDRESS\_RENAME\_DIRECTION\_MAP](#ADDRESS_RENAME_DIRECTION_MAP)**
+ **[RENAME\_NUMBERS en utilisant ADDRESS\_RENAME\_NUMBER\_MAP = remplacez les numéros de la chaîne d'adresse par la chaîne ADDRESS\_RENAME\_NUMBER\_MAP](#ADDRESS_RENAME_NUMBER_MAP.title)**
+ **[RENAME\_SPECIAL\_CHARS en utilisant ADDRESS\_RENAME\_SPECIAL\_CHAR\_MAP = remplacez les caractères spéciaux de la chaîne d'adresse par la chaîne ADDRESS\_RENAME\_SPECIAL\_CHAR\_MAP](#ADDRESS_RENAME_SPECIAL_CHAR_MAP.title)**

#### ADRESSE\_RENOMME\_WORD\_MAP
<a name="ADDRESS_RENAME_WORD_MAP"></a>

Ce sont les mots qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
"avenue": "ave",
 "bouled": "blvd",
 "circle": "cir",
 "circles": "cirs",
 "court": "ct",
 "centre": "ctr",
 "center": "ctr",
 "drive": "dr",
 "freeway": "fwy",
 "frwy": "fwy",
 "highway": "hwy",
 "lane": "ln",
 "parks": "park",
 "parkways": "pkwy",
 "pky": "pkwy",
 "pkway": "pkwy",
 "pkwys": "pkwy",
 "parkway": "pkwy",
 "parkwy": "pkwy",
 "place": "pl",
 "plaza": "plz",
 "plza": "plz",
 "road": "rd",
 "square": "sq",
 "squ": "sq",
 "sqr": "sq",
 "street": "st",
 "str": "st",
 "str.": "strasse"
```

#### ADRESSE\_RENAME\_DELIMITER\_MAP
<a name="ADDRESS_RENAME_DELIMITER_MAP"></a>

Il s'agit des délimiteurs qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
",": " ",
".": " ",
"[": " ",
"]": " ",
"/": " ",
"-": " ",
"#": " number "
```

#### ADRESSE\_RENAME\_DIRECTION\_MAP
<a name="ADDRESS_RENAME_DIRECTION_MAP"></a>

Il s'agit des identificateurs de direction qui seront renommés lors de la normalisation de la chaîne d'adresse.

```
"east": "e",
"north": "n",
"south": "s",
"west": "w",
"northeast": "ne",
"northwest": "nw",
"southeast": "se",
"southwest": "sw"
```

#### ADRESSE\_RENOMME\_NUMÉRO\_MAP
<a name="ADDRESS_RENAME_NUMBER_MAP"></a>

Il s'agit des chaînes numériques qui seront renommées lors de la normalisation de la chaîne d'adresse.

```
"número": "number",
 "numero": "number",
 "no": "number",
 "núm": "number",
 "num": "number"
```

#### ADRESSE\_RENAME\_SPECIAL\_CHAR\_MAP
<a name="ADDRESS_RENAME_SPECIAL_CHAR_MAP"></a>

Il s'agit de la chaîne de caractères spéciaux qui sera renommée lors de la normalisation de la chaîne d'adresse.

```
"ß": "ss",
 "ä": "ae",
 "ö": "oe",
 "ü": "ue",
 "ø": "o",
 "æ": "ae"
```

### Haché
<a name="normalization-rule-hashed"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière

### Source\_ID
<a name="normalization-rule-source-id"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière

## Normalisation (ApplyNormalization) — ML-based uniquement
<a name="normalization-ML-defn"></a>

Choisissez si vous souhaitez normaliser les données d'entrée telles que définies dans le schéma. La normalisation normalise les données en supprimant les espaces et les caractères spéciaux supplémentaires et en normalisant le format en minuscules. 

Par exemple, si un champ de saisie possède un type d'`NAME`attribut et que les valeurs de la table d'entrée sont mises en forme`Johns Smith`, les valeurs Résolution des entités AWS seront normalisées en`john smith`.

Les sections suivantes décrivent les règles de normalisation pour les flux de travail de [correspondance basés sur le machine learning](#ml-matching-defn).

**Topics**
+ [Nom](#normalization-ML-defn-name)
+ [E-mail](#normalization-ML-defn-email)
+ [Téléphone](#normalization-ML-defn-phone)

### Nom
<a name="normalization-ML-defn-name"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules

### E-mail
<a name="normalization-ML-defn-email"></a>
+ **MINUSCULES** = Tous les caractères alphabétiques sont en minuscules
+ Remplace uniquement (at) (sensible aux majuscules et minuscules) par le symbole @
+ Supprime tous les espaces blancs, n'importe où dans la valeur 
+ Supprime tout ce qui se trouve en dehors du premier `"<` `>"` s'il existe

### Téléphone
<a name="normalization-ML-defn-phone"></a>
+ **TRIM** = Supprime les espaces blancs avant et arrière
+ **REMOVE\_ALL\_NON\_NUMERIC = Supprime tous les caractères non numériques [0-9]**
+ **REMOVE\_ALL\_LEADING\_ZEROES = Supprime tous les zéros** en tête
+ **ENSURE\_PREFIX\_WITH\_MAP, « phonePrefixMap" = Examine chaque numéro de téléphone** et essaie de le comparer aux modèles du téléphone. PrefixMap Si une correspondance est trouvée, la règle ajoutera ou modifiera le préfixe du numéro de téléphone pour s'assurer qu'il est conforme au format standardisé spécifié sur la carte.

## One-to-One appariement
<a name="one-to-one-matching-defn"></a>

One-to-one le matching compare des instances uniques de données similaires. Les champs de saisie ayant la même clé de correspondance et les mêmes valeurs dans le même champ de saisie seront comparés les uns aux autres. 

Par exemple, vous pouvez avoir plusieurs champs de saisie de numéros de téléphone, tels `home_phone` que `mobile_phone` et qui ont la même touche de correspondance « Téléphone ». Utilisez la correspondance biunivoque pour comparer les données du champ de `mobile_phone` saisie avec les données du champ de `mobile_phone` saisie et pour comparer les données du champ de `home_phone` saisie avec les données du champ de `home_phone` saisie. Les données du champ de `mobile_phone` saisie ne seront pas comparées aux données du champ de `home_phone` saisie. 

Les règles de correspondance évaluent les données de plusieurs champs de saisie avec la même clé de correspondance à l'aide d'une opération (ou), et le rapprochement un-à-plusieurs compare les valeurs d'un seul champ de saisie. Cela signifie que si `mobile_phone` ou `home_phone` correspond entre deux enregistrements, la touche de correspondance « Téléphone » renverra une correspondance. Pour la touche de correspondance « Téléphone » pour trouver une correspondance, `Record One mobile_phone = Record Two mobile_phone` OU`Record One home_phone = Record Two home_phone`. 

Les règles de correspondance évaluent les données dans les champs de saisie dotés de différentes clés de correspondance à l'aide d'une opération (et). Si vous souhaitez que la correspondance basée sur des règles prenne en compte les différents types d'informations de numéro de téléphone de manière complètement séparée, vous pouvez créer des clés de correspondance plus spécifiques, telles que « mobile\_phone » et « home\_phone ». Si vous souhaitez utiliser les deux touches de correspondance dans une règle pour rechercher des correspondances, `Record One mobile_phone = Record Two mobile_phone` ET`Record One home_phone = Record Two home_phone`.

## Output
<a name="output-defn"></a>

Une liste d'**OutputAttribute**objets, dont chacun comporte les champs **Name** et **Hashed**. Chacun de ces objets représente une colonne à inclure dans la table AWS Glue de sortie et indique si vous souhaitez que les valeurs de la colonne soient hachées.

## Sorties 3 voies
<a name="output-s3-path"></a>

Destination S3 vers laquelle Résolution des entités AWS sera écrite la table de sortie.

## OutputSourceConfig
<a name="output-source-config"></a>

**Une liste d' OutputSource objets, dont chacun possède les champs **Outputs3Path** et Output. **ApplyNormalization****

## Correspondance basée sur les services des fournisseurs
<a name="provider-service-matching"></a>

Le jumelage basé sur les services des fournisseurs est un processus conçu pour associer, relier et améliorer vos dossiers avec les fournisseurs de services de données préférés et les ensembles de données sous licence. Vous devez avoir souscrit un abonnement AWS Data Exchange auprès du service du fournisseur pour utiliser cette technique de mise en correspondance.

Résolution des entités AWS s'intègre actuellement aux fournisseurs de services de données suivants : 
+ LiveRamp
+ TransUnion
+ UID 2.0

## Rule-based appariement
<a name="rule-based-matching-defn"></a>

Rule-based le matching est un processus conçu pour trouver des correspondances exactes. Rule-based le matching est un ensemble hiérarchique de règles de correspondance en cascade, suggérées par Résolution des entités AWS, basées sur les données que vous saisissez et entièrement configurables par vos soins. Toutes les clés de correspondance fournies dans les critères des règles doivent correspondre exactement pour que les données comparées soient déclarées concordantes et pour que les métadonnées associées soient sorties. Rule-based matching renvoie un [identifiant de correspondance](#match-id-defin) et un numéro de règle pour chaque ensemble de données correspondant.

Nous recommandons de définir des règles permettant d'identifier une entité de manière unique. Classez vos règles pour trouver d'abord des correspondances plus précises. 

Supposons, par exemple, que vous ayez deux règles, la **règle 1** et la **règle 2**.

Ces règles comportent les clés de correspondance suivantes :
+ **La règle 1** inclut le nom complet et l'adresse
+ **La règle 2** inclut le nom complet, l'adresse et le téléphone

Comme la **Règle 1** s'exécute en premier, aucune correspondance ne sera trouvée par la **Règle 2** car elles auraient toutes été trouvées selon la **Règle 1**.

Pour trouver des correspondances différenciées par téléphone, réorganisez les règles comme suit :
+ **La règle 2** inclut le nom complet, l'adresse et le téléphone
+ **La règle 1** inclut le nom complet et l'adresse

## Correspondance transitive
<a name="transitive-matching-defn"></a>

La correspondance transitive est une fonctionnalité facultative pour les flux de travail de [correspondance basés sur des règles qui utilisent le type de règle](#rule-based-matching-defn) avancée. Résolution des entités AWS Utilise par défaut une approche de correspondance en cascade dans laquelle les enregistrements correspondant à un niveau de règle supérieur sont exclus des règles suivantes. Lorsque la correspondance transitive est activée, tous les enregistrements sont traités à tous les niveaux de règles. L'[ID de correspondance](#match-id-defin) d'un enregistrement est fixé lors de sa première correspondance, mais l'enregistrement continue de servir de lien pour relier les enregistrements non concordants issus de règles ultérieures aux groupes de correspondance issus de règles antérieures.

Pour de plus amples informations, veuillez consulter [Utilisation de la correspondance transitive](transitive-matching.md).

## Schema
<a name="schema-definition"></a>

Terme utilisé pour désigner une structure ou une mise en page définissant la manière dont un ensemble de données est organisé et connecté.

## Description du schéma
<a name="schema-description-defn"></a>

Description facultative du schéma que vous pouvez choisir de saisir. Les descriptions vous aident à différencier les mappages de schéma si vous en créez plusieurs.

## Nom du schéma
<a name="schema-name-defn"></a>

Nom du schéma. 

**Note**  
Les noms de schéma doivent être uniques. Ils ne peuvent pas porter le même nom, sinon une erreur sera renvoyée.

## Cartographie du schéma
<a name="schema-mapping-definition"></a>

Le mappage du schéma Résolution des entités AWS est le processus par lequel vous indiquez Résolution des entités AWS comment interpréter vos données à des fins de correspondance. Vous définissez le schéma de la table de données d'entrée que vous Résolution des entités AWS souhaitez lire dans un flux de travail correspondant.

## ARN de mappage de schéma
<a name="schema-arn-defn"></a>

Amazon Resource Name (ARN) généré pour le [mappage du schéma](#schema-mapping-definition).

## Identifiant unique
<a name="unique-id-defn"></a>

Identifiant unique que vous désignez et qui doit être attribué à chaque ligne de données d'entrée Résolution des entités AWS lue.

**Example**  
Par exemple : **Primary\_key**, **Row\_ID** ou **Record\_ID**.

La colonne **Unique ID** est obligatoire.

 L'**identifiant unique** doit être un identifiant unique au sein d'une même table. 

L'**identifiant unique** doit respecter le modèle suivant : `[a-zA-Z0-9_-]`

Dans différentes tables, l'**identifiant unique peut comporter** des valeurs dupliquées. 

La longueur maximale de l'**identifiant unique** est de 38 pour un [flux de travail correspondant](#matching-workflow-definition)

La longueur maximale de l'**identifiant unique** est de 257 caractères pour un [Workflow de mappage des identifiants](#id-mapping-workflow-defn)

Lorsque le [flux de travail correspondant](#matching-workflow-definition) est exécuté, l'enregistrement est rejeté si l'**ID unique** :
+ n'est pas spécifié
+ n'est pas unique au sein d'une même table
+ chevauchements en termes de nom d'attribut entre les sources
+ dépasse 38 caractères (flux de travail de correspondance basés sur des règles uniquement)