Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Connexion à Confluence pour votre base de connaissances
<a name="confluence-data-source-connector"></a>

Atlassian Confluence est un outil de gestion du travail collaboratif conçu pour partager, stocker et travailler sur la planification de projets, le développement de logiciels et la gestion de produits. Vous pouvez vous connecter à votre instance Confluence pour votre base de connaissances Amazon Bedrock en utilisant soit la [console de AWS gestion pour Amazon Bedrock](https://console.aws.amazon.com/bedrock/home), soit l'[CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)API (voir SDK [compatibles](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html) avec Amazon Bedrock et). AWS CLI

**Note**  
Le connecteur de source de données Confluence est proposé en version préliminaire et peut faire l’objet de modifications.  
Les sources de données Confluence ne prennent pas en charge les données multimodales, telles que les tableaux, les graphiques, les diagrammes ou autres images.

Amazon Bedrock prend en charge la connexion aux instances Confluence Cloud. Actuellement, seul le magasin vectoriel Amazon OpenSearch Serverless peut être utilisé avec cette source de données.

Il existe des limites au nombre de fichiers et de Mo par fichier pouvant être indexés. Consultez [Quotas pour les bases de connaissances](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fonctionnalités prises en charge](#supported-features-confluence-connector)
+ [Conditions préalables](#prerequisites-confluence-connector)
+ [Configuration de la connexion](#configuration-confluence-connector)

## Fonctionnalités prises en charge
<a name="supported-features-confluence-connector"></a>
+ Détection automatique des principaux champs d’un document
+ Inclusion/exclusion filtres de contenu
+ Synchronisation incrémentielle du contenu ajouté, mis à jour et supprimé
+ Authentification OAuth 2.0, authentification avec le jeton d’API Confluence

## Conditions préalables
<a name="prerequisites-confluence-connector"></a>

**Dans Confluence :**
+ Assurez-vous de notez l’URL de votre instance Confluence. Par exemple, pour Confluence Cloud,{{https://example.atlassian.net}}. L'URL de Confluence Cloud doit être l'URL de base, se terminant {{.atlassian.net}} par.
+ Configurez les informations d’identification pour l’authentification de base : un nom d’utilisateur (e-mail du compte administrateur) et un mot de passe (jeton d’API Confluence) pour permettre à Amazon Bedrock de se connecter à votre instance Confluence Cloud. Pour en savoir plus sur la création d’un jeton d’API Confluence, consultez [Manage API tokens for your Atlassian account](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/#Create-an-API-token) sur le site web Atlassian.
+ (Facultatif) Configurez une application OAuth 2.0 avec des informations d’identification comprenant une clé d’application, un secret d’application, un jeton d’accès et un jeton d’actualisation. Pour plus d’informations, consultez [OAuth 2.0 apps](https://developer.atlassian.com/cloud/confluence/oauth-2-3lo-apps/) sur le site web Atlassian.
+ Certaines autorisations ou portées de lecture doivent être activées pour que votre application OAuth 2.0 puisse se connecter à Confluence.

  API Confluence :
  + offline\_access
  + read:content:confluence : afficher les contenus détaillés 
  + read:content-details:confluence : afficher les informations sur le contenu 
  + read:space-details:confluence : afficher les informations sur l’espace
  + read:audit-log:confluence : afficher les enregistrements d’audits 
  + read:page:confluence : afficher les pages 
  + read:attachment:confluence : afficher et télécharger les pièces jointes au contenu 
  + read:blogpost:confluence : afficher les articles de blog 
  + read:custom-content:confluence : afficher le contenu personnalisé 
  + read:comment:confluence : afficher les commentaires 
  + read:template:confluence : afficher les modèles de contenu 
  + read:label:confluence : afficher les étiquettes 
  + read:watcher:confluence : afficher les observateurs de contenu 
  + read:relation:confluence : afficher les relations des entités 
  + read:user:confluence : afficher les informations sur l’utilisateur 
  + read:configuration:confluence : afficher les paramètres Confluence 
  + read:space:confluence : afficher les informations sur l’espace 
  + read:space.property:confluence : afficher les propriétés de l’espace 
  + read:user.property:confluence : afficher les propriétés utilisateur 
  + read:space.setting:confluence : afficher les paramètres de l’espace 
  + read:analytics.content:confluence : afficher l’analytique du contenu
  + read:content.property:confluence : afficher les propriétés du contenu
  + read:content.metadata:confluence : afficher les récapitulatifs de contenu 
  + read:inlinetask:confluence : afficher les tâches 
  + read:task:confluence : afficher les tâches 
  + read:whiteboard:confluence : afficher les tableaux blancs 
  + read:app-data:confluence : lire les données d’application 
  + read:folder:confluence : afficher les dossiers
  + read:embed:confluence : afficher les données Smart Link

**Dans votre AWS compte, assurez-vous** de :
+ Pour l’authentification, assurez-vous de stocker vos informations d’identification dans un [secret AWS Secrets Manager](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html) et notez l’Amazon Resource Name (ARN) du secret. Suivez les instructions de la section **Configuration de la connexion** sur cette page pour inclure les paires clé-valeur qui doivent être incluses dans votre secret.
+ Incluez les autorisations nécessaires pour vous connecter à votre source de données dans votre role/permissions politique Gestion des identités et des accès AWS (IAM) pour votre base de connaissances. Pour plus d'informations sur les autorisations requises pour que cette source de données soit ajoutée à votre IAM rôle dans la base de connaissances, consultez la section [Autorisations d'accès aux sources de données](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**Note**  
Si vous utilisez la console, vous pouvez accéder AWS Secrets Manager à pour ajouter votre secret ou utiliser un secret existant dans le cadre de l'étape de configuration de la source de données. Le IAM rôle doté de toutes les autorisations requises peut être créé pour vous dans le cadre des étapes de la console pour créer une base de connaissances. Une fois que vous avez configuré votre source de données et les autres configurations, le IAM rôle doté de toutes les autorisations requises est appliqué à votre base de connaissances spécifique.  
Nous vous recommandons d’actualiser ou de modifier régulièrement vos informations d’identification et votre secret. Pour votre propre sécurité, fournissez uniquement le niveau d’accès nécessaire. Nous vous recommandons de ne pas réutiliser vos informations d’identification et vos secrets d’une source de données à l’autre.

## Configuration de la connexion
<a name="configuration-confluence-connector"></a>

Afin de vous connecter à votre instance Confluence, vous devez fournir les informations de configuration nécessaires pour qu’Amazon Bedrock puisse accéder à vos données et les indexer. Vous devez également respecter les [Conditions préalables](#prerequisites-confluence-connector).

Un exemple de configuration pour cette source de données est inclus dans cette section.

Pour plus d'informations sur la détection automatique des champs du document, inclusion/exclusion les filtres, la synchronisation incrémentielle, les informations d'authentification secrètes et leur fonctionnement, sélectionnez les options suivantes :

### Détection automatique des principaux champs d’un document
<a name="ds-confluence-document-fields"></a>

Le connecteur de source de données détecte et indexe automatiquement les principaux champs de métadonnées de vos documents ou contenus. Par exemple, le connecteur de source de données peut indexer le contenu principal (ou son équivalent), le titre et la date de création ou de modification de vos documents, ou d’autres champs de base susceptibles de s’appliquer à ceux-ci.

**Important**  
Si votre contenu contient des informations sensibles, vous Amazon Bedrock pouvez répondre en utilisant des informations sensibles.

Vous pouvez appliquer des opérateurs de filtrage aux champs de métadonnées afin d’améliorer davantage la pertinence des réponses. Par exemple, « epoch\_modification\_time » pour connaître le nombre de secondes écoulées depuis le 1er janvier 1970 jusqu’au moment de la dernière mise à jour du document. Vous pouvez filtrer les données en fonction des plus récentes, pour lesquelles « epoch\_modification\_time » est *supérieur à* un certain nombre. Pour plus d’informations sur les opérateurs de filtrage que vous pouvez appliquer à vos champs de métadonnées, consultez [Métadonnées et filtrage](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html).

### Inclusion/exclusion filtres
<a name="ds-confluence-inclusion-exclusion"></a>

Vous pouvez inclure ou exclure l’indexation de certains contenus. Par exemple, vous pouvez spécifier un modèle d' prefix/regular expression d'exclusion pour ignorer l'analyse de tout fichier dont le nom contient le mot « privé ». Vous pouvez également spécifier un modèle d' prefix/regular expression d'inclusion pour inclure certaines entités de contenu ou certains types de contenu. Si vous spécifiez un filtre d’inclusion et un filtre d’exclusion et que les deux correspondent à un document, le filtre d’exclusion est prioritaire et le document n’est pas indexé.

Exemple de modèle d’expression régulière permettant d’exclure ou de filtrer les fichiers PDF dont le nom contient « privé » : *".\*privé.\*\\\\.pdf"*

Vous pouvez appliquer inclusion/exclusion des filtres aux types de contenu suivants :
+ `Space` : touche d’espace unique
+ `Page` : titre de la page principale
+ `Blog` : titre du blog principal
+ `Comment` : commentaires qui appartiennent à une page ou à un blog en particulier Spécifiez {{Re: Page/Blog Title}}
+ `Attachment` : nom de fichier joint avec son extension

### Synchronisation incrémentielle
<a name="ds-confluence-incremental-sync"></a>

Le connecteur de source de données analyse le contenu nouveau, modifié et supprimé chaque fois que votre source de données se synchronise avec votre base de connaissances. Amazon Bedrock peut utiliser le mécanisme de votre source de données pour suivre les modifications de contenu et explorer le contenu modifié depuis la dernière synchronisation. Lorsque vous synchronisez votre source de données avec votre base de connaissances pour la première fois, l’ensemble du contenu est indexé par défaut.

Pour synchroniser votre source de données avec votre base de connaissances, utilisez l'[StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API ou sélectionnez votre base de connaissances dans la console et sélectionnez **Synchroniser** dans la section de présentation de la source de données.

**Important**  
Toutes les données que vous synchronisez à partir de votre source de données sont accessibles à toute personne disposant des autorisations `bedrock:Retrieve` pour récupérer les données. Cela peut également inclure toutes les données dont les autorisations de source de données sont contrôlées. Pour plus d’informations, consultez [Autorisations de la base de connaissances](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

### Informations d’identification secrètes
<a name="ds-confluence-secret-auth-credentials"></a>

(Si vous utilisez l’authentification de base) Vos informations d’identification secrètes dans AWS Secrets Manager doivent inclure les paires clé-valeur suivantes :
+ `username`: {{admin user email address of Atlassian account}}
+ `password`: {{Confluence API token}}

(Si vous utilisez l’authentification OAuth 2.0) Vos informations d’identification dans AWS Secrets Manager doivent inclure les paires clé-valeur suivantes :
+ `confluenceAppKey`: {{app key}}
+ `confluenceAppSecret`: {{app secret}}
+ `confluenceAccessToken`: {{app access token}}
+ `confluenceRefreshToken`: {{app refresh token}}

**Note**  
Le jeton OAuth2.0 **d'accès** Confluence a une durée d'expiration par défaut de 60 minutes. S’il expire alors que votre source de données est en cours de synchronisation (tâche de synchronisation), Amazon Bedrock utilise le jeton d’**actualisation** fourni pour le régénérer. Cette régénération actualise à la fois les jetons d’accès et ceux d’actualisation. Pour maintenir les jetons à jour entre la tâche de synchronisation en cours et la tâche de synchronisation suivante, Amazon Bedrock a besoin d' write/put autorisations pour vos informations d'identification secrètes dans le cadre de votre rôle IAM dans la base de connaissances.

**Note**  
Votre code secret AWS Secrets Manager doit utiliser la même région que celle de votre base de connaissances.

------
#### [ Console ]

**Connexion d’une instance Confluence à votre base de connaissances**

1. Suivez les étapes décrites dans [Création d’une base de connaissances en se connectant à une source de données dans Amazon Bedrock Knowledge Bases](knowledge-base-create.md) et choisissez **Confluence** comme source de données.

1. Indiquez un nom et une description facultative de la source de données.

1. Indiquez l’URL de votre instance Confluence. Par exemple, pour Confluence Cloud,{{https://example.atlassian.net}}. L'URL de Confluence Cloud doit être l'URL de base, se terminant {{.atlassian.net}} par.

1. Dans la section **Paramètres avancés**, vous pouvez éventuellement configurer les éléments suivants :
   + **Clé KMS pour le stockage de données transitoires** — Vous pouvez chiffrer les données transitoires tout en les convertissant en données intégrées à l'aide de la clé KMS par défaut Clé gérée par AWS ou de votre propre clé. Pour de plus amples informations, veuillez consulter [Chiffrement du stockage des données transitoires lors de l’ingestion de données](encryption-kb.md#encryption-kb-ingestion).
   + **Politique de suppression des données** : vous pouvez supprimer les vectorisations de votre source de données qui sont stockées dans le magasin de vecteurs par défaut, ou choisir de conserver les données du magasin de vecteurs.

1. Fournissez les informations d’authentification pour vous connecter à votre instance Confluence :
   + Pour une authentification de base, rendez-vous AWS Secrets Manager sur pour ajouter vos informations d'authentification secrètes ou utilisez un Amazon Resource Name (ARN) existant pour le secret que vous avez créé. Votre secret doit contenir l’adresse e-mail de l’administrateur du compte Atlassian comme nom d’utilisateur et un jeton d’API Confluence à la place d’un mot de passe. Pour en savoir plus sur la création d’un jeton d’API Confluence, consultez [Manage API tokens for your Atlassian account](https://support.atlassian.com/atlassian-account/docs/manage-api-tokens-for-your-atlassian-account/#Create-an-API-token) sur le site web Atlassian.
   + Pour l'authentification OAuth 2.0, rendez-vous sur AWS Secrets Manager pour ajouter vos informations d'authentification secrètes ou utilisez un Amazon Resource Name (ARN) existant pour le secret que vous avez créé. Votre secret doit contenir la clé d’application, le secret d’application, le jeton d’accès et le jeton d’actualisation Confluence. Pour plus d’informations, consultez [OAuth 2.0 apps](https://developer.atlassian.com/cloud/confluence/oauth-2-3lo-apps/) sur le site web Atlassian.

1. (Facultatif) Dans la section **Analyse et découpage du contenu**, vous pouvez personnaliser le mode d’analyse et de découpage de vos données. Consultez les ressources suivantes pour en savoir plus sur ces personnalisations :
   + Pour plus d’informations sur les options d’analyse, consultez [Options d’analyse structurée pour votre source de données](kb-advanced-parsing.md).
   + Pour plus d’informations sur les stratégies de découpage, consultez [Fonctionnement du découpage du contenu pour les bases de connaissances](kb-chunking.md).
**Avertissement**  
Une fois connecté à la source de données, vous ne pouvez plus modifier la stratégie de découpage.
   + Pour plus d’informations sur la façon de personnaliser le découpage de vos données et le traitement de vos métadonnées avec une fonction Lambda, consultez [Utilisation d’une fonction Lambda de transformation personnalisée pour définir la manière dont vos données sont ingérées](kb-custom-transformation.md).

1. Choisissez d'utiliser des modèles d' filters/regular expressions pour inclure ou exclure certains contenus. Autrement, l’ensemble du contenu standard est indexé.

1. Continuez en choisissant un modèle de vectorisation et un magasin de vecteurs. Pour voir les étapes restantes, revenez à [Création d’une base de connaissances en se connectant à une source de données dans Amazon Bedrock Knowledge Bases](knowledge-base-create.md) et poursuivez après avoir connecté votre source de données.

------
#### [ API ]

Voici un exemple de configuration pour se connecter à Confluence Cloud pour votre base de connaissances Amazon Bedrock. Vous configurez votre source de données à l'aide de l'API avec le SDK compatible AWS CLI ou compatible, tel que Python. Après avoir appelé [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), vous appelez [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)pour créer votre source de données avec vos informations de connexion`dataSourceConfiguration`.

Pour en savoir plus sur les personnalisations que vous pouvez appliquer à l’ingestion en incluant le champ facultatif `vectorIngestionConfiguration`, consultez [Personnalisation de l’ingestion pour une source de données](kb-data-source-customize-ingestion.md).

**AWS Command Line Interface**

```
aws bedrock create-data-source \
 --name "Confluence Cloud/SaaS connector" \
 --description "Confluence Cloud/SaaS data source connector for Amazon Bedrock to use content in Confluence" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://confluence-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE" \
 --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}'

confluence-bedrock-connector-configuration.json
{
    "confluenceConfiguration": {
        "sourceConfiguration": {
            "hostUrl": "https://example.atlassian.net",
            "hostType": "SAAS",
            "authType": "OAUTH2_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Confluence"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "Attachment",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "CONFLUENCE"
}
```

------