本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
连接 Micros SharePoint oft 获取知识库
Microsoft SharePoint 是一项基于 Web 的协作服务,用于处理文档、网页、网站、列表等。您可以使用适用于亚马逊 Bedrock 的AWS 管理控制台或 CreateDataSourceAPI(参见 Amazon Bedrock 支持的软件开发工具包和)连接到您的 SharePoint 实例,以
注意
SharePoint 数据源连接器处于预览版,可能会发生变化。
Microsoft SharePoint 数据源不支持多模式数据,例如表格、图表、图表或其他图像。
Amazon Bedrock 支持连接到 SharePoint 在线实例。目前不支持搜寻 OneNote 文档。目前,只有 Amazon OpenSearch Serverless 矢量存储可用于此数据源。
对可爬取的文件数和文件的 MB 数是有限制的。请参阅 Quotas for knowledge bases。
支持的特征
-
自动检测主要文档字段
-
Inclusion/exclusion 内容过滤器
-
对已添加、更新、删除的内容进行增量内容同步
-
微软 Entra ID 身份验证(OAuth2 客户端凭据)
先决条件
SharePoint (在线)
重要
SharePoint App-Only 通过 Azure ACS 进行的身份验证已于 2026 年 4 月 2 日被微软停用,不再起作用。改用微软 Entra ID(OAuth2 客户端凭据)身份验证。配置数据源时,请将设置authType为OAUTH2_CLIENT_CREDENTIALS。
在 SharePoint (在线)中,完成以下步骤来配置 Microsoft Entra ID 身份验证:
-
记下您的 SharePoint 在线网站 URL/URLs。例如
https://yourdomain.sharepoint.com/sites/mysite。您的 URL 必须以https开头并包含sharepoint.com。您的网站网址必须是实际 SharePoint 网站,而不是sharepoint.com/或sites/mysite/home.aspx -
记下您的 SharePoint 在线实例的域名 URL/URLs。
-
复制您的 Microsoft 365 租户 ID。您可以在 Microsoft Entra 管理门户的“属性”中找到租户 ID。有关详细信息,请参阅查找您的 Microsoft 365 租户 ID
。 -
在 Microsoft Entra ID 中注册应用程序。前往 Microsoft Entra 管理中心
,导航到 “应用程序注册”,然后选择 “新建注册”。记下应用程序(客户端)ID 和目录(租户)ID。 -
为注册的应用程序配置 API 权限。添加 Microsoft Graph → 应用程序权限 →
Sites.Read.All。然后为您的组织授予管理员同意。 -
创建客户端密钥。在您的应用程序注册中,前往 “证书和密钥” → “新建客户机密”。立即复制密钥值,因为它不会再次显示。
-
将租户 ID、客户端 ID 和客户端密钥存储在中 AWS Secrets Manager。您的密钥必须包含以下键值对:
clientId、。clientSecret
AWS 账户
在您的 AWS 账户中,请确保:
-
将身份验证凭证存储在 AWS Secrets Manager 密钥中,并记下该密钥的 Amazon 资源名称(ARN)。按照此页面上的连接配置说明添加密钥中必须包含的键值对。
-
在知识库的 AWS Identity and Access Management (IAM) role/permissions 策略中包括连接数据源的必要权限。有关将此数据源添加到知识库 IAM 角色所需的权限的信息,请参阅访问数据源的权限。
注意
如果您使用控制台,则可以 AWS Secrets Manager 前往添加您的密钥或使用现有密钥作为数据源配置步骤的一部分。作为创建知识库的控制台步骤的一部分,可以为您创建具有所有所需权限的 IAM 角色。配置数据源和其他配置后,具有所有必需权限的 IAM 角色将应用于您的特定知识库。
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。建议不要跨数据来源重复使用凭证和密钥。
连接配置
要连接到您的 SharePoint 实例,您必须提供必要的配置信息,以便 Amazon Bedrock 可以访问和抓取您的数据。您还必须遵循 先决条件。
本部分包含此数据来源的配置示例。
有关自动检测文档字段、 inclusion/exclusion筛选器、增量同步、秘密身份验证凭据及其工作原理的更多信息,请选择以下选项:
数据来源连接器会自动检测并爬取文档或内容的所有主要元数据字段。例如,数据来源连接器可以爬取与您的文档等效的文档正文、文档标题、文档创建或修改日期或其他可能适用于您文档的核心字段。
重要
如果您的内容包含敏感信息,则 Amazon Bedrock 可以使用敏感信息进行响应。
您可以对元数据字段应用筛选运算符,以帮助您进一步提高响应的相关性。例如,文档“epoch_modification_time”或文档在 1970 年 1 月 1 日最后一次更新之后经历的秒数。您可以通过将“epoch_modification_time”设置为大于某个数值,筛选出最新的数据。有关可以应用于元数据字段的筛选运算符的更多信息,请参阅元数据和筛选。
您可以包含或排除对某些内容的爬取。例如,您可以指定排除 prefix/regular 表达式模式来跳过对文件名中包含 “private” 的任何文件的抓取。您也可以指定包含 prefix/regular 表达式模式以包含某些内容实体或内容类型。如果您指定了包含和排除筛选条件,且两者都与文档匹配,则优先执行排除筛选条件,不爬取该文档。
排除或筛选掉文件名中包含“private”的 PDF 文件的正则表达式模式示例:".*private.*\\.pdf"
您可以对以下内容类型应用 inclusion/exclusion 过滤器:
-
Page:主页标题 -
Event:事件名称 -
File:附件和所有文档文件的文件名及其扩展名
目前不支持搜寻 OneNote 文档。
每次您的数据源与知识库同步时,数据源连接器都会抓取新内容、修改内容和已删除内容。 Amazon Bedrock 可以使用数据源的机制来跟踪内容更改并抓取自上次同步以来更改的内容。首次将数据来源与知识库同步时,默认爬取所有内容。
要将您的数据源与知识库同步,请使用 StartIngestionJobAPI 或在控制台中选择您的知识库,然后在数据源概述部分中选择同步。
重要
您从数据来源同步的所有数据都可供有检索数据的 bedrock:Retrieve 权限的任何人使用。这也可以包括任何具有受控数据来源权限的数据。有关更多信息,请参阅知识库权限。
使用 Microsoft Entra ID 身份验证 (OAUTH2_CLIENT_CREDENTIALS) 时,您的秘密身份验证凭据 AWS Secrets Manager 必须包含以下密钥值对:
-
clientId:Application (client) ID from your Microsoft Entra ID app registration -
clientSecret:client secret value from your Microsoft Entra ID app registration
注意
您的密钥 AWS Secrets Manager 必须使用知识库中的相同区域。
重要
SharePoint App-Only 微软已于 2026 年 4 月 2 日停用通过 Azure ACS 进行身份验证。按照上述先决条件中所述,使用 Microsoft Entra ID 身份验证 (OAUTH2_CLIENT_CREDENTIALS)。
使用 OAuth 2.0,您可以对与知识库集成的 SharePoint 连接器进行身份验证和授权访问 SharePoint资源。
Pre-requisites
在中 SharePoint,对于 OAuth 2.0 身份验证,请确保:
-
记下您的 SharePoint 在线网站 URL/URLs。例如
https://yourdomain.sharepoint.com/sites/mysite。您的 URL 必须以https开头并包含sharepoint.com。您的网站网址必须是实际 SharePoint 网站,而不是sharepoint.com/或sites/mysite/home.aspx -
记下您的 SharePoint 在线实例的域名 URL/URLs。
-
复制您的 Microsoft 365 租户 ID。在 Microsoft Entra 门户的“属性”或 OAuth 应用程序中,可以找到您的租户 ID。
请记下管理员 SharePoint帐户的用户名和密码,并在注册应用程序时复制客户端 ID 和客户端密钥值。
注意
有关示例应用程序,请参阅 Microsoft Learn 网站上的在 Microsoft Entra ID 中注册客户端应用程序
(Microsoft Entra ID 以前称为 Azure Active Directory)。 -
注册应用程序 SharePoint 时,需要某些读取权限才能连接。
-
SharePoint: AllSites.Read (已授权)-读取所有网站集中的项目
-
-
您可能需要使用管理员用户在 Azure 门户中停用安全默认值。有关在 Azure 门户中管理安全默认设置的更多信息,请参阅 Microsoft 关于如何设置 enable/disable 安全默认设置的文档
。 -
您可能需要关闭账户中的多重身份验证 (MFA),以免阻止 Amazon Bedrock 抓取 SharePoint 您的内容。 SharePoint
要完成先决条件,请确保您已完成AWS 账户 中的步骤。
密钥身份验证凭证
对于的连接配置 OAuth2.0,您可以执行与自动检测主文档字段、 inclusion/exclusion 筛选器和增量同步相同的步骤,如中所连接配置述。
对于 OAuth 2.0 身份验证,您在中的秘密身份验证凭据 AWS Secrets Manager 必须包含这些键值对。
-
username:SharePoint admin username -
password:SharePoint admin password -
clientId:OAuth app client ID -
clientSecret:OAuth app client secret
将 SharePoint 实例连接到您的知识库
要在使用时将 SharePoint 实例连接到知识库,请执行 OAuth2.0以下操作:
-
(控制台)在控制台中,按照将 SharePoint 实例连接到知识库中所述的相同步骤进行操作。当您想提供身份验证信息以连接到您的 SharePoint 实例时。
-
提供租户 ID。您可以在 Azure Active Directory 门户的“属性”中找到租户 ID。
-
AWS Secrets Manager 前往添加您的秘密身份验证凭证,或者使用您创建的密钥的现有 Amazon 资源名称 (ARN)。您的密钥必须包含 SharePoint 管理员用户名和密码,以及您注册的应用程序客户端 ID 和客户端密钥。有关示例应用程序,请参阅 Microsoft Learn 网站上的在 Microsoft Entra ID 中注册客户端应用程序
(Microsoft Entra ID 以前称为 Azure Active Directory)。
-
-
(API) 以下是使用
CreateDataSourceAPI 创建数据源的示例,其中包含您的连接信息 OAuth2.0。aws bedrock-agent create-data-source \ --name "SharePoint Online connector" \ --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE"sharepoint-bedrock-connector-configuration.json的内容{ "sharePointConfiguration": { "sourceConfiguration": { "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de", "hostType": "ONLINE", "domain": "yourdomain", "siteUrls": [ "https://yourdomain.sharepoint.com/sites/mysite" ], "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "File", "inclusionFilters": [ ".*\\.pdf" ], "exclusionFilters": [ ".*private.*\\.pdf" ] } ] } } } }, "type": "SHAREPOINT" }