使用敏感資訊篩選條件從對話中移除 PII - Amazon Bedrock

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用敏感資訊篩選條件從對話中移除 PII

Amazon Bedrock Guardrails 可在輸入提示或使用敏感資訊篩選條件的模型回應中,協助偵測敏感資訊,例如個人身分識別資訊 (PII)。此篩選條件是一種機率式機器學習 (ML) 型解決方案,與內容相關,並根據輸入提示或模型回應中的內容偵測敏感資訊。您可以從 Amazon Bedrock Guardrails 針對您的使用案例或組織提供的一組內建 PIIs 中進行設定,方法為定義它,以及根據模式比對來封鎖或遮罩 PII 資料的規則表達式 (自訂 regex)。

敏感資訊偵測適用於自然語言和程式碼網域,包括程式碼語法、註解、字串常值和混合內容。這有助於識別內嵌在程式碼元素中的 PII,例如變數名稱、硬式編碼憑證或程式碼文件。

您可以設定下列模式來處理防護機制偵測到的敏感資訊:

  • 封鎖 - 敏感資訊篩選條件政策可以封鎖包含敏感資訊的請求或回應。這類應用程式的範例可能包括以公有文件為基礎的一般問題和答案。如果在提示或回應中偵測到敏感資訊,防護機制會封鎖所有內容,並傳回您設定的訊息。

  • 遮罩 - 敏感資訊篩選條件政策可以匿名化或修訂模型請求或回應中的資訊。例如,防護機制會遮罩 PII,同時產生使用者與客戶服務客服人員之間的對話摘要。如果在模型請求或回應中偵測到敏感資訊,防護機制會將其遮罩,並將其取代為 PII 類型 (例如 {NAME}{EMAIL})。

Amazon Bedrock 防護機制提供下列 PII 來封鎖或匿名化:

  • 一般

    • ADDRESS

      實體地址,例如 "100 Main Street, Anytown, USA" 或 "Suite #12, Building 123"。地址可以包括街道、建築物、位置、城市、州、國家/地區、郡、郵遞區號、分區、鄰里等資訊。

    • AGE

      個人的年齡,包括數量和時間單位。例如,在「我 40 歲」一詞中,Amazon Bedrock 防護機制會將「40 歲」視為年齡。

    • 名稱

      個人的姓名。此實體類型不包含稱謂,例如醫師、先生、太太或小姐。Amazon Bedrock 防護機制不會將此實體類型套用至屬於組織或地址的名稱。例如,防護機制會將 "John Doe Organization" 辨識為一個組織,而將 "Jane Doe Street" 辨識為地址。

    • EMAIL

      電子郵件位址,例如 marymajor@email.com

    • 電話

      電話號碼。此實體類型還包括傳真和呼叫器號碼。

    • USERNAME

      識別帳戶的使用者名稱,例如登入名稱、螢幕名稱、別名或控制代碼。

    • 密碼

      用作密碼的英數字串,例如 "*very20special#pass*"。

    • DRIVER_ID

      指派給駕照的號碼,這是官方文件,允許個人在公有道路上操作一或多個機動車輛。駕照號碼由英數字元組成。

    • LICENSE_PLATE

      車輛的車牌是由註冊車輛的州或國家/地區核發。客車的格式通常為 5 到 8 位數,由大寫字母和數字組成。格式會根據發行州或國家/地區的位置而有所不同。

    • VEHICLE_IDENTIFICATION_NUMBER

      車輛識別號碼 (VIN) 可唯一識別車輛。VIN 內容和格式在 ISO 3779 規格中定義。每個國家/地區都有 VIN 的特定代碼和格式。

  • 財務

    • CREDIT_DEBIT_CARD_CVV

      VISA、MasterCard 卡和 Discover 信用卡和簽帳卡上存在 3 位數卡驗證碼 (CVV)。在美國運通信用卡或簽帳卡,CVV 是一個 4 位數的數字代碼。

    • CREDIT_DEBIT_CARD_EXPIRY

      信用卡或簽帳卡到期日。該數字通常為 4 位數,格式為月/年MM/YY。Amazon Bedrock 防護機制會辨識過期日期,例如 01/2101/20212021 年 1 月

    • CREDIT_DEBIT_CARD_NUMBER

      信用卡或簽帳卡號碼。這些數字的長度從 13 到 16 位數不等。不過,當只有最後 4 位數時,Amazon Bedrock 也會辨識信用卡或簽帳金融卡號碼。

    • PIN

      您可以用來存取銀行帳戶的 4 位數個人識別號碼 (PIN)。

    • INTERNATIONAL_BANK_ACCOUNT_NUMBER

      國際銀行帳戶號碼在每個國家/地區都有特定的格式。如需詳細資訊,請參閱 www.iban.com/structure

    • SWIFT_CODE

      SWIFT 代碼是銀行識別符代碼 (BIC) 的標準格式,用於指定特定的銀行或分行。銀行使用這些代碼進行匯款,例如國際電匯。

      SWIFT 代碼由 8 個或 11 個字元組成。11 位數代碼是指特定的分行,而 8 位數代碼 (或結尾為 'XXX' 的 11 位數代碼) 是指總部或主要辦公室。

  • IT

    • IP_ADDRESS

      IPv4 位址,例如 198.51.100.0

    • MAC_ADDRESS

      媒體存取控制 (MAC) 地址是指派給網路介面控制器 (NIC) 的唯一識別符。

    • URL

      網址,例如 www.example.com

    • AWS_ACCESS_KEY

      與私密存取金鑰相關聯的唯一識別符;您要使用存取金鑰 ID 和私密存取金鑰,以密碼編譯的方式來簽署程式設計的 AWS 請求。

    • AWS_SECRET_KEY

      與存取金鑰相關聯的唯一識別符。您可以使用存取金鑰 ID 和私密存取金鑰,以密碼編譯方式簽署程式設計 AWS 請求。

  • 美國特定

    • US_BANK_ACCOUNT_NUMBER

      美國銀行帳號,通常為 10 到 12 位數。

    • US_BANK_ROUTING_NUMBER

      美國銀行帳戶的分行代碼。這些通常為 9 位數,

    • US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER

      美國個人納稅人識別號碼 (ITIN) 是一個以 "9" 開頭的 9 位數號碼,其中包含 "7" 或 "8" 作為第 4 位數。ITIN 的格式可以在第 3 和第 4 個數字後面使用空格或破折號。

    • US_PASSPORT_NUMBER

      美國護照號碼。護照號碼範圍為 6 到 9 個英數字元。

    • US_SOCIAL_SECURITY_NUMBER

      美國社會安全號碼 (SSN) 是核發給美國公民、永久居民和臨時工作居民的 9 位數號碼。

  • 加拿大特定

    • CA_HEALTH_NUMBER

      加拿大健康服務號碼是 10 位數的唯一識別符,個人需要此識別符才能使用醫療保健權益。

    • CA_SOCIAL_INSURANCE_NUMBER

      加拿大社會保險號碼 (SIN) 是 9 位數的唯一識別符,個人需要此識別符才能使用政府計劃和權益。

      SIN 格式為三組 3 個位數,例如 123-456-789。SIN 可以透過稱為 Luhn 演算法的簡單檢查位數程序進行驗證。

  • 英國特定

    • UK_NATION_HEALTH_SERVICE_NUMBER

      英國國家衛生服務號碼是 10-17 位數的數字,例如 485 777 3456。目前的系統格式為 10 位數的數字,並在第 3 位數和第 6 位數之後加上空格。最後一個數字是錯誤偵測檢查總和。

    • UK_國家_保險_編號

      英國國民保險號碼 (NINO) 可讓個人存取國民保險 (社會安全) 權益。它也用於英國稅務系統中的某些目的。

      數字為 9 位數,以 2 個字母開頭,隨後接著 6 個數字和 1 個字母。NINO 的格式可為在 2 個字母後面以及在第 2、4 和 6 位數後面加上空格或破折號。

    • UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER

      英國唯一納稅人參考 (UTR) 是識別納稅人或企業的 10 位數號碼。

  • Custom

    • Regex 篩選條件

      您可以使用規則表達式來定義護欄的模式,以識別和處理序號、預訂 ID 或其他自訂模式。

注意

PII 模型在取得足夠的內容時,會更有效率地執行。為了提高其準確性,請包含更多內容資訊,並避免向模型提交單字或短語。由於 PII 可能會與內容相關 (例如,數字字串可能代表 AWS KMS key 或使用者 ID,視周圍資訊而定),因此提供完整的內容對於準確識別至關重要。

注意

敏感資訊篩選條件的自訂 regex 篩選條件不支援 regex 預期相符項目。

為您的防護機制設定敏感資訊政策

您可以使用 AWS 管理主控台 或 Amazon Bedrock API 來設定防護機制的敏感資訊政策。

Console
  1. AWS 管理主控台 使用具有使用 Amazon Bedrock 主控台之許可的 IAM 身分登入 。接著,開啟位於 https://console.aws.amazon.com/bedrock 的 Amazon Bedrock 主控台。

  2. 從左側導覽窗格中,選擇防護機制,然後選擇建立防護機制

  3. 提供防護機制詳細資訊頁面中,執行下列動作:

    1. 防護機制詳細資訊區段中,提供防護機制的名稱和選用的描述

    2. 封鎖提示的訊息中,輸入套用防護機制時顯示的訊息。選取為回應套用相同的封鎖訊息核取方塊,以在將防護機制套用至回應時,使用相同的訊息。

    3. (選用) 若要為您的防護機制啟用跨區域推論,請展開跨區域推論,然後選取為您的防護機制啟用跨區域推論。選擇護欄設定檔,定義可路由護欄推論請求 AWS 區域 的目的地。

    4. (選用) 根據預設,您的護欄會使用 加密 AWS 受管金鑰。若要使用您自己的客戶受管 KMS 金鑰,請展開 KMS 金鑰選取範圍,然後選取自訂加密設定 (進階) 核取方塊。

      您可以選取現有的 AWS KMS 金鑰,或選取建立金鑰以建立新的 AWS KMS 金鑰

    5. (選用) 若要將標籤新增至防護機制,請展開標籤,然後為您定義的每個標籤選取新增標籤

      如需詳細資訊,請參閱標記 Amazon Bedrock 資源

    6. 選擇下一步

  4. 新增敏感資訊篩選條件頁面上,執行下列動作來設定篩選條件,以封鎖或遮罩敏感資訊:

    1. PII 類型區段中,設定個人身分識別資訊 (PII) 類別,以封鎖、遮罩或不採取任何動作 (偵測模式)。您有下列選項:

      • 若要新增所有 PII 類型,請選取新增 PII 類型旁的下拉箭頭。然後選取要對其套用的防護機制行為。

        警告

        如果您指定行為,則您為 PII 類型設定的任何現有行為都會遭到覆寫。

      • 若要刪除 PII 類型,請選取垃圾桶圖示 ( Trapezoid-shaped diagram showing data flow from source to destination through AWS Transfer Family. )。

      • 若要刪除包含錯誤的資料列,請選取全部刪除,然後選取刪除發生錯誤的所有列

      • 若要刪除所有 PII 類型,請選取全部刪除,然後選取刪除所有資料列

      • 若要搜尋資料列,請在搜尋列中輸入運算式。

      • 若要僅顯示有錯誤的資料列,請選取標記為顯示全部的下拉式功能表,然後選取僅顯示錯誤

      • 若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 ( Gear icon representing settings or configuration options. )。設定您的偏好設定,然後選取確認

    2. 規則運算式區段中,使用規則運算式來定義要篩選的防護機制模式。您有下列選項:

      • 若要新增模式,請選取新增規則運算式模式。設定下列欄位:

        欄位 Description
        Name 模式的名稱
        規則運算式模式 定義模式的規則運算式
        Input 選擇是否要封鎖包含模式的內容,或使用識別符將其遮罩。若不採取任何動作,請選取偵測 (不採取任何動作)
        Output
        新增描述 (選用) 撰寫模式的描述
      • 若要編輯模式,請在動作欄位中選取與主題相同資料列中的三個點圖示。然後,選取編輯。完成編輯後,請選取確認

      • 若要刪除模式,請選取要刪除模式的核取方塊。選取刪除,然後選取刪除選取的項目

      • 若要刪除所有模式,請選取刪除,然後選取全部刪除

      • 若要搜尋模式,請在搜尋列中輸入運算式。

      • 若要設定資料表中每個頁面的大小或資料表中的資料欄顯示,請選取設定圖示 ( Gear icon representing settings or configuration options. )。設定您的偏好設定,然後選取確認

    3. 當您完成設定敏感資訊篩選條件時,請選取下一步跳至檢閱和建立

API

若要使用敏感資訊政策建立防護機制,請傳送 CreateGuardrail 請求。請求格式如下:

POST /guardrails HTTP/1.1 Content-type: application/json { "blockedInputMessaging": "string", "blockedOutputsMessaging": "string", "sensitiveInformationPolicyConfig": { "piiEntitiesConfig": [{ "type": "ADDRESS | EMAIL | PHONE | NAME | SSN | ...", "action": "BLOCK | ANONYMIZE | NONE", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }], "regexesConfig": [{ "name": "string", "pattern": "string", "action": "BLOCK | ANONYMIZE | NONE", "description": "string", "inputAction": "BLOCK | ANONYMIZE | NONE", "inputEnabled": true, "outputAction": "BLOCK | ANONYMIZE | NONE", "outputEnabled": true }] }, "description": "string", "kmsKeyId": "string", "name": "string", "tags": [{ "key": "string", "value": "string" }], "crossRegionConfig": { "guardrailProfileIdentifier": "string" } }
  • 為防護機制指定 namedescription

  • 指定當防護機制成功封鎖 blockedInputMessagingblockedOutputsMessaging 欄位中的提示或模型回應時的訊息。

  • sensitiveInformationPolicyConfig 物件中設定敏感資訊政策:

    • 使用 piiEntitiesConfig 陣列來設定預先定義的 PII 實體類型:

      • type 欄位中指定 PII 實體類型。有效值包括 ADDRESSEMAILPHONENAMEUS_SOCIAL_SECURITY_NUMBER 等。

      • 指定在 action 欄位中偵測到 PII 實體時所要採取的動作。選擇 BLOCK 以封鎖內容、選擇 ANONYMIZE 以遮罩內容,或選擇 NONE 以不採取任何動作,但傳回偵測資訊。

      • (選用) 使用 inputActioninputEnabledoutputActionoutputEnabled 來設定提示和回應的不同行為。

    • 使用 regexesConfig 陣列來定義要偵測的自訂模式:

      • 為 regex 模式指定 name (1-100 個字元)。

      • 定義要偵測的規則運算式 pattern (1-500 個字元)。

      • 指定在偵測到模式時要採取的 action。選擇 BLOCK 以封鎖內容、選擇 ANONYMIZE 以遮罩內容,或選擇 NONE 以不採取任何動作,但傳回偵測資訊。

      • (選用) 為規則運算式模式提供 description (1-1000 個字元)。

      • (選用) 使用 inputActioninputEnabledoutputActionoutputEnabled 來設定提示和回應的不同行為。

  • (選用) 將任何標籤連接到防護機制。如需詳細資訊,請參閱標記 Amazon Bedrock 資源

  • (選用) 為了安全起見,請在 kmsKeyId 欄位中包含 KMS 金鑰的 ARN。

  • (選用) 若要啟用跨區域推論,請在 crossRegionConfig 物件中指定防護機制設定檔。

回應格式如下:

HTTP/1.1 202 Content-type: application/json { "createdAt": "string", "guardrailArn": "string", "guardrailId": "string", "version": "string" }