本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用敏感資訊篩選條件從對話中移除 PII
Amazon Bedrock Guardrails 可在輸入提示或使用敏感資訊篩選條件的模型回應中,協助偵測敏感資訊,例如個人身分識別資訊 (PII)。此篩選條件是一種機率式機器學習 (ML) 型解決方案,與內容相關,並根據輸入提示或模型回應中的內容偵測敏感資訊。您可以從 Amazon Bedrock Guardrails 針對您的使用案例或組織提供的一組內建 PIIs 中進行設定,方法為定義它,以及根據模式比對來封鎖或遮罩 PII 資料的規則表達式 (自訂 regex)。
敏感資訊偵測適用於自然語言和程式碼網域,包括程式碼語法、註解、字串常值和混合內容。這有助於識別內嵌在程式碼元素中的 PII,例如變數名稱、硬式編碼憑證或程式碼文件。
您可以設定下列模式來處理防護機制偵測到的敏感資訊:
-
封鎖 - 敏感資訊篩選條件政策可以封鎖包含敏感資訊的請求或回應。這類應用程式的範例可能包括以公有文件為基礎的一般問題和答案。如果在提示或回應中偵測到敏感資訊,防護機制會封鎖所有內容,並傳回您設定的訊息。
-
遮罩 - 敏感資訊篩選條件政策可以匿名化或修訂模型請求或回應中的資訊。例如,防護機制會遮罩 PII,同時產生使用者與客戶服務客服人員之間的對話摘要。如果在模型請求或回應中偵測到敏感資訊,防護機制會將其遮罩,並將其取代為 PII 類型 (例如
{NAME}或{EMAIL})。
Amazon Bedrock 防護機制提供下列 PII 來封鎖或匿名化:
-
一般
-
ADDRESS
實體地址,例如 "100 Main Street, Anytown, USA" 或 "Suite #12, Building 123"。地址可以包括街道、建築物、位置、城市、州、國家/地區、郡、郵遞區號、分區、鄰里等資訊。
-
AGE
個人的年齡,包括數量和時間單位。例如,在「我 40 歲」一詞中,Amazon Bedrock 防護機制會將「40 歲」視為年齡。
-
名稱
個人的姓名。此實體類型不包含稱謂,例如醫師、先生、太太或小姐。Amazon Bedrock 防護機制不會將此實體類型套用至屬於組織或地址的名稱。例如,防護機制會將 "John Doe Organization" 辨識為一個組織,而將 "Jane Doe Street" 辨識為地址。
-
EMAIL
電子郵件位址,例如 marymajor@email.com。
-
電話
電話號碼。此實體類型還包括傳真和呼叫器號碼。
-
USERNAME
識別帳戶的使用者名稱,例如登入名稱、螢幕名稱、別名或控制代碼。
-
密碼
用作密碼的英數字串,例如 "*very20special#pass*"。
-
DRIVER_ID
指派給駕照的號碼,這是官方文件,允許個人在公有道路上操作一或多個機動車輛。駕照號碼由英數字元組成。
-
LICENSE_PLATE
車輛的車牌是由註冊車輛的州或國家/地區核發。客車的格式通常為 5 到 8 位數,由大寫字母和數字組成。格式會根據發行州或國家/地區的位置而有所不同。
-
VEHICLE_IDENTIFICATION_NUMBER
車輛識別號碼 (VIN) 可唯一識別車輛。VIN 內容和格式在 ISO 3779 規格中定義。每個國家/地區都有 VIN 的特定代碼和格式。
-
-
財務
-
CREDIT_DEBIT_CARD_CVV
VISA、MasterCard 卡和 Discover 信用卡和簽帳卡上存在 3 位數卡驗證碼 (CVV)。在美國運通信用卡或簽帳卡,CVV 是一個 4 位數的數字代碼。
-
CREDIT_DEBIT_CARD_EXPIRY
信用卡或簽帳卡到期日。該數字通常為 4 位數,格式為月/年或 MM/YY。Amazon Bedrock 防護機制會辨識過期日期,例如 01/21、01/2021 和 2021 年 1 月。
-
CREDIT_DEBIT_CARD_NUMBER
信用卡或簽帳卡號碼。這些數字的長度從 13 到 16 位數不等。不過,當只有最後 4 位數時,Amazon Bedrock 也會辨識信用卡或簽帳金融卡號碼。
-
PIN
您可以用來存取銀行帳戶的 4 位數個人識別號碼 (PIN)。
-
INTERNATIONAL_BANK_ACCOUNT_NUMBER
國際銀行帳戶號碼在每個國家/地區都有特定的格式。如需詳細資訊,請參閱 www.iban.com/structure
。 -
SWIFT_CODE
SWIFT 代碼是銀行識別符代碼 (BIC) 的標準格式,用於指定特定的銀行或分行。銀行使用這些代碼進行匯款,例如國際電匯。
SWIFT 代碼由 8 個或 11 個字元組成。11 位數代碼是指特定的分行,而 8 位數代碼 (或結尾為 'XXX' 的 11 位數代碼) 是指總部或主要辦公室。
-
-
IT
-
IP_ADDRESS
IPv4 位址,例如 198.51.100.0。
-
MAC_ADDRESS
媒體存取控制 (MAC) 地址是指派給網路介面控制器 (NIC) 的唯一識別符。
-
URL
網址,例如 www.example.com。
-
AWS_ACCESS_KEY
與私密存取金鑰相關聯的唯一識別符;您要使用存取金鑰 ID 和私密存取金鑰,以密碼編譯的方式來簽署程式設計的 AWS 請求。
-
AWS_SECRET_KEY
與存取金鑰相關聯的唯一識別符。您可以使用存取金鑰 ID 和私密存取金鑰,以密碼編譯方式簽署程式設計 AWS 請求。
-
-
美國特定
-
US_BANK_ACCOUNT_NUMBER
美國銀行帳號,通常為 10 到 12 位數。
-
US_BANK_ROUTING_NUMBER
美國銀行帳戶的分行代碼。這些通常為 9 位數,
-
US_INDIVIDUAL_TAX_IDENTIFICATION_NUMBER
美國個人納稅人識別號碼 (ITIN) 是一個以 "9" 開頭的 9 位數號碼,其中包含 "7" 或 "8" 作為第 4 位數。ITIN 的格式可以在第 3 和第 4 個數字後面使用空格或破折號。
-
US_PASSPORT_NUMBER
美國護照號碼。護照號碼範圍為 6 到 9 個英數字元。
-
US_SOCIAL_SECURITY_NUMBER
美國社會安全號碼 (SSN) 是核發給美國公民、永久居民和臨時工作居民的 9 位數號碼。
-
-
加拿大特定
-
CA_HEALTH_NUMBER
加拿大健康服務號碼是 10 位數的唯一識別符,個人需要此識別符才能使用醫療保健權益。
-
CA_SOCIAL_INSURANCE_NUMBER
加拿大社會保險號碼 (SIN) 是 9 位數的唯一識別符,個人需要此識別符才能使用政府計劃和權益。
SIN 格式為三組 3 個位數,例如 123-456-789。SIN 可以透過稱為 Luhn 演算法
的簡單檢查位數程序進行驗證。
-
-
英國特定
-
UK_NATION_HEALTH_SERVICE_NUMBER
英國國家衛生服務號碼是 10-17 位數的數字,例如 485 777 3456。目前的系統格式為 10 位數的數字,並在第 3 位數和第 6 位數之後加上空格。最後一個數字是錯誤偵測檢查總和。
-
UK_國家_保險_編號
英國國民保險號碼 (NINO) 可讓個人存取國民保險 (社會安全) 權益。它也用於英國稅務系統中的某些目的。
數字為 9 位數,以 2 個字母開頭,隨後接著 6 個數字和 1 個字母。NINO 的格式可為在 2 個字母後面以及在第 2、4 和 6 位數後面加上空格或破折號。
-
UK_UNIQUE_TAXPAYER_REFERENCE_NUMBER
英國唯一納稅人參考 (UTR) 是識別納稅人或企業的 10 位數號碼。
-
-
Custom
-
Regex 篩選條件
您可以使用規則表達式來定義護欄的模式,以識別和處理序號、預訂 ID 或其他自訂模式。
-
注意
PII 模型在取得足夠的內容時,會更有效率地執行。為了提高其準確性,請包含更多內容資訊,並避免向模型提交單字或短語。由於 PII 可能會與內容相關 (例如,數字字串可能代表 AWS KMS key 或使用者 ID,視周圍資訊而定),因此提供完整的內容對於準確識別至關重要。
注意
敏感資訊篩選條件的自訂 regex 篩選條件不支援 regex 預期相符項目。
為您的防護機制設定敏感資訊政策
您可以使用 AWS 管理主控台 或 Amazon Bedrock API 來設定防護機制的敏感資訊政策。