本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 S3 Vectors 和向量儲存貯體
<a name="s3-vectors"></a>

## 什麼是 Amazon S3 Vectors？
<a name="s3-vectors-what-is"></a>

Amazon S3 Vectors 為 AI 代理器、推論、RAG 和語意搜尋提供專用、成本最佳化的向量儲存。S3 Vectors 旨在提供與 Amazon S3 相同的彈性、耐用性和可用性，並為不常查詢提供次秒的延遲，並為更頻繁的查詢提供低至 100 毫秒的延遲。您可以取得專用 API 操作集，以儲存、存取和查詢向量資料，而無需佈建任何基礎設施。S3 Vectors 包含數個共同運作的關鍵元件：
+ **向量儲存貯體** – 這是一種新儲存貯體類型，專門用於儲存和查詢向量。
+ **向量索引** – 在向量儲存貯體中，您可以在向量索引中組織向量資料。您可以在向量索引中對向量資料執行相似度查詢。
+ **向量 **– 您可以將向量儲存在向量索引中。對於相似性搜尋和 AI 應用程式，向量會建立為向量嵌入，這是保留內容之間語義關係的數值表示法 (例如文字、影像或音訊)，因此相似項目會放在更接近的位置。S3 Vectors 可以根據語義執行相似性搜尋，而不是從數學角度比較向量之間的接近程度來進行精確比對。將向量資料新增至向量索引時，您也可以根據一組條件 (例如時間戳記、類別和使用者偏好設定) 連接中繼資料，以供未來篩選查詢。

寫入 S3 Vectors 的資料非常一致，這表示您可以立即存取最近新增的資料。當您寫入、更新和刪除向量一段時間後，S3 Vectors 會自動最佳化向量資料，以實現向量儲存的可能最佳性價比，對於資料集擴展和演進也一樣。您可以使用 Amazon S3 的現有存取控制機制來控制對向量資料的存取，包括儲存貯體和 IAM 政策。如需有關每個儲存貯體的向量索引限制，和每個索引的向量限制的詳細資訊，請參閱 [限制](s3-vectors-limitations.md)。

## 使用案例：跨大型資料集的相似性搜尋
<a name="s3-vectors-use-cases"></a>

相似性搜尋可讓您根據其向量表示法來尋找概念上彼此相關的項目，而不是與關鍵字完全相符的項目。即使確切的單字或視覺元素不同，這些搜尋也會識別具有相似意義或特性的內容。

使用 S3 Vectors 進行相似性搜尋的常見使用案例包括：
+ **醫學影像** - 在數百萬個醫療影像中尋找其相似性，協助診斷和治療規劃
+ **著作權侵權** - 在大型媒體庫中識別潛在的衍生內容
+ **影像重複資料刪除** - 從大型影像收集中偵測並移除重複或近乎重複的影像
+ **影片理解** - 搜尋影片資產中的特定場景或內容
+ **企業文件搜尋** - 啟用跨企業文件的語義搜尋，以根據意義尋找相關資訊
+ **個人化** - 透過尋找相似的項目來提供量身打造的建議

如果您想要以毫秒級搜尋時間建置經濟實惠的向量搜索和代理式 AI 應用程式，您應該使用 S3 Vectors。使用向量儲存貯體時，您只需支付已使用數量的費用，如此可節省上傳、儲存和查詢向量嵌入的成本。如需定價的詳細資訊，請參閱 [Amazon S3 定價](https://aws.amazon.com/s3/pricing/)。

## S3 Vectors 的功能
<a name="s3-vectors-features"></a>


### 向量專用儲存
<a name="s3-vectors-purpose-built-storage"></a>

S3 Vectors 是雲端中第一個用於儲存和查詢向量的專用物件儲存體。向量儲存貯體旨在為向量資料提供經濟實惠、彈性且耐久的儲存體。

向量嵌入正在轉換客戶使用和擷取其非結構化資料的方式，包括偵測醫療影像的相似性、在數千小時的影片片段中尋找異常狀況、瀏覽大型程式碼基礎，以及識別與特定法律事項最相關的判例法。這些新興應用程式結合嵌入模型，將資料的語義 (例如文字、影像、影片、程式碼) 編碼為數值向量嵌入。

在向量儲存貯體中，您可以在向量索引中組織向量資料，無需佈建基礎設施。當您寫入、更新和刪除向量一段時間後，S3 Vectors 會自動最佳化向量資料，以實現向量儲存的可能最佳性價比，對於資料集擴展和演進也一樣。如需有關每個儲存貯體的向量索引限制，和每個索引的向量限制的詳細資訊，請參閱 [限制](s3-vectors-limitations.md)。

### 執行相似度查詢
<a name="s3-vectors-similarity-queries"></a>

使用 S3 向量，您可以執行查詢以尋找與查詢向量最相似的向量，不常查詢的回應時間不到一秒，而較頻繁查詢的回應時間低至 100 毫秒。S3 Vectors 非常適用於查詢頻率較低的工作負載。

### 中繼資料篩選
<a name="s3-vectors-filtering-metadata"></a>

您可以將中繼資料 (例如年份、作者、類型、位置) 以鍵值對形式連接到您的向量。根據預設，除非您明確指定為不可篩選，否則所有中繼資料都可篩選。您可以使用可篩選的中繼資料，並根據特定屬性篩選查詢結果，增強查詢的相關性。向量索引支援中繼資料的字串、數字、布林值和清單類型。如需有關每個向量中繼資料大小限制，和每個向量可篩選中繼資料大小限制的詳細資訊，請參閱 [限制](s3-vectors-limitations.md)。

### 存取管理與安全性
<a name="s3-vectors-access-management-and-security"></a>

您可以使用 AWS Organizations 中的 IAM [和服務控制政策](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_scps.html)，管理向量儲存貯體中資源的存取權。S3 Vectors 使用與 Amazon S3 不同的服務命名空間：`s3vectors` 命名空間。因此，您可以專門為 S3 Vectors 服務及其資源設計政策。您可以設計政策來授予對個別向量索引、向量儲存貯體中的所有向量索引，或帳戶中所有向量儲存貯體的存取權。向量儲存貯體一律啟用所有 Amazon S3 封鎖公開存取設定，且無法停用。

### 與 AWS 服務整合
<a name="s3-vectors-aws-integration"></a>

S3 Vectors 與其他 AWS 服務整合，以增強您的向量處理功能：
+ **[Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service/)** - 最佳化向量儲存成本，同時可繼續使用 OpenSearch API 操作。這非常適用於需要進階搜尋功能的工作負載，例如混合搜尋、彙總、進階篩選和多面向搜尋。您也可以將 S3 Vectors 索引的快照匯出至 Amazon OpenSearch Serverless，以利於高 QPS 和低延遲向量搜索。
+ **[Amazon Bedrock 知識庫](https://aws.amazon.com/bedrock/knowledge-bases/)** - 選取 S3 Vectors 中的向量索引當作向量存放區，以節省檢索增強生成 (RAG) 應用程式的儲存成本。
+ **[SageMaker Unified Studio 中的 Amazon Bedrock](https://aws.amazon.com/bedrock/unifiedstudio/)** - 將 S3 Vectors 用作向量存放區來開發和測試知識庫。