의미 체계 캐싱을 위해 ElastiCache for Valkey를 사용하는 이유

의미 체계 캐싱 워크로드는 응답을 최신 상태로 유지하면서 수신되는 사용자 쿼리의 스트림을 제공하기 위해 캐시 항목을 지속적으로 작성, 검색 및 제거합니다. 캐시 스토어는 다음 요구 사항을 충족해야 합니다.

실시간 벡터 업데이트 - 적중률을 유지하려면 캐시에서 새 쿼리 및 응답을 즉시 사용할 수 있어야 합니다.
지연 시간이 짧은 조회 - 캐시는 모든 쿼리의 온라인 요청 경로에 있으므로 조회가 최종 사용자 응답 시간에 감지할 수 있는 지연을 추가해서는 안 됩니다.
효율적인 임시 관리 - 항목은 자주 작성, 읽기 및 제거되므로 핫 세트를 효율적으로 관리해야 합니다.

ElastiCache for Valkey는 다음 요구 사항을 충족합니다.

가장 짧은 지연 시간 벡터 검색 - 작성 시 ElastiCache for Valkey는의 인기 있는 벡터 데이터베이스 중에서 가장 높은 처리량과 95% 이상의 재현율로 가장 낮은 지연 시간 벡터 검색을 제공합니다 AWS. 지연 시간은 최대 99%의 재현율로 마이크로초만큼 낮습니다.
다중 스레드 아키텍처 - ElastiCache의 벡터 검색은 실시간 벡터 업데이트와 높은 쓰기 처리량을 지원하는 동시에 검색 요청에 대한 짧은 지연 시간을 유지하는 다중 스레드 아키텍처를 사용합니다.
기본 제공 캐시 기능 - TTL(Time to Live), 제거 정책(allkeys-lru) 및 원자성 작업은 의미 체계 캐싱이 생성하는 임시 항목 세트를 관리하는 데 도움이 됩니다.
벡터 인덱스 지원 - ElastiCache는 COSINE, Euclidean 및 내부 제품 거리 지표를 사용하여 HNSW(Hierarchical Navigable Small World) 및 FLAT 인덱스 알고리즘을 모두 지원합니다.
제로 가동 중지 확장성 - ElastiCache는 가동 중지 없이 규모 조정을 지원하므로 캐시가 증가함에 따라 용량을 조정할 수 있습니다.
프레임워크 통합 - ElastiCache for Valkey는 LangGraph 프레임워크를 통해 Amazon Bedrock AgentCore와 통합되어 Amazon Bedrock에 구축된 에이전트를 위한 Valkey 지원 시맨틱 캐시를 구현할 수 있습니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

의미 체계 캐싱 개요

솔루션 아키텍처