View a markdown version of this page

의미 체계 캐싱을 위해 ElastiCache for Valkey를 사용하는 이유 - Amazon ElastiCache

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

의미 체계 캐싱을 위해 ElastiCache for Valkey를 사용하는 이유

의미 체계 캐싱 워크로드는 응답을 최신 상태로 유지하면서 수신되는 사용자 쿼리의 스트림을 제공하기 위해 캐시 항목을 지속적으로 작성, 검색 및 제거합니다. 캐시 스토어는 다음 요구 사항을 충족해야 합니다.

  • 실시간 벡터 업데이트 - 적중률을 유지하려면 캐시에서 새 쿼리 및 응답을 즉시 사용할 수 있어야 합니다.

  • 지연 시간이 짧은 조회 - 캐시는 모든 쿼리의 온라인 요청 경로에 있으므로 조회가 최종 사용자 응답 시간에 감지할 수 있는 지연을 추가해서는 안 됩니다.

  • 효율적인 임시 관리 - 항목은 자주 작성, 읽기 및 제거되므로 핫 세트를 효율적으로 관리해야 합니다.

ElastiCache for Valkey는 다음 요구 사항을 충족합니다.

  • 가장 짧은 지연 시간 벡터 검색 - 작성 시 ElastiCache for Valkey는의 인기 있는 벡터 데이터베이스 중에서 가장 높은 처리량과 95% 이상의 재현율로 가장 낮은 지연 시간 벡터 검색을 제공합니다 AWS. 지연 시간은 최대 99%의 재현율로 마이크로초만큼 낮습니다.

  • 다중 스레드 아키텍처 - ElastiCache의 벡터 검색은 실시간 벡터 업데이트와 높은 쓰기 처리량을 지원하는 동시에 검색 요청에 대한 짧은 지연 시간을 유지하는 다중 스레드 아키텍처를 사용합니다.

  • 기본 제공 캐시 기능 - TTL(Time to Live), 제거 정책(allkeys-lru) 및 원자성 작업은 의미 체계 캐싱이 생성하는 임시 항목 세트를 관리하는 데 도움이 됩니다.

  • 벡터 인덱스 지원 - ElastiCache는 COSINE, Euclidean 및 내부 제품 거리 지표를 사용하여 HNSW(Hierarchical Navigable Small World) 및 FLAT 인덱스 알고리즘을 모두 지원합니다.

  • 제로 가동 중지 확장성 - ElastiCache는 가동 중지 없이 규모 조정을 지원하므로 캐시가 증가함에 따라 용량을 조정할 수 있습니다.

  • 프레임워크 통합 - ElastiCache for Valkey는 LangGraph 프레임워크를 통해 Amazon Bedrock AgentCore와 통합되어 Amazon Bedrock에 구축된 에이전트를 위한 Valkey 지원 시맨틱 캐시를 구현할 수 있습니다.