

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 특성 저장소 스토리지 구성
<a name="feature-store-storage-configurations"></a>

Amazon SageMaker 특성 저장소는 온라인 저장소와 오프라인 저장소로 구성되어 있습니다. 온라인 저장소에서는 추론을 위한 기능을 실시간으로 조회할 수 있는 반면, 오프라인 저장소에서는 모델 훈련 및 일괄 추론을 위한 과거 데이터가 포함되어 있습니다. 특성 그룹을 생성할 때 온라인 저장소, 오프라인 저장소 또는 둘 다를 활성화할 수 있습니다. 둘 다 활성화하면 훈련 데이터와 제공 데이터 간의 불일치를 방지하기 위해 동기화됩니다. 온라인 및 오프라인 저장소 및 기타 특성 저장소 개념에 대한 자세한 내용은 [특성 저장소 개념](feature-store-concepts.md)섹션을 참조하세요.

다음 항목에서는 온라인 저장소 스토리지 유형 및 오프라인 저장소 테이블 형식에 대해 설명합니다.

**Topics**
+ [온라인 저장소](feature-store-storage-configurations-online-store.md)
+ [오프라인 저장소](feature-store-storage-configurations-offline-store.md)
+ [처리량 모드](feature-store-throughput-mode.md)

# 온라인 저장소
<a name="feature-store-storage-configurations-online-store"></a>

온라인 저장소는 특성을 실시간으로 조회할 수 있는 저지연 고가용성의 데이터 저장소입니다. 일반적으로 기계 학습 (ML) 모델 서비스에 사용됩니다. 특성 그룹을 생성할 때 표준 온라인 저장소(`Standard`) 또는 인메모리 계층 온라인 저장소(`InMemory`) 중에서 선택할 수 있습니다. 이렇게 하면 성능과 비용을 고려하면서 특정 애플리케이션의 읽기 및 쓰기 패턴에 가장 잘 맞는 스토리지 유형을 선택할 수 있습니다. 요금에 대한 자세한 내용은 [Amazon SageMaker 요금](https://aws.amazon.com/sagemaker/pricing/)을 참조하세요.

온라인 저장소에는 다음 `StorageType`옵션이 있습니다. 온라인 저장소 콘텐츠에 대한 자세한 내용은 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OnlineStoreConfig.html) 섹션을 참조하세요.

## 표준 계층 스토리지 유형
<a name="feature-store-storage-configurations-online-store-standard-tier"></a>

`Standard` 계층은 온라인 저장소 특성 그룹을 위한 저지연 관리형 데이터 저장소입니다. 애플리케이션의 ML 모델 서비스를 위한 빠른 데이터 검색을 제공합니다. `Standard`는 기본 스토리지 유형입니다.

## 인메모리 계층 스토리지 유형
<a name="feature-store-storage-configurations-online-store-in-memory-tier"></a>

`InMemory` 계층은 초저지연 검색을 지원하는 온라인 저장소 특성 그룹을 위한 관리형 데이터 저장소입니다. 처리량이 많은 애플리케이션에 사용되는 ML 모델 서비스를 위한 대규모 실시간 데이터 검색을 제공합니다. `InMemory` 계층은 Amazon ElastiCache(Redis OSS)에서 제공합니다. 자세한 내용은 [What is Amazon ElastiCache (Redis OSS)?](https://docs.aws.amazon.com/AmazonElastiCache/latest/red-ug/WhatIs.html)를 참조하세요.

온라인 저장소 `InMemory`계층은 컬렉션 유형, 즉 목록, 세트, 벡터를 지원합니다. `InMemory` 컬렉션 유형에 대한 자세한 내용은 [컬렉션 유형](feature-store-collection-types.md) 섹션을 참조하세요.

특성 저장소는 온라인 저장소에 대한 저지연 읽기 및 쓰기를 제공합니다. 애플리케이션 지연 시간은 주로 인프라 또는 네트워크 지연 시간과 특성 저장소 API 지연 시간이라는 두 가지 기본 구성 요소로 구성됩니다. 네트워크 지연 시간을 줄이면 특성 저장소에 대한 읽기 및 쓰기 지연 시간을 최소화하는 데 도움이 됩니다. 특성 저장소 런타임 엔드포인트에 배포하여 AWS PrivateLink 특성 저장소의 네트워크 지연 시간을 줄일 수 있습니다. 를 사용하면 인터페이스 VPC 엔드포인트를 사용하여 확장 가능한 방식으로 Amazon Virtual Private Cloud(VPC)에서 모든 특성 저장소 런타임 API 작업에 비공개로 액세스할 AWS PrivateLink수 있습니다. `privateDNSEnabled` 옵션이 true로 설정된 AWS PrivateLink 배포:
+ 모든 특성 저장소 읽기/쓰기 트래픽을 VPC 내에 유지합니다.
+ 특성 저장소를 사용할 때 트래픽을 생성한 클라이언트와 동일한 AZ에 트래픽을 유지합니다. 이렇게 하면 AZ 간의 “홉”을 방지하여 네트워크 지연 시간이 줄어듭니다.

[인터페이스 VPC 엔드포인트를 AWS 사용하여 서비스 액세스](https://docs.aws.amazon.com/vpc/latest/privatelink/create-interface-endpoint.html)의 단계에 따라 특성 저장소 AWS PrivateLink 로 설정합니다. 에서 특성 저장소 런타임의 서비스 이름은 AWS PrivateLink 입니다`com.amazonaws.region.sagemaker.featurestore-runtime`.

`InMemory` 계층 온라인 저장소는 스토리지 사용량 및 요청에 따라 자동으로 규모가 조정됩니다. 자동 확장은 빠르게 변화하는 경우 새로운 사용 패턴에 적응하는 데 몇 분 정도 걸릴 수 있습니다. 자동 확장 중:
+ 특성 그룹에 대한 쓰기 작업 시 스로틀링 오류가 발생할 수 있습니다. 몇 분 후에 요청을 다시 시도해야 합니다.
+ 특성 그룹에 대한 읽기 작업에서 스로틀링 오류가 발생할 수 있습니다. 이 경우에는 표준 재시도 전략이 적합합니다.
+ 읽기 작업의 지연 시간이 길어질 수 있습니다.

기본 `InMemory`계층 특성 그룹 최대 크기는 50GiB입니다.

현재 `InMemory`계층은 온라인 특성 그룹만 지원하고 온라인\$1오프라인 특성 그룹은 지원하지 않으므로, `InMemory`계층의 온라인 저장소와 오프라인 저장소 간에 복제가 이루어지지 않습니다. 또한 `InMemory`계층은 현재 고객 관리형 KMS 키를 지원하지 않습니다.

# 오프라인 저장소
<a name="feature-store-storage-configurations-offline-store"></a>

오프라인 저장소는 1초 미만의 검색이 필요하지 않는 과거 데이터에 사용됩니다. 일반적으로 데이터 탐색, 모델 훈련 및 일괄 추론에 사용됩니다.

특성 그룹에 대해 온라인 저장소와 오프라인 저장소를 모두 활성화하면 두 저장소가 모두 동기화되어 훈련 데이터와 제공 데이터 간의 불일치를 피할 수 있습니다. `InMemory` 스토리지 유형이 활성화된 온라인 저장소 특성 그룹은 현재 오프라인 저장소에서 해당 특성 그룹을 지원하지 않습니다(온라인-오프라인 복제 불가). Amazon SageMaker Feature Store에서 제공하는 ML 모델에 대한 자세한 내용은 [온라인 저장소](feature-store-storage-configurations-online-store.md) 섹션을 참조하세요.

오프라인 저장소에는 다음 `TableFormat`옵션이 있습니다. 오프라인 저장소 콘텐츠에 대한 자세한 내용은 Amazon SageMaker API 참조의 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_OfflineStoreConfig.html) 섹션을 참조하세요.

## Glue 테이블 형식
<a name="feature-store-storage-configurations-offline-store-glue-table-format"></a>

`Glue` 형식(기본값)은 AWS Glue를 위한 표준 Hive 유형 테이블 형식입니다. AWS Glue를 사용하면 여러 소스에서 데이터를 검색, 준비, 이동 및 통합할 수 있습니다. 또한 작성, 작업 실행, 비즈니스 워크플로 구현을 위한 추가 생산성 및 데이터 운영 도구도 포함됩니다. 에 대한 자세한 내용은 [란 무엇입니까 AWS Glue?](https://docs.aws.amazon.com/glue/latest/dg/what-is-glue.html)를 AWS Glue참조하십시오.

## Iceberg 테이블 형식
<a name="feature-store-storage-configurations-offline-store-iceberg-table-format"></a>

`Iceberg` 형식(권장)은 대규모 분석 테이블에 대한 오픈 테이블 형식입니다. `Iceberg`를 사용하면 작은 데이터 파일을 파티션에 있는 더 적은 수의 큰 파일로 압축하여 쿼리 속도를 크게 높일 수 있습니다. 이 압축 작업은 동시에 수행되며 특성 그룹에서 진행 중인 읽기 및 쓰기 작업에는 영향을 주지 않습니다. Iceberg 테이블 최적화에 대한 자세한 내용은 [Amazon Athena](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg-data-optimization.html) 및 [AWS Lake Formation](https://docs.aws.amazon.com/lake-formation/latest/dg/data-compaction.html) 사용 설명서를 참조하세요.

`Iceberg`는 대규모 파일 컬렉션을 테이블로 관리하고 최신 분석 데이터 레이크 작업을 지원합니다. 새 특성 그룹 생성 시 `Iceberg`옵션을 선택하면 Amazon SageMaker 특성 저장소는 Parquet 파일 형식을 사용하여 테이블을 생성하고 `Iceberg`테이블을 AWS Glue Data Catalog에 등록합니다. `Iceberg` 테이블 형식에 대한 자세한 내용은 [Using Apache Iceberg tables](https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html)을 참조하세요.

**중요**  
`Iceberg` 테이블 형식의 특성 그룹의 경우, 이벤트 시간의 특성 유형을 `String`으로 지정해야 함에 유의하세요. 다른 유형을 지정하면 특성 그룹을 성공적으로 생성할 수 없습니다.

# 처리량 모드
<a name="feature-store-throughput-mode"></a>

Amazon SageMaker Feature Store는 온디맨드(`On-demand`) 및 프로비저닝된(`Provisioned`) 처리량 모드라는 두 가지 요금 모델을 제공합니다. `On-demand`는 예측 불가능한 트래픽에 가장 적합하고, `Provisioned`는 일관되고 예측 가능한 트래픽에 가장 적합합니다.

애플리케이션 트래픽 패턴이 변경되거나 예측이 불가능한 기간을 수용하기 위해 지정된 특성 그룹에 대해 `On-demand` 및 `Provisioned` 처리량 모드 간에 전환할 수 있는 옵션이 있습니다. 특성 그룹 처리량 모드는 24시간 동안 한 번만 `On-demand`로 업데이트할 수 있습니다. 처리량 모드는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용해 프로그래밍 방식으로 또는 콘솔 UI를 통해 업데이트할 수 있습니다. 콘솔 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

`Provisioned` 처리량 모드는 오프라인 전용 특성 그룹 또는 `Standard` 스토리지 유형을 사용하는 특성 그룹에서 사용할 수 있습니다. 다른 스토리지 구성의 경우 `On-demand` 처리량 모드가 사용됩니다. 온라인 및 오프라인 스토리지 구성에 대한 자세한 내용은 각각 [온라인 저장소](feature-store-storage-configurations-online-store.md) 및 [오프라인 저장소](feature-store-storage-configurations-offline-store.md) 섹션을 참조하세요.

요금에 대한 자세한 내용은 [Amazon SageMaker 요금](https://aws.amazon.com/sagemaker/pricing/)을 참조하세요.

**Topics**
+ [온디맨드 처리량 모드](#feature-store-throughput-mode-on-demand)
+ [프로비저닝된 처리량 모드](#feature-store-throughput-mode-provisioned)
+ [처리량 모드 지표](#feature-store-throughput-mode-metrics)
+ [처리량 모드 한도](#feature-store-throughput-mode-limits)

## 온디맨드 처리량 모드
<a name="feature-store-throughput-mode-on-demand"></a>

`On-demand`(기본값) 처리량 모드는 워크로드를 알 수 없고 애플리케이션 트래픽을 예측할 수 없는 특성 그룹을 사용하며 용량 요구 사항을 예측할 수 없는 경우에 가장 적합합니다.

`On-demand` 모드에서는 애플리케이션이 특성 그룹에서 수행하는 읽기 및 쓰기에 대해 요금이 부과됩니다. Feature Store는 늘어나거나 줄어드는 워크로드를 즉시 수용하기 때문에 애플리케이션에서 수행할 것으로 예상되는 읽기 및 쓰기 처리량을 지정할 필요가 없습니다. `ReadRequestsUnits` 및 `WriteRequestsUnits`에서 측정되는 사용량에 대해서만 비용을 지불합니다.

[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) 또는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용하거나 콘솔 UI를 통해 `On-demand` 처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

**중요**  
특성 그룹 처리량 모드는 24시간 동안 한 번만 `On-demand`로 업데이트할 수 있습니다.

## 프로비저닝된 처리량 모드
<a name="feature-store-throughput-mode-provisioned"></a>

`Provisioned` 처리량 모드는 워크로드가 예측 가능한 특성 그룹을 사용하며 비용을 통제하기 위해 용량 요구 사항을 예측할 수 있을 때 가장 적합합니다. 이 모드를 사용하면 처리량 요구 사항을 미리 예상할 수 있는 특정 워크로드에 대해 비용 효과가 높아질 수 있습니다.

특성 그룹을 `Provisioned` 모드로 설정하면 애플리케이션이 특성 그룹에서 사용할 수 있는 최대 용량인 용량 단위를 지정합니다. 애플리케이션에서 이 `Provisioned` 처리량 용량을 초과할 경우 스로틀링 요청이 적용됩니다.

아래에 읽기 및 쓰기 용량 단위에 대한 정보가 나와 있습니다.
+ `GetRecord` API를 사용하여 최대 4KB의 단일 레코드를 검색하면 *최소* 1개의 RCU(읽기 용량 단위)를 사용합니다. 더 큰 페이로드를 검색하려면 더 많은 RCU가 사용될 수 있습니다. 필요한 총 읽기 용량 단위 수는 Feature Store 서비스에서 추가하는 레코드당 작은 메타데이터를 포함하여 항목 크기에 따라 달라집니다.
+ `PutRecord` API를 사용한 페이로드가 1KB인 단일 쓰기 요청은 *최소* 1개의 WCU(쓰기 용량 단위)를 소비하며, 분수 페이로드는 가장 가까운 KB로 반올림됩니다. 이벤트 시간, 레코드의 삭제 상태 및 Time to Live(TTL) 상태에 따라 더 많이 소비될 수 있습니다. TTL에 대한 자세한 내용은 [레코드의 TTL (Time to live) 기간](feature-store-time-to-live.md) 섹션을 참조하세요.

**중요**  
용량 단위를 설정할 때 다음을 고려하세요.  
`Provisioned` 용량을 완전히 활용하지 않더라도 특성 그룹에 대해 프로비저닝하는 읽기 및 쓰기 용량에 대한 요금이 부과됩니다.
읽기 또는 쓰기 용량을 너무 낮게 설정하면 요청에 스로틀링이 적용될 수 있습니다.
경우에 따라 레코드는 다양한 특성을 활성화하기 위해 Feature Store 서비스에서 추가하는 레코드 수준 메타데이터로 인해 추가 용량 단위를 사용할 수 있습니다.
`GetRecord` 또는 `BatchGetRecord` API를 사용하여 특성의 하위 집합만 검색해도 여전히 전체 레코드에 해당하는 RCU가 사용됩니다.
쓰기 용량의 경우 많은 수의 기록 쓰기가 발생할 수 있는 채우기 또는 대량 수집을 수행할 때 스로틀링을 방지하기 위해 최근 피크 용량의 2배를 프로비저닝해야 합니다. 이는 기록 레코드 작성이 추가 쓰기 용량을 소비하기 때문입니다.
Feature Store는 현재 `Provisioned` 모드에 대한 오토 스케일링을 지원하지 않습니다.

[CreateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateFeatureGroup.html) 또는 [UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API를 사용하거나 콘솔 UI를 통해 `On-demand` 처리량 모드를 활성화할 수 있습니다. 콘솔 UI 사용 방법에 대한 자세한 내용은 [콘솔에서 Amazon SageMaker Feature Store 사용](feature-store-use-with-studio.md) 섹션을 참조하세요.

다음은 `Provisioned` 모드가 활성화될 때 특성 그룹의 RCU 및 WCU 처리량을 늘리거나 줄이는 방법을 설명합니다.

**프로비저닝된 처리량 늘리기**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API 또는 콘솔 UI를 사용하여 필요한 만큼 자주 RCU 또는 WCU를 늘릴 수 있습니다.

**프로비저닝된 처리량 줄이기**

[UpdateFeatureGroup](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateFeatureGroup.html) API 또는 콘솔 UI를 사용하여 특성 그룹의 RCU 및 WCU(또는 둘 다)를 줄일 수 있습니다.

특성 그룹에서 하루에 수행할 수 있는 `Provisioned` 용량 감소 횟수에는 기본 할당량이 있습니다. 하루는 협정 세계시(UTC)에 따라 정의됩니다. 특정 일에 아직 용량 감소를 수행하지 않은 경우 한 시간 내에 최대 4회 용량 감소를 수행할 수 있습니다. 그 후에는 이전 시간에 용량 감소를 수행하지 않았다면 시간당 1회 추가 용량 감소를 수행할 수 있습니다. 이에 따라 하루에 줄일 수 있는 최대 횟수를 27회로 설정할 수 있습니다(처음 1시간 동안 4회 줄이기, 이후 1시간마다 1회 줄이기(당일 기준)).

## 처리량 모드 지표
<a name="feature-store-throughput-mode-metrics"></a>

`On-demand` 모드의 특성 그룹은 `ConsumedReadRequestsUnits` 및 `ConsumedWriteRequestsUnits` 지표를 내보냅니다. `Provisioned` 모드의 특성 그룹은 `ConsumedReadCapacityUnits` 및 `ConsumedWriteCapacityUnits` 지표를 내보냅니다. Feature Store 지표에 대한 자세한 내용은 [Amazon SageMaker 특성 스토어 지표](monitoring-cloudwatch.md#cloudwatch-metrics-feature-store) 섹션을 참조하세요.

## 처리량 모드 한도
<a name="feature-store-throughput-mode-limits"></a>

각 AWS 계정 에는 가용성을 보장하고 결제 위험을 관리하는 데 도움이 되는 기본 서비스 할당량 또는 제한이 적용됩니다. 기본 할당량과 한도에 대한 자세한 내용은 [할당량, 이름 지정 규칙 및 데이터 형식](feature-store-quotas.md) 섹션을 참조하세요.

경우에 따라 이러한 한도가 설명서에 명시된 한도보다 낮을 수 있습니다. 이 한도를 늘려야 하는 경우 증가 요청을 제출할 수 있습니다. 작업 중단을 방지하기 위해 기존 한도에 도달하기 전에 요청하는 것이 좋습니다. 서비스 할당량과 할당량 증가를 요청하는 방법에 대한 자세한 내용은 [AWS 서비스 할당량](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)을 참조하세요.