

 신규 고객은 Amazon Forecast를 더 이상 사용할 수 없습니다. Amazon Forecast의 기존 고객은 서비스를 정상적으로 계속 사용할 수 있습니다. [자세히 알아보기](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 대체 데이터 세트
<a name="replacement-series"></a>

대체 데이터 세트는 what-if 예측에서 변경하려는 값만 포함하는 기준선 관련 시계열의 수정된 버전입니다. 대체 데이터 세트에는 기준선 관련 시계열의 예측 차원, 항목 식별자, 타임스탬프와 하나 이상의 변경된 시계열이 포함되어야 합니다. 이 데이터 세트는 기준선 관련 시계열과 병합되어 what-if 예측에 사용되는 변환된 데이터 세트를 생성합니다. 대체 데이터 세트는 CSV 형식이어야 합니다.

이 데이터 세트에는 동일한 시계열에 대한 중복된 타임스탬프가 포함되어서는 안 됩니다.

다음은 대체 시계열을 지정하는 방법과 해당 사양을 해석하는 방법에 대한 몇 가지 예제입니다. 일별 예측을 하고 예측 기간이 2022-08-01부터 2022-08-03까지인 경우를 생각해 보세요. 모든 예제의 기준선 관련 시계열이 다음 표에 나와 있습니다.


| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- | --- | --- | --- | 
| item\$11 | 2022-08-01 | 100 | 50 | 
| item\$11 | 2022-08-02 | 100 | 50 | 
| item\$11 | 2022-08-03 | 100 | 50 | 
| item\$12 | 2022-08-01 | 75 | 500 | 
| item\$12 | 2022-08-02 | 75 | 500 | 
| item\$12 | 2022-08-03 | 75 | 500 | 

------
#### [ Unchanged values ]

2022-08-02 및 2022-08-03에 item\$11에 10% 할인을 적용하려면 대체 데이터 세트에 다음을 지정하는 것으로 충분합니다.


**대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | 
| --- | --- | --- | 
| item\$11 | 2022-08-02 | 90 | 
| item\$11 | 2022-08-03 | 90 | 

하지만 대체 데이터 세트에 변경되지 않은 값을 지정하는 것도 유효합니다. 대체 데이터 세트로 사용할 경우 다음 세 테이블 각각은 이전에 제공된 테이블과 동일한 결과를 산출합니다.


**열이 변경되지 않은 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- | --- | --- | --- | 
| item\$11 | 2022-08-02 | 90 | 50 | 
| item\$11 | 2022-08-03 | 90 | 50 | 


**행이 변경되지 않은 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | 
| --- | --- | --- | 
| item\$11 | 2022-08-01 | 100 | 
| item\$11 | 2022-08-02 | 90 | 
| item\$11 | 2022-08-03 | 90 | 
| item\$12 | 2022-08-01 | 75 | 
| item\$12 | 2022-08-02 | 75 | 
| item\$12 | 2022-08-03 | 75 | 


**행과 열이 변경되지 않은 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- | --- | --- | --- | 
| item\$11 | 2022-08-01 | 100 | 50 | 
| item\$11 | 2022-08-02 | 90 | 50 | 
| item\$11 | 2022-08-03 | 90 | 50 | 
| item\$12 | 2022-08-01 | 75 | 500 | 
| item\$12 | 2022-08-02 | 75 | 500 | 
| item\$12 | 2022-08-03 | 75 | 500 | 

------
#### [ Missing values ]

대체 시계열에서 누락된 값은 기준선 관련 시계열의 값으로 대체됩니다. 2022-08-02 및 2022-08-03에 item\$11에 10% 할인을 적용하고 2022-08-01에 item\$12의 재고를 늘리는 시나리오를 생각해 보세요. 다음과 같은 대체 데이터 세트로 충분합니다.


**누락된 값이 있는 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- |--- |--- |--- |
| item\$11 | 2022-08-02 | 90 |  | 
| --- |--- |--- |--- |
| item\$11 | 2022-08-03 | 90 |  | 
| --- |--- |--- |--- |
| item\$12 | 2022-08-01 |  | 5000 | 
| --- |--- |--- |--- |

이 테이블에서 누락된 값은 기준선 관련 시계열에서 귀속됩니다.

------
#### [ Extraneous values ]

what-if 예측을 생성할 때 대체 시계열의 관련 없는 값은 무시됩니다. 즉, 기준선 관련 시계열의 값과 일치하지 않는 대체 데이터 집합의 값은 모델링되지 않습니다. 다음 대체 데이터 세트를 생각해 보세요.


**관련 없는 값이 있는 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- |--- |--- |--- |
| item\$11 | 2022-08-01 | 100 | 50 | 
| item\$11 | 2022-08-02 | 100 | 50 | 
| item\$11 | 2022-08-03 | 100 | 50 | 
| item\$12 | 2022-08-01 | 75 | 500 | 
| item\$12 | 2022-08-02 | 75 | 500 | 
| item\$12 | 2022-08-03 | 75 | 500 | 
| item\$13 | 2022-08-01 | 50 | 125 | 
| --- |--- |--- |--- |
| item\$13 | 2022-08-02 | 50 | 125 | 
| --- |--- |--- |--- |
| item\$13 | 2022-08-03 | 50 | 125 | 
| --- |--- |--- |--- |

item\$13이 포함된 행은 무시되며 what-if 분석에 포함되지 않습니다.

------
#### [ Historical changes ]

예측 기간을 벗어난 대체 데이터 세트의 변경 사항은 무시됩니다. 다음 대체 데이터 세트를 생각해 보세요.


**예측 기간을 벗어난 값이 있는 대체 데이터 세트**  

| item\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- |--- |--- |--- |
| item\$11 | 2022-07-31 | 100 | 50 | 
| --- |--- |--- |--- |
| item\$11 | 2022-08-01 | 100 | 50 | 
| item\$11 | 2022-08-02 | 100 | 50 | 
| item\$11 | 2022-08-03 | 100 | 50 | 
| item\$11 | 2022-08-04 | 100 | 50 | 
| --- |--- |--- |--- |
| item\$12 | 2022-07-31 | 75 | 500 | 
| --- |--- |--- |--- |
| item\$12 | 2022-08-01 | 75 | 500 | 
| item\$12 | 2022-08-02 | 75 | 500 | 
| item\$12 | 2022-08-03 | 75 | 500 | 
| item\$13 | 2022-08-04 | 75 | 500 | 
| --- |--- |--- |--- |

2022-07-31과 2022-08-04를 포함하는 행은 무시되며 what-if 분석에 포함되지 않습니다.

------

## 예측 차원
<a name="forecast-dimensions"></a>

데이터 세트에 예측 차원을 포함하는 경우 대체 데이터 세트에도 해당 차원을 포함해야 합니다. 다음과 같은 기준선 관련 시계열을 생각해 보세요.


| item\$1id | store\$1id | 타임스탬프 | 가격 | stock\$1count | 
| --- | --- | --- | --- | --- | 
| item\$11 | store\$11 | 2022-08-01 | 100 | 50 | 
| item\$11 | store\$11 | 2022-08-02 | 100 | 50 | 
| item\$11 | store\$11 | 2022-08-03 | 100 | 50 | 
| item\$11 | store\$12 | 2022-08-01 | 75 | 500 | 
| item\$11 | store\$12 | 2022-08-02 | 75 | 500 | 
| item\$11 | store\$12 | 2022-08-03 | 75 | 500 | 

따라서 2022-08-02에 모든 매장에서 10% 할인이 적용되는 대체 데이터 세트는 다음과 같습니다.


| item\$1id | store\$1id | 타임스탬프 | 가격 | 
| --- | --- | --- | --- | 
| item\$11 | store\$11 | 2022-08-02 | 90 | 
| item\$11 | store\$12 | 2022-08-02 | 67.5 | 