

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 항목 데이터세트 요구사항(ECOMMERCE 도메인)
<a name="ECOMMERCE-items-dataset"></a>

 항목 데이터세트는 ECOMMERCE 항목에 대한 메타데이터를 저장합니다.** 여기에는 각 항목에 대한 가격, 범주, 제품 설명 등의 정보가 포함될 수 있습니다. Personalize로 가져올 수 있는 항목 데이터 유형에 대한 더 자세한 내용은 [항목 메타데이터](items-datasets.md)단원을 참조하세요. 형식 지정 요구 사항 및 사용 가능한 필드 데이터 유형과 같은 일반적인 Personalize 스키마 요구 사항에 대한 자세한 내용은 [Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성](how-it-works-dataset-schema.md)단원을 참조하세요. 이러한 요구 사항은 도메인과 상관없이 모든 스키마에 적용됩니다.

 항목 데이터세트는 모든 ECOMMERCE 사용 사례에 대해 선택 사항입니다. 항목 데이터가 있는 경우, 가장 관련성이 높은 추천을 받을 수 있도록 한 개의 사용자 데이터를 생성하는 것이 좋습니다.. 항목 데이터세트를 만드는 경우, 스키마에 다음 필드가 포함되어야 합니다.
+ ITEM\$1ID
+ PRICE(`float`)
+ CATEGORY\$1L1(범주형 `string`)

 다음과 같은 예약어를 스키마에 포함할 수도 있습니다. 범주형 필드의 경우, 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다.
+ CATEGORY\$1L2(범주형`string`,`null`)
+ CATEGORY\$1L3(범주형`string`,`null`)
+ PRODUCT\$1DESCRIPTION(텍스트형 `string`, `null`)
+ CREATION\$1TIMESTAMP(`float`)
+ AGE\$1GROUP(범주형`string`,`null`): 항목이 대상 연령대입니다. 값은 신생아, 유아, 어린이, 성인일 수 있습니다.
+ ADULT(범주형 `string`, `null`): 항목이 알코올과 같이 성인으로만 제한되는지 여부. 값은 예 또는 아니오일 수 있습니다.
+ GENDER(범주형`string`,`null`): 항목이 성별입니다. 값은 남성, 여성, 남녀공용일 수 있습니다.

 최상의 추천을 얻으려면 이러한 필드를 데이터의 수만큼 스키마에 보관하는 것이 좋습니다. 가져오는 데이터는 스키마와 일치해야 합니다. 가져오는 데이터는 스키마와 일치해야 합니다. 최대 메타데이터 열 수는 100개입니다. 사용 사례와 데이터에 따라 추가 필드를 마음대로 추가할 수 있습니다. 필드가 필수 또는 예약으로 나열되어 있지 않고 데이터 유형이 [스키마 데이터 유형](how-it-works-dataset-schema.md#personalize-datatypes)에 나열된 경우, 필드 이름과 데이터 사용자가 선택할 수 있습니다.

 다중 레벨 범주가 여러 개 있는 항목에는 예약어 CATEGORY\$1L2 및 CATEGORY\$1L3을 사용합니다. 자세한 내용은 [범주형 데이터 사용](#ECOMMERCE-items-categorical-data)단원을 참조하세요. 텍스트 및 범주형 메타데이터에 대한 자세한 내용은 [비정형 텍스트 메타데이터](items-datasets.md#text-data)을 참조하세요. ECOMMERCE 도메인의 항목 데이터세트에 대한 기본 스키마의 예제는 [기본 항목 스키마(ECOMMERCE 도메인)](#ECOMMERCE-items-dataset-schema)단원을 참조하세요.

## 범주형 데이터 사용
<a name="ECOMMERCE-items-categorical-data"></a>

 범주형 데이터를 사용하려면 스키마에서 유형 `string`필드를 추가하고 필드의 범주형 속성을 `true`로 설정합니다. 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 범주형 데이터를 포함합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의할 수 있습니다. 범주형 값은 최대 1000자까지 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 항목이 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

 여러 범주를 갖는 항목의 경우, 세로 막대 '\$1'로 각 값을 구분합니다. 예를 들어, CATEGORY\$1L1 필드의 경우 항목에 대한 데이터가 `Electronics|Productivity|Mouse`이 될 수 있습니다. 여러 수준의 범주형 데이터가 있고 일부 항목에 계층의 각 수준에 대해 여러 범주가 있는 경우, 각 수준에 대한 필드를 추가하고 각 필드 이름 뒤에 수준 표시기(CATEGORY\$1L1, CATEGORY\$1L2, CATEGORY\$1L3)를 추가하세요. 이렇게 하면 항목이 여러 멀티 레벨 범주에 속하더라도 하위 범주를 기준으로 추천을 필터링할 수 있습니다. 예를 들어, 항목에는 각 범주 수준에 대해 다음과 같은 데이터가 있을 수 있습니다.
+ CATEGORY\$1L1: 전자제품\$1생산성
+ CATEGORY\$1L2: 생산성\$1컴퓨터
+ CATEGORY\$1L3: 마우스

이 예제에서 항목은 전자 제품 > 생산성 > 마우스 계층 구조 및 생산성 > 컴퓨터 > 마우스 계층 구조입니다.** L3까지만 사용하는 것이 좋지만, 필요한 경우 더 많은 레벨을 사용할 수 있습니다. 필터 생성 및 사용에 대한 자세한 내용은 [추천 및 사용자 세그먼트 필터링](filter.md)단원을 참조하세요.

## 기본 항목 스키마(ECOMMERCE 도메인)
<a name="ECOMMERCE-items-dataset-schema"></a>

 다음은 필수 필드만 포함된 ECOMMERCE 도메인의 항목 데이터세트에 대한 기본 스키마입니다.

```
{
  "type": "record",
  "name": "Items",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
    {
      "name": "ITEM_ID",
      "type": "string"
    },
    {
      "name": "PRICE",
      "type": "float"
    },
    {
      "name": "CATEGORY_L1",
      "type": [
        "string"
      ],
      "categorical": true
    }
  ],
  "version": "1.0"
}
```