

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# IP Insights 데이터 형식
<a name="ip-insights-data-formats"></a>

이 섹션에서는 훈련 및 추론 중 IP Insights 알고리즘에서 사용 가능한 입력 및 출력 데이터 형식의 예를 제공합니다.

**Topics**
+ [IP Insights 훈련 데이터 형식](ip-insights-training-data-formats.md)
+ [IP Insights 추론 데이터 형식](ip-insights-inference-data-formats.md)

# IP Insights 훈련 데이터 형식
<a name="ip-insights-training-data-formats"></a>

다음은 IP Insights 알고리즘에 사용할 수 있는 데이터 입력 형식입니다. Amazon SageMaker AI 기본 제공 알고리즘은 [훈련을 위한 공통 데이터 형식](cdf-training.md)에 설명된 일반적인 입력 훈련 형식을 준수합니다. 그러나 SageMaker AI IP Insights 알고리즘은 현재 CSV 데이터 입력 형식만 지원합니다.

## IP Insights 훈련 데이터 입력 형식
<a name="ip-insights-training-input-format-requests"></a>

### INPUT: CSV
<a name="ip-insights-input-csv"></a>

CSV 파일에는 두 개의 열이 있어야 합니다. 첫 번째 열은 엔터티의 고유한 식별자에 해당하는 불투명한 문자열입니다. 두 번째 열은 엔터티의 액세스 이벤트에 대한 IPv4 주소로, 10진수 점 표기법으로 표시됩니다.

content-type: text/csv

```
entity_id_1, 192.168.1.2
entity_id_2, 10.10.1.2
```

# IP Insights 추론 데이터 형식
<a name="ip-insights-inference-data-formats"></a>

다음은 IP Insights 알고리즘에 사용할 수 있는 입력 및 출력 형식입니다. Amazon SageMaker AI 기본 제공 알고리즘은 [추론을 위한 공통 데이터 형식](cdf-inference.md)에 설명된 일반적인 입력 추론 형식을 준수합니다. 그러나 SageMaker AI IP Insights 알고리즘은 현재 RecordIO 형식을 지원하지 않습니다.

## IP Insights 입력 요청 형식
<a name="ip-insights-input-format-requests"></a>

### INPUT: CSV 형식
<a name="ip-insights-input-csv-format"></a>

CSV 파일에는 두 개의 열이 있어야 합니다. 첫 번째 열은 엔터티의 고유한 식별자에 해당하는 불투명한 문자열입니다. 두 번째 열은 엔터티의 액세스 이벤트에 대한 IPv4 주소로, 10진수 점 표기법으로 표시됩니다.

content-type: text/csv

```
entity_id_1, 192.168.1.2
entity_id_2, 10.10.1.2
```

### INPUT: JSON 형식
<a name="ip-insights-input-json"></a>

JSON 데이터는 다른 형식으로 제공할 수 있습니다. IP Insights는 공통 SageMaker AI 형식을 따릅니다. 추론 형식에 대한 자세한 정보는 [추론을 위한 공통 데이터 형식](cdf-inference.md) 섹션을 참조하세요.

content-type: application/json

```
{
  "instances": [
    {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}},
    {"features": ["entity_id_2", "10.10.1.2"]}
  ]
}
```

### INPUT: JSONLINES 형식
<a name="ip-insights-input-jsonlines"></a>

JSON Lines 콘텐츠 유형은 실행 중인 배치 변환 작업에 유용합니다. SageMaker AI 추론 형식에 대한 자세한 내용은 [추론을 위한 공통 데이터 형식](cdf-inference.md) 섹션을 참조하세요. 배치 변환 작업 실행에 대한 자세한 정보는 [Amazon SageMaker AI를 사용한 추론용 배치 변환](batch-transform.md) 섹션을 참조하세요.

content-type: application/jsonlines

```
{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}},
{"features": ["entity_id_2", "10.10.1.2"]}]
```

## IP Insights 출력 응답 형식
<a name="ip-insights-ouput-format-response"></a>

### OUTPUT: JSON 응답 형식
<a name="ip-insights-output-json"></a>

SageMaker AI IP Insights 알고리즘의 기본 출력은 입력 엔터티 및 IP 주소 간의 `dot_product`입니다. dot\$1product는 모델이 엔터티와 IP 주소를 고려할 수 있는 호환성을 나타냅니다. `dot_product`는 무한합니다. 이벤트가 변칙적인지 여부를 예측하려면 정의한 분포를 기반으로 임계값을 설정해야 합니다. 이상 탐지에 `dot_product`를 사용하는 방법에 대한 자세한 내용은 [An Introduction to the SageMaker AIIP Insights Algorithm](https://sagemaker-examples.readthedocs.io/en/latest/introduction_to_amazon_algorithms/ipinsights_login/ipinsights-tutorial.html)을 참조하세요.

accept: application/json

```
{
  "predictions": [
    {"dot_product": 0.0},
    {"dot_product": 2.0}
  ]
}
```

고급 사용자는 Accept 헤딩에 추가 콘텐츠 유형 파라미터인 `verbose=True`를 제공하여 모델의 학습된 엔터티 및 IP 임베딩에 액세스할 수 있습니다. 모델 디버깅, 시각화 및 이해에 `entity_embedding` 및 `ip_embedding`을 사용할 수 있습니다. 또한 분류 또는 클러스터링과 같은 다른 기계 학습 기법에 이러한 임베딩을 사용할 수 있습니다.

accept: application/json;verbose=True

```
{
  "predictions": [
    {
        "dot_product": 0.0,
        "entity_embedding": [1.0, 0.0, 0.0],
        "ip_embedding": [0.0, 1.0, 0.0]
    },
    {
        "dot_product": 2.0,
        "entity_embedding": [1.0, 0.0, 1.0],
        "ip_embedding": [1.0, 0.0, 1.0]
    }
  ]
}
```

### OUTPUT: JSONLINES 응답 형식
<a name="ip-insights-jsonlines"></a>

accept: application/jsonlines 

```
{"dot_product": 0.0}
{"dot_product": 2.0}
```

accept: application/jsonlines; verbose=True 

```
{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]}
{"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}
```