

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 품질 검사
<a name="data-quality-checks"></a>

데이터 품질은 필수이지만 데이터 정리 프로세스에서 종종 간과되는 부분입니다. 다음 다이어그램에서는 데이터 품질 검사가 데이터 엔지니어링 자동화 및 액세스 제어 수명 주기에 어떻게 부합하는지 보여줍니다.

![\[데이터 품질 다이어그램\]](http://docs.aws.amazon.com/ko_kr/prescriptive-guidance/latest/modern-data-centric-use-cases/images/data_quality_checks.png)


다음 표에서는 사용 사례에 따라 다양한 데이터 품질 솔루션에 대한 개요를 제공합니다.


|  |  |  | 
| --- |--- |--- |
| **사용 사례**: | **솔루션** | **예제** | 
| 열 수준 또는 테이블 수준 품질 조건을 추가하는 노코드 솔루션 | [AWS Glue DataBrew](https://aws.amazon.com/glue/features/databrew/) | 모든 열 값이 1에서 12 사이인지 또는 테이블이나 열이 비어 있는지 확인합니다. | 
| 열 수준 또는 테이블 수준 품질 조건을 추가하기 위해 AWS Glue 작업 또는 노코드 솔루션(미리 보기)에 추가된 사용자 지정 코드 | [AWS Glue Data Quality](https://docs.aws.amazon.com/glue/latest/dg/glue-data-quality.html) | `first_name` 열이 null이 아닌지 또는 `phone_number` 열에 숫자 또는 '\$1' 연산자 및/또는 평균 또는 합계와 같은 통계 함수만 포함되어 있는지 확인합니다. | 
| 사용자 지정 검사 | [AWS Lambda](https://aws.amazon.com/lambda/), [AWS Glue](https://aws.amazon.com/glue/) 또는 [Amazon EMR](https://aws.amazon.com/emr/)과 같은 원하는 ETL | A 열의 값이 항상 B 열 및 C 열의 해당 값보다 큰지 또는 `continent` 열 값이 항상 지리적으로 정확하고 `city` 열에서 파생되었는지 확인합니다. | 
| 지표 보고서, 제약 조건 검증 및 제약 조건 제안이 포함된 정교한 솔루션 | [Deequ](https://aws.amazon.com/blogs/big-data/test-data-quality-at-scale-with-deequ/) | `review_id` 열 지표의 완전성에 대한 `CompletenessConstraint`가 `1`인지 확인합니다. | 