

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# HealthOmics 변형 저장소 가져오기 작업 생성
<a name="parsing-annotation-stores"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

다음 예제에서는를 사용하여 변형 저장소 AWS CLI 에 대한 가져오기 작업을 생성하는 방법을 보여줍니다.

```
aws omics start-variant-import-job \
       --destination-name myvariantstore \
       --runLeftNormalization false \
       --role-arn  arn:aws:iam::55555555555:role/roleName \
       --items source=s3://my-omics-bucket/sample.vcf.gz source=s3://my-omics-bucket/sample2.vcf.gz
```

```
{
    "destinationName": "store_a",
    "roleArn": "....",
    "runLeftNormalization": false,
    "items": [
        {"source": "s3://my-omics-bucket/sample.vcf.gz"},
        {"source": "s3://my-omics-bucket/sample2.vcf.gz"}
    ]
}
```

2023년 5월 15일 이후에 생성된 스토어의 경우 다음 예제에서는 `--annotation-fields` 파라미터를 추가하는 방법을 보여줍니다. 주석 필드는 가져오기로 정의됩니다.

```
aws omics start-variant-import-job \
   --destination-name annotationparsingvariantstore \
   --role-arn arn:aws:iam::123456789012:role/<role_name> \
   --items source=s3://pathToS3/sample.vcf
   --annotation-fields '{"VEP": "CSQ"}'
```

```
{
    "jobId": "981e2286-e954-4391-8a97-09aefc343861"
}
```

**get-variant-import-job**을 사용하여 상태를 확인합니다.

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

가져오기 작업의 상태를 보여주는 JSON 응답을 받게 됩니다. VCF의 VEP 주석은 INFO 열에 ID/값 페어로 저장된 정보에 대해 구문 분석됩니다. [변형 효과 예측기 주석 앙상블](https://useast.ensembl.org/info/docs/tools/vep/index.html/#vcf) INFO 열의 기본 ID는 CSQ이지만 `--annotation-fields` 파라미터를 사용하여 INFO 열에 사용되는 사용자 지정 값을 나타낼 수 있습니다. 구문 분석은 현재 VEP 주석에 대해 지원됩니다.

2023년 5월 15일 이전에 생성된 저장소 또는 VEP 주석이 포함되지 않은 VCF 파일의 경우 응답에 주석 필드가 포함되지 않습니다.

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
       "jobStatus": "COMPLETED",
       "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::555555555555:role/<role_name>",

    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
}
```

VCF 파일의 일부인 VEP 주석은 다음 구조의 사전 정의된 스키마로 저장됩니다. 추가 항목 필드는 기본 스키마에 포함되지 않은 추가 VEP 필드를 저장하는 데 사용할 수 있습니다.

```
annotations struct<
   vep: array<struct<
      allele:string,
      consequence: array<string>,
      impact:string,
      symbol:string,
      gene:string,
      `feature_type`: string, 
      feature: string,
      biotype: string,
      exon: struct<rank:string, total:string>,
      intron: struct<rank:string, total:string>,
      hgvsc: string,
      hgvsp: string,
      `cdna_position`: string,
      `cds_position`: string,
      `protein_position`: string,
      `amino_acids`: struct<reference:string, variant: string>,
      codons: struct<reference:string, variant: string>,
      `existing_variation`: array<string>,
      distance: string, 
      strand: string, 
      flags: array<string>,
      symbol_source: string,
      hgnc_id: string,
      `extras`: map<string, string> 
    >>
>
```

구문 분석은 최선의 방법으로 수행됩니다. VEP 항목이 [VEP 표준 사양을](https://useast.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf) 따르지 않으면 구문 분석되지 않고 배열의 행이 비어 있습니다.

새 변형 저장소의 경우 **get-variant-import-job**에 대한 응답에는 다음과 같이 주석 필드가 포함됩니다.

```
aws omics get-variant-import-job --job-id 08279950-a9e3-4cc3-9a3c-a574f9c9e229      
```

가져오기 작업의 상태를 보여주는 JSON 응답을 받습니다.

```
{
    "creationTime": "2023-04-11T17:52:37.241958+00:00",
    "destinationName": "annotationparsingvariantstore",
    "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
    "items": [

    {
    "jobStatus": "COMPLETED",
    "source": "s3://amzn-s3-demo-bucket/NA12878.2k.garvan.vcf"
    }
 ],
    "roleArn": "arn:aws:iam::123456789012:role/<role_name>",
    "runLeftNormalization": false,
    "status": "COMPLETED",
    "updateTime": "2023-04-11T17:58:22.676043+00:00",
    "annotationFields" : {"VEP": "CSQ"}
  }
}
```

**list-variant-import-jobs**를 사용하여 모든 가져오기 작업과 해당 상태를 볼 수 있습니다.

```
aws omics list-variant-import-jobs --ids 7a1c67e3-b7f9-434d-817b-9c571fd63bea          
```

응답에는 다음과 같은 정보가 포함됩니다.

```
{
    "variantImportJobs": [
    {
        "creationTime": "2023-04-11T17:52:37.241958+00:00",
        "destinationName": "annotationparsingvariantstore",
        "id": "7a1c67e3-b7f9-434d-817b-9c571fd63bea",
        "roleArn": "arn:aws:iam::55555555555:role/roleName",
        "runLeftNormalization": false,
        "status": "COMPLETED",
        "updateTime": "2023-04-11T17:58:22.676043+00:00",
        "annotationFields" : {"VEP": "CSQ"}
        }
    ]
  }
}
```

필요한 경우 다음 명령을 사용하여 가져오기 작업을 취소할 수 있습니다.

```
aws omics cancel-variant-import-job 
     --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```