

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# HealthOmics 주석 저장소에 대한 가져오기 작업 생성
<a name="annotation-store-import-jobs"></a>

**중요**  
AWS HealthOmics 변형 저장소 및 주석 저장소는 더 이상 신규 고객에게 공개되지 않습니다. 기존 고객은 정상적으로 서비스를 계속 이용할 수 있습니다. 자세한 내용은 [AWS HealthOmics 변형 저장소 및 주석 저장소 가용성 변경](variant-store-availability-change.md) 단원을 참조하십시오.

**Topics**
+ [API를 사용하여 주석 가져오기 작업 생성](#create-annotation-import-api)
+ [TSV 및 VCF 형식에 대한 추가 파라미터](#annotation-import-tsv-vcf)
+ [TSV 형식의 주석 저장소 생성](#annotation-import-tsv-vcftsv-annotation-store-examples-tsv)
+ [VCF 형식의 가져오기 작업 시작](#vcf-annotation-store-examples)

## API를 사용하여 주석 가져오기 작업 생성
<a name="create-annotation-import-api"></a>

다음 예제에서는를 사용하여 주석 가져오기 작업을 AWS CLI 시작하는 방법을 보여줍니다.

```
aws omics start-annotation-import-job \
           --destination-name myannostore \
           --version-name myannostore \
           --role-arn arn:aws:iam::123456789012:role/roleName \
           --items source=s3://my-omics-bucket/sample.vcf.gz
           --annotation-fields '{"VEP": "CSQ"}'
```

2023년 5월 15일 이전에 생성된 주석 저장소는 **주석 필드가 포함된 경우 오류 메시지를 반환합니다**. 주석 저장소 가져오기 작업과 관련된 API 작업에 대한 출력은 반환되지 않습니다.

그런 다음 **get-annotation-import-job** API 작업과 `job ID` 파라미터를 사용하여 주석 가져오기 작업에 대한 자세한 내용을 알아볼 수 있습니다.

```
aws omics get-annotation-import-job --job-id 9e4198fb-fa85-446c-9301-9b823a1a8ba8         
```

주석 필드를 포함하여 다음과 같은 응답을 받게 됩니다.

```
{
          "creationTime": "2023-04-11T19:09:25.049767+00:00",
          "destinationName": "parsingannotationstore",
          "versionName": "parsingannotationstore",
          "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
          "items": [
              {
                  "jobStatus": "COMPLETED",
                  "source": "s3://my-omics-bucket/sample.vep.vcf"
              }
          ],
          "roleArn": "arn:aws:iam::55555555555:role/roleName",
          "runLeftNormalization": false,
          "status": "COMPLETED",
          "updateTime": "2023-04-11T19:13:09.110130+00:00",
          "annotationFields" : {"VEP": "CSQ"}
       }
```

모든 주석 저장소 가져오기 작업을 보려면 **list-annotation-import-jobs를 **사용합니다.

```
aws omics list-annotation-import-jobs --ids 9e4198fb-fa85-446c-9301-9b823a1a8ba8          
```

응답에는 주석 저장소 가져오기 작업의 세부 정보와 상태가 포함됩니다.

```
{
          "annotationImportJobs": [
          {
              "creationTime": "2023-04-11T19:09:25.049767+00:00",
              "destinationName": "parsingannotationstore",
              "versionName": "parsingannotationstore",
              "id": "9e4198fb-fa85-446c-9301-9b823a1a8ba8",
              "roleArn": "arn:aws:iam::55555555555:role/roleName",
              "runLeftNormalization": false,
              "status": "COMPLETED",
              "updateTime": "2023-04-11T19:13:09.110130+00:00",
              "annotationFields" : {"VEP": "CSQ"}
          }
          ]
      }
```

## TSV 및 VCF 형식에 대한 추가 파라미터
<a name="annotation-import-tsv-vcf"></a>

TSV 및 VCF 형식의 경우 입력 구문 분석 방법을 API에 알려주는 추가 파라미터가 있습니다.

**중요**  
 쿼리 엔진으로 내보낸 CSV 주석 데이터는 데이터 세트 가져오기의 정보를 직접 반환합니다. 가져온 데이터에 수식 또는 명령이 포함된 경우 파일에 CSV 삽입이 적용될 수 있습니다. 따라서 쿼리 엔진으로 내보낸 파일은 보안 경고를 표시할 수 있습니다. 악의적인 활동을 방지하려면 내보내기 파일을 읽을 때 링크와 매크로를 끄세요.

또한 TSV 구문 분석기는 다음 표에 나열된 유전체 좌표의 왼쪽 정규화 및 표준화와 같은 기본 생물 정보학 작업을 수행합니다.


| 형식 유형 | 설명 | 
| --- | --- | 
| Generic | 일반 텍스트 파일. 게놈 정보가 없습니다. | 
| CHR\$1POS | 시작 위치 - 1,와 동일한 종료 위치 추가POS. | 
| CHR\$1POS\$1REF\$1ALT | contig, 1-base 위치, ref 및 alt 대립형질 정보를 포함합니다. | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ONE\$1BASE | contig, start, end, ref 및 alt 대립형질 정보를 포함합니다. 좌표는 1 기반입니다. | 
| CHR\$1START\$1END\$1ZERO\$1BASE | contig, start 및 end 위치를 포함합니다. 좌표는 0 기반입니다. | 
| CHR\$1START\$1END\$1ONE\$1BASE | contig, start 및 end 위치를 포함합니다. 좌표는 1 기반입니다. | 
| CHR\$1START\$1END\$1REF\$1ALT\$1ZERO\$1BASE | contig, start, end, ref 및 alt 대립형질 정보를 포함합니다. 좌표는 0 기반입니다. | 

TSV 가져오기 주석 저장소 요청은 다음 예제와 같습니다.

```
aws omics start-annotation-import-job \
--destination-name tsv_anno_example \
--role-arn arn:aws:iam::555555555555:role/demoRole \
--items source=s3://demodata/genomic_data.bed.gz \
--format-options '{ "tsvOptions": {
        "readOptions": {
            "header": false,
            "sep": "\t"
        }
    }
}'
```

## TSV 형식의 주석 저장소 생성
<a name="annotation-import-tsv-vcftsv-annotation-store-examples-tsv"></a>

다음 예제에서는 헤더, 행 및 설명이 포함된 탭 제한 파일을 사용하여 주석 저장소를 생성합니다. 좌표는 이며`CHR_START_END_ONE_BASED`, OMIM의 인적 Gene Map 개요에 있는 HG19 Gene Map이 포함되어 있습니다. [https://www.omim.org/downloads](https://www.omim.org/downloads) 

```
aws omics create-annotation-store --name mimgenemap \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='{
    annotationType=CHR_START_END_ONE_BASE,  
    formatToHeader={CHR=chromosome, START=genomic_position_start, END=genomic_position_end},
    schema=[
      {chromosome=STRING}, 
      {genomic_position_start=LONG}, 
      {genomic_position_end=LONG}, 
      {cyto_location=STRING}, 
      {computed_cyto_location=STRING}, 
      {mim_number=STRING}, 
      {gene_symbols=STRING}, 
      {gene_name=STRING}, 
      {approved_gene_name=STRING}, 
      {entrez_gene_id=STRING}, 
      {ensembl_gene_id=STRING}, 
      {comments=STRING}, 
      {phenotypes=STRING}, 
      {mouse_gene_symbol=STRING}]}'
```

헤더를 사용하거나 사용하지 않고 파일을 가져올 수 있습니다. CLI 요청에서 이를 나타내려면 다음 가져오기 작업 예제와 `header=false`같이를 사용합니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/annotation-examples/hg38_genemap2.txt \
   --destination-name output-bucket \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

다음 예시에서는 침대 파일에 대한 주석 저장소를 생성합니다. 침대 파일은 탭으로 구분된 간단한 파일입니다. 이 예제에서 열은 염색체, 시작, 끝 및 리전 이름입니다. 좌표는 0을 기반으로 하며 데이터에 헤더가 없습니다.

```
aws omics create-annotation-store \
   --name cexbed --store-format TSV \
   --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
   --store-options=tsvStoreOptions='{
   annotationType=CHR_START_END_ZERO_BASE,  
   formatToHeader={CHR=chromosome, START=start, END=end}, 
   schema=[{chromosome=STRING}, {start=LONG}, {end=LONG}, {name=STRING}]}'
```

그런 다음 CLI 명령을 사용하여 Bed 파일을 주석 저장소로 가져올 수 있습니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/TruSeq_Exome_TargetedRegions_v1.2.bed \ 
   --destination-name cexbed \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

다음 예제에서는 VCF 파일의 처음 몇 개의 열과 주석 정보가 있는 열이 포함된 탭으로 구분된 파일에 대한 주석 저장소를 생성합니다. 여기에는 염색체, 시작, 참조 및 대체 대립형질에 대한 정보가 포함된 유전체 위치가 포함되며 헤더가 포함됩니다.

```
aws omics create-annotation-store --name gnomadchrx --store-format TSV \
--reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
--store-options=tsvStoreOptions='{
    annotationType=CHR_POS_REF_ALT, 
    formatToHeader={CHR=chromosome, POS=start, REF=ref, ALT=alt}, 
    schema=[
        {chromosome=STRING}, 
        {start=LONG}, 
        {ref=STRING}, 
        {alt=STRING}, 
        {filters=STRING}, 
        {ac_hom=STRING}, 
        {ac_het=STRING},
        {af_hom=STRING}, 
        {af_het=STRING}, 
        {an=STRING}, 
        {max_observed_heteroplasmy=STRING}]}'
```

그런 다음 CLI 명령을 사용하여 파일을 주석 저장소로 가져옵니다.

```
aws omics start-annotation-import-job \
  --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://amzn-s3-demo-bucket/gnomad.genomes.v3.1.sites.chrM.reduced_annotations.tsv \
   --destination-name gnomadchrx \
   --format-options=tsvOptions='{readOptions={sep="\t",header=true,comment="#"}}'
```

다음 예제에서는 고객이 mim2gene 파일에 대한 주석 저장소를 생성하는 방법을 보여줍니다. mim2gene 파일은 OMIM의 유전자와 다른 유전자 식별자 간의 링크를 제공합니다. 탭이 구분되어 있으며 주석이 포함되어 있습니다.

```
aws omics create-annotation-store \
  --name mim2gene \
  --store-format TSV \
  --reference=referenceArn=arn:aws:omics:us-west-2:555555555555:referenceStore/6505293348/reference/2310864158 \
  --store-options=tsvStoreOptions='
    {annotationType=GENERIC,      
    formatToHeader={}, 
    schema=[
        {mim_gene_id=STRING}, 
        {mim_type=STRING}, 
        {entrez_id=STRING}, 
        {hgnc=STRING}, 
        {ensembl=STRING}]}'
```

그런 다음 다음과 같이 스토어로 데이터를 가져올 수 있습니다.

```
aws omics start-annotation-import-job \
   --role-arn arn:aws:iam::555555555555:role/demoRole \
   --items=source=s3://xquek-dev-aws/annotation-examples/mim2gene.txt \
   --destination-name mim2gene \
   --format-options=tsvOptions='{readOptions={sep="\t",header=false,comment="#"}}'
```

## VCF 형식의 가져오기 작업 시작
<a name="vcf-annotation-store-examples"></a>

VCF 파일의 경우 표시된 대로 해당 파라미터를 무시하거나 포함하는 `ignoreQualField` 및 `ignoreFilterField`라는 두 개의 추가 입력이 있습니다.

```
aws omics start-annotation-import-job --destination-name annotation_example\
  --role-arn arn:aws:iam::555555555555:role/demoRole \
  --items source=s3://demodata/example.garvan.vcf \
  --format-options '{ "vcfOptions": {
    "ignoreQualField": false,
    "ignoreFilterField": false         
    }
   }'
```

그림과 같이 주석 저장소 가져오기를 취소할 수도 있습니다. 취소에 성공하면이 AWS CLI 호출에 대한 응답을 받지 못합니다. 그러나 가져오기 작업 ID를 찾을 수 없거나 가져오기 작업이 완료되면 오류 메시지가 표시됩니다.

```
aws omics cancel-annotation-import-job --job-id edd7b8ce-xmpl-47e2-bc99-258cac95a508
```

**참고**  
**get-annotation-import-job**, **get-variant-import-job**, **list-annotation-import-jobs** 및 **list-variant-import-jobs**에 대한 메타데이터 가져오기 작업 기록은 2년 후에 자동으로 삭제됩니다. 가져온 변형 및 주석 데이터는 자동으로 삭제되지 않으며 데이터 스토어에 남아 있습니다.