

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 了解导入任务
<a name="understanding-import-jobs"></a>

在 AWS 中创建[数据存储](getting-started-concepts.md#concept-data-store)后 HealthImaging，您必须将医学影像数据从 Amazon S3 输入存储桶导入数据存储以创建[图像集](getting-started-concepts.md#concept-image-set)。您可以使用 AWS 管理控制台 AWS CLI、和 AWS SDK 来启动、描述和列出导入任务。

[当您将 DICOM P10 数据导入 AWS HealthImaging 数据存储时，该服务会尝试根据元数据元素根据研究 UID、系列 UID、实例 UID 的 DICOM 层次结构自动组织实例。](understanding-image-sets.md)如果导入数据的[元数据元素](understanding-image-sets.md)与数据存储中的现有主[影像集不冲突，则导入的数据将成为主映像](getting-started-concepts.md#concept-image-set)。[如果新导入的 DICOM P10 数据的元数据元素与现有的主[影像集](getting-started-concepts.md#concept-image-set)冲突，则新数据将被添加到非主影像集中。](getting-started-concepts.md#concept-image-set)当数据导入创建非主[映像集](getting-started-concepts.md#concept-image-set)时，AWS 会 HealthImaging 发出一个带有 EventBridge 的事件`isPrimary: False`，写入的记录也`success.ndjson`将包含`isPrimary: False`在对象中`importResponse`。

导入数据时， HealthImaging 会执行以下操作：
+ 如果在一个导入任务中导入了构成 DICOM 系列的实例，并且这些实例与数据存储中已有的实例不冲突，则所有实例都将组织成一个主[映像集](getting-started-concepts.md#concept-image-set)。
+ 如果构成 DICOM 系列的实例是在两个或多个导入任务中导入的，并且这些实例与数据存储中已有的实例不冲突，则所有实例都将组织为一个主[影像集](getting-started-concepts.md#concept-image-set)。
+ 如果多次导入实例，则最新版本将覆盖存储在主[映像集中的任何旧版本，并且主映](getting-started-concepts.md#concept-image-set)[像集](getting-started-concepts.md#concept-image-set)的版本号将递增。

您可以按照更新[映像集元数据中所述的步骤更新](update-image-set-metadata.md)主实例中的实例。

在导入过程中，私有标签（VR 类型 OB、OD、OF、OL、OV、OV、OW、UN）中大小超过 1MB 的二进制值与元数据分开存储。使用`GetDICOMInstanceMetadata`或检索这些实例的元数据时`GetDICOMSeriesMetadata`，这些较大的二进制值将被替换 BulkDataURIs，并且可以使用 `GetDICOMBulkdata` API 检索实际的二进制数据。

HealthImaging 尝试导入您的所有医学影像数据。如果在导入过程中遇到数据不一致或无法识别的数据元素，则会在`warning.ndjson`文件中为仍可能导入的 DICOM 实例 HealthImaging 添加警告。有关警告代码的完整列表，请参阅[HealthImaging 警告码](reference-warning-codes.md)。

将您的医学影像文件从 Amazon S3 导入 HealthImaging 数据存储时，请记住以下几点：
+ 与 DICOM 系列对应的实例将自动组合成一个影像集，表示为主影像。
+ 您可以在一个导入任务或多个导入任务中导入 DICOM P10 数据，该服务会将实例组织成与 DICOM 系列对应的主映像集
+ 在导入过程中，长度限制适用于特定的 DICOM 元素。为确保成功完成导入任务，请确认您的医学影像数据未超过长度限制。有关更多信息，请参阅 [DICOM 元素限制](dicom-element-constraints.md)。
+ 在导入任务开始时执行像素数据验证检查。有关更多信息，请参阅 [像素数据验证](pixel-data-verification.md)。
+ 有与 HealthImaging 导入操作相关的终端节点、配额和限制限制。有关更多信息，请参阅[端点和限额](endpoints-quotas.md)和[节流限制](throttling-limits.md)。
+ 对于每个导入任务，处理结果都存储在 `outputS3Uri` 位置。处理结果按 `job-output-manifest.json` 文件以及 `SUCCESS` 和 `FAILURE` 文件夹进行组织。
**注意**  
单个导入任务最多可以包含 10,000 个嵌套文件夹。
  + 该 `job-output-manifest.json` 文件包含有关已处理数据的 `jobSummary` 输出和其他详细信息。以下示例显示从 `job-output-manifest.json` 文件的输出。

    ```
    {
    "jobSummary": {
    "jobId": "09876543210987654321098765432109",
            "datastoreId": "12345678901234567890123456789012",
            "inputS3Uri": "s3://medical-imaging-dicom-input/dicom_input/",
            "outputS3Uri": "s3://medical-imaging-output/job_output/12345678901234567890123456789012-DicomImport-09876543210987654321098765432109/",
            "successOutputS3Uri": "s3://medical-imaging-output/job_output/12345678901234567890123456789012-DicomImport-09876543210987654321098765432109/SUCCESS/",
            "failureOutputS3Uri": "s3://medical-imaging-output/job_output/12345678901234567890123456789012-DicomImport-09876543210987654321098765432109/FAILURE/",
            "warningsOutputS3Uri": "s3://medical-imaging-output/job_output/12345678901234567890123456789012-DicomImport-09876543210987654321098765432109/WARNING/",
            "numberOfScannedFiles": 5,
            "numberOfImportedFiles": 3,
            "numberOfFilesWithCustomerError": 2,
            "numberOfFilesWithServerError": 0,
            "numberOfGeneratedImageSets": 2,
            "imageSetsSummary": [{
    "imageSetId": "12345612345612345678907890789012",
                    "numberOfMatchedSOPInstances": 2
                },
                {
    "imageSetId": "12345612345612345678917891789012",
                    "numberOfMatchedSOPInstances": 1
                }
            ]
        }
    }
    ```
  + 该 `SUCCESS` 文件夹包含所有成功导入的影像文件结果的 `success.ndjson` 文件。以下示例显示从 `success.ndjson` 文件的输出。

    ```
    {"inputFile":"dicomInputFolder/1.3.51.5145.5142.20010109.1105620.1.0.1.dcm","importResponse":{"imageSetId":"12345612345612345678907890789012", "isPrimary": True}} 
    {"inputFile":"dicomInputFolder/1.3.51.5145.5142.20010109.1105630.1.0.1.dcm","importResponse":{"imageSetId":"12345612345612345678917891789012", "isPrimary": True}}
    ```
  + 该 `FAILURE` 文件夹包含所有未成功导入的影像文件结果的 `failure.ndjson` 文件。以下示例显示从 `failure.ndjson` 文件的输出。

    ```
    {"inputFile":"dicom_input/invalidDicomFile1.dcm","exception":{"exceptionType":"ValidationException","message":"DICOM attribute TransferSyntaxUID does not exist"}}
    {"inputFile":"dicom_input/invalidDicomFile2.dcm","exception":{"exceptionType":"ValidationException","message":"DICOM attributes does not exist"}}
    ```
  + 该`WARNING`文件夹包含所有成功导入但带有警告的映像文件的结果的文件。`warning.ndjson`以下示例显示从 `warning.ndjson` 文件的输出。

    ```
    {"inputFile":"dicom_input/warningDicomFile1.dcm","importResponse":{"imageSetId":"12345612345612345678907890789012","imageSetVersion":1,"isPrimary":true,"warnings":[{"warning_reason_code":45330,"type":"InvalidOffsetTable","message":"The file was imported but contains an invalid offset table, may see issues when retrieving certain frames."}]}}
    ```
+ 导入任务将在任务列表中保留 90 天，然后存档。