

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Implemente un modelo compilado mediante el AWS CLI
<a name="neo-deployment-hosting-services-cli"></a>

Debe cumplir con la sección de [requisitos previos](https://docs.aws.amazon.com//sagemaker/latest/dg/neo-deployment-hosting-services-prerequisites) si el modelo se compiló con AWS SDK para Python (Boto3) AWS CLI, o la consola Amazon SageMaker AI. Siga los pasos que se indican a continuación para crear e implementar un SageMaker Neo-compiled modelo con. [AWS CLI](https://docs.aws.amazon.com/cli/latest/reference/) 

**Topics**
+ [Implementar el modelo](#neo-deploy-cli)

## Implementar el modelo
<a name="neo-deploy-cli"></a>

Una vez que haya cumplido los [requisitos previos](https://docs.aws.amazon.com//sagemaker/latest/dg/neo-deployment-hosting-services-prerequisites), utilice los `create-endpoint` AWS CLI comandos `create-model``create-enpoint-config`, y. Los siguientes pasos muestran cómo usar estos comandos para implementar un modelo compilado con Neo: 



### Creación de un modelo
<a name="neo-deployment-hosting-services-cli-create-model"></a>

En [Neo Inference Container Images](https://docs.aws.amazon.com/sagemaker/latest/dg/neo-deployment-hosting-services-container-images.html), seleccione el URI de la imagen de inferencia y, a continuación, utilice la `create-model` API para crear un SageMaker modelo de IA. Para hacerlo, siga estos pasos: 

1. Cree un archivo `create_model.json`. En el archivo, especifique el nombre del modelo, el URI de la imagen, la ruta al `model.tar.gz` archivo en su bucket de Amazon S3 y su función de ejecución de SageMaker IA: 

   ```
   {
       "ModelName": {{"insert model name"}},
       "PrimaryContainer": {
           "Image": {{"insert the ECR Image URI"}},
           "ModelDataUrl": {{"insert S3 archive URL"}},
           "Environment": {{{"See details below"}}}
       },
       "ExecutionRoleArn": {{"ARN for AmazonSageMaker-ExecutionRole"}}
   }
   ```

   Si entrenó su modelo con SageMaker IA, especifique la siguiente variable de entorno: 

   ```
   "Environment": {
       "SAGEMAKER_SUBMIT_DIRECTORY" : {{"[Full S3 path for *.tar.gz file containing the training script]"}}
   }
   ```

   Si no entrenó el modelo con SageMaker IA, especifique las siguientes variables de entorno: 

------
#### [ MXNet and PyTorch ]

   ```
   "Environment": {
       "SAGEMAKER_PROGRAM": "inference.py",
       "SAGEMAKER_SUBMIT_DIRECTORY": {{"/opt/ml/model/code"}},
       "SAGEMAKER_CONTAINER_LOG_LEVEL": "20",
       "SAGEMAKER_REGION": {{"insert your region"}},
       "MMS_DEFAULT_RESPONSE_TIMEOUT": "500"
   }
   ```

------
#### [ TensorFlow ]

   ```
   "Environment": {
       "SAGEMAKER_PROGRAM": "inference.py",
       "SAGEMAKER_SUBMIT_DIRECTORY": {{"/opt/ml/model/code"}},
       "SAGEMAKER_CONTAINER_LOG_LEVEL": "20",
       "SAGEMAKER_REGION": {{"insert your region"}}
   }
   ```

------
**nota**  
Las políticas `AmazonSageMakerFullAccess` y `AmazonS3ReadOnlyAccess` deben asociarse al rol de IAM `AmazonSageMaker-ExecutionRole`. 

1. Use el siguiente comando:

   ```
   aws sagemaker create-model --cli-input-json file://create_model.json
   ```

   Para informarse de la sintaxis completa de la API de `create-model`, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-model.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-model.html). 

### Crear una configuración de punto de conexión
<a name="neo-deployment-hosting-services-cli-create-endpoint-config"></a>

Tras crear un modelo de SageMaker IA, cree la configuración del punto final mediante la `create-endpoint-config` API. Para ello, cree un archivo JSON con las especificaciones de configuración de su punto de conexión. Por ejemplo, puede usar la siguiente plantilla de código y guardarla como `create_config.json`: 

```
{
    "EndpointConfigName": {{"<provide your endpoint config name>"}},
    "ProductionVariants": [
        {
            "VariantName": {{"<provide your variant name>"}},
            "ModelName": "my-sagemaker-model",
            "InitialInstanceCount": 1,
            "InstanceType": {{"<provide your instance type here>"}},
            "InitialVariantWeight": 1.0
        }
    ]
}
```

Ahora ejecute el siguiente AWS CLI comando para crear la configuración de su punto final: 

```
aws sagemaker create-endpoint-config --cli-input-json file://create_config.json
```

Para informarse de la sintaxis completa de la API de `create-endpoint-config`, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-endpoint-config.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-endpoint-config.html). 

### Creación de un punto de conexión
<a name="neo-deployment-hosting-services-cli-create-endpoint"></a>

Una vez que haya creado la configuración de su punto de conexión, cree un punto de conexión mediante la API `create-endpoint`: 

```
aws sagemaker create-endpoint --endpoint-name {{'<provide your endpoint name>'}} --endpoint-config-name {{'<insert your endpoint config name>'}}
```

Para informarse de la sintaxis completa de la API de `create-endpoint`, consulte [https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-endpoint.html](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-endpoint.html). 