

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Implantar seus modelos em um endpoint
<a name="canvas-deploy-model"></a>

No Amazon SageMaker Canvas, você pode implantar seus modelos em um endpoint para fazer previsões. SageMaker A IA fornece a infraestrutura de ML para você hospedar seu modelo em um endpoint com as instâncias de computação que você escolher. Em seguida, você pode *invocar* o endpoint (enviar uma solicitação de predição) e obter uma predição em tempo real do seu modelo. Com essa funcionalidade, você pode usar seu modelo na produção para responder às solicitações de entrada e integrar seu modelo aos fluxos de trabalho e aplicações existentes.

Para começar, você deve ter uma versão do modelo pronta para implantação. Você pode implantar versões personalizadas de modelos que você criou, modelos de SageMaker JumpStart fundação da Amazon e modelos de fundação ajustados. JumpStart Para obter mais informações sobre a criação de um modelo no Canvas, consulte [Como os modelos personalizados funcionam](canvas-build-model.md). Para obter mais informações sobre modelos de JumpStart base no Canvas, consulte[Modelos básicos de IA generativa no Canvas SageMaker](canvas-fm-chat.md).

Revise a seção **Gerenciamento de permissões** a seguir e comece a criar novas implantações na seção **Implantação de modelo**.

## Gerenciamento de permissões
<a name="canvas-deploy-model-prereqs"></a>

Por padrão, você tem permissões para implantar modelos nos endpoints do SageMaker AI Hosting. SageMaker A IA concede essas permissões para todos os perfis de usuário do Canvas novos e existentes por meio da [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html)política, que é anexada à função de execução AWS do IAM para o domínio de SageMaker IA que hospeda seu aplicativo Canvas.

Se o administrador do Canvas estiver configurando um novo domínio ou perfil de usuário, ao configurar o domínio e seguir as instruções de pré-requisito no[Pré-requisitos para configurar o Amazon Canvas SageMaker](canvas-getting-started.md#canvas-prerequisites), o SageMaker AI ativa as permissões de implantação do modelo por meio da opção **Habilitar implantação direta de modelos do Canvas**, que é ativada por padrão.

O administrador do Canvas também pode gerenciar as permissões implantações de modelos no nível do perfil do usuário. Por exemplo, se o administrador não quiser conceder permissões de implantações de modelos a todos os perfis de usuário ao configurar um domínio, ele poderá conceder permissões a usuários específicos após criar o domínio.

O seguinte procedimento mostra como desativar permissões de implantações de modelos para um perfil de usuário específico:

1. Abra o console de SageMaker IA em [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. No painel de navegação à esquerda, escolha **Configurações do administrador**.

1. Em **Configurações do administrador**, escolha **Domínios**.

1. Na lista de Domínios, selecione o Domínio do perfil do usuário.

1. Na página **Detalhes do Domínio**, escolha a aba **Perfis de usuário**.

1. Escolha seu **Perfil de usuário**.

1. Na página do perfil do usuário, selecione a aba **Configurações da aplicação**.

1. Na seção **Logs**, selecione **Editar**.

1. Na seção de **configuração do Operações**, ative a opção **Habilitar implantação direta de modelos do Canvas** para habilitar as permissões de implantação.

1. Escolha **Enviar** para salvar as alterações nas configurações do seu Domínio.

O perfil do usuário não deve mais ter permissões para implantações de modelos.

Depois de conceder permissões ao domínio ou perfil do usuário, certifique-se de que o usuário saia da aplicação Canvas e faça login novamente para aplicar as alterações de permissão.

## Implantar um modelo
<a name="canvas-deploy-model-deploy"></a>

Para começar a implantar seu modelo, você cria uma nova implantação no Canvas e especifica a versão do modelo que deseja implantar junto com a infraestrutura de ML, como o tipo e o número de instâncias de computação que você gostaria de usar para hospedar o modelo.

O Canvas sugere um tipo padrão e um número de instâncias com base no seu tipo de modelo, ou você pode aprender mais sobre os vários tipos de instância de SageMaker IA na [página de SageMaker preços da Amazon](https://aws.amazon.com/sagemaker/pricing/). Você é cobrado com base no preço da instância de SageMaker IA enquanto seu endpoint está ativo.

Ao implantar modelos JumpStart básicos, você também tem a opção de especificar a duração do tempo de implantação. Você pode implantar o modelo em um endpoint indefinidamente (o que significa que o endpoint está ativo até você excluir a implantação). Ou, se você precisar do endpoint apenas por um curto período de tempo e quiser reduzir custos, você pode implantar o modelo em um endpoint por um determinado período de tempo, após o qual a SageMaker IA desliga o endpoint para você.

**nota**  
Se você implantar um modelo por um período de tempo especificado, permaneça conectado à aplicação Canvas durante o endpoint. Se você sair ou excluir a aplicação, o Canvas não poderá encerrar o endpoint no horário especificado.

*Depois que seu modelo for implantado em um [endpoint de inferência em tempo real do SageMaker AI Hosting, você pode começar a fazer previsões invocando o endpoint](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html).*

Há várias maneiras diferentes de implantar uma versão de modelo a partir da aplicação Canvas. É possível acessar a opção de implantação do modelo usando qualquer um dos seguintes métodos:
+ Na página **Meus modelos** da aplicação Canvas, você pode escolher o modelo que deseja implantar. Em seguida, na página **Versões** do modelo, você pode escolher o ícone **Mais opções** (![Vertical ellipsis icon representing a menu or more options.](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) ao lado da versão do modelo e selecionar **Implantar**.
+ Na página de detalhes de uma versão do modelo, na guia **Analisar**, você pode escolher a opção **Implantar**.
+ Na página de detalhes de uma versão do modelo, na guia **Prever**, você pode escolher o ícone **Mais opções** (![](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) na parte superior da página e selecionar **Implantar**.
+ Na página **Operações** da aplicação Canvas, escolha a guia **Implantações** e, em seguida, escolha **Criar implantação**.
+ Para modelos de JumpStart fundação e modelos de fundação ajustados, acesse a página de **Ready-to-use modelos** do aplicativo Canvas. Escolha **Gerar, extrair e resumir conteúdo**. Em seguida, encontre o modelo de JumpStart base ou o modelo de fundação ajustado que você deseja implantar. Escolha o modelo e, na página de bate-papo do modelo, escolha o botão **Implantar**.

Todos esses métodos abrem o painel lateral **Implantar modelo**, onde você especifica a configuração de implantação do seu modelo. Para implantar o modelo a partir desse painel, faça o seguinte:

1. (Opcional) Se você estiver criando uma implantação na página **Operações**, você terá a opção de **Selecionar modelo e versão**. Use os menus suspensos para selecionar o modelo e a versão do modelo que você deseja implantar.

1. Insira um nome no campo **Nome da implantação**.

1. **(Somente para modelos de JumpStart base e modelos de base ajustados) Escolha um comprimento de implantação.** Selecione **Indefinido** para deixar o endpoint ativo até que você o desligue, ou selecione **Especificar comprimento** e, em seguida, insira o período durante o qual você deseja que o endpoint permaneça ativo.

1. Em **Tipo de instância**, a SageMaker IA detecta um tipo e número de instância padrão adequados ao seu modelo. No entanto, você pode alterar o tipo de instância que gostaria de usar para hospedar seu modelo.
**nota**  
Se você ficar sem a cota de instância para o tipo de instância escolhido em sua AWS conta, poderá solicitar um aumento de cota. Para obter mais informações sobre as cotas padrão e como solicitar um aumento, consulte os [endpoints e cotas do Amazon SageMaker AI no guia](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html) de referência *AWS geral*.

1. Em **Contagem de instâncias**, você pode definir o número de instâncias ativas que são usadas para seu endpoint. SageMaker A IA detecta um número padrão adequado ao seu modelo, mas você pode alterar esse número.

1. Quando estiver pronto para implantação do seu modelo, selecione **Implantar**.

Seu modelo agora deve ser implantado em um endpoint.