

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Algoritmos integrados e modelos pré-treinados na Amazon SageMaker
<a name="algos"></a>

 SageMaker A Amazon fornece um conjunto de algoritmos integrados, modelos pré-treinados e modelos de soluções pré-criados para ajudar cientistas de dados e profissionais de aprendizado de máquina a começar a treinar e implantar modelos de aprendizado de máquina rapidamente. Para alguém que é novato SageMaker, escolher o algoritmo certo para seu caso de uso específico pode ser uma tarefa desafiadora. A tabela a seguir fornece uma rápida folha de dicas que mostra como você pode começar com um exemplo de problema ou caso de uso e encontrar um algoritmo incorporado apropriado oferecido por SageMaker ele que seja válido para esse tipo de problema. Orientações adicionais organizadas por paradigmas de aprendizado (supervisionados e não supervisionados) e domínios de dados importantes (texto e imagens) são fornecidas nas seções a seguir à tabela.

Tabela: Mapeando casos de uso para algoritmos integrados



- **[Modelos pré-treinados e modelos de soluções pré-criados](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html)**
  - ****Tipos de problema**:** Classificação de imagens<br />Classificação tabular<br />Regressão tabular<br />Classificação de texto<br />Detecção de objetos<br />Incorporação de texto<br />Perguntas e respostas<br />Classificação de pares de frases<br />Incorporação de imagens<br />Reconhecimento de entidades nomeadas<br />Segmentação de instância<br />Geração de texto<br />Resumo de texto<br />Segmentação semântica<br />Tradução de máquina
  - ****Exemplos de problemas e casos de uso**:** Aqui estão alguns exemplos dos 15 tipos de problemas que podem ser resolvidos pelos modelos pré-treinados e modelos de soluções pré-criados fornecidos pela Amazon: SageMaker JumpStart<br />Resposta a perguntas: chatbot que gera uma resposta para uma determinada pergunta.<br />Análise de texto: analise textos de modelos específicos de um domínio do setor, como finanças.
  - ****Formato dos dados de entrada**:** Imagem, texto, tabular
  - ****Algoritmos integrados**:** Modelos populares, incluindo Mobilenet, YOLO, Faster R-CNN, BERT, LightGBM e CatBoost<br />Para obter uma lista dos modelos pré-treinados disponíveis, consulte [JumpStart Modelos](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html#jumpstart-models).<br />Para obter uma lista dos modelos de solução predefinidos disponíveis, consulte [JumpStart Soluções](https://docs.aws.amazon.com/sagemaker/latest/dg/studio-jumpstart.html#jumpstart-solutions).

- ** [Aprendizado supervisionado](#algorithms-built-in-supervised-learning) **
  - ****Tipos de problema**:** Classificação binária/multiclasse / ****Exemplos de problemas e casos de uso**:** Preveja se um item pertence a uma categoria: um filtro de spam por e-mail / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [AutoGluon-Tabular](autogluon-tabular.md), [CatBoost](catboost.md), [Algoritmo de Máquinas de fatoração](fact-machines.md), [Algoritmo k-nearest neighbors (k-NN)](k-nearest-neighbors.md), [LightGBM](lightgbm.md), [Algoritmo de Aprendizagem linear](linear-learner.md), [TabTransformer](tabtransformer.md), [XGBoost algoritmo com Amazon SageMaker AI](xgboost.md)
  - ****Tipos de problema**:** Regressão / ****Exemplos de problemas e casos de uso**:** Preveja um numeric/continuous valor: estime o valor de uma casa / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [AutoGluon-Tabular](autogluon-tabular.md), [CatBoost](catboost.md), [Algoritmo de Máquinas de fatoração](fact-machines.md), [Algoritmo k-nearest neighbors (k-NN)](k-nearest-neighbors.md), [LightGBM](lightgbm.md), [Algoritmo de Aprendizagem linear](linear-learner.md), [TabTransformer](tabtransformer.md), [XGBoost algoritmo com Amazon SageMaker AI](xgboost.md)
  - ****Tipos de problema**:** Previsão de séries temporais / ****Exemplos de problemas e casos de uso**:** Com base nos dados históricos de um comportamento, preveja o comportamento futuro: preveja as vendas de um novo produto com base nos dados de vendas anteriores. / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [Use o algoritmo de SageMaker previsão AI DeepAR](deepar.md)
  - ****Tipos de problema**:** Incorporações: converta objetos de alta dimensão em espaço de baixa dimensão. / ****Exemplos de problemas e casos de uso**:** Melhore a incorporação de dados dos objetos de alta dimensão: identifique tickets de atendimento duplicados ou encontre o roteamento correto com base na similaridade do texto nos tickets / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [Algoritmo Object2Vec](object2vec.md)

- **[Aprendizado não supervisionado](#algorithms-built-in-unsupervised-learning)**
  - ****Tipos de problema**:** Engenharia de atributos: redução de dimensionalidade / ****Exemplos de problemas e casos de uso**:** Elimine essas colunas de um conjunto de dados que têm uma relação fraca com a label/target variável: a cor de um carro ao prever sua quilometragem. / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [Algoritmo de Análise de componente principal (PCA)](pca.md)
  - ****Tipos de problema**:** Detecção de anomalias / ****Exemplos de problemas e casos de uso**:** Detecte comportamento anormal na aplicação: detecte quando um sensor de IoT está enviando leituras anormais / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [Algoritmo RCF (Random Cut Forest)](randomcutforest.md)
  - ****Tipos de problema**:** Detecção de anomalias de IP / ****Exemplos de problemas e casos de uso**:** Proteja sua aplicação contra usuários suspeitos: detecte se um endereço IP que acessa um serviço pode ser de um agente mal-intencionado / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [IP Insights](ip-insights.md)
  - ****Tipos de problema**:** Cluster ou agrupamento / ****Exemplos de problemas e casos de uso**:** Agrupe similares: encontre clientes objects/data com gastos altos, médios e baixos a partir de seus históricos de transações / ****Formato dos dados de entrada**:** Tabular / ****Algoritmos integrados**:** [Algoritmo k-means](k-means.md)
  - ****Tipos de problema**:** Modelagem de tópicos / ****Exemplos de problemas e casos de uso**:** Organize um conjunto de documentos em tópicos (não conhecidos de antemão): marque um documento como pertencente a uma categoria médica com base nos termos usados no documento. / ****Formato dos dados de entrada**:** Texto / ****Algoritmos integrados**:** [Algoritmo Latent Dirichlet Allocation (LDA)](lda.md), [Algoritmo de Modelo de tópicos neurais (NTM)](ntm.md)

- ** [Análise de texto](#algorithms-built-in-text-analysis) **
  - ****Tipos de problema**:** Classificação de texto  / ****Exemplos de problemas e casos de uso**:** Atribua categorias predefinidas a documentos em um corpus: categorize livros em uma biblioteca em disciplinas acadêmicas / ****Formato dos dados de entrada**:** Texto / ****Algoritmos integrados**:** [BlazingText algoritmo](blazingtext.md), [Classificação de texto - TensorFlow](text-classification-tensorflow.md)
  - ****Tipos de problema**:** Tradução de máquinaalgoritmo / ****Exemplos de problemas e casos de uso**:** Converter texto de um idioma para outro: espanhol para inglês / ****Formato dos dados de entrada**:** Texto / ****Algoritmos integrados**:** [Sequence-to-Sequence Algoritimo](seq-2-seq.md)
  - ****Tipos de problema**:** Resumo de texto / ****Exemplos de problemas e casos de uso**:** Resuma um corpus de texto longo: um resumo para um paper de pesquisa / ****Formato dos dados de entrada**:** Texto / ****Algoritmos integrados**:** [Sequence-to-Sequence Algoritimo](seq-2-seq.md)
  - ****Tipos de problema**:** S peech-to-text / ****Exemplos de problemas e casos de uso**:** Converta arquivos de áudio em texto: transcreva conversas da central de atendimento para análise posterior / ****Formato dos dados de entrada**:** Texto / ****Algoritmos integrados**:** [Sequence-to-Sequence Algoritimo](seq-2-seq.md)

- **[Processamento de imagens](#algorithms-built-in-image-processing)**
  - ****Tipos de problema**:** Classificação de imagem e vários rótulos / ****Exemplos de problemas e casos de uso**:** Rotular/marcar uma imagem com base no conteúdo da imagem: alertas sobre conteúdo adulto em uma imagem / ****Formato dos dados de entrada**:** Imagem / ****Algoritmos integrados**:** [Classificação de imagens - MXNet](image-classification.md)
  - ****Tipos de problema**:** Classificação de imagens / ****Exemplos de problemas e casos de uso**:** Classifique algo em uma imagem usando o aprendizado por transferência. / ****Formato dos dados de entrada**:** Imagem / ****Algoritmos integrados**:** [Classificação de imagens - TensorFlow](image-classification-tensorflow.md)
  - ****Tipos de problema**:** Detecção e classificação de objetos / ****Exemplos de problemas e casos de uso**:** Detecte pessoas e objetos em uma imagem: a polícia analisa uma grande galeria de fotos de uma pessoa desaparecida / ****Formato dos dados de entrada**:** Imagem / ****Algoritmos integrados**:** [Detecção de objetos - MXNet](object-detection.md), [Detecção de objetos - TensorFlow](object-detection-tensorflow.md)
  - ****Tipos de problema**:** Visão computacional / ****Exemplos de problemas e casos de uso**:** Marque cada pixel de uma imagem individualmente com uma categoria: carros autônomos se preparam para identificar objetos em seu caminho / ****Formato dos dados de entrada**:** Imagem / ****Algoritmos integrados**:** [Algoritmo de segmentação semântica](semantic-segmentation.md)



Para obter informações importantes sobre os seguintes itens comuns a todos os algoritmos integrados fornecidos pela SageMaker IA, consulte[Parâmetros para algoritmos integrados](common-info-all-im-models.md).
+ Caminhos de registro Docker
+ formatos de dados
+ tipos de instância recomendados do Amazon EC2
+ CloudWatch troncos

As seções a seguir fornecem orientações adicionais para os algoritmos integrados de SageMaker IA da Amazon, agrupados pelos paradigmas de aprendizado supervisionado e não supervisionado aos quais eles pertencem. Para obter descrições desses paradigmas de aprendizado e dos tipos de problemas associados, consulte [Tipos de Algoritmos](algorithms-choose.md). Também são fornecidas seções para os algoritmos integrados de SageMaker IA disponíveis para abordar dois domínios importantes de aprendizado de máquina: análise textual e processamento de imagens.
+ [Modelos pré-treinados e modelos de soluções](#algorithms-built-in-jumpstart)
+ [Aprendizado supervisionado](#algorithms-built-in-supervised-learning)
+ [Aprendizado não supervisionado](#algorithms-built-in-unsupervised-learning)
+ [Análise de texto](#algorithms-built-in-text-analysis)
+ [Processamento de imagens](#algorithms-built-in-image-processing)

## Modelos pré-treinados e modelos de soluções
<a name="algorithms-built-in-jumpstart"></a>

 SageMaker JumpStart A Amazon fornece uma ampla variedade de modelos pré-treinados, modelos de soluções pré-criados e exemplos para tipos de problemas populares. Eles usam o SageMaker SDK e o Studio Classic. Para obter mais informações sobre esses modelos, soluções e os exemplos de notebooks fornecidos pela Amazon SageMaker JumpStart, consulte[SageMaker JumpStart modelos pré-treinados](studio-jumpstart.md).

## Aprendizado supervisionado
<a name="algorithms-built-in-supervised-learning"></a>

A Amazon SageMaker AI fornece vários algoritmos integrados de uso geral que podem ser usados para problemas de classificação ou regressão.
+ [AutoGluon-Tabular](autogluon-tabular.md): uma estrutura de AutoML de código aberto que é bem-sucedida ao agrupar modelos e empilhá-los em várias camadas. 
+ [CatBoost](catboost.md): uma implementação do algoritmo de árvores com aumento de gradiente que introduz o aumento ordenado e um algoritmo inovador para processar atributos categóricos.
+ [Algoritmo de Máquinas de fatoração](fact-machines.md): é uma extensão de um modelo linear projetado para capturar, com baixo custo, as interações entre os atributos presentes em conjuntos de dados esparsos altamente dimensionais.
+ [Algoritmo k-nearest neighbors (k-NN)](k-nearest-neighbors.md): um método não paramétrico que usa os pontos k rotulados mais próximos para atribuição de um valor. Para classificação, é um rótulo para um novo ponto de dados. Para regressão, é um valor de destino previsto a partir da média dos pontos k mais próximos.
+ [LightGBM](lightgbm.md): uma implementação do algoritmo de árvores com aumento de gradiente que adiciona duas novas técnicas para melhorar a eficiência e a escalabilidade. Essas duas novas técnicas são a amostragem unilateral baseada em gradiente (GOSS) e empacotamento de atributos exclusivos (EFB).
+ [Algoritmo de Aprendizagem linear](linear-learner.md): aprende uma função linear para regressão ou uma função de limite linear para classificação.
+ [TabTransformer](tabtransformer.md)—uma nova arquitetura de modelagem de dados tabular profunda baseada em self-attention-based Transformers. 
+ [XGBoost algoritmo com Amazon SageMaker AI](xgboost.md): uma implementação do algoritmo de árvores com aumento de gradiente que combina um conjunto de estimativas a partir de um conjunto de modelos mais simples e menos robustos.

A Amazon SageMaker AI também fornece vários algoritmos de aprendizado supervisionado integrados usados para tarefas mais especializadas durante a engenharia de recursos e a previsão a partir de dados de séries temporais.
+ [Algoritmo Object2Vec](object2vec.md): um novo algoritmo multiuso altamente personalizável usado para engenharia de atributos. Ele pode aprender incorporações densas de baixa dimensão de objetos de alta dimensão para produzir atributos que melhoram a eficiência do treinamento para modelos posteriores. Embora esse seja um algoritmo supervisionado, há muitos cenários nos quais os rótulos de relacionamento podem ser obtidos puramente a partir de agrupamentos naturais de dados. Embora exija dados rotulados para treinamento, isso pode ocorrer sem qualquer anotação humana explícita.
+ [Use o algoritmo de SageMaker previsão AI DeepAR](deepar.md): o algoritmo de aprendizado supervisionado é um algoritmo de aprendizado supervisionado para previsão de séries temporais escalares (unidimensionais) usando redes neurais recorrentes (RNN).

## Aprendizado não supervisionado
<a name="algorithms-built-in-unsupervised-learning"></a>

A Amazon SageMaker AI fornece vários algoritmos integrados que podem ser usados para uma variedade de tarefas de aprendizado não supervisionadas. Essas tarefas incluem clustering, redução de dimensão, reconhecimento de padrões e detecção de anomalias.
+ [Algoritmo de Análise de componente principal (PCA)](pca.md): reduz a dimensionalidade (número de atributos) em um conjunto de dados projetando pontos de dados nos primeiros componentes principais. O objetivo é reter o máximo possível de informações ou variações. Para matemáticos, os componentes principais são autovetores da matriz de covariância dos dados.
+ [Algoritmo k-means](k-means.md): localiza agrupamentos discretos nos dados. Ocorre quando os membros de um grupo forem o mais similares possível entre eles e o mais diferentes possível dos membros de outros grupos.
+ [IP Insights](ip-insights.md)—aprende os padrões de uso dos endereços. IPv4 Ele foi projetado para capturar associações entre IPv4 endereços e várias entidades, como números de usuários IDs ou contas.
+ [Algoritmo RCF (Random Cut Forest)](randomcutforest.md): detecta pontos de dados anômalos em um conjunto de dados que divergem de dados bem estruturados ou padronizados.

## Análise de texto
<a name="algorithms-built-in-text-analysis"></a>

SageMaker A IA fornece algoritmos personalizados para a análise de documentos textuais. Inclui o texto usado no processamento de linguagem natural, classificação ou resumo de documentos, modelagem ou classificação de tópicos e transcrição ou tradução de idiomas.
+ [BlazingText algoritmo](blazingtext.md): uma implantação altamente otimizada do Word2vec e dos algoritmos de classificação de texto que podem ser facilmente escalados para grandes conjuntos de dados. É útil para muitas tarefas posteriores de processamento de linguagem natural (PLN).
+ [Sequence-to-Sequence Algoritimo](seq-2-seq.md): esse algoritmo supervisionado é comumente usado para tradução de máquina neural. 
+ [Algoritmo Latent Dirichlet Allocation (LDA)](lda.md): esse algoritmo é adequado para determinar tópicos em um conjunto de documentos. É um algoritmo *não supervisionado*, o que significa que ele não usa dados de exemplo com respostas durante o treinamento.
+ [Algoritmo de Modelo de tópicos neurais (NTM)](ntm.md): outra técnica não supervisionada para determinar tópicos em um conjunto de documentos, usando uma abordagem de rede neural.
+ [Classificação de texto - TensorFlow](text-classification-tensorflow.md): um algoritmo supervisionado que oferece apoio ao aprendizado por transferência com modelos pré-treinados disponíveis para classificação de texto.

## Processamento de imagens
<a name="algorithms-built-in-image-processing"></a>

SageMaker A IA também fornece algoritmos de processamento de imagem que são usados para classificação de imagens, detecção de objetos e visão computacional.
+ [Classificação de imagens - MXNet](image-classification.md): usa dados de exemplo com respostas (conhecido como *algoritmo supervisionado*). Use esse algoritmo para classificar imagens.
+ [Classificação de imagens - TensorFlow](image-classification-tensorflow.md)*—usa modelos de TensorFlow Hub pré-treinados para ajustar tarefas específicas (conhecido como algoritmo supervisionado).* Use esse algoritmo para classificar imagens.
+ [Algoritmo de segmentação semântica](semantic-segmentation.md): fornece uma abordagem granular em nível de pixel ao desenvolvimento de aplicações de visão computacional.
+ [Detecção de objetos - MXNet](object-detection.md): detecta e classifica objetos em imagens usando uma única rede neural profunda. Ele é um algoritmo de aprendizado supervisionado que captura imagens como entrada e identifica todas as instâncias de objetos na cena da imagem.
+ [Detecção de objetos - TensorFlow](object-detection-tensorflow.md): detecta caixas delimitadoras e rótulos de objetos em uma imagem. É um algoritmo de aprendizado supervisionado que oferece suporte ao aprendizado por transferência com modelos pré-treinados TensorFlow disponíveis.

**Topics**
+ [Modelos pré-treinados e modelos de soluções](#algorithms-built-in-jumpstart)
+ [Aprendizado supervisionado](#algorithms-built-in-supervised-learning)
+ [Aprendizado não supervisionado](#algorithms-built-in-unsupervised-learning)
+ [Análise de texto](#algorithms-built-in-text-analysis)
+ [Processamento de imagens](#algorithms-built-in-image-processing)
+ [Parâmetros para algoritmos integrados](common-info-all-im-models.md)
+ [Algoritmos integrados do SageMaker AI para dados tabulares](algorithms-tabular.md)
+ [Algoritmos de SageMaker IA integrados para dados de texto](algorithms-text.md)
+ [Algoritmos integrados do SageMaker AI para dados de séries temporais](algorithms-time-series.md)
+ [Algoritmos integrados não supervisionados do SageMaker AI](algorithms-unsupervised.md)
+ [Algoritmos integrados do SageMaker AI para visão computacional](algorithms-vision.md)