

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# CatBoost hiperparâmetros
<a name="catboost-hyperparameters"></a>

A tabela a seguir contém o subconjunto de hiperparâmetros que são necessários ou mais comumente usados para o algoritmo Amazon SageMaker AI CatBoost . Os usuários definem esses parâmetros para facilitar a estimativa dos parâmetros do modelo a partir dos dados. O CatBoost algoritmo de SageMaker IA é uma implementação do [CatBoost](https://github.com/catboost/catboost)pacote de código aberto.

**nota**  
Os hiperparâmetros padrão são baseados em conjuntos de dados de exemplo no [CatBoost cadernos de amostra](catboost.md#catboost-sample-notebooks).

Por padrão, o CatBoost algoritmo de SageMaker IA escolhe automaticamente uma métrica de avaliação e uma função de perda com base no tipo de problema de classificação. O CatBoost algoritmo detecta o tipo de problema de classificação com base no número de rótulos em seus dados. Para problemas de regressão, a métrica de avaliação e as funções de perda são, ambas, a raiz do erro quadrático médio. Para problemas de classificação binária, a métrica de avaliação é Área sob a curva (AUC) e a função de perda é perda de log. Para problemas de classificação multiclasse, a métrica de avaliação e as funções de perda são entropia cruzada multiclasse. Você pode usar o hiperparâmetro `eval_metric` para alterar a métrica de avaliação padrão. Consulte a tabela a seguir para obter mais informações sobre os hiperparâmetros do LightGBM, incluindo descrições, valores válidos e valores padrão.


| Nome do parâmetro | Description | 
| --- | --- | 
| iterations | O número máximo de árvores que podem ser construídas.<br />Valores válidos: inteiro, intervalo: inteiro positivo.<br />Valor padrão: `500`. | 
| early\_stopping\_rounds | O treinamento será interrompido se uma métrica de um ponto de dados de validação não melhorar na última rodada `early_stopping_rounds`. Se `early_stopping_rounds` for menor ou igual a zero, esse hiperparâmetro será ignorado.<br />Valores válidos: inteiro.<br />Valor padrão: `5`. | 
| eval\_metric | A métrica de avaliação para os dados de validação. Se `eval_metric` for definido como o valor padrão `"auto"`, o algoritmo escolherá automaticamente uma métrica de avaliação com base no tipo de problema de classificação:[See the AWS documentation website for more details](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/catboost-hyperparameters.html)<br />Valores válidos: string, consulte a [CatBoost documentação](https://catboost.ai/en/docs/references/eval-metric__supported-metrics) para valores válidos.<br />Valor padrão: `"auto"`. | 
| learning\_rate | A taxa na qual os pesos do modelo são atualizados depois de analisar cada lote de exemplos de treinamento.<br />Valores válidos: flutuante. Intervalo: (`0.0`, `1.0`).<br />Valor padrão: `0.009`. | 
| depth | Profundidade da árvore.<br />Valores válidos: inteiro. Intervalo: (`1`, `16`).<br />Valor padrão: `6`. | 
| l2\_leaf\_reg | Coeficiente para o termo de regularização L2 da função de custo.<br />Valores válidos: inteiro, intervalo: inteiro positivo.<br />Valor padrão: `3`. | 
| random\_strength | A quantidade de aleatoriedade a ser usada para dividir a pontuação quando a estrutura da árvore é selecionada. Use esse parâmetro para evitar o ajuste excessivo do modelo.<br />Valores válidos: flutuante, intervalo: número de ponto flutuante positivo.<br />Valor padrão: `1.0`. | 
| max\_leaves | O número máximo de folhas na árvore resultante. Só pode ser usado com a política de crescimento `"Lossguide"`.<br />Valores válidos: inteiro, Intervalo: [`2`, `64`].<br />Valor padrão: `31`. | 
| rsm | Método de subespaço aleatório. A porcentagem de atributos a serem usados em cada seleção dividida, quando os atributos são selecionados aleatoriamente outra vez.<br />Valores válidos: flutuante. Intervalo: (`0.0`, `1.0`].<br />Valor padrão: `1.0`. | 
| sampling\_frequency | Frequência para amostrar pesos e objetos ao construir árvores.<br />Valores válidos: string, ou: (`"PerTreeLevel"` ou `"PerTree"`).<br />Valor padrão: `"PerTreeLevel"`. | 
| min\_data\_in\_leaf | O número mínimo de amostras de treinamento em uma folha. CatBoost não procura novas divisões em folhas com uma contagem de amostras menor que o valor especificado. Só pode ser usado com as políticas de crescimento `"Lossguide"` e `"Depthwise"`.<br />Valores válidos: inteiro, Intervalo: (`1` ou `∞`).<br />Valor padrão: `1`. | 
| bagging\_temperature | Define as configurações do bootstrap bayesiano. Use o bootstrap bayesiano para atribuir pesos aleatórios aos objetos. Se `bagging_temperature` estiver definido como `1.0`, os pesos serão amostrados a partir de uma distribuição exponencial. Se `bagging_temperature` estiver definido como `0.0`, todos os pesos serão 1,0.<br />Valores válidos: float, range: Non-negative float.<br />Valor padrão: `1.0`. | 
| boosting\_type | O esquema de reforço. “Auto” significa que `boosting_type` é selecionado com base no tipo de unidade de processamento, no número de objetos no conjunto de dados de treinamento e no modo de aprendizado selecionado.<br />Valores válidos: string, qualquer um dos seguintes: (`"Auto"`, `"Ordered"`, `"Plain"`).<br />Valor padrão: `"Auto"`. | 
| scale\_pos\_weight | O peso da classe positiva na classificação binária. O valor é usado como um multiplicador para os pesos dos objetos da classe positiva.<br />Valores válidos: flutuante, intervalo: flutuante positivo.<br />Valor padrão: `1.0`. | 
| max\_bin | O número de divisões para atributos numéricos. `"Auto"`significa que `max_bin` é selecionado com base no tipo de unidade de processamento e em outros parâmetros. Para obter detalhes, consulte a CatBoost documentação.<br />Valores válidos: string, either: (`"Auto"` ou string de inteiro de `"1"` até `"65535"` inclusivamente).<br />Valor padrão: `"Auto"`. | 
| grow\_policy | A política de crescimento de árvores. Define como realizar a construção de árvores gananciosas.<br />Valores válidos: string, qualquer um dos seguintes: (`"SymmetricTree"`, `"Depthwise"` ou `"Lossguide"`).<br />Valor padrão: `"SymmetricTree"`. | 
| random\_seed | A semente aleatória usada para treinamento.<br />Valores válidos: inteiro, intervalo: Non-negative inteiro.<br />Valor padrão: `1.0`. | 
| thread\_count | O número de threads a serem usados durante o treinamento. Se `thread_count` for`-1`, então o número de threads é igual ao número de núcleos do processador. `thread_count` não pode ser`0`.<br />Valores válidos: número inteiro: (ou número inteiro positivo)`-1`.<br />Valor padrão: `-1`. | 
| verbose | A verbosidade das mensagens impressas, com níveis mais altos correspondendo a declarações impressas mais detalhadas.<br />Valores válidos: inteiro, intervalo: inteiro positivo.<br />Valor padrão: `1`. | 