

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Acelere el desarrollo de IA generativa con MLflow gestionado en Amazon AI SageMaker
<a name="mlflow"></a>

MLflow, totalmente gestionado en Amazon SageMaker AI, le permite acelerar la IA generativa al facilitar el seguimiento de los experimentos y la supervisión del rendimiento de los modelos y las aplicaciones de IA mediante una sola herramienta.

**Desarrollo de IA generativa con MLflow**

A medida que los clientes de todos los sectores aceleran su desarrollo de la IA generativa, requieren capacidades para realizar un seguimiento de los experimentos, observar el comportamiento y evaluar el rendimiento de los modelos y las aplicaciones de IA. Los científicos y desarrolladores de datos carecen de herramientas para analizar el rendimiento de los modelos y las aplicaciones de IA desde la experimentación hasta la producción, lo que dificulta la identificación de las causas y la resolución de los problemas. Los equipos dedican más tiempo a integrar herramientas que a mejorar sus modelos o aplicaciones de IA generativa.

El entrenamiento o refinamiento de la IA generativa o machine learning es un proceso iterativo que requiere experimentar con varias combinaciones de datos, algoritmos y parámetros, mientras se observa su impacto en la exactitud de los modelos. La naturaleza iterativa de la experimentación da lugar a numerosas versiones y ejecuciones de entrenamiento de modelos, lo que dificulta el seguimiento de los modelos con mejor rendimiento y sus configuraciones. La complejidad de administrar y comparar las ejecuciones iterativas de entrenamiento aumenta con GenAI, donde la experimentación implica no solo refinar los modelos, sino también explorar resultados creativos y diversos. Los investigadores deben ajustar los hiperparámetros, seleccionar las arquitecturas de modelos adecuadas y seleccionar diversos conjuntos de datos para optimizar tanto la calidad como la creatividad del contenido generado. La evaluación de los modelos de IA generativa requiere métricas cuantitativas y cualitativas, lo que añade otro nivel de complejidad al proceso de experimentación. Las funciones de seguimiento de la experimentación de MLflow en Amazon SageMaker AI le permiten realizar un seguimiento, organizar, ver, analizar y comparar la experimentación iterativa de aprendizaje automático para obtener información comparativa y registrar e implementar los modelos con mejor rendimiento.

Las funciones de rastreo de MLflow, totalmente gestionado, le permiten registrar las entradas, las salidas y los metadatos en cada paso de una aplicación de IA generativa, lo que le ayuda a identificar rápidamente el origen de los errores o los comportamientos inesperados. Al mantener registros de cada modelo y versión de la aplicación, MLflow, totalmente gestionado, ofrece trazabilidad para conectar las respuestas de la IA con sus componentes de origen, lo que permite rastrear rápidamente un problema directamente hasta el código, los datos o los parámetros específicos que lo generaron. Esto reduce drásticamente el tiempo de resolución de problemas y permite a los equipos centrarse más en la innovación.

## Integraciones de MLflow
<a name="mlflow-integrations"></a>

Utilice MLflow mientras entrena y evalúa modelos para encontrar los mejores candidatos para el caso de uso. Puede comparar el rendimiento, los parámetros y las métricas del modelo entre los experimentos en la interfaz de usuario de MLflow, realizar un seguimiento de sus mejores modelos en el registro de modelos de MLflow, registrarlos automáticamente como un modelo de SageMaker IA e implementar modelos registrados en los puntos finales de SageMaker IA.

**Amazon SageMaker AI con MLflow**

Utilice MLflow para realizar un seguimiento y gestionar la fase de experimentación del ciclo de vida del aprendizaje automático (ML) con AWS integraciones para el desarrollo, la administración, la implementación y el seguimiento de los modelos. 

**Amazon SageMaker Studio**

Cree y administre servidores de seguimiento, ejecute cuadernos para crear experimentos y acceda a la interfaz de usuario de MLflow para ver y comparar las ejecuciones de experimentos en Studio. 

**SageMaker Registro de modelos**

Administre las versiones de los modelos y catalogue los modelos para la producción registrando automáticamente los modelos del registro de modelos de MLflow en el registro de SageMaker modelos. Para obtener más información, consulte [Registre automáticamente los modelos de SageMaker IA con Model Registry SageMaker](mlflow-track-experiments-model-registration.md).

**SageMaker Inferencia de IA**

Prepare sus mejores modelos para su implementación en un punto final de SageMaker IA utilizando`ModelBuilder`. Para obtener más información, consulte [Implementación de modelos de MLflow con `ModelBuilder`](mlflow-track-experiments-model-deployment.md).

**AWS Identity and Access Management**

Configure el acceso a MLflow mediante control de acceso basado en roles (RBAC) con IAM. Escriba políticas de identidad de IAM para autorizar a las API de MLflow a las que puede llamar un cliente de un servidor de seguimiento de MLflow. Todas las API de REST de MLflow se representan como acciones de IAM con el prefijo de servicio `sagemaker-mlflow`. Para obtener más información, consulte [Configuración de permisos de IAM para MLflow](mlflow-create-tracking-server-iam.md).

**AWS CloudTrail**

Consulta los inicios de sesión AWS CloudTrail para ayudarte a habilitar la auditoría operativa y de riesgos, la gobernanza y el cumplimiento de tu AWS cuenta. Para obtener más información, consulte [AWS CloudTrail registros](#mlflow-create-tracking-server-cloudtrail).

**Amazon EventBridge**

Automatice la revisión del modelo y el ciclo de vida de la implementación mediante los eventos de MLflow capturados por Amazon EventBridge. Para obtener más información, consulte [EventBridge Eventos de Amazon](#mlflow-create-tracking-server-eventbridge).

## Compatible Regiones de AWS
<a name="mlflow-regions"></a>

**Servidores de seguimiento MLflow**

Los servidores de seguimiento de MLflow están disponibles generalmente en todas [las regiones AWS comerciales en las](https://docs.aws.amazon.com/sagemaker/latest/dg/regions-quotas.html) que Amazon SageMaker Studio está disponible, excepto en las regiones de China. Los servidores de seguimiento de MLflow están disponibles únicamente AWS CLI en la región de Europa (Zúrich), la región de Asia Pacífico (Hyderabad), la región de Asia Pacífico (Melbourne) y la región de Canadá oeste (Calgary).

Los servidores de seguimiento se inician en una única zona de disponibilidad dentro de la región especificada. 

**Aplicaciones MLflow**

Las aplicaciones MLflow están disponibles en las siguientes ubicaciones: Regiones de AWS
+ Región Este de EE. UU. (Norte de Virginia)
+ Región del este de EE. UU. (Ohio)
+ Región del oeste de EE. UU. (Norte de California)
+ Región del oeste de EE. UU. (Oregón)
+ Asia Pacific (Mumbai) Region
+ Región de Asia-Pacífico (Seúl)
+ Región de Asia-Pacífico (Singapur)
+ Región de Asia-Pacífico (Sídney)
+ Región de Asia-Pacífico (Tokio)
+ Región de Canadá (centro)
+ Región de Europa (Fráncfort)
+ Región de Europa (Irlanda)
+ Región de Europa (Londres)
+ Región de Europa (París)
+ Región Europa (Estocolmo)
+ Región de América del Sur (São Paulo)

## Funcionamiento
<a name="mlflow-create-tracking-server-how-it-works"></a>

Un servidor de seguimiento de MLflow tiene tres componentes principales: computación, almacenamiento de metadatos de backend y almacenamiento de artefactos. El cómputo que aloja el servidor de seguimiento y el almacenamiento de metadatos del backend se alojan de forma segura en la cuenta de servicio de SageMaker IA. El almacenamiento de artefactos reside en un depósito de Amazon S3 en tu propia AWS cuenta.

![Diagrama que muestra el almacén de computación y metadatos de un servidor de seguimiento MLflow](http://docs.aws.amazon.com/es_es/sagemaker/latest/dg/images/mlflow/mlflow-diagram.png)


Un servidor de seguimiento tiene un ARN. Puede usar este ARN para conectar el MLflow SDK al servidor de seguimiento y empezar a registrar las ejecuciones de entrenamiento en MLflow.

Siga leyendo para obtener más información sobre los siguientes conceptos clave:
+ [Almacenamiento de metadatos de backend](#mlflow-create-tracking-server-backend-store) 
+ [Almacenamiento de artefactos](#mlflow-create-tracking-server-artifact-store) 
+ [Tamaños de los servidores de seguimiento de MLflow](#mlflow-create-tracking-server-sizes) 
+ [Versiones del servidor de seguimiento](#mlflow-create-tracking-server-versions) 
+ [AWS CloudTrail registros](#mlflow-create-tracking-server-cloudtrail) 
+ [EventBridge Eventos de Amazon](#mlflow-create-tracking-server-eventbridge) 

### Almacenamiento de metadatos de backend
<a name="mlflow-create-tracking-server-backend-store"></a>

Al crear un servidor de seguimiento de MLflow, se configura automáticamente en la cuenta de servicio de IA un [almacén](https://mlflow.org/docs/latest/tracking/backend-stores.html) interno que conserva varios metadatos para cada [ejecución](https://mlflow.org/docs/latest/tracking.html#runs), como el identificador de la ejecución, las horas de inicio y finalización, los parámetros y las métricas, y se gestiona por completo en la cuenta de servicio de SageMaker IA. 

### Almacenamiento de artefactos
<a name="mlflow-create-tracking-server-artifact-store"></a>

Para proporcionar a MLflow un almacenamiento persistente para los metadatos de cada ejecución, como, por ejemplo, ponderaciones de modelos, imágenes, archivos de modelos y archivos de datos para las ejecuciones de experimentos, debe crear un almacenamiento de artefactos con Amazon S3. El almacén de artefactos debe estar configurado en su AWS cuenta y debe conceder a MLflow acceso a Amazon S3 de forma explícita para poder acceder a su almacén de artefactos. Para obtener más información, consulte [Artifact Stores](https://mlflow.org/docs/latest/tracking.html#artifact-stores) en la documentación de MLflow.

**nota**  
SageMaker AI MLflow tiene un límite de tamaño de descarga de 200 MB.

### Versiones de la aplicación MLflow
<a name="mlflow-create-mlflow-app-versions"></a>

Las siguientes versiones de MLflow están disponibles para su uso con las aplicaciones SageMaker AI MLflow:


| Versión de MLflow | Versión de Python | 
| --- | --- | 
| [MLflow 3.10](https://mlflow.org/releases/3.10.1/) (última versión) | [Python 3.10](https://www.python.org/downloads/release/python-3100/) o posterior | 

La última versión de la aplicación MLflow tiene las últimas funciones, parches de seguridad y correcciones de errores. Cuando cree una nueva aplicación MLflow, se actualizará automáticamente a la última versión compatible. Para obtener más información sobre la creación de una aplicación MLflow, consulte. [Configuración de la aplicación MLflow](mlflow-app-setup.md)

Las aplicaciones MLflow utilizan el control de versiones semántico. Las versiones están en el siguiente formato: `{{major-version}}.{{minor-version}}.{{patch-version}}`.

### Tamaños de los servidores de seguimiento de MLflow
<a name="mlflow-create-tracking-server-sizes"></a>

Si lo desea, puede especificar el tamaño de su servidor de seguimiento en la interfaz de usuario de Studio o con el parámetro. AWS CLI `--tracking-server-size` Puede elegir entre `"Small"`, `"Medium"` y `"Large"`. El tamaño de configuración predeterminado del servidor de seguimiento de MLflow es `"Small"`. Puede elegir un tamaño en función del uso previsto del servidor de seguimiento, como, por ejemplo, el volumen de datos registrados, el número de usuarios y la frecuencia de uso.

Recomendamos utilizar un servidor de seguimiento pequeño para equipos de hasta 25 usuarios, un servidor de seguimiento mediano para equipos de hasta 50 usuarios y un servidor de seguimiento grande para equipos de hasta 100 usuarios. Supongamos que todos los usuarios realizarán solicitudes simultáneas al servidor de seguimiento de MLflow para hacer estas recomendaciones. Debe seleccionar el tamaño del servidor de seguimiento en función del patrón de uso previsto y del valor de TPS (transacciones por segundo) que admite cada servidor de seguimiento. 

**nota**  
La naturaleza de la carga de trabajo y el tipo de solicitudes que realice al servidor de seguimiento determinan el valor de TPS que se muestre.


| Tamaño del servidor de seguimiento | TPS sostenidas | TPS de ráfaga | 
| --- | --- | --- | 
| Small | Hasta 25 | Hasta 50 | 
| Medio | Hasta 50 | Hasta 100 | 
| Grande | Hasta 100 | Hasta 200 | 

### Versiones del servidor de seguimiento
<a name="mlflow-create-tracking-server-versions"></a>

Las siguientes versiones de MLflow están disponibles para su uso con SageMaker AI:


| Versión de MLflow | Versión de Python | 
| --- | --- | 
| [MLflow 3.0](https://mlflow.org/releases/3) (última versión) | [Python 3.9](https://www.python.org/downloads/release/python-390/) o posterior | 
| [MLflow 2.16](https://mlflow.org/releases/2.16.0) | [Python 3.8](https://www.python.org/downloads/release/python-380/) o posterior | 
| [MLflow 2.13](https://mlflow.org/releases/2.13.0) | [Python 3.8](https://www.python.org/downloads/release/python-380/) o posterior | 

La versión más reciente del servidor de seguimiento incluye las características más recientes, parches de seguridad y correcciones de errores. Al crear un nuevo servidor de seguimiento, recomendamos utilizar la versión más reciente. Para obtener más información sobre cómo crear un servidor de seguimiento, consulte [Servidores de seguimiento de MLflow](mlflow-create-tracking-server.md).

Los servidores de seguimiento de MLflow utilizan control de versiones semántico. Las versiones están en el siguiente formato: `{{major-version}}.{{minor-version}}.{{patch-version}}`.

Las últimas características, como los nuevos elementos de la interfaz de usuario y la funcionalidad de la API, están en la versión secundaria.

### AWS CloudTrail registros
<a name="mlflow-create-tracking-server-cloudtrail"></a>

AWS CloudTrail registra automáticamente la actividad relacionada con su servidor de seguimiento de MLflow. Se registran las siguientes llamadas a la API del plano de control: CloudTrail
+ CreateMlflowTrackingServer
+ DescribeMlflowTrackingServer
+ UpdateMlflowTrackingServer
+ DeleteMlflowTrackingServer
+ ListMlflowTrackingServers
+ CreatePresignedMlflowTrackingServer
+ StartMlflowTrackingServer
+ StopMlflowTrackingServer

AWS CloudTrail también registra automáticamente la actividad relacionada con su plano de datos de MLflow. Se registran las siguientes llamadas a la API del plano de datos. CloudTrail Para los nombres de los eventos, añada el prefijo `Mlflow` (por ejemplo, `MlflowCreateExperiment`).
+ CreateExperiment
+ CreateModelVersion
+ CreateRegisteredModel
+ CreateRun
+ DeleteExperiment
+ DeleteModelVersion
+ DeleteModelVersionTag
+ DeleteRegisteredModel
+ DeleteRegisteredModelAlias
+ DeleteRegisteredModelTag
+ DeleteRun
+ DeleteTag
+ GetDownloadURIForModelVersionArtifacts
+ GetExperiment
+ GetExperimentByName
+ GetLatestModelVersions
+ GetMetricHistory
+ GetModelVersion
+ GetModelVersionByAlias
+ GetRegisteredModel
+ GetRun
+ ListArtifacts
+ LogBatch
+ LogInputs
+ LogMetric
+ LogModel
+ LogParam
+ RenameRegisteredModel
+ RestoreExperiment
+ RestoreRun
+ SearchExperiments
+ SearchModelVersions
+ SearchRegisteredModels
+ SearchRuns
+ SetExperimentTag
+ SetModelVersionTag
+ SetRegisteredModelAlias
+ SetRegisteredModelTag
+ SetTag
+ TransitionModelVersionStage
+ UpdateExperiment
+ UpdateModelVersion
+ UpdateRegisteredModel
+ UpdateRun
+ FinalizeLoggedModel
+ GetLoggedModel
+ DeleteLoggedModel
+ SearchLoggedModels
+ SetLoggedModelTags
+ DeleteLoggedModelTag
+ ListLoggedModelArtifacts
+ LogLoggedModelParams
+ LogOutputs

Para obtener más información al respecto CloudTrail, consulte la *[Guía AWS CloudTrail del usuario](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html)*.

### EventBridge Eventos de Amazon
<a name="mlflow-create-tracking-server-eventbridge"></a>

Úselo EventBridge para redirigir los eventos desde el uso de MLflow con SageMaker IA hasta las aplicaciones de consumo de toda su organización. Se emiten los siguientes eventos a EventBridge:
+ «Creación SageMaker de un servidor de seguimiento»
+ «Se creó SageMaker un servidor de rastreo»
+ «Falló la creación del servidor de SageMaker rastreo»
+ «Actualización del servidor de SageMaker seguimiento»
+ «Servidor SageMaker de seguimiento actualizado»
+ «Falló la actualización del servidor de SageMaker rastreo»
+ «Eliminación del servidor de SageMaker rastreo»
+ «Se ha eliminado el servidor de SageMaker seguimiento»
+ «Falló la eliminación del servidor de SageMaker rastreo»
+ «Se está SageMaker iniciando el servidor de rastreo»
+ «Se inició SageMaker el servidor de rastreo»
+ «Falló el inicio del servidor de SageMaker rastreo»
+ «SageMaker El servidor de rastreo se detiene»
+ «SageMaker El servidor de rastreo se detuvo»
+ «Falló la parada del servidor de SageMaker rastreo»
+ «SageMaker El mantenimiento del servidor de seguimiento está en curso»
+ «Se SageMaker ha completado el mantenimiento del servidor de rastreo»
+ «Falló el mantenimiento del servidor de SageMaker rastreo»
+ «El servidor SageMaker de seguimiento MLflow está creando una ejecución»
+ «Creación del servidor SageMaker de seguimiento MLflow» RegisteredModel
+ «Creación del servidor SageMaker de seguimiento MLflow» ModelVersion
+ «SageMaker Etapa de transición ModelVersion del servidor de seguimiento MLflow»
+ «El servidor de seguimiento SageMaker MLflow establece un alias de modelo registrado»

Para obtener más información al respecto EventBridge, consulta la *[Guía del EventBridge usuario de Amazon](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html)*.

**Topics**
+ [Integraciones de MLflow](#mlflow-integrations)
+ [Compatible Regiones de AWS](#mlflow-regions)
+ [Funcionamiento](#mlflow-create-tracking-server-how-it-works)
+ [Configuración de la aplicación MLflow](mlflow-app-setup.md)
+ [Servidores de seguimiento de MLflow](mlflow-create-tracking-server.md)
+ [Inicio de la interfaz de usuario de MLflow mediante una URL prefirmada](mlflow-launch-ui.md)
+ [Integración de MLflow con el entorno](mlflow-track-experiments.md)
+ [Tutoriales de MLflow con cuadernos de Jupyter de ejemplo](mlflow-tutorials.md)
+ [Solución de problemas de configuración comunes](mlflow-troubleshooting.md)
+ [Limpieza de recursos de MLflow](mlflow-cleanup.md)
+ [Amazon SageMaker Experiments en Studio Classic](experiments.md)