Modelos básicos de IA generativa en Canvas SageMaker

Amazon SageMaker Canvas proporciona modelos básicos de IA generativa que puede utilizar para iniciar conversaciones conversacionales. Estos modelos de generación de contenido se entrenan con grandes cantidades de datos de texto para aprender los patrones estadísticos y las relaciones entre las palabras, y pueden producir un texto coherente que sea estadísticamente similar al texto en el que se entrenaron. Puede utilizar esta capacidad para aumentar la productividad de la siguiente manera:

Generar contenido, como esquemas de documentos, informes y blogs
Resumir el texto a partir de grandes corpus de texto, como transcripciones de presentaciones de beneficios, informes anuales o capítulos de manuales de usuario
Extraer información y conclusiones clave de amplios pasajes de texto, como notas o transcripciones de reuniones
Mejorar el texto y captar errores gramaticales o tipográficos

Los modelos básicos son una combinación de los modelos de lenguaje grande (LLM) de Amazon SageMaker JumpStart y Amazon Bedrock. Canvas ofrece los siguientes modelos:

Modelo	Tipo	Description (Descripción)
Amazon Titán	Modelo de Amazon Bedrock	Amazon Titan es un modelo de lenguaje potente y de uso general que puede utilizar para tareas como el resumen, la generación de texto (como la creación de una entrada de blog), la clasificación, las preguntas y respuestas abiertas y la extracción de información. Está entrenado previamente con conjuntos de datos de gran tamaño, lo que hace que resulte adecuado para tareas y razonamientos complejos. Para seguir respaldando las prácticas recomendadas en el uso responsable de la IA, los modelos fundacionales de Amazon Titan están diseñados para detectar y eliminar el contenido dañino de los datos, rechazar el contenido inapropiado en las entradas de los usuarios y filtrar los resultados de los modelos que contengan contenido inapropiado (como la incitación al odio, las palabras malsonantes y la violencia).
Anthropic Claude Instant	Modelo de Amazon Bedrock	El Anthropic Claude Instant es un modelo más rápido y rentable, pero aún así tiene una alta capacidad. Este modelo puede realizar una variedad de tareas, como el diálogo informal, el análisis de texto, el resumen y la respuesta a preguntas sobre documentos. Del mismo modo Claude-2, Claude Instant puede admitir hasta 100 000 fichas en cada solicitud, lo que equivale a unas 200 páginas de información.
Anthropic Claude-2	Modelo de Amazon Bedrock	Claude-2 es el modelo más potente de Anthropic, que sobresale en una amplia gama de tareas, desde diálogos sofisticados y generación de contenido creativo hasta el seguimiento detallado de instrucciones. Claude-2 pueden ocupar hasta 100 000 fichas en cada solicitud, lo que equivale a unas 200 páginas de información. Puede generar respuestas más largas en comparación con su versión anterior. Admite casos de uso como la respuesta a preguntas, la extracción de información, la eliminación de información de identificación personal, la generación de contenido, la clasificación de opción múltiple, los juegos de roles, la comparación de texto, la síntesis y las preguntas y respuestas de documentos con citas.
Falcon-7B-Instruct	JumpStart modelo	Falcon-7B-Instruct tiene 7 mil millones de parámetros y se ajustó a una combinación de conjuntos de datos de chat e instrucción. Es adecuado como asistente virtual y funciona mejor cuando se siguen instrucciones o se entabla una conversación. Dado que el modelo se entrenó con grandes cantidades de datos English-language web, contiene los estereotipos y sesgos que suelen encontrarse en Internet y no es adecuado para otros idiomas además del inglés. En comparación con Falcon-40B-Instruct, Falcon-7B-Instruct es un modelo un poco más pequeño y compacto.
Falcon-40B-Instruct	JumpStart modelo	Falcon-40B-Instruct tiene 40 mil millones de parámetros y se ajustó a una combinación de conjuntos de datos de chat e instrucción. Es adecuado como asistente virtual y funciona mejor cuando se siguen instrucciones o se entabla una conversación. Dado que el modelo se entrenó con grandes cantidades de datos English-language web, contiene los estereotipos y sesgos que suelen encontrarse en Internet y no es adecuado para otros idiomas además del inglés. En comparación con Falcon-7B-Instruct, Falcon-40B-Instruct es un modelo un poco más grande y potente.
Jurassic-2 Medio	Modelo de Amazon Bedrock	Jurassic-2 Mid es un modelo de generación de texto de alto rendimiento basado en un corpus de texto masivo (actualizado hasta mediados de 2022). Es muy versátil, de uso general y capaz de componer textos similares a los humanos y de resolver tareas complejas, como responder preguntas, clasificar textos y muchas otras. Este modelo ofrece capacidades de instrucción de cero intentos, lo que permite que se dirija únicamente con lenguaje natural y sin el uso de ejemplos. Funciona hasta un 30% más rápido que su predecesor, el Jurassic-1 modelo. Jurassic-2 El Mid es el modelo de tamaño medio del AI21, diseñado cuidadosamente para lograr el equilibrio adecuado entre una calidad excepcional y un precio asequible.
Jurassic-2 Ultra	Modelo de Amazon Bedrock	Jurassic-2 Ultra es un modelo de generación de texto de alto rendimiento basado en un corpus de texto masivo (actualizado hasta mediados de 2022). Es muy versátil, de uso general y capaz de componer textos similares a los humanos y de resolver tareas complejas, como responder preguntas, clasificar textos y muchas otras. Este modelo ofrece capacidades de instrucción de cero intentos, lo que permite que se dirija únicamente con lenguaje natural y sin el uso de ejemplos. Funciona hasta un 30% más rápido que su predecesor, el Jurassic-1 modelo. En comparación con Jurassic-2 Mid, Jurassic-2 Ultra es un modelo un poco más grande y potente.
Llama-2-7b-Chat	JumpStart modelo	Llama-2-7b-Chat es un modelo básico de Meta que es adecuado para entablar conversaciones significativas y coherentes, generar contenido nuevo y extraer respuestas de las notas existentes. Dado que el modelo se entrenó con grandes cantidades de datos de English-language Internet, tiene los sesgos y limitaciones que se encuentran comúnmente en Internet y es el más adecuado para tareas en inglés.
Llama-2-13B-Chat	Modelo de Amazon Bedrock	Llama-2-13B-Chat by Meta se adaptó a los datos conversacionales después de una formación inicial sobre datos de Internet. Está optimizado para un diálogo natural y una atractiva capacidad de chat, lo que hace que resulte idóneo como agente conversacional. En comparación con el más pequeño Llama-2-7b-Chat, Llama-2-13B-Chat tiene casi el doble de parámetros, lo que le permite recordar más contexto y producir respuestas conversacionales más matizadas. Por ejemplo Llama-2-7b-Chat, Llama-2-13B-Chat se formó con English-language datos y es ideal para tareas en inglés.
Llama-2-70B-Chat	Modelo de Amazon Bedrock	Por ejemplo Llama-2-7b-Chat Llama-2-13B-Chat, el Llama-2-70B-Chat modelo de Meta está optimizado para entablar un diálogo natural y significativo. Con 70 000 millones de parámetros, este gran modelo conversacional puede recordar un contexto más extenso y producir respuestas muy coherentes en comparación con las versiones de modelos más compactos. Sin embargo, esto se produce a costa de respuestas más lentas y mayores necesidades de recursos. Llama-2-70B-Chat se formó con grandes cantidades de datos de English-language Internet y es la persona más adecuada para realizar tareas en inglés.
Mistral-7B	JumpStart modelo	Mistral-7B by Mistral.AI es un excelente modelo de lenguaje de uso general adecuado para una amplia gama de tareas de lenguaje natural (PNL), como la generación de texto, el resumen y la respuesta a preguntas. Utiliza la atención de consulta agrupada (GQA), que permite velocidades de inferencia más rápidas, con un rendimiento comparable al de los modelos con el doble o el triple de parámetros. Se ha entrenado con una combinación de datos de texto, incluidos libros, sitios web y artículos científicos en inglés, por lo que es idóneo para tareas en inglés.
Mistral-7B-Chat	JumpStart modelo	Mistral-7B-Chat es un modelo conversacional Mistral.AI basado en Mistral-7B. Si bien Mistral-7B es mejor para tareas generales de PNL, se Mistral-7B-Chat ha ajustado aún más a los datos conversacionales para optimizar sus capacidades y lograr un chat natural y atractivo. Como resultado, Mistral-7B-Chat genera respuestas más parecidas a las humanas y recuerda el contexto de las respuestas anteriores. Por ejemplo Mistral-7B, este modelo es el más adecuado para tareas en inglés.
MPT-7B-Instruct	JumpStart modelo	MPT-7B-Instruct es un modelo para la instrucción extensa después de las tareas y puede ayudarlo con las tareas de escritura, como el resumen de textos y la respuesta a preguntas, para ahorrarle tiempo y esfuerzo. Este modelo se entrenó con grandes cantidades de datos ajustados y puede hacer frente a entradas más grandes, como documentos complejos. Utilice este modelo cuando desee procesar cuerpos de texto grandes o si desea que el modelo genere respuestas largas.

Por el momento, los modelos fundacionales de Amazon Bedrock solo están disponibles en las regiones Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón). Además, cuando utilice modelos fundacionales de Amazon Bedrock, se le cobrará en función del volumen de los tokens de entrada y salida, según lo especifique cada proveedor de modelos. Para obtener más información, consulte la página de Precios de Amazon Bedrock. Los modelos JumpStart básicos se implementan en las instancias de SageMaker AI Hosting y se le cobrará por la duración del uso en función del tipo de instancia utilizada. Para obtener más información sobre el costo de los distintos tipos de instancias, consulta la sección Amazon SageMaker AI Hosting: Real-Time Inference en la página de SageMaker precios.

La consulta de documentos es una característica adicional que puede utilizar para consultar y obtener información de los documentos almacenados en índices mediante Amazon Kendra. Con esta funcionalidad, puede generar contenido a partir del contexto de esos documentos y recibir respuestas específicas para su caso de uso empresarial, en lugar de respuestas genéricas según las grandes cantidades de datos en las que se basaron los modelos fundacionales. Para obtener más información acerca de los índices en Amazon Kendra, consulte la Guía para desarrolladores de Amazon Kendra.

Si desea obtener respuestas de alguno de los modelos fundacionales personalizados con sus datos y su caso de uso, puede afinar dichos modelos. Para obtener más información, consulte Fine-tune modelos básicos.

Si quieres obtener predicciones de un modelo SageMaker JumpStart básico de Amazon a través de una aplicación o un sitio web, puedes implementar el modelo en un punto final de SageMaker IA. SageMaker Los puntos finales de IA alojan su modelo y usted puede enviar solicitudes al punto final a través del código de su aplicación para recibir predicciones del modelo. Para obtener más información, consulte Implementación de sus modelos en un punto de conexión.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Automatice la preparación de datos en SageMaker Canvas

Cómo completar los requisitos previos de