Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Obtenga información sobre los casos de uso de diferentes métodos de inferencia de modelos

Puede ejecutar directamente la inferencia de modelos de las siguientes maneras:

Método Caso de uso
Sitios de prueba de la consola de Amazon Bedrock Ejecutar inferencias en una interfaz gráfica intuitiva. Práctico para la exploración.
Conversar o ConverseStream Implementar aplicaciones conversacionales con una API unificada para la entrada del modelo.
InvokeModel o InvokeModelWithResponseStream Enviar una única petición y generar una respuesta sincrónica. Útil para generar respuestas en tiempo real o para consultas de búsqueda.
StartAsyncInvoke Enviar una única petición y generar una respuesta asincrónica. Útil para generar respuestas a gran escala.
CreateModelInvocationJob Preparar un conjunto de datos de peticiones y generar respuestas en lotes.
API de respuestas Usa la API de respuestas para aplicaciones de agencia modernas que requieren el uso de herramientas integradas (búsqueda, intérprete de código), entradas multimodales y conversaciones con estado.
Finalización del chat Usa la API Chat Completions para realizar tareas livianas, sin estado y centradas en texto, en las que necesites tener un control total sobre la administración del historial de chats y reducir la latencia.

Las siguientes características de Amazon Bedrock también utilizan la inferencia de modelos como un paso en un flujo de trabajo más amplio:

  • La evaluación de modelos utiliza el proceso de invocación de modelos para evaluar el rendimiento de los distintos modelos después de enviar una solicitud. CreateEvaluationJob

  • Las bases de conocimientos utilizan la invocación de modelos al utilizar la API de RetrieveAndGenerate para generar una respuesta basada en los resultados obtenidos de una base de conocimientos.

  • Los agentes utilizan la invocación de modelos para generar respuestas en varias etapas durante una solicitud de InvokeAgent.

  • Los flujos incluyen recursos de Amazon Bedrock, como peticiones, bases de conocimiento y agentes, que utilizan la invocación de modelos.

Tras probar distintos modelos básicos con distintas indicaciones y parámetros de inferencia, puede configurar su aplicación para que los utilice APIs con las especificaciones que desee.