Optimisation et migration des invites dans Amazon Bedrock

Amazon Bedrock propose une optimisation rapide, un outil de migration et d'optimisation de modèles qui vous aide à tirer le meilleur parti des modèles de base. Amazon Bedrock propose deux options d'optimisation rapides.

L'optimisation simple effectue une réécriture heuristique rapide d'une seule demande courte pour un modèle.
L'optimisation avancée des commandes (AdvPO) vous permet d'optimiser vos instructions pour n'importe quel modèle sur Bedrock tout en comparant vos instructions d'origine aux instructions optimisées pour un maximum de 5 modèles simultanément.

Vous pouvez l'utiliser si vous migrez vers un nouveau modèle ou si vous souhaitez simplement améliorer les performances de votre modèle actuel. Si vous changez de modèle, sélectionnez votre modèle actuel comme référence et jusqu'à 4 autres modèles. Si vous ne changez pas de modèle, sélectionnez simplement votre modèle actuel pour voir avant et après l'optimisation. L'optimiseur prend vos modèles d'invite (jusqu'à 10 par tâche) et des exemples de valeurs variables saisies par l'utilisateur (jusqu'à 100 par modèle d'invite). Cela nécessite également des réponses véridiques sur le terrain et une métrique d'évaluation pour guider l'optimisation. Il est même compatible avec les entrées multimodales telles que jpeg, png ou PDF. Vous pouvez fournir une LLM-as-a-judge rubrique, une fonction Lambda ou de courts critères de pilotage en langage naturel. L'évaluation oriente l'optimisation rapide. L'optimiseur fonctionne dans une boucle de rétroaction basée sur l'évaluation afin d'optimiser les réponses rapides et résultantes du modèle. Il produit les modèles d'invite originaux et finaux avec les scores d'évaluation, les estimations de coûts et le temps de latence.

Choisissez une méthode d'optimisation

	Optimisation simple	Optimisation rapide avancée
Cas d'utilisation	Réécriture de base à invite unique pour les instructions courtes	Optimisation flexible et itérative où votre évaluation oriente la réécriture rapide, pour la migration des modèles et le réglage des performances
Idéal pour	Courtes instructions (environ 1 000 jetons ou moins)	Modèles rapides de n'importe quelle longueur correspondant à la fenêtre contextuelle du modèle
Entrée	Texte d'invite unique	Jusqu'à 10 modèles d'invite avec des échantillons d'évaluation, y compris des modèles multimodaux
Modèles	1 modèle	Jusqu'à 5 modèles comparés simultanément
Evaluation	Aucune (réécriture heuristique)	Votre choix : critères de pilotage, LLM-as-judge rubrique ou fonction Lambda personnalisée
Sortie	Demande réécrite (instantanée)	Modèles optimisés avec scores d'évaluation, estimations de coûts et latence par modèle
Exécution	Synchrone (secondes)	Tâche asynchrone (de 15 minutes à quelques heures, selon le nombre de modèles d'invite et d'échantillons d'évaluation)
Multimodal	Non	Oui (images, PDF)
Migration de modèles	Partiel : possibilité de réécrire les instructions, mais pas de comparaison côte à côte	Oui, comparez le modèle actuel aux candidats côte à côte

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Capacités supplémentaires

Comment ça marche