Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Optimisation et migration des invites dans Amazon Bedrock
Amazon Bedrock propose une optimisation rapide, un outil de migration et d'optimisation de modèles qui vous aide à tirer le meilleur parti des modèles de base. Amazon Bedrock propose deux options d'optimisation rapides.
-
L'optimisation simple effectue une réécriture heuristique rapide d'une seule demande courte pour un modèle.
-
L'optimisation avancée des commandes (AdvPO) vous permet d'optimiser vos instructions pour n'importe quel modèle sur Bedrock tout en comparant vos instructions d'origine aux instructions optimisées pour un maximum de 5 modèles simultanément.
Vous pouvez l'utiliser si vous migrez vers un nouveau modèle ou si vous souhaitez simplement améliorer les performances de votre modèle actuel. Si vous changez de modèle, sélectionnez votre modèle actuel comme référence et jusqu'à 4 autres modèles. Si vous ne changez pas de modèle, sélectionnez simplement votre modèle actuel pour voir avant et après l'optimisation. L'optimiseur prend vos modèles d'invite (jusqu'à 10 par tâche) et des exemples de valeurs variables saisies par l'utilisateur (jusqu'à 100 par modèle d'invite). Cela nécessite également des réponses véridiques sur le terrain et une métrique d'évaluation pour guider l'optimisation. Il est même compatible avec les entrées multimodales telles que jpeg, png ou PDF. Vous pouvez fournir une LLM-as-a-judge rubrique, une fonction Lambda ou de courts critères de pilotage en langage naturel. L'évaluation oriente l'optimisation rapide. L'optimiseur fonctionne dans une boucle de rétroaction basée sur l'évaluation afin d'optimiser les réponses rapides et résultantes du modèle. Il produit les modèles d'invite originaux et finaux avec les scores d'évaluation, les estimations de coûts et le temps de latence.
Choisissez une méthode d'optimisation
| Optimisation simple | Optimisation rapide avancée | |
|---|---|---|
| Cas d'utilisation | Réécriture de base à invite unique pour les instructions courtes | Optimisation flexible et itérative où votre évaluation oriente la réécriture rapide, pour la migration des modèles et le réglage des performances |
| Idéal pour | Courtes instructions (environ 1 000 jetons ou moins) | Modèles rapides de n'importe quelle longueur correspondant à la fenêtre contextuelle du modèle |
| Entrée | Texte d'invite unique | Jusqu'à 10 modèles d'invite avec des échantillons d'évaluation, y compris des modèles multimodaux |
| Modèles | 1 modèle | Jusqu'à 5 modèles comparés simultanément |
| Evaluation | Aucune (réécriture heuristique) | Votre choix : critères de pilotage, LLM-as-judge rubrique ou fonction Lambda personnalisée |
| Sortie | Demande réécrite (instantanée) | Modèles optimisés avec scores d'évaluation, estimations de coûts et latence par modèle |
| Exécution | Synchrone (secondes) | Tâche asynchrone (de 15 minutes à quelques heures, selon le nombre de modèles d'invite et d'échantillons d'évaluation) |
| Multimodal | Non | Oui (images, PDF) |
| Migration de modèles | Partiel : possibilité de réécrire les instructions, mais pas de comparaison côte à côte | Oui, comparez le modèle actuel aux candidats côte à côte |