View a markdown version of this page

Optimisation et migration des invites dans Amazon Bedrock - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Optimisation et migration des invites dans Amazon Bedrock

Amazon Bedrock propose une optimisation rapide, un outil de migration et d'optimisation de modèles qui vous aide à tirer le meilleur parti des modèles de base. Amazon Bedrock propose deux options d'optimisation rapides.

  • L'optimisation simple effectue une réécriture heuristique rapide d'une seule demande courte pour un modèle.

  • L'optimisation avancée des commandes (AdvPO) vous permet d'optimiser vos instructions pour n'importe quel modèle sur Bedrock tout en comparant vos instructions d'origine aux instructions optimisées pour un maximum de 5 modèles simultanément.

    Vous pouvez l'utiliser si vous migrez vers un nouveau modèle ou si vous souhaitez simplement améliorer les performances de votre modèle actuel. Si vous changez de modèle, sélectionnez votre modèle actuel comme référence et jusqu'à 4 autres modèles. Si vous ne changez pas de modèle, sélectionnez simplement votre modèle actuel pour voir avant et après l'optimisation. L'optimiseur prend vos modèles d'invite (jusqu'à 10 par tâche) et des exemples de valeurs variables saisies par l'utilisateur (jusqu'à 100 par modèle d'invite). Cela nécessite également des réponses véridiques sur le terrain et une métrique d'évaluation pour guider l'optimisation. Il est même compatible avec les entrées multimodales telles que jpeg, png ou PDF. Vous pouvez fournir une LLM-as-a-judge rubrique, une fonction Lambda ou de courts critères de pilotage en langage naturel. L'évaluation oriente l'optimisation rapide. L'optimiseur fonctionne dans une boucle de rétroaction basée sur l'évaluation afin d'optimiser les réponses rapides et résultantes du modèle. Il produit les modèles d'invite originaux et finaux avec les scores d'évaluation, les estimations de coûts et le temps de latence.

Choisissez une méthode d'optimisation

Optimisation simple Optimisation rapide avancée
Cas d'utilisation Réécriture de base à invite unique pour les instructions courtes Optimisation flexible et itérative où votre évaluation oriente la réécriture rapide, pour la migration des modèles et le réglage des performances
Idéal pour Courtes instructions (environ 1 000 jetons ou moins) Modèles rapides de n'importe quelle longueur correspondant à la fenêtre contextuelle du modèle
Entrée Texte d'invite unique Jusqu'à 10 modèles d'invite avec des échantillons d'évaluation, y compris des modèles multimodaux
Modèles   1 modèle Jusqu'à 5 modèles comparés simultanément
Evaluation Aucune (réécriture heuristique) Votre choix : critères de pilotage, LLM-as-judge rubrique ou fonction Lambda personnalisée
Sortie Demande réécrite (instantanée) Modèles optimisés avec scores d'évaluation, estimations de coûts et latence par modèle
Exécution Synchrone (secondes) Tâche asynchrone (de 15 minutes à quelques heures, selon le nombre de modèles d'invite et d'échantillons d'évaluation)
Multimodal Non Oui (images, PDF)
Migration de modèles Partiel : possibilité de réécrire les instructions, mais pas de comparaison côte à côte Oui, comparez le modèle actuel aux candidats côte à côte