Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Llama 3.1 405B Instruct
Meta — Llama 3.1 405B Instruct
Détails du modèle
Llama 3.1 405B Instruct est le plus grand modèle ouvert de Meta avec 405 milliards de paramètres et une fenêtre contextuelle de 128 Ko, prenant en charge l'utilisation d'outils et les tâches multilingues. Pour plus d'informations sur le développement et les performances des modèles, consultez la fiche modèle/service
Date de lancement du modèle : 23 juillet 2024
Date d'expiration du modèle : Legacy : 7 juillet 2026
Contrats de licence utilisateur final et conditions d'utilisation : Afficher
Cycle de vie du modèle : actif
Fenêtre contextuelle : 128 000 jetons
Nombre maximum de jetons de sortie : 4K
Date limite de disponibilité des connaissances : décembre 2023
| Modalités de saisie | Modalités de sortie | APIs pris en charge | Endpoints pris en charge |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Tarification
Pour connaître les tarifs, consultez la page de tarification d'Amazon Bedrock
Accès programmatique
Utilisez le modèle IDs et le point de terminaison suivants URLs pour accéder à ce modèle par programmation. Pour plus d'informations sur les terminaux disponibles APIs et les points de terminaison, consultez les sections APIs Supportés et Terminaux pris en charge.
| Point de terminaison | ID du modèle | URL du point de terminaison régional | Identifiant d'inférence géographique | ID d'inférence global |
|---|---|---|---|---|
bedrock-runtime |
meta.llama3-1-405b-instruct-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
us.meta.llama3-1-405b-instruct-v1:0 |
Non pris en charge |
Par exemple, si la région est us-east-1 (Virginie du Nord), l'URL du point de terminaison de bedrock-runtime sera « » et celle de bedrock-mantle sera https://bedrock-runtime.us-east-1.amazonaws.com « https://bedrock-mantle.us-east-1.api.aws/v1 ».
Niveaux de service
Amazon Bedrock propose plusieurs niveaux de service pour répondre à vos exigences en matière de charge de travail. Standard fournit pay-per-token un accès sans engagement. Priority offre un débit plus élevé avec un engagement basé sur le temps. Flex fournit un accès à moindre coût pour des charges de non-time-sensitive travail flexibles. Reserved fournit un débit dédié avec un engagement à terme pour des charges de travail prévisibles. Pour plus d'informations, consultez la section niveaux de service.
| Standard | Priorité | Flex | Réservé |
|---|---|---|---|
Disponibilité par région
La disponibilité régionale en un coup d'œil
Bedrock propose trois options d'inférence : In-Region conserve les demandes au sein d'une même région pour une conformité stricte, itinéraires géo-interrégionaux à travers les régions d'une même zone géographique (États-Unis, UE, etc.) pour un débit plus élevé tout en respectant la résidence des données, et itinéraires interrégionaux mondiaux partout dans le monde pour un débit maximal en l'absence de contraintes de résidence. Reportez-vous à la Disponibilité par région page pour plus de détails.
| Région | Dans la région | Géo | Solution internationale |
|---|---|---|---|
us-east-2(Ohio) | |||
us-west-2(Oregon) |
Détails de la géo-inférence
Géo : États-Unis
Identifiant d'inférence géographique : us.meta.llama3-1-405b-instruct-v1:0
| Région source | Régions de destination |
|---|---|
| us-east-2 (Ohio) | us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon) |
Exemple de code
Étape 1 - Compte AWS : si vous possédez déjà un compte AWS, ignorez cette étape. Si vous utilisez AWS pour la première fois, créez un compte AWS
Étape 2 - Clé d'API : accédez à la console Amazon Bedrock
Étape 3 - Téléchargez le SDK : pour utiliser ce guide de démarrage, Python doit déjà être installé. Installez ensuite le logiciel approprié en fonction de celui APIs que vous utilisez.
pip install boto3
Étape 4 - Définissez les variables d'environnement : configurez votre environnement pour utiliser la clé API pour l'authentification.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Étape 5 - Exécutez votre première demande d'inférence : enregistrez le fichier sous bedrock-first-request.py