Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Stability.ai Diffusion stable 3,5 L
Le modèle Stable Diffusion 3.5 Large utilise 8 milliards de paramètres et prend en charge une sortie de résolution de 1 mégapixel pour la génération de texte vers image et d’image vers image.
Le corps de la demande est transmis dans le body champ d'une demande à InvokeModel.
Modèle de champ du corps de la demande d'invocation
Lorsque vous effectuez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, remplissez le champ body avec un objet JSON qui ressemble à ce qui suit.
Champ body des réponses à l’invocation du modèle
Lorsque vous passez un InvokeModel appel à l'aide d'un modèle Stable Diffusion 3.5 Large, la réponse est la suivante
{
'seeds': [2130420379],
"finish_reasons":[null],
"images":["..."]
}
Une réponse dont le motif final n'est pas null le cas ressemblera à ce qui suit :
{
"finish_reasons":["Filter reason: prompt"]
}
seeds : (chaîne) liste des amorces permettant de générer des images pour le modèle.
-
finish_reasons : Enum indiquant si la demande a été filtrée ou non. null indiquera que la demande a été acceptée. Valeurs possibles actuelles : "Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
-
images : liste des images générées au format de chaîne Base64.
- Text to image
-
Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d'inférence texte-image.
Paramètres facultatifs
-
aspect_ratio (string) — Contrôle le rapport hauteur/largeur de l'image générée. Valable uniquement pour les demandes texte vers image. Enum : 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21. Valeur par défaut : 1:1.
-
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image vers image ou texte vers image. Détermine s’il s’agit d’une génération de texte vers image ou d’image vers image, ce qui a une incidence sur les paramètres requis :
-
texte vers image ne nécessite que le paramètre d’invite.
-
image vers image nécessite les paramètres prompt, image et strength.
-
seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).
| Minimum |
Maximum |
Par défaut |
| 0 |
4294967294 |
0 |
-
negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.
-
output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
- Image to image
-
Le modèle Stability.ai Stable Diffusion 3.5 Large possède les paramètres d'inférence suivants pour un appel d'inférence image à image.
-
prompt (string) — Description textuelle de l'image de sortie souhaitée. 10 000 caractères maximum.
-
image (chaîne) — image Base64-encoded d'entrée. Minimum 64 pixels par côté. Formats pris en charge : jpeg, png, webp.
-
mode (string) (GenerationMode) - Par défaut : text-to-image. Enum : image vers image ou texte vers image. Détermine s’il s’agit d’une génération de texte vers image ou d’image vers image, ce qui a une incidence sur les paramètres requis :
-
texte vers image ne nécessite que le paramètre d’invite.
-
image vers image nécessite les paramètres prompt, image et strength.
-
force (nombre) — Contrôle l'influence de l'image d'entrée sur la sortie. Plage de valeurs : de 0 à 1. La valeur 0 préserve l’image d’entrée, la valeur 1 ignore l’image d’entrée.
-
seed (number) — Valeur permettant de contrôler le caractère aléatoire de la génération. Plage de 0 à 4 294 967 294. 0 par défaut (amorce aléatoire).
| Minimum |
Maximum |
Par défaut |
| 0 |
4294967294 |
0 |
-
negative_prompt (string) — Texte décrivant les éléments à exclure de l'image de sortie. 10 000 caractères maximum.
-
output_format (string) — Format de l'image de sortie. Enum : jpeg, png, webp. Valeur par défaut : png.
import boto3
import base64
import json
# Load and encode image
with open('input_image.jpg', 'rb') as image_file:
image_base64 = base64.b64encode(image_file.read()).decode('utf-8')
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.sd3-5-large-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.',
'image': image_base64,
'strength': 0.7
})
)