Monitoraggio dei processi di inferenza in batch

Oltre a impostare le configurazioni per un processo di inferenza in batch, è possibile anche monitorarne l’avanzamento visualizzandone lo stato. Per ulteriori informazioni sui possibili stati di un lavoro, vedere il status campo in ModelInvocationJobSummary.

Per tenere traccia dell'avanzamento di un lavoro, puoi utilizzare i contatori di avanzamento restituiti dalle operazioni GetModelInvocationJobe dall'ListModelInvocationJobsAPI. Questi contatori mostrano il numero totale di record di input e quanti sono stati elaborati dal servizio. Puoi monitorare il completamento senza controllare i bucket di output di Amazon S3. In alternativa, puoi trovare questi numeri nel manifest.json.out file nel bucket Amazon S3 che contiene i file di output. Per ulteriori informazioni, consulta Visualizzazione dei risultati di un processo di inferenza in batch. Per informazioni su come scaricare un oggetto S3, consulta Download di oggetti.

Suggerimento

Invece di controllare lo stato del lavoro, puoi utilizzare Amazon per EventBridge ricevere notifiche automatiche quando un processo di inferenza in batch viene completato o cambia lo stato. Per ulteriori informazioni, consulta Monitora le modifiche allo stato dei job di Amazon Bedrock con Amazon EventBridge.

Per scoprire come visualizzare i dettagli dei processi di inferenza in batch, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi sotto indicati.

Console

Per visualizzare informazioni sui processi di inferenza in batch

Accedi a Console di gestione AWS con un'identità IAM che dispone delle autorizzazioni per utilizzare la console Amazon Bedrock. Quindi, apri la console Amazon Bedrock in https://console.aws.amazon.com/bedrock.
Seleziona Inferenza in batch nel riquadro di navigazione a sinistra.
Nella sezione Processi di inferenza in batch, scegli un processo.
Nella pagina dei dettagli del processo, è possibile visualizzare le informazioni sulla relativa configurazione e monitorarne l’avanzamento visualizzandone lo stato.

API

Per ottenere informazioni su un processo di inferenza in batch, invia una GetModelInvocationJobrichiesta con un endpoint del piano di controllo Amazon Bedrock e fornisci l'ID o l'ARN del lavoro sul campo. jobIdentifier

Per elencare informazioni su più processi di inferenza in batch, invia una ListModelInvocationJobsrichiesta con un endpoint del piano di controllo Amazon Bedrock. È inoltre possibile specificare i parametri opzionali seguenti:

Campo	Breve descrizione
maxResults	Il numero massimo di risultati da restituire nella risposta.
nextToken	Se i risultati sono superiori al numero specificato nel campo `maxResults`, la risposta restituisce un valore `nextToken`. Per visualizzare il batch di risultati successivo, invia il valore `nextToken` in un’altra richiesta.

La risposta per GetModelInvocationJob e ListModelInvocationJobs include un modelInvocationType campo che indica se il processo utilizza il formato InvokeModel o Converse API.

La risposta include anche i seguenti campi che è possibile utilizzare per tenere traccia dell'avanzamento di un processo in esecuzione:

totalRecordCount— Il numero totale di record inviati al processo di inferenza in batch.
processedRecordCount— Il numero di record elaborati finora, che include sia i successi che gli errori.
successRecordCount— Il numero di record elaborati con successo finora.
errorRecordCount— Il numero di record che hanno causato errori durante l'elaborazione.

Per calcolare la percentuale di avanzamento di un processo in esecuzione, dividi processedRecordCount pertotalRecordCount. I contatori 0 vengono visualizzati quando si invia un lavoro ma l'elaborazione non è ancora iniziata. Mentre un lavoro è in corso, i contatori potrebbero subire un ritardo fino a 1 minuto.

Per elencare tutti i tag di un lavoro, invia una ListTagsForResourcerichiesta con un endpoint del piano di controllo Amazon Bedrock e includi l'Amazon Resource Name (ARN) del lavoro.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Creazione di un processo

Arresto di un processo