

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Come funziona Bedrock Data Automation


Bedrock Data Automation (BDA) consente di configurare l’output in base alle esigenze di elaborazione per un tipo di dati specifico: documenti, immagini, video o audio. BDA può generare output standard o output personalizzati. Di seguito sono riportati alcuni concetti chiave per comprendere come funziona BDA. Ai nuovi utenti si consiglia di iniziare con le informazioni sull’output standard.
+ Output standard: l’invio di un file a BDA senza altre informazioni restituisce l’output standard predefinito, che consiste nelle informazioni comunemente richieste in base al tipo di dati, ad esempio trascrizioni audio, riepiloghi delle scene per video e riepiloghi dei documenti. Questi output possono essere adattati al caso d’uso utilizzando progetti per modificarli. Per ulteriori informazioni, consulta [Output standard in Bedrock Data Automation](bda-standard-output.md).
+ Output personalizzato: solo per documenti, audio e immagini. Scegliere un output personalizzato per definire esattamente quali informazioni estrarre utilizzando un blueprint. Un blueprint è costituito da un elenco di campi previsti da recuperare da un file. Ogni campo rappresenta un’informazione che deve essere estratta per soddisfare il caso d’uso specifico. È possibile creare blueprint personalizzati o selezionare blueprint predefiniti dal catalogo dei blueprint di BDA. Per ulteriori informazioni, consulta [Output e blueprint personalizzati](bda-custom-output-idp.md).
+ Progetti: un progetto è una risorsa di BDA che consente di modificare e organizzare le configurazioni dell’output. Ogni progetto può contenere configurazioni dell’output standard per documenti, immagini, video e audio, nonché blueprint dell’output personalizzato per documenti, audio e immagini. La chiamata API `InvokeDataAutomationAsync` fa riferimento ai progetti per istruire BDA su come elaborare i file. Per ulteriori informazioni sui progetti e sui loro casi d’uso, consultare [Progetti di Bedrock Data Automation](bda-projects.md).

# Progetti di Bedrock Data Automation


Un modo per elaborare i file utilizzando Amazon Bedrock Data Automation (BDA) consiste nel creare un progetto. Un progetto è un raggruppamento di configurazioni di output standard e personalizzate. Gli output standard sono obbligatori nei progetti, mentre quelli personalizzati sono facoltativi. Quando viene chiamata l’API `InvokeDataAutomationAsync` con un ARN di progetto, il file viene elaborato automaticamente utilizzando le impostazioni di configurazione definite in quel progetto. L’output viene quindi generato in base alla configurazione del progetto.

A un progetto può essere assegnata una fase, `LIVE` o `DEVELOPMENT`. Ogni fase è una versione unica e mutevole del progetto. Ciò significa che è possibile modificare o testare la fase `DEVELOPMENT` ed elaborare le richieste dei clienti utilizzando la fase `LIVE`. Non è possibile accedere ai progetti `DEVELOPMENT` nella console ed è necessario modificarli e invocarli tramite l’API.

Un progetto consente di utilizzare una singola risorsa per più tipi di file. Ad esempio, un file audio inviato a BDA utilizzando il nome di progetto ABC verrà elaborato utilizzando la configurazione dell’output standard audio per il progetto ABC. Un documento inviato a BDA utilizzando il nome di progetto ABC verrà elaborato utilizzando la configurazione dell’output standard del documento per il progetto ABC.

I progetti garantiscono una maggiore flessibilità nella configurazione degli output standard. Ogni output standard ha il proprio set di opzioni configurabili, come trascrizioni o riepiloghi, e i progetti consentono di modificare tali opzioni per adattarle meglio al proprio caso d’uso. È possibile anche configurare un progetto con i blueprint per documenti, audio e immagini per definire un output personalizzato. Un progetto configurato per generare un output personalizzato genererà automaticamente anche un output standard.

Nelle sezioni seguenti vengono illustrati alcuni esempi di utilizzo dei progetti.

## Utilizzo di progetti con output standard


Consideriamo un caso d’uso in cui si vuole solo a estrarre i riepiloghi delle trascrizioni dei file audio e video completi. Per impostazione predefinita, quando i file audio e video vengono inviati a BDA, si ricevono i riepiloghi delle trascrizioni insieme a trascrizioni complete, riepiloghi a livello di scena, testo rilevato e altre informazioni. In questo caso d’uso, non è consigliabile dedicare tempo e risorse aggiuntivi alla raccolta di informazioni non necessarie. In questo caso d’uso, è possibile configurare un progetto di output standard per abilitare solo la funzionalità di riepilogo per i file audio e video.

A tale scopo, utilizzando l’API o la console, è possibile creare un progetto e modificare le impostazioni di output standard per audio e video. Per i video, abilitare il **riepilogo completo del video**, ma assicurarsi che le altre estrazioni (ad esempio, Trascrizione audio completa, Riepiloghi delle scene, Moderazione dei contenuti, ecc.) siano disabilitate. Ripetere questa configurazione per l’audio. Dopo aver configurato il progetto per generare solo riepiloghi, salvare il progetto e annotare i nomi delle risorse Amazon (ARN) del progetto. L’ARN può essere utilizzato per l’operazione `InvokeDataAutomationAsync` per elaborare i file su larga scala. Inviando un file audio o video a BDA e specificando l’ARN di questo progetto, come output si riceveranno solo i riepiloghi per ciascuno dei file. Notare che in questo esempio non è stata eseguita alcuna configurazione per documenti o immagini. Ciò significa che se si invia un’immagine o un documento a BDA utilizzando l’ARN del progetto, si riceverà l’output standard predefinito per tali file.

## Utilizzo di progetti con output personalizzato e output standard


In questo caso d’uso, supponiamo di voler generare riepiloghi di output standard per documenti e file audio e di estrarre anche campi personalizzati dai documenti. Dopo aver creato un progetto, configurare l’output standard per l’audio per abilitare il **Riepilogo audio completo** e assicurarsi che non siano abilitate altre estrazioni. Ripetere questa configurazione di output standard per i documenti. È quindi possibile configurare l’output personalizzato per i documenti aggiungendo un nuovo blueprint o un blueprint preesistente nel catalogo globale di BDA. I documenti inviati a BDA utilizzando l’ARN del progetto genereranno l’output standard, i riepiloghi completi dei documenti e l’output del blueprint per i campi personalizzati definiti. I file audio inviati a BDA utilizzando l’ARN del progetto genereranno riepiloghi completi.

Durante l’elaborazione dei documenti, potrebbe essere necessario utilizzare più blueprint per diversi tipi di documenti inviati al progetto. A un progetto possono essere associati fino a 40 blueprint di documenti. BDA abbina automaticamente i documenti al blueprint appropriato configurato nel progetto e genera un output personalizzato utilizzando tale progetto. Inoltre, potrebbe essere necessario inviare i documenti in blocco. Se viene inviato un file contenente più documenti, è possibile scegliere di dividere il documento durante la creazione del progetto. In tal caso, BDA scansiona il file e lo divide in singoli documenti in base al contesto. Poi i singoli documenti vengono abbinati al blueprint corretto per l’elaborazione.

Attualmente, le immagini supportano solo una definizione di blueprint per progetto. I tipi di file di immagine JPG e PNG potrebbero essere trattati come immagini o come documenti scansionati in base al loro contenuto. Si consiglia di creare un blueprint personalizzato per le immagini quando si elabora l’output personalizzato per i documenti, in modo che BDA fornisca l’output desiderato per i file di immagine che contengono testo.

Anche i file audio supportano solo una definizione di blueprint per progetto.

# Dividere i documenti durante l’utilizzo dei progetti


Amazon Bedrock Data Automation (BDA) supporta la suddivisione dei documenti quando si utilizza l' Amazon Bedrock API. Se abilitata, la suddivisione consente a BDA di prendere un PDF contenente più documenti logici e dividerlo in documenti separati per l’elaborazione. 

Una volta completata la suddivisione, ogni segmento del documento diviso viene elaborato in modo indipendente. Ciò significa che un documento di input può contenere diversi tipi di documenti. Ad esempio, se disponi di un PDF contenente 3 estratti conto bancari e un documento W2, la suddivisione tenterà di dividerlo in 4 documenti separati da elaborare singolarmente.

La suddivisione automatica BDA supporta file con un massimo di 3.000 pagine e singoli documenti fino a 20 pagine ciascuno.

L’opzione per dividere i documenti è disattivata per impostazione predefinita, ma può essere attivata durante l’utilizzo dell’API. Di seguito, è riportato un esempio di creazione di un progetto con la suddivisione abilitata. Le ellissi rappresentano i blueprint aggiuntivi forniti al progetto.

```
   response = client.create_data_automation_project(
    projectName=project_name,
    projectDescription="Provide a project description",
    projectStage='LIVE',
    standardOutputConfiguration=output_config,
    customOutputConfiguration={
    'blueprints': [
        {
        'blueprintArn': Blueprint ARN,
        'blueprintStage': 'LIVE'
        },
        ...
        ]
        },
         overrideConfiguration={'document': {'splitter': {'state': 'ENABLED'}}}
)
```

La parte che abilita il processo di suddivisione è la riga overrideConfiguration. Questa riga configura la suddivisione e consente di passare più documenti all’interno dello stesso file.

I documenti vengono suddivisi in base ai limiti semantici relativi. 

La suddivisione dei documenti avviene indipendentemente dall’applicazione dei blueprint e i documenti suddivisi verranno abbinati al blueprint più vicino. Per ulteriori informazioni su come BDA fa corrispondere i blueprint, consulta [Informazioni sulla corrispondenza dei blueprint](#bda-blueprint-matching).

## Informazioni sulla corrispondenza dei blueprint


La corrispondenza dei blueprint si basa sui seguenti elementi:
+  Nome del blueprint 
+  Descrizione del blueprint 
+  Campi del blueprint 

Durante l’elaborazione dei documenti, puoi fornire più blueprint con cui effettuare la corrispondenza. Ciò consente di elaborare diversi tipi di documenti con i blueprint appropriati. È possibile fornire più blueprint IDs quando si richiama l'API di automazione dei dati e BDA tenterà di abbinare ogni documento al blueprint più adatto. Ciò consente l’elaborazione di tipi di documenti misti in un singolo batch. Tale procedura risulta utile quando si prevede che i documenti siano di diversi tipi (ad esempio estratti conto bancari, fatture, passaporti).

Se ti occorrono blueprint separati perché i formati dei documenti sono molto diversi o richiedono prompt specializzati, la creazione di un blueprint per tipo di documento può aiutarti a trovare la corrispondenza. Per ulteriori informazioni sulla creazione di blueprint utili, consulta [Best practice per la creazione di blueprint](#bda-blueprint-best-practices).

## Best practice per la creazione di blueprint


 Per sfruttare al massimo i blueprint, attieniti alle best practice seguenti: 
+ Per facilitare la corrispondenza, occorre essere espliciti e dettagliati nei nomi e nelle descrizioni dei blueprint 
+ La fornitura di più blueprint pertinenti consente a BDA di selezionare la soluzione migliore. Crea blueprint separati per formati di documenti significativamente diversi 
+ Prendi in considerazione la possibilità di creare progetti specializzati per ogni vendor/document fonte, se hai bisogno della massima precisione
+ Non includere due blueprint dello stesso tipo in un progetto (ad esempio due blueprint W2). Le informazioni contenute nel documento stesso e nel blueprint vengono utilizzate per elaborare i documenti e l’inclusione di più blueprint dello stesso tipo in un progetto comporterà prestazioni peggiori. 

Sfruttando la suddivisione dei documenti e la corrispondenza di più blueprint, BDA è in grado di gestire in modo più flessibile diversi set di documenti, applicando al contempo la logica di estrazione più appropriata a ciascuno.

# Disabilitazione delle modalità e dei tipi di file di routing


Per impostazione predefinita, i progetti in BDA elaborano i tipi di file supportati, ordinandoli in diverse modalità semantiche. Durante la creazione o la modifica del progetto, puoi scegliere quali modalità verranno elaborate e quali tipi di file verranno inviati a ciascuna modalità. In questa sezione esamineremo l’abilitazione e la disabilitazione di diverse modalità, il routing dei file a modalità specifiche e la procedura di routing predefinita per BDA.

## Disabilitazione dell’elaborazione delle modalità


Quando crei un progetto, potresti avere in mente un caso d’uso che non include l’elaborazione di tutti i tipi di file. Potresti, ad esempio, voler elaborare solo documenti e file audio. In tal caso, non si desidera che BDA invii un file JPEG da elaborare come immagine o come video. MP4 L’abilitazione delle modalità consente di disattivare determinate modalità in un progetto, selezionando le risposte derivanti dall’elaborazione di BDA.

**Disabilitazione delle modalità con la console BDA**  
Quando si utilizza la console BDA, l’abilitazione delle modalità viene gestita da un elenco di controllo, in cui è sufficiente selezionare o deselezionare ciascuna modalità durante la modifica o la creazione del progetto. Queste opzioni si trovano nella scheda Impostazioni avanzate. È necessario selezionare almeno una modalità per un progetto.

![\[Modality enablement options with checkboxes for document, image, video, and audio.\]](http://docs.aws.amazon.com/it_it/bedrock/latest/userguide/images/bda/modalityenableconsole.png)


**Disabilitazione delle modalità con l’API BDA**  
Quando si utilizza l’API BDA, l’abilitazione delle modalità viene gestita dall’elemento della richiesta `overrideConfiguration`, all’interno dell’operazione `CreateDataAutomation`. Ogni modalità ha una sezione associata in cui è possibile dichiarare la modalità `ENABLED` o `DISABLED`. Di seguito è riportato un esempio dell’elemento `overrideConfiguration` in cui sono abilitate solo le modalità documento e audio. L'impostazione predefinita del flag `modalityProcessing` è `ENABLED`.

```
"overrideConfiguration" : {
    "document": {
        "splitter": {
            "state": ENABLED
        },
        "modalityProcessing": {
            "state": ENABLED
        },
    },
    "image": {
        "modalityProcessing": {
            "state": DISABLED
        }
    },
    "video": {
        "modalityProcessing": {
            "state": DISABLED 
        }
    },
    "audio": {
        "modalityProcessing": {
            "state": ENABLED
        }
    },
    ...
}
```

I tre puntini alla fine di questa sezione indicano la rimozione dell’elemento `modalityRouting`, di cui parleremo più approfonditamente nella prossima sezione.

## Routing dei file a determinati tipi di elaborazione


Alcuni tipi di file possono essere instradati a modalità diverse, in base a una serie di fattori. Con il routing di modalità è possibile impostare determinati tipi di file in modo che vengano instradati manualmente verso determinate modalità di elaborazione. JPEGs e PNGs possono essere indirizzati all'elaborazione di documenti o immagini. MP4s e MOVs possono essere indirizzati all'elaborazione video o audio.

**Routing con la console BDA**  
Nella scheda Impostazioni avanzate, quando si crea o si modifica un blueprint, è possibile scegliere di aggiungere una nuova modalità di routing manuale. In questo modo è possibile selezionare uno dei 4 tipi di file disponibili e quindi la modalità di elaborazione a cui verranno instradati. Di seguito è riportata una screenshot della console, con una modalità di routing manuale che invia i file PNG alla modalità di elaborazione dei documenti.

**Nota**  
Le impostazioni per i file JPEG si applicano sia ai file “.jpeg” che “.jpg”. Le impostazioni per MP4 le impostazioni si applicano a entrambi i file «.mp4" «.m4v».

![\[Immagine della Console AWS che mostra due menu a discesa denominati Tipo di file e Instradamento manuale delle modalità, selezionati come PNG e Documento.\]](http://docs.aws.amazon.com/it_it/bedrock/latest/userguide/images/bda/manualrouting.png)


**Routing con l’API BDA**  
Analogamente all’abilitazione delle modalità, il routing alle modalità viene gestito tramite l’elemento della richiesta `overrideConfiguration`. Di seguito è riportato un esempio della parte `modalityRouting` di `overrideConfiguration`. Questo esempio presuppone che tutte le modalità siano abilitate e indirizza i file JPEG e PNG alla modalità documento e i file MOV alla modalità audio. MP4 

```
...
   "modalityRouting": {
        "jpeg": DOCUMENT, 
        "png": DOCUMENT,  
        "mp4": AUDIO,     
        "mov": AUDIO      
    }
}
```

I puntini di sospensione all’inizio dell’esempio indicano la rimozione della parte restante di `overrideConfiguration`, argomento trattato più approfonditamente nella sezione sull’abilitazione delle modalità e sulla funzionalità di suddivisione dei documenti.

## Routing standard per l'API InvokeDataAutomationAsync


Senza configurare procedure di routing personalizzate, BDA utilizza un set standard di procedure basate sul tipo di file per determinare a quale modalità instradare il contenuto. Le procedure predefinite sono elencate nella tabella seguente.

PNGs ed JPEGs elenca Semantic Classifer come comportamento predefinito. Ciò significa che BDA valuterà, tramite modelli interni, gli indicatori che determinano se un file inviato è un’immagine o un documento e gestirà il routing in modo automatico.


| Tipi di file | Comportamento di routing predefinito | 
| --- | --- | 
|  PNG  |  Classificatore semantico; immagine o documento  | 
|  JPEG  |  Classificatore semantico; immagine o documento  | 
|  PDF, TIFF  |  Documento  | 
|  MP4, MOV  |  Video  | 
|  AMR, FLAC, M4A, OGG, WEBM MP3, WAV  |  Audio  | 

## Routing standard per l'API InvokeDataAutomation


L'[InvokeDataAutomation](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_data-automation-runtime_InvokeDataAutomation.html)API esaminerà anche gli indicatori del fatto che un file PNG o JPEG inviato sia o meno un'immagine o un documento utilizzando modelli interni ed eseguirà il routing automaticamente. Le procedure predefinite sono elencate nella tabella seguente.

PNGs ed JPEGs elenca Semantic Classifier come comportamento predefinito. Ciò significa che BDA valuterà, tramite modelli interni, gli indicatori che determinano se un file inviato è un’immagine o un documento e gestirà il routing in modo automatico. I file PDF e TIFF verranno indirizzati alla modalità Documents per l'elaborazione. InvokeDataAutomation Al momento l'API non supporta file audio e video.


| Tipi di file | Comportamento di routing predefinito | 
| --- | --- | 
|  PNG  |  Classificatore semantico; immagine o documento  | 
|  JPEG  |  Classificatore semantico; immagine o documento  | 
|  PDF, TIFF  |  Documento  | 