

# Gestione dei guasti
<a name="failure-management"></a>

****  
 Con il passare del tempo, non sono da escludere eventuali guasti: dai router ai dischi rigidi, dai sistemi operativi alle unità di memoria che danneggiano i pacchetti TCP, nonché errori di natura temporanea o permanente. Questi sono dati scontati, indipendentemente dal fatto che si stia utilizzando hardware di alta qualità o componenti a basso costo, [https://www.allthingsdistributed.com/2016/03/10-lessons-from-10-years-of-aws.html](https://www.allthingsdistributed.com/2016/03/10-lessons-from-10-years-of-aws.html) 

 I guasti dei componenti hardware di basso livello vengono risolti ogni giorno in un data center on-premises. Nel cloud, tuttavia, devi essere protetto dalla maggior parte di questi tipi di guasti. Ad esempio, i volumi Amazon EBS vengono collocati in una zona di disponibilità specifica in cui avviene la loro replica in automatico per proteggerti dai guasti di un singolo componente. Tutti i volumi EBS sono progettati per garantire una disponibilità del 99,999%. Gli oggetti di Amazon S3 vengono archiviati in almeno tre zone di disponibilità, garantendo una durabilità degli oggetti pari al 99,999999999% per un determinato anno. Indipendentemente dal provider di servizi cloud, è possibile che si verifichino guasti che influiscono sul tuo carico di lavoro. Pertanto, occorre adottare misure per implementare la resilienza se è necessario che il tuo carico di lavoro sia affidabile. 

 Un prerequisito per l'applicazione delle linee guida qui discusse è la necessità di accertarsi che le persone incaricate della progettazione, dell'implementazione e della gestione dei tuoi carichi di lavoro, siano consapevoli degli obiettivi aziendali e di affidabilità in modo da conseguirli. Queste persone devono essere informate e addestrate per questi requisiti di affidabilità. 

 Le sezioni seguenti illustrano le best practice per la gestione dei guasti, così da evitarne l'impatto sul tuo carico di lavoro.

**Topics**
+ [Esecuzione del backup dei dati](back-up-data.md)
+ [Utilizzo dell'isolamento dei guasti per proteggere il carico di lavoro](use-fault-isolation-to-protect-your-workload.md)
+ [Progettazione di un carico di lavoro resistente agli errori dei componenti](design-your-workload-to-withstand-component-failures.md)
+ [Test dell'affidabilità](test-reliability.md)
+ [Pianificazione per il disaster recovery (DR)](plan-for-disaster-recovery-dr.md)