La fragilità del cloud

Un piccolo problema dà il via a una serie di eventi in cascata che paralizzano mezzo web: è successo con il servizio cloud AWS di Amazon.

Failed cloudInternet, 28 febbraio 2017: irraggiungibili i siti di Github, Mailchimp, Citrix, Expedia (solo per citare alcuni dei più famosi). A terra anche il servizio cloud di Adobe, oltre alla mail di Yahoo.
Internet sotto scacco? Cyber-attacco? Niente di tutto ciò. Qualcuno ha sbagliato a digitare un comando all’interno del data center di Amazon Web Services (AWS) in Virginia.
Tanto semplice quanto devastante per una miriade di servizi basati sul cloud, incluse una serie di applicazioni domotiche (come i prodotti Nest) che per quattro ore hanno smesso di funzionare.
Per quanto ci si impegni, si trovino soluzioni ridondanti, si eviti l’intervento umano (ebbene sì, la maggior parte dei problemi di solito sono legati all’intervento umano), qualcosa può capitare. Il problema è che quando questo capita, siamo totalmente impreparati ad affrontarne le conseguenze.
Qualcuno può ritenere irrilevante il fatto che la propria e-mail risulti inaccessibile per una manciata di minuti, ma altri basano il proprio business su questi servizi (che non contano solo l’hosting di siti web, ma includono l’elaborazione di dati, la gestione delle informazioni, la teleassistenza di impianti all’altro capo del mondo ecc.). Tra questi anche Comcast (telecomunicazioni), General Electric (produzione energia) e persino la Cia!
Niente panico, però: vista la complessità dell’infrastruttura, la tempistica relativamente breve di soluzione del problema e il tipo di servizi coinvolti, l’accaduto rientra nella possibile casistica di downtime. Questo nonostante ci si impegni per avere una disponibilità prossima al 100%.
Qual è quindi la morale di questa storia? Sicuramente non è quella di tornare indietro di 10 anni, quando il cloud non esisteva (o comunque veniva chiamato in un altro modo) e i servizi basati sulla disponibilità di server esterni erano principalmente solo quelli e-mail.
Occorre prevedere l’imprevedibile, avere un piano B, monitorare con attenzione eventuali anomalie e affidarsi a partner affidabili (come è e rimane Amazon Web Services, al pari di Microsoft Azure e altri simili).
E sperare che nessuno digiti il comando sbagliato all’interno di qualche sala server.

calendar_month

a cura di Maria Bonaria Mereu