L'interruzione di AWS ci ricorda che il destino di Internet è nelle mani di pochi

L'interruzione di AWS ci ricorda che il destino di Internet è nelle mani di pochi

A quel tempo, gestiamo siti da server personali e aziendali, generalmente situati nelle nostre case e uffici. Con la crescita di Internet, abbiamo costruito server rack, sedi e data center. Tuttavia, nel tempo, aziende e servizi di tutte le dimensioni hanno scaricato i sacrifici dei server su terze parti, o come vengono ora chiamati, servizi cloud.

La logica è solida. Viviamo in case, ma non costruiamo fisicamente le nostre case. L'atto di servire e sviluppare i siti non è essenziale per il servizio che forniscono. Bene, è come se senza server non ci fosse alcun servizio. Ma il server esegue API, script e altri algoritmi e programmi sviluppati dall'azienda per fornire cose come il tuo stream Netflix, i dettagli del tuo account del portafoglio Coinbase o il prossimo potenziale utente di Tinder.

La capacità dei servizi cloud come Amazon Web Services (AWS) e Azure di Microsoft di aumentare (o ridurre, se necessario) rapidamente, se paghi abbastanza, lo rende una soluzione aziendale intelligente per qualsiasi azienda di qualsiasi dimensione. Non si sa mai, ad esempio, quando una piccola impresa diventerà una grande azienda e quando dovrà servire dieci utenti simultanei sul sito di cinquecento.

Questo è l'ovvio vantaggio dei servizi Web basati su cloud. Il rovescio della medaglia è quello che è successo questa settimana con AWS.

Errore AWS

Enormi pezzi di AWS si sono sbriciolati martedì pomeriggio. Il dashboard di AWS Health offre una buona panoramica dell'interruzione di quasi 7 ore. In sottofondo c'era, almeno secondo Amazon, un attacco, hacking o denial of service (DDoS). Erano un paio di API che si comportavano male in un enorme settore dei servizi.

Viviamo tutti nella paura di un attacco DDoS essenziale o di un attacco che violerà questi sistemi (in realtà, qualunque sia il sistema da cui dipendiamo) e li metterà in ginocchio, ma raramente lo fa. Quando Cloudflare è caduto nel duemiladiciannove, è stato inizialmente accettato che si trattasse di un attacco al loro sistema. Tuttavia, abbiamo scoperto rapidamente che si trattava semplicemente di una cattiva implementazione del software, principalmente di un errore umano.

Anche con l'interruzione di AWS contenuta in quella che Amazon chiama la "regione US-EAST-1", l'impatto è stato significativo e diffuso. Questo è stato avvertito su piattaforme rivolte ai consumatori come Disney + e, naturalmente, Amazon.com e alcuni servizi Alexa.

Quando ho pubblicato quello attuale su Twitter, ho apprezzato quante persone stavano praticamente sbattendo la testa in faccia ed esclamando: "Quindi ero fuori!"

Mi è venuto in mente che molti di questi utenti non avevano idea che AWS fosse dietro i loro utenti preferiti e i loro sistemi aziendali. Oltre a questo, assolutamente nessuno ha il numero preciso (a parte Amazon), ma rapporti recenti affermano che AWS serve milioni di persone. Azure di Microsoft riporta anche milioni di utenti e la maggior parte delle cinquecento aziende Fortune. Google Cloud ha grandi nomi come Verizon, NewsCorp e Fb.

Qualcosa deve cambiare?

L'uso diffuso dei servizi cloud non è una cosa negativa, anche se la mancanza di informazioni può portare a confusione e impronte digitali, come ad esempio il ragazzo che non è riuscito a spostare i comandi sul suo sistema e ha ricevuto più messaggi di errore incolpando i suoi sistemi di un distributore esterno . come AWS).

La combinazione dell'ampia portata dei sistemi cloud e della generale mancanza di informazioni e feedback in tempo reale per i clienti del servizio svantaggiati è motivo di preoccupazione. L'entità di un eventuale blackout è sicuramente preoccupante, soprattutto se si considera che il prossimo è inevitabile.

Sono finiti i giorni in cui il rack del server di qualcuno non funzionava e il sito non funzionava. Ora abbiamo piccole interruzioni in grandi sistemi cloud come AWS, Axure e Cloudflare che stanno causando uno tsunami di interruzioni.

Qualcuno su Twitter ha chiesto: "Cosa è successo al ridimensionamento e al bilanciamento del carico?" "Questa è una buona domanda. AWS è costruito su centinaia di cluster di server cloud separati e offre tonnellate di ridondanza, scalabilità e bilanciamento del carico. E ancora, a volte non è sufficiente. I sistemi complessi possono comportarsi in modo anomalo e sono particolarmente fragili per gli aggiornamenti software che possono entrare in collisione con codice obsoleto A causa del fatto che per quanto potenti e distribuiti siano tutti questi servizi cloud, incluso AWS, sono ancora programmati, eseguiti e mantenuti da persone fallibili.

Quindi, come possiamo educare meglio il pubblico e, soprattutto, proteggere AWS, Azure, Cloudflare e altri da questo tipo di errori, che non solo si traducono in siti e servizi inattivi, ma piuttosto nella perdita di milioni di persone? Dollari americani?

Forse è il momento di fare un passo indietro ed esaminare l'integrità e la sicurezza dei sistemi cloud, esattamente nello stesso modo in cui monitoriamo i sistemi idrici. Nessuno di questi è troppo grande per fallire, a quanto pare, ma tutti sono troppo essenziali per essere danneggiati, violati o persi.