Ecco perché il tuo Microsoft Office ha smesso di funzionare questa settimana

Ecco perché il tuo Microsoft Office ha smesso di funzionare questa settimana

Microsoft ha rivelato alcuni dettagli su ciò che ritiene abbia causato la recente interruzione globale di Office 365 e di alcune delle sue altre piattaforme. Gli utenti sono rimasti indietro dopo l'interruzione di Office 365 in tutto il mondo e anche altri servizi come Microsoft Teams, Office.com, Power Platform e Dynamics365 sono stati interessati. Secondo Microsoft, l'interruzione è stata causata da una distribuzione fallita di un aggiornamento del servizio Azure AD.

Fallimento dell'ufficio

Un rapporto preliminare dell'azienda ha rilevato che l'aggiornamento è stato rilasciato troppo presto, in quanto non ha seguito il consueto regime di test dell'azienda. Ciò comportava in genere lo spostamento attraverso cinque "anelli" prima del rilascio, consentendo a Microsoft di testare qualsiasi modifica o aggiornamento con un gruppo definito di tester controllati. Questa volta, tuttavia, un bug nel Secure Deployment Process (SDP) di Microsoft ha causato la distribuzione dell'aggiornamento a tutti gli anelli anziché al primo anello di test corretto. "Azure AD è progettato per essere un servizio distribuito geograficamente distribuito in una configurazione attivo-attivo multi-partizione in più data center in tutto il mondo, costruito con limiti di isolamento", ha affermato Microsoft nel suo rapporto post-preliminare. incidente. In genere, le modifiche mirano inizialmente a un anello di convalida che non contiene dati sui clienti, seguito da un anello interno contenente solo utenti Microsoft e infine il nostro ambiente di produzione. Queste modifiche vengono implementate in fasi su cinque anelli in più giorni. "In questo caso, il sistema SDP non è riuscito a indirizzare correttamente l'anello di test di convalida a causa di un difetto latente che ha influito sulla capacità del sistema di interpretare i metadati di implementazione. Pertanto, tutti gli anelli sono stati attaccati contemporaneamente. L'errore di implementazione errata ha comportato una minore disponibilità del servizio. In seguito al rilascio imprevisto, Microsoft afferma di aver tentato di eseguire il rollback "pochi minuti dopo l'impatto" utilizzando i suoi sistemi di ripristino automatico che normalmente avrebbero limitato la durata e la gravità dell'impatto. "Tuttavia, il difetto nascosto nel nostro sistema SDP aveva danneggiato il metadati di distribuzione e abbiamo dovuto ricorrere a processi di ripristino manuale. Ciò ha notevolmente esteso il tempo necessario per mitigare il problema", afferma il rapporto dell'azienda, spiegando perché il problema ha interessato gli utenti di tutto il mondo. Gli utenti che avevano già effettuato l'accesso a Office 365 o a uno degli altri servizi non sono stati interessati. Via BleepingComputer