Chiara Rossi

Aggiungi Startmag.it

alle tue fonti preferite su Google

Google down, ecco i 2 errori. Parla il prof. Colajanni

Conversazione di Start con Michele Colajanni, professore di Sicurezza informatica all'Università di Modena e Reggio Emilia, sul down di Google

16 Dicembre 2020 08:05

Chiara Rossi

Aggiungi Startmag.it

alle tue fonti preferite su Google

Google ha liquidato il crash planetario di tutti i servizi (da YouTube al Drive fino a Gmail e Meet) avvenuto lunedì tra le 12.55 e le 13.50 italiane con un problema di “memoria insufficiente”.

Nonostante sia durata appena 50 minuti, qualsiasi interruzione diffusa dei servizi Google principali ha un impatto su centinaia di milioni di utenti.

Dopo aver ripristinato i servizi, il colosso di Mountain View non ha pubblicato i dettagli preliminari sulla causa dell’interruzione globale di lunedì. Con un scarno tweet, Google ha spiegato che la causa principale era un problema nel sistema di gestione delle quote di archiviazione automatizzato di Google, che a sua volta riduceva la capacità del sistema di autenticazione.

Start ne ha parlato con Michele Colajanni, professore di Sicurezza informatica presso il Dipartimento di Ingegneria “Enzo Ferrari” dell’Università di Modena e Reggio Emilia.

PROBLEMI CON LE QUOTE DI ARCHIVIZIAZIONE… MA BIG NON HA PROBLEMI DI MEMORIA

“Quello che hanno percepito gli utenti è il non funzionamento di tutti i servizi che richiedevano autenticazione. I servizi che si possono usare anche senza autenticazione (compreso il motore di ricerca ma anche alcuni servizi di YouTube) continuavano a funzionare. Quindi, il problema è stato il sistema di autenticazione e di autorizzazione. La motivazione fornita da Google è stata molto scarna: insufficienti risorse di memoria. Riferita a un colosso mondiale come Google, è come dire insufficienti risorse d’acqua in un lago”, è l’opinione dell’esperto cyber Colajanni.

La società ha comunicato infatti che il nocciolo del problema, ora etichettato come “Google Cloud Infrastructure Components incidente 20013”, era la capacità ridotta del sistema centrale di gestione delle identità di Google, bloccando qualsiasi servizio che richiedesse agli utenti di accedere.

“Google non ha problemi di memoria. È un’organizzazione di architetti, ingegneri e sistemisti informatici estremamente competenti che sono assolutamente in grado di progettare e realizzare architetture con caratteristiche di affidabilità Five Nine. Ovvero un livello di affidabilità e continuità del servizio del 99,999% (in pratica 5 minuti all’anno di disservizio) e in alcune aree sono già al Six Nine, che in termini informatici corrisponde all’always on, qualunque cosa succeda, terremoti, incendi e uragani inclusi. Visto che l’architettura è nata per essere massimamente resiliente, significa che c’è stato un altro tipo di problema”, sottolinea il professore: “Se simili architetture hanno subito un’interruzione di servizio di un’ora, è probabile che vi siano stati almeno un paio di eventi concomitanti”.

PERCHÉ NON SI TRATTA DI UN ATTACCO HACKER

Da quel che è noto finora, Colajanni esclude l’opzione di attacco cibernetico ai danni di Google.

“Sono sempre più portato a escludere l’attacco informatico. È come attaccare il caveau di una grande banca. Non è che non ci abbiano mai provato, ma gli attaccanti ragionano in termini di ritorno dell’investimento. Per mettere in campo un attacco simile devi investire ingenti risorse e devi avere una forte motivazione; senza guadagno economico o di visibilità, non c’è interesse. Alcuni hanno ipotizzato che possa essersi trattato di un attacco di negazione del servizio (Denial of Service), ma non lo ritengo credibile. Un simile attacco che riesce a mettere in ginocchio Google sarebbe rilevato da uno o più Internet Service Provider che avrebbero notato anomalie di traffico in alcune aree geografiche. Nel caso di lunedì, una simile anomalia non è stata rilevata né riportata da alcuno, almeno sino ad ora”.

NON COLLEGATO AGLI ATTACCHI CIBERNETICI AL GOVERNO USA

Nessun collegamento nemmeno con l’attacco hacker subito nei giorni scorsi dai rami dell’amministrazione Usa, tra cui i dipartimenti del Tesoro e del Commercio e l’Fbi. I pirati informatici, che la Casa Bianca ritiene legati al Cremlino, hanno rubato informazioni dalla posta elettronica delle agenzie federali attraverso una falla nella piattaforma Orion di SolarWinds, utilizzata per la gestione e il monitoraggio delle reti da circa 275 mila organizzazioni in tutto il mondo.

“Sono due eventi completamente indipendenti – dice il professore, uno dei massimi esperti in Italia di sicurezza informatica – L’attacco al Tesoro degli Stati Uniti e alle agenzie federali statunitensi è qualcosa che è iniziato a marzo 2020 se non prima. La coincidenza della scoperta e comunicazione dell’attacco nel primo caso e dell’evento di Google è appunto una coincidenza, ma sono eventi indipendenti. Tra l’altro l’attacco alle reti governative ha riguardato un prodotto della società Solarwinds che non c’entra nulla con Google che utilizza i propri sistemi di monitoraggio”.

IL DOWN DI GOOGLE CAUSATO DA UN ERRORE TECNICO UMANO

“Se usiamo un approccio da rasoio di Occam, la causa più probabile è l’errore umano, magari in concomitanza con qualche guasto o incidente che non è stato gestito correttamente – aggiunge il professor Colajanni – Che sia stato solo un problema di cattiva configurazione è sempre possibile, ma lo ritengo poco probabile. Un guasto o malfunzionamento (errore 1) combinato a un errore nella sua gestione (errore 2) è la mia ipotesi più probabile, ed è questo che intendevo per combinazione di eventi”.

LA QUESTIONE DELL’ARCHITETTURA STESSA DI GOOGLE

Infine, sottolinea Colajanni, “teniamo presente che Google utilizza un’architettura Zero Trust che, per il presente e prossimo futuro, ritengo sia l’unico approccio corretto per garantire la sicurezza di sistemi informatici che, tra smart work, dispositivi mobili e servizi esternalizzati su cloud, non hanno più alcun perimetro né la possibilità di recuperarlo. È la soluzione migliore, in quanto richiede un’autenticazione continua di tutte le persone e di tutti i dispositivi indipendentemente da dove si trovino. Tuttavia, introduce una forte componente di stress sul sistema di Autenticazione e Autorizzazione tale da poter risultare un collo di bottiglia e un conseguente punto di rottura nel caso di un picco di richieste. Non che gli ingegneri di Google non sapessero o non avessero provveduto, ma è senza dubbio una delle componenti architetturali che definirei più innovative e sperimentali anche se al loro interno utilizzano questo approccio da tanti anni. In un sistema simile sotto stress, anche un piccolo errore di configurazione potrebbe causare danni quali quelli cui abbiamo assistito. La consideri una mera ipotesi formulata dall’esterno senza alcuna informazione aggiuntiva oltre allo scarno tweet. Se così fosse, tutta la comunità informatica potrebbe imparare a comprendere e gestire al meglio le soluzioni Zero Trust, una volta che Google vorrà condividere la lezione appresa dall’incidente”.

Per saperne di più non resta che attendere il resoconto di Google stesso. Il colosso tecnologico intende infatti pubblicare un’analisi di questo incidente una volta che avrà completato la sua indagine interna.