Blog

Inside Netsons: come avviene il monitoraggio dei nostri server 1

Inside Netsons: come avviene il monitoraggio dei nostri server

Uno degli elementi più importanti da valutare nella scelta di un hosting provider come Netsons riguarda l’uptime dei propri server che, come vedremo, si riesce a mantenere elevato solo grazie ad una scrupolosa attività di monitoraggio dei sistemi.

L’uptime, convenzionalmente indicato in termini percentuali, è il tempo (su base annua) in cui uno specifico server è attivo e raggiungibile stabilmente sulla rete. Al contrario, invece, il downtime indica il periodo di tempo di irraggiungibilità di uno specifico server.

Il downtime può dipendere da diversi fattori, tra cui un guasto del server o del datacenter, un consumo eccessivo delle risorse o una intrusione nei sistemi e potrebbe portare a disservizi in grado di produrre perdite economiche notevoli per siti ed e-commerce.

Come avviene il monitoraggio dei server Netsons

Per mantenere sempre elevati gli standard dei servizi erogati, fornendo i più alti livelli di uptime presenti sul mercato, Netsons monitora i propri server ogni 60 secondi, 24 ore su 24, 7 giorni su 7, 365 giorni su 365. Lo fa attraverso numerosi strumenti utili a controllare le macchine sia esternamente che internamente.

Una schermata di esempio di pingdom.com

Monitoraggio esterno con Pingdom

Per il fare il monitoring esterno viene usato Pingdom, un software di monitoraggio che, basandosi sull’invio costante di ping diretti ai server, riesce a verificare se questi risultino accessibili o meno agli utenti. Nello specifico, il software verifica la raggiungibilità del server, l’accesso al web (HTTP) e l’accesso al database.

Pingdom, grazie alla sua rete di oltre 100 server localizzati in tutto il mondo, una volta individuato un eventuale down ed essersi accertato che non sia un falso positivo attraverso un secondo controllo, sfrutta un imponente sistema di alert per avvisare gli amministratori di sistema di Netsons.

Nello specifico, ad ogni down i sistemisti vengono avvisati automaticamente tramite la notifica di un’app sul cellulare, tramite SMS e tramite e-mail. Come ulteriore garanzia, in caso di inattività notturna dei server, viene avviata una chiamata automatica diretta ai cellulari dei membri dello staff di turno e del responsabile di reparto. Questo consente ai tecnici Netsons di intervenire immediatamente per risolvere eventuali problematiche.

Monitoraggio interno con Zabbix

Un altro sistema di monitoring utilizzato da Netsons è Zabbix, un software utilizzato per il monitoraggio dello stato dei server, che raccoglie dati riguardanti CPU, memoria, utilizzo del disco e dell’interfaccia di rete di un server.

Mentre Pingdom monitora la raggiungibilità dei server, con Zabbix viene tenuto sotto controllo il contenuto dei server stessi, per consentire agli amministratori di sistema di Netsons di intervenire mantenendo sempre bilanciato il carico delle singole macchine. Anche in questo caso i tecnici vengono avvisati automaticamente ed in tempo reale del verificarsi di situazioni potenzialmente problematiche.

I server vengono monitorati attraverso Zabbix agent, un software installato direttamente nelle singole macchine per verificare le loro prestazioni e raccogliere dati. Una interfaccia grafica centralizzata permette poi di visualizzare le informazioni raccolte tramite una reportistica completa.

Come vengono ripristinati i server

I software utilizzati da Netsons per il monitoraggio sia interno che esterno, dopo aver notificato ogni situazione potenzialmente critica, avvisano una seconda volta al momento del ripristino delle normali condizioni operative.

Sia al verificarsi di un ipotetico down che nel caso di un consumo eccessivo di risorse delle macchine, si attivano automaticamente degli script programmati dagli amministratori di sistema per svolgere delle operazioni automatiche utili a ristabilire una situazione ottimale.

Questi script, controllati e aggiornati quotidianamente, nella stragrande maggioranza dei casi riescono a far tornare automaticamente raggiungibili e bilanciati i server. Nei rari casi in cui le loro operazioni automatiche non risultano sufficienti, dopo aver ricevuto notifica ed aver analizzato la casistica, intervengono direttamente i sistemisti Netsons con operazioni manuali.

Nella maggior parte dei casi, i down sono dettati da un alto load dei server. Si tratta comunque di situazioni molto rare, poiché Netsons rifiuta da sempre qualsiasi politica di overselling. Non vendendo mai risorse delle macchine che non possono essere garantite, i server vengono bilanciati con molta attenzione evitando di raggiungere il limite di carico.

Perché un monitoraggio così scrupoloso

Abbiamo visto come Netsons utilizzi diversi strumenti per il monitoraggio dei propri server. Grazie a software quali Pingdom e Zabbix, la raggiungibilità e il carico dei server viene mantenuto sempre sotto stretto controllo. Per la risoluzione delle casistiche, invece, vengono sfruttati degli script che intervengono automaticamente e, in caso di necessità, anche l’intervento manuale di tecnici professionisti altamente qualificati.

Ad ulteriore garanzia dell’elevatissimo uptime garantito dai servizi Netsons, Pingdom gestisce la pagina pubblica uptime.netsons.com, che fornisce in tempo reale informazioni sull’uptime dei nostri server. Si tratta di dati visualizzabili da chiunque e assolutamente imparziali, sui quali Netsons non può avere alcuna tipologia di influenza.

Fornire un elevato livello di uptime è molto importante per un hosting provider, poiché vuol dire dare la possibilità ai propri clienti di avere un servizio professionale e affidabile. Un sito web irraggiungibile, infatti, scoraggia i visitatori che potrebbero decidere di non acquistare i prodotti o servizi venduti. Allo stesso modo, downtime ripetuti vengono malvisti dai crawler di Google, portando il motore di ricerca a penalizzare l’instabilità della piattaforma con un basso posizionamento tra i risultati di ricerca.