Passa a contenuti principali
Microsoft 365
Abbonati

Servizi cloud affidabili: disponibilità di Office 365

L’idea di base di Microsoft Office 365 è di offrire un ufficio completo nel cloud. Anche se siamo orgogliosi del miliardo di persone che usano Office, riconosciamo di avere una grande responsabilità nel soddisfare e superare ogni giorno le aspettative dei clienti. Le app di produttività sono senza subbio cruciali, perché sono quelle che consentono di completare il lavoro. È fondamentale per noi assicurarci che il nostro servizio sia affidabile e attendibile mentre continuiamo ad aggiungere nuove funzionalità a Office 365. Il nostro metro di riferimento in questo contesto è la disponibilità del servizio.

Disponibilità di Office 365

Da quando abbiamo lanciato Office 365 due anni fa, abbiamo continuato a investire nella nostra infrastruttura per assicurare l’elevata disponibilità del servizio.  Oggi abbiamo deciso di rendere disponibili per tutti i clienti che valutano se acquisire Office 365 le stesse informazioni dettagliate che forniamo agli attuali clienti.   Per misurare la disponibilità, calcoliamo il numero di minuti in cui il servizio Office 365 è disponibile in un mese di calendario come percentuale del numero totale di minuti nello stesso mese.  Questa misura della disponibilità corrisponde al tempo di operatività. In questo calcolo includiamo i servizi per le aziende, per gli enti pubblici e per l’istruzione. La percentuale di operatività a livello mondiale per Office 365 negli ultimi quattro trimestri a partire da luglio 2012 fino a giugno 2013 è stata rispettivamente del 99,98%, 99,97%, 99,94% e 99,97%.  In futuro riveleremo queste percentuali ogni trimestre nel Centro protezione di Office 365.

Ecco alcuni dettagli in più sulla percentuale del tempo di operatività:

  1. Il valore sul tempo di operatività include Exchange, SharePoint, Lync e Office Web Apps, ponderato in base al numero di persone che usano ognuno di questi servizi. I clienti usano questi servizi contemporaneamente, quindi vengono considerati tutti per il calcolo del tempo di operatività.
  2. Questo valore si applica a Office 365 per le aziende, per l’istruzione e per gli enti pubblici. Nel calcolo non sono inclusi i servizi per utenti privati.
  3. Office 365 ProPlus è parte integrante della nostra offerta di servizi ma non viene incluso in questo calcolo perché viene eseguito prevalentemente nei dispositivi degli utenti.
  4. I singoli clienti possono riscontrare percentuali del tempo di operatività più alte o più basse rispetto ai numeri globali in base alla località e ai modelli di utilizzo.

Nell’ambito del nostro impegno a offrire un servizio ad alta disponibilità, abbiamo un contratto di servizio del 99,9% di operatività con copertura finanziaria.

Principi di progettazione per la disponibilità

Microsoft soluzioni di livello enterprise da diversi decenni. Inoltre, gestiamo numerosi servizi cloud come Office 365, Windows Azure, CRM Online, Outlook.com, SkyDrive, Bing, Skype e Xbox Live, solo per citarne alcuni. Questa diversità di servizi ci offre diversi vantaggi, con la possibilità di sfruttare le best practice di un servizio in tutti gli altri per migliorare la progettazione del software e i processi operativi.

Ecco alcuni esempi di best practice applicate nei processi di progettazione e operazioni per Office 365.

Ridondanza. Ridondanza a livello fisico, dei dati e funzionale:

  • La ridondanza è integrata a livello di disco/scheda all’interno dei server, a livello di server all’interno di un data center e a livello di servizio nel diversi data center geograficamente distribuiti per proteggere dai guasti. Ogni data center include ridondanza a livello di struttura e di alimentazione. In ogni area geografica ci sono diversi data center.
  • Per offrire ridondanza a livello dei dati, replichiamo continuamente i dati tra diversi data center geograficamente distribuiti. Il nostro obiettivo a livello di progettazione è mantenere più copie dei dati, sia in transito che in archivio, con funzionalità di failover per assicurare il ripristino rapido.
  • Oltre alla ridondanza fisica e dei dati, uno dei nostri punti di forza è che sviluppiamo i client Office per offrire ridondanza funzionale, in modo da assicurare la produttività degli utenti tramite funzionalità offline in assenza di connettività di rete.

Resilienza. Bilanciamento del carico attivo e test di ripristino tra domini di errore:

  • Implementiamo attivamente il bilanciamento del carico per offrire agli utenti le migliori esperienze possibili in maniera automatizzata. Questi meccanismi assegnano inoltre dinamicamente le priorità, eseguendo le attività a bassa priorità durante i periodi con carico ridotto e rinviandole in caso di carico elevato.
  • Abbiamo funzionalità di failover automatizzate e manuali per assicurare l’integrità delle risorse in caso di errori hardware o software e il monitoraggio degli avvisi.
  • Eseguiamo regolarmente interventi di ripristino nei domini di errore per assicurare una risposta immediata se le circostanze richiedono failover.

Servizi distribuiti. Servizi dei componenti funzionalmente distribuiti:

  • I servizi dei componenti di Office 365, come Exchange, SharePoint, Lync e Office Web Apps, sono funzionalmente distribuiti, assicurando che l’ambito e l’impatto degli errori che si verificano in un’area siano limitati solo a quell’area e non interessino le altre.
  • Replichiamo i dati della directory tra questi servizi dei componenti in modo che se si verifica un problema in un servizio gli utenti siano in grado di accedere e usarne altri senza problemi.
  • I nostri team addetti alle operazioni e alla distribuzione possono sfruttare il fatto che i servizi siano distribuiti per semplificare tutti gli aspetti di manutenzione e distribuzione, diagnostica, correzione e ripristino.

Monitoraggio. Strumenti completi di monitoraggio, ripristino e diagnostica:

  • I nostri sistemi interni monitorano continuamente il servizio per rilevare eventuali errori e sono progettati per attivare interventi automatizzati di ripristino.
  • I sistemi analizzano eventuali deviazioni nel comportamento del servizio per avvisare i tecnici in modo che possano intraprendere misure proattive.
  • Abbiamo anche sistemi di monitoraggio esterni, eseguiti costantemente da più sedi di tutto il mondo tramite servizi affidabili di terze parti (per la verifica indipendente del contratto di servizio) e i nostri data center mondiali per l’invio di avvisi.
  • Per la diagnostica, abbiamo sistemi completi di registrazione, controllo e traccia. Il monitoraggio e la traccia a livello capillare ci consentono di isolare i problemi alla causa radice.

Semplificazione. Complessità ridotta per la prevedibilità:

  • Usiamo sempre componenti standard laddove possibile. In questo modo possiamo ridurre la complessità associata alla distribuzione e all’isolamento dei problemi, oltre a prevedere errori e ripristini.
  • Usiamo sempre processi standard laddove possibile. L’obiettivo non è solo garantire automazione, ma anche fare in modo che i processi cruciali siano ripetuti e ripetibili.
  • Abbiamo progettato i componenti software in modo che siano poco accoppiati e che quindi la distribuzione e l’integrità non richiedano un’orchestrazione complessa.
  • La gestione del cambiamento che implementiamo si basa su anelli di ambito e convalida instrumentati, progressivi e in fasi prima della distribuzione a livello mondiale.

Backup di risorse umane. Supporto disponibile 24 ore su 24, 7 giorni su 7:

  • Oltre agli interventi di ripristino automatizzati, laddove possibile, abbiamo anche un team di professionisti del supporto disponibili 24 ore su 24, 7 giorni su 7. Questo team include tecnici del supporto, sviluppatori di prodotti, program manager, product manager e alti dirigenti.
  • Con l’intero team in servizio, abbiamo la possibilità di fornire risposte rapide e di raccogliere tutte le informazioni necessarie per la risoluzione dei problemi.
  • I nostri professionisti, oltre a fornire backup, migliorano anche i sistemi automatizzati ogni volta che ricevono una richiesta di assistenza.

Raccolta continua di informazioni

Sappiamo bene che prima o poi possono verificarsi interruzioni del servizio. Ogni volta che si verifica un incidente, eseguiamo una revisione completa post-incidente, indipendentemente dall’entità dell’impatto. La revisione consiste nell’analisi del problema che si è verificato, di come abbiamo risposto e di come possiamo prevenire incidenti simili in futuro. Nell’ottica della trasparenza e della responsabilità, condividiamo la revisione post-incidente per tutti i principali problemi del servizio con le organizzazioni interessate. Essendo una grande impresa, usiamo anche un nostro servizio di pre-produzione per svolgere le attività quotidiane in Microsoft. Il continuo miglioramento è il componente chiave per offrire un servizio all’avanguardia e a elevata disponibilità.

Comunicazioni coerenti

La trasparenza richiede comunicazioni coerenti, soprattutto quando si usano servizi di produttività online per gestire il business. Abbiamo diversi canali di comunicazione, come l’e-mail, i feed RSS e il dashboard Integrità dei servizi. I clienti di Office 365 hanno una visione dettagliata della disponibilità dei servizi importanti per la loro organizzazione. Il dashboard Integrità dei servizi di Office 365 offre una finestra sullo stato corrente dei servizi e sulle licenze. Continuiamo a inserire miglioramenti in questo dashboard, ad esempio la registrazione della tempestività degli aggiornamenti, per assicurarci di fornire tutte le informazioni necessarie sull’integrità dei servizi.

Abbiamo anche alcuni nuovi strumenti avanzati che offrono informazioni sempre aggiornate sul servizio.  La scorsa settimana abbiamo introdotto una nuova funzionalità nel portale di amministrazione, il “Centro messaggi”. Si tratta di un hub centrale per le comunicazioni sui servizi, i report sul tenant e le azioni richieste agli amministratori.  Inoltre, entro fine anno, gli amministratori possono aspettarsi una nuova app per dispositivi mobili che fornirà informazioni sull’integrità dei servizi oltre ad altre comunicazioni appropriate.

La gestione di un servizio completo e in evoluzione su una scala sempre più vasta rappresenta una sfida e, nonostante i nostri sforzi, si verificheranno inevitabilmente interruzioni. Vogliamo assicurare i nostri clienti che continuiamo a informarci e a perseguire il nostro impegno a fornire un servizio affidabile e a disponibilità elevata che soddisfi tutte le aspettative.  La continuità del servizio non è solo un principio di progettazione, ma è un impegno nei confronti dei clienti sancito nel nostro contratto dei servizi, oltre a essere uno dei principali pilastri del Centro protezione di Office 365 (gli altri quattro sono la privacy, la sicurezza, la conformità e la trasparenza). Questo annuncio pubblico del tempo di operatività di Office 365 è la dimostrazione del nostro impegno continuo verso la continuità del servizio e la trasparenza.