Services cloud fiables : Disponibilité d’Office 365

« Tout le bureau dans le cloud ». Telle est la manière dont nous concevons Microsoft Office 365. Si nous sommes extrêmement fiers de pouvoir dire qu’un milliard de personnes utilisent Office, nous prenons également toute la mesure de la responsabilité qui est la nôtre de satisfaire et même de dépasser chaque jour les attentes de nos clients. Nous sommes conscients que les applications de productivité revêtent une importance stratégique et que l’accomplissement du travail dépend de leur utilisation. À mesure que nous continuons à ajouter des fonctionnalités à Office 365, nous devons impérativement veiller à ce que notre service soit crédible et fiable. Notre étalon pour cela est la disponibilité du service.

Disponibilité d’Office 365

Depuis le lancement d’Office 365 il y a deux ans, nous avons continué à investir massivement dans notre infrastructure pour assurer un service hautement disponible.  Si ces informations étaient précédemment disponibles et détaillées pour nos clients actuels, nous les mettons aujourd’hui à la disposition de tous les clients qui envisagent d’adopter Office 365.   Nous mesurons la disponibilité au nombre de minutes pendant lesquelles le service Office 365 est disponible au cours d’un mois calendaire, en tant que pourcentage du nombre total de minutes que compte ce mois.  Nous appelons cette mesure de la disponibilité le temps de fonctionnement. Dans ce calcul, nous incluons les services que nous fournissons aux entreprises, au secteur public et aux organismes d’enseignement. Le temps de fonctionnement mondial d’Office 365 au cours des quatre trimestres écoulés entre juillet 2012 à juin 2013 a été respectivement de 99,98 %, 99,97 %, 99,94 % et 99,97 %.  À l’avenir, nous divulguerons les chiffres du temps de fonctionnement trimestriellement via le Centre de gestion de la confidentialité Office 365.

Voici quelques détails supplémentaires sur le temps de fonctionnement :

  1. Le temps de fonctionnement inclut les services Exchange, SharePoint, Lync et Office Web Apps, pondérés en fonction du nombre de personnes qui les utilisent. Les clients utilisant ces services ensemble sont pris en compte lors du calcul du temps de disponibilité.
  2. Ce temps de fonctionnement s’applique à Office 365 pour les entreprises, l’éducation et le secteur public. Nous n’incluons pas dans ce calcul les services aux consommateurs.
  3. Office 365 ProPlus fait partie intégrante de notre offre de services, mais n’est pas inclus dans ce calcul du temps de fonctionnement parce qu’il s’exécute en grande partie sur les appareils des utilisateurs.
  4. Selon leur emplacement géographique et leur mode d’utilisation, les clients individuels peuvent rencontrer des pourcentages de temps de fonctionnement supérieurs ou inférieurs aux chiffres de temps de fonctionnement global.

Dans le cadre de notre engagement à opérer un service hautement disponible, nous avons établi un contrat de niveau de service de 99,9 % assorti d’une garantie financière.

Principes de conception de la disponibilité

Nous créons des solutions d’entreprise depuis des décennies. En outre, Microsoft opère un certain nombre de services cloud tels qu’Office 365, Windows Azure, CRM Online, Outlook.com, SkyDrive, Bing, Skype et Xbox Live pour n’en nommer que quelques-uns. Nous bénéficions de cette diversité de services, en tirant parti des meilleures pratiques de chacun d’eux pour les appliquer aux autres, afin d’améliorer tant la conception des logiciels que les processus opérationnels.

Vous trouverez ci-dessous des exemples de meilleures pratiques appliquées à la conception et aux processus opérationnels pour Office 365.

Redondance. Redondance de chaque couche (physique, données et fonctionnelle) :

  • Nous créons une redondance physique au niveau disque ou carte au sein des serveurs, au niveau serveur dans un centre de données, et au niveau service dans des centres de données séparés géographiquement afin d’offrir une protection contre les pannes. Chaque centre de données dispose d’installations et d’une alimentation redondantes. Plusieurs centres de données desservent chaque région.
  • Pour créer une redondance au niveau données, nous répliquons constamment les données dans des centres de données séparés géographiquement. Notre objectif de conception est de maintenir plusieurs copies des données, tant en transit qu’au repos, ainsi que des capacités de basculement pour permettre une récupération rapide.
  • En plus de la redondance du matériel et des données, l’une de nos principales forces est que nous créons des clients Office pour assurer une redondance fonctionnelle afin de vous permettre de rester productif en utilisant des fonctionnalités hors connexion quand il n’y a pas de connectivité réseau.

Résilience. Équilibrage de charge actif et tests de récupération constants des domaines de défaillance :

  • Nous équilibrons activement la charge afin de fournir aux utilisateurs finals les meilleures expériences possibles de manière automatisée. Ces mécanismes hiérarchisent également les tâches de façon dynamique, en exécutant celles dont la priorité est basse pendant les périodes de faible activité, et en les différant lorsque la charge est élevée.
  • Nous avons mis en place un dispositif de basculement, tant automatisé que manuel, vers des ressources saines, qui opère lors de défaillances matérielles ou logicielles, et d’alertes de surveillance.
  • Nous effectuons régulièrement une récupération des domaines de défaillance afin de nous assurer d’être prêts quand les circonstances nécessitent un basculement.

Services distribués. Services des composants distribués sur le plan fonctionnel :

  • Les services de composants dans Office 365, tels qu’Exchange, SharePoint, Lync et Office Web Apps, sont distribués sur le plan fonctionnel, ce qui garantit que la portée et l’incidence d’un échec dans un domaine sont limités à celui-ci et n’affectent pas les autres.
  • Nous répliquons les données d’annuaire dans ces services de composants de manière à ce que, si un service rencontre un problème, les utilisateurs puissent encore se connecter et utiliser les autres services de manière transparente.
  • Nos équipes chargées des opérations et du déploiement bénéficient de la nature distribuée de notre service, qui simplifie tous les aspects de la maintenance, du déploiement, du diagnostic, de la réparation et de la récupération.

Surveillance. Vaste panoplie d’outils de surveillance, de récupération et de diagnostic :

  • Nos systèmes de surveillance interne surveillent le service en permanence afin de détecter toute défaillance, et sont conçus pour opérer une récupération automatisée du service si nécessaire.
  • Nos systèmes analysent le comportement du service afin de détecter tout écart nécessitant d’alerter les ingénieurs d’astreinte afin qu’ils puissent prendre des mesures proactives.
  • Nous disposons également d’un système de surveillance externe actif en permanence dans plusieurs sites à travers le monde, composé à la fois de services tiers de confiance pour assurer la vérification indépendante du respect du contrat de niveau de service, et de nos propres centres de données dans le monde entier pour le déclenchement des alertes.
  • Pour les diagnostics, nous disposons d’un système étendu de journalisation, d’audit et de traçage. Le traçage et la surveillance granulaires nous aident à isoler la cause racine des problèmes.

Simplification. Une réduction de la complexité entraîne la prévisibilité :

  • Nous utilisons des composants standardisés dans la mesure du possible. Cela contribue à réduire la complexité du déploiement et de l’isolation des problèmes, ainsi que les pannes et récupérations prévisibles.
  • Nous utilisons des processus standardisés dans la mesure du possible. L’accent n’est pas seulement mis sur l’automatisation, mais aussi sur la répétition et la répétabilité des processus critiques.
  • Nous avons architecturé les composants logiciels de façon à ce qu’ils ne soient pas étroitement couplés, et que leur déploiement et leur intégrité ne nécessitent pas d’orchestration complexe.
  • Notre gestion des changements passe par des anneaux d’étendue et de validation progressifs, échelonnés et instrumentés, avant leur déploiement à l’échelle mondiale.

Assistance humaine. Support téléphonique permanent :

  • Bien que nous ayons automatisé autant que possible les actions de récupération, une équipe de professionnels se tient également à votre disposition en permanence pour vous assister. Cette équipe se compose d’ingénieurs de support technique, de développeurs de produits, de gestionnaires de programmes, de chefs de produits et de cadres supérieurs.
  • Avec une telle équipe joignable en permanence, nous avons la capacité de réagir rapidement ainsi que de collecter les informations nécessaires à la résolution des problèmes.
  • Nos professionnels, en plus d’assurer le support technique, contribuent également à améliorer les systèmes automatisés chaque fois que leur assistance est sollicitée.

Apprentissage permanent

Nous sommes conscients qu’il peut vous arriver de rencontrer des interruptions de service. Nous procédons systématiquement à une analyse post-incident, quelle que soit l’ampleur de l’impact de l’incident. Une analyse post-incident consiste à examiner ce qui s’est passé, la façon dont nous avons réagi et la manière dont nous comptons éviter la reproduction d’incidents similaires à l’avenir. Dans l’intérêt de la transparence et de la responsabilisation, nous partageons l’analyse post-incident pour tout incident de service majeur si votre organisation a été affectée. En tant que grande entreprise, nous utilisons également notre propre service de préproduction dans le cadre de nos activités quotidiennes. L’amélioration continue est un aspect clé de la fourniture d’un service de classe mondiale hautement disponible.

Communication cohérente

La transparence exige une communication cohérente, en particulier lorsque vous utilisez des services de productivité en ligne pour mener vos activités. Nous disposons d’un certain nombre de canaux de communication, tels que l’e-mail, les flux RSS et le Tableau de bord d’intégrité des services. En tant que client Office 365, vous disposez d’une vue détaillée de la disponibilité des services pertinents pour votre organisation. Le Tableau de bord d’intégrité des services Office 365 est votre fenêtre sur l’état actuel de vos services et licences. Nous continuons à apporter des améliorations au Tableau de bord d’intégrité des services, y compris au suivi de la ponctualité des mises à jour, pour nous assurer que vous disposiez d’une vision complète de l’intégrité de vos services.

Nous avons également de nouveaux outils sensationnels pour améliorer votre capacité à rester au fait du service.  La semaine dernière, nous avons publié sur le portail d’administration une nouvelle fonctionnalité nommée « Centre de messages ». Le Centre de messages est un point central pour les communications du service, la génération de rapports sur les clients, et les actions requises par les administrateurs.  De même, avant la fin de cette année, les administrateurs peuvent s’attendre à la publication d’une nouvelle application mobile qui fournira des informations sur l’intégrité des services ainsi que d’autres communications concernant ceux-ci.

Gérer un service complet et évolutif à une échelle toujours plus grande constitue un véritable défi, et il y aura toujours des interruptions de service en dépit de nos efforts. Nous tenons à vous assurer que nous continuons d’apprendre sans relâche, et sommes constants dans notre engagement à vous fournir un service hautement disponible fiable et conforme à vos attentes.  La continuité du service est plus qu’un principe d’ingénierie. Il s’agit du respect d’un engagement pris envers nos clients en vertu de notre contrat de niveau de service, et de l’un des piliers clés du Centre de gestion de la confidentialité Office 365 (les quatre autres piliers étant la confidentialité, la sécurité, la conformité et la transparence). Cette divulgation publique du temps de fonctionnement d’Office 365 témoigne de notre engagement permanent en faveur de la continuité et de la transparence des services.

Veuillez noter que le contenu inclus dans ces billets de blog décrit des fonctionnalités pouvant varier selon le marché. Pour plus d’informations sur les offres de produit spécifiques de votre marché, consultez la page Microsoft 365, Office 365, Windows 10 ou Enterprise Mobility + Security.
Il se peut que le contenu de ces articles ne soit pas disponible dans votre langue.