Pular para o conteúdo principal
Microsoft 365
Assinar

Serviços em nuvem nos quais você pode confiar: Disponibilidade do Office 365

“Seu escritório completo na nuvem” é como pensamos no Microsoft Office 365. O fato de um bilhão de pessoas usar o Office nos enche de orgulho, agradecemos profundamente a responsabilidade que temos de atender e exceder às expectativas dos nossos clientes todos os dias. Reconhecemos que os aplicativos de produtividade são de extrema importância; é com eles que o trabalho acontece. Para nós, é imperativo garantir que nosso serviço seja autêntico e confiável à medida que adicionamos novos recursos ao Office 365. Nossa medida para isso é a disponibilidade do serviço.

Disponibilidade do Office 365

Desde o lançamento do Office 365 há dois anos, continuamos investindo profundamente em nossa infraestrutura para garantir um serviço altamente disponível.  Embora a informação já tenha sido disponibilizada em detalhes para os nossos clientes atuais, hoje estamos tornando-a disponível a todos os clientes que consideram usar o Office 365.   Medimos a disponibilidade de acordo com o número de minutos que o serviço do Office 365 está disponível em um mês como uma porcentagem do número total de minutos nesse mês.  Essa medida de disponibilidade é chamada de número de tempo de atividade. Dentro desse cálculo, incluímos nossos serviços de negócios, governo e educação. O número de tempo de atividade mundial para o Office 365 nos últimos quatro trimestres, com início em julho de 2012 e término em junho de 2013, foi de 99,98%, 99,97%, 99,94% e 99,97%, respectivamente.  No futuro, divulgaremos os números de tempo de atividade trimestralmente na Central de Confiabilidade do Office 365.

Aqui estão mais alguns detalhes sobre o número de Tempo de Atividade:

  1. O número do Tempo de Atividade inclui o Exchange, o SharePoint, o Lync e o Office Web Apps, ponderado pelo número de pessoas que usam cada um desses serviços. Os clientes usam esses serviços juntos, então todos são levados em consideração no cálculo do Tempo de Atividade.
  2. Este número de tempo de atividade aplica-se ao Office 365 para negócios, educação e governo. Não incluímos serviços ao consumidor neste cálculo.
  3. O Office 365 ProPlus é parte integrante da nossa oferta de serviços, mas não está incluído no cálculo do tempo de atividade, uma vez que é executado, em grande parte, nos próprios dispositivos dos usuários.
  4. Os clientes individuais podem apresentar porcentagens de tempo de atividade mais altas ou mais baixas em comparação com os números de tempo de atividade global, dependendo da localização e dos padrões de uso.

Como um compromisso de executar um serviço altamente disponível, temos um Contrato de Nível de Serviço de 99,9% suportado financeiramente.

Princípios de design de disponibilidade

Desenvolvemos soluções corporativas há décadas. Além disso, a Microsoft executa uma série de serviços em nuvem, como o Office 365, o Windows Azure, o CRM Online, o Outlook.com, o SkyDrive, o Bing, o Skype e o Xbox Live, para citar alguns. Nós nos beneficiamos dessa diversidade de serviços, utilizando as práticas recomendadas de cada serviço para aprimorar tanto o design do software quanto os processos operacionais.

Abaixo estão alguns exemplos de práticas recomendadas aplicadas em processos de design e operacionais para o Office 365.

Redundância. Redundância em todas as camadas, física, de dados e funcional:

  • Criamos redundância física no nível de disco/cartão dentro dos servidores, no nível do servidor dentro de um data center e no nível de serviço em data centers geograficamente separados para oferecer proteção contra falhas. Cada data center possui instalações e redundância de energia. Temos vários data centers atendendo em todas as regiões.
  • Para criar redundância no nível de dados, replicamos dados constantemente em data centers separados geograficamente. Nosso objetivo é manter múltiplas cópias de dados em trânsito ou em repouso e recursos de failover para permitir uma recuperação rápida.
  • Além da redundância física e de dados, como uma das nossas principais forças criamos clientes do Office a fim de fornecer redundância funcional e permitir que você mantenha a produtividade usando funcionalidades offline quando não há conectividade de rede.

Resiliência. Balanceamento de carga ativo e testes de recuperação constantes em domínios de falha:

  • Nós balanceamos ativamente a carga para fornecer aos usuários finais as melhores experiências possíveis de forma automatizada. Esses mecanismos também priorizam dinamicamente, realizando tarefas de baixa prioridade durante períodos de baixa atividade e adiando-as durante alta carga.
  • Dispomos de failover automático e manual para recursos ricos durante falhas de hardware ou software e alertas de monitoramento.
  • Rotineiramente, realizamos recuperações em domínios de falha para garantir a prontidão caso as circunstâncias exijam failovers.

Serviços distribuídos. Serviços de componentes funcionalmente distribuídos:

  • Os serviços de componentes no Office 365, como Exchange, SharePoint, Lync e Office Web Apps, são distribuídos funcionalmente, garantindo que o escopo e o impacto da falha em uma área sejam limitados somente a essa área e não impactem outras.
  • Replicamos os dados do diretório em todos esses serviços de componentes, de modo que, se um serviço apresentar um problema, os usuários possam fazer login e usar outros serviços perfeitamente.
  • Nossas operações e equipes de implantação se beneficiam da natureza distribuída de nosso serviço, simplificando todos os aspectos de manutenção e implantação, diagnóstico, reparo e recuperação.

Monitoramento. Ferramentas extensivas de monitoramento, recuperação e diagnóstico:

  • Nossos sistemas de monitoramento interno analisam continuamente o serviço em busca de qualquer falha e são criados para iniciar a recuperação automatizada do serviço.
  • Eles avaliam qualquer desvio no comportamento do serviço para alertar os engenheiros de plantão a tomar medidas pró-ativas.
  • Também temos um monitoramento externo em execução constante a partir de vários locais ao redor do mundo, tanto de serviços de terceiros confiáveis (para verificação de SLA independente), quanto de nossos próprios data centers mundiais, para emitir alertas.
  • Para diagnósticos, temos extenso registro, auditoria e rastreamento. O rastreamento e o monitoramento granulares nos ajudam a isolar os problemas da causa raiz.

Simplificação. A complexidade reduzida impulsiona a previsibilidade:

  • Usamos componentes padronizados sempre que possível. Isso leva a menos complexidade de implantação e isolamento de problemas, bem como a falhas e recuperação previsíveis.
  • Usamos processos padronizados sempre que possível. Nos concentramos na automação e em garantir que os processos críticos sejam repetidos e repetitivos.
  • Arquitetamos os componentes do software de forma a serem ligeiramente atrelados, de modo que sua implantação e integridade contínua não exijam uma orquestração complexa.
  • Nossa gestão de mudanças passa por etapas de alcance e validação progressivas, organizadas e instrumentadas antes de serem implantadas em todo o mundo.

Backup humano. Suporte de plantão 24 horas por dia, 7 dias por semana:

  • Embora tenhamos ações de recuperação automatizadas sempre que possível, também temos uma equipe de profissionais de plantão 24 horas por dia, 7 dias por semana, para ajudar você. Essa equipe inclui engenheiros de suporte, desenvolvedores de produtos, gerentes de programas, gerentes de produtos e líderes seniores.
  • Com uma equipe inteira de plantão, temos a capacidade de fornecer uma resposta rápida e coleta de informações para a resolução de problemas.
  • Além de fornecer backup, nossos profissionais de plantão também aperfeiçoam os sistemas automatizados sempre que são chamados para ajudar.

Aprendizado contínuo

Entendemos que haverá momentos em que você pode enfrentar interrupções no serviço. Fazemos uma análise detalhada pós-incidente toda vez que ocorre um incidente, independentemente da magnitude do impacto. Uma análise pós-incidente consiste em uma análise do que aconteceu, como respondemos e como podemos evitar incidentes semelhantes no futuro. No interesse da transparência e da responsabilidade, compartilhamos a análise pós-incidente de quaisquer incidentes de serviços importantes se sua organização foi afetada. Como uma grande empresa, nós também usamos nosso próprio serviço de pré-produção para realizar negócios no dia-a-dia aqui na Microsoft. A melhoria contínua é um componente essencial para fornecer um serviço de classe mundial altamente disponível.

Comunicação consistente

A transparência requer uma comunicação consistente, especialmente quando você está usando serviços de produtividade online para conduzir seus negócios. Temos uma série de canais de comunicação, como email, feeds RSS e o Painel de Integridade do Serviço. Como cliente do Office 365, você obtém uma visão detalhada da disponibilidade de serviços relevantes para sua organização. O Painel de Integridade do Serviço do Office 365 é a janela para o status atual de seus serviços e licenças. Continuamos a gerar melhorias no Painel de Integridade do Serviço, incluindo o acompanhamento da periodicidade de atualizações, para garantir que você tenha uma visão completa da integridade de seus serviços.

Também temos novas ferramentas interessantes para melhorar sua capacidade de manter-se atualizado com o serviço.  Na semana passada, lançamos um novo recurso no portal de administração chamado “Centro de Mensagens”. O Centro de Mensagens é uma central para comunicações de serviços, relatórios de locatários e ações exigidas pelos administradores.  Além disso, até o final deste ano, os administradores podem aguardar um novo aplicativo para dispositivos móveis que fornecerá informações de integridade do serviço, bem como outras comunicações relativas ao seu serviço.

Executar um serviço abrangente e evolutivo em escala cada vez maior é um desafio e, apesar dos nossos esforços, haverá interrupções no serviço. Queremos assegurar a você que estamos aprendendo continuamente e somos persistentes em nosso compromisso de fornecer um serviço confiável e altamente disponível que atenda às suas expectativas.  A continuidade do serviço é mais do que um princípio de engenharia, é um compromisso com os clientes em nosso SLA e um dos principais pilares da Central de Confiabilidade do Office 365 (os outros quatro pilares são Privacidade, Segurança, Conformidade e Transparência). Essa divulgação pública do tempo de atividade do Office 365 é evidência de nosso compromisso permanente com a continuidade do serviço e a transparência.