Abra mais portas com certificação baseada em funções. Certify with Confidence oferece mais chances de passar.

Exame
70-773

Microsoft SQL Server logo

  • Publicado:
    terça-feira, 3 de janeiro de 2017
  • Idiomas:
    Inglês
  • Públicos:
    Cientistas de dados
  • Tecnologia:
    Microsoft R Server, SQL R Services
  • Crédito para certificação:
    MCSA, MCSE

Analisando Grande Volume de Dados com o Microsoft R

Este exame será aposentado no dia domingo, 30 de junho de 2019. Um exame de substituição pode estar disponível. Para saber mais, visite nosso blog: https://www.microsoft.com/en-us/learning/community.aspx e reveja nossos posts de aposentadoria de exame.

* O preço não reflete quaisquer ofertas promocionais ou preço reduzido para membros do programa Microsoft Imagine Academy, Microsoft Certified Trainers e membros do programa Microsoft Partner Network. O preço está sujeito à alteração sem aviso prévio. O preço não inclui impostos. Confirme o preço exato com o provedor do exame antes de se inscrever para fazer um exame.

A partir do dia 1 de maio de 2017, a política de cancelamento existente será completamente substituída pela seguinte política: cancelar ou remarcar seu exame dentro de 5 dias úteis da data marcada é sujeito a uma taxa. Não comparecer para seu exame agendado ou não remarcar ou cancelar seu agendamento com pelo menos 24 horas de antecedência do exame faz com que você perca toda a taxa do exame.

Assista a uma seção de Preparação de Teste do Microsoft Ignite 2017

Habilidades medidas

Este exame mede sua habilidade em executar as tarefas técnicas listadas abaixo. Veja tutoriais em vídeo sobre a variety of question types sobre exames da Microsoft.

Observe que as perguntas podem testar, mas não estarão limitadas a, os tópicos descritos no texto com marcadores.

Deseja enviar comentários sobre a relevância das habilidades medidas neste exame? Envie seus comentários para a Microsoft. Todos os comentários serão revisados e incorporados conforme apropriado, mantendo a validade e confiabilidade do processo de certificação. Observe que a Microsoft não responderá diretamente aos comentários. Agradecemos seus comentários para garantir a qualidade do Programa de Certificação Microsoft.

Se tiver dúvidas sobre perguntas específicas deste exame, envie um exam challenge.

Se você tiver outras perguntas ou comentários sobre os exames de certificação da Microsoft ou sobre o programa de certificação, o registro ou as promoções, entre em contato com seu Regional Service Center.

Ler e explorar grandes dados
  • Leitura de dados com R Server
    • Ler arquivos de dados em formatos suportados, tais como arquivos de texto, SAS e SPSS; converter dados para o formato XDF e arquivos de texto plano; ler dados através de fontes de dados Open Database Connectivity (ODBC); ler em arquivos de outros sistemas de arquivos; utilizar uma estrutura de dados interna como uma fonte de dados; processar dados de fontes que não podem ser lidas nativamente pelo R Server.
  • Sumarizar dados
    • Computar tabelas de referência cruzada e estatísticas invariáveis, escolher quando usar rxCrossTabs versus rxCube, integra-se com tecnologias de código aberto usando pacotes como dplyrXdf, uso de grupo por funcionalidade, cria fórmulas complexas para executar várias tarefas em uma só passagem pelos dados usando rxQuantile
  • Visualizar dados
    • Visualizar dados na memória com funções de plotagem e ggplot2; criar visualizações personalizadas com o rxSummary e rxCube; visualizar dados com o rxHistogram e rxLinePlot, incluindo parcelas facetadas
Processar bandes volumes de dados
  • Processar dados com o rxDataStep
    • Subconjunto de linhas de dados, modificar e criar colunas usando o argumento Transforms , escolher quando usar o transformações on-the-fly versus trade-offs de transformações in-data, manipular valores ausentes através de filtragem ou substituição, gerar um quadro de dados ou um arquivo XDF, datas do processo (POSIXct, POSIXlt)
  • Realizar transformações complexas que usam funções de transformação
    • Definir uma função de transformação, remodelar dados usando uma função de transformação; usar pacotes de código aberto, como o lubridate; passar em valores usando transformVars e transformEnvir; usar variáveis e funções.rx internas para tarefas, incluindo a comunicação entre blocos
  • Gerenciar conjuntos dos dados
    • Classificar dados em várias ordens, tais como descendente e ascendente, usando a desduplicação rxSort para remover valores duplicados; mesclar fontes de dados usando rxMerge(); opções de mescla e tipos; identificar quando alternativas ao rxSort e rxMerge devem ser usadas.
  • Processar texto usando pacotes RML
    • Criar recursos usando funções RML, tais como featurizeText(); criar variáveis de indicadores e matrizes usando funções RML, tais como categorical() e categoricalHash(); executar seleção de recursos usando funções RML
Construir modelos preditivos com ScaleR
  • Estimar modelos lineares
    • Usar rxLinMod, rxGlm, e rxLogit para estimar modelos lineares; definir a família para um modelo linear generalizado usando funções tais como rxTweedie; processar dados rapidamente usando argumentos e funções apropriados, tais como a função F e o argumento das transformações; observações ponderadas através de ponderações de frequência ou probabilidade; escolher entre diferentes tipos de seleções de variáveis automáticas, como buscas ambiciosas; pontuação repetida e subproduto do treinamento; identificar o impacto de valores faltantes durante a seleção automática de variáveis
  • Criar e usar modelos de particionamento
    • Usar rxDTree, rxDForest, e rxBTrees para construir modelos de particionamento; ajustar a ponderação de falsos positivos e erros usando a perda; selecionar os parâmetros que afetam o viés e a variância, como a poda, a taxa de aprendizado e a profundidade da árvore ; usar as.rpart para interagir com ecossistemas de código aberto
  • Gerar previsões e resíduos
    • Usar rxPredict para gerar previsões; executar pontuação paralela usando rxExec; gerar diferentes tipos de previsões, como pontuação de link e resposta para GLM, resposta, prob, e votação para rxDForest; gerar diferentes tipos de resíduos, como Usual, Pearson, e DBM
  • Avaliar modelos e parâmetros de ajuste
    • Resumir modelos estimados; executar código arbitrário fora do processo, como ajuste paralelo de parâmetros usando rxExec; avaliar modelos de árvore usando RevoTreeView e rxVarImpPlot; calcular métricas de avaliação de modelo usando funções incorporadas; calcular as métricas de avaliação do modelo e visualizações usando o código personalizado, como o erro de porcentagem absoluta média e as curvas de retorno de precisão.
  • Criar modelos adicionais usando pacotes RML
    • Construir e usar uma Máquina de Vetores de Suporte Classe Única, construir e usar regressões lineares e logísticas que usam regularização L1 e L2, construir e usar uma árvore de decisão usando FastTree, usar o FastTree como recomendação com perda de classificação (NDCG), construir e usar uma rede neural de alimentação de três camadas simples.
Usar o R Server em diferentes ambientes
  • Usar diferentes contextos de computação para executar o R Server de forma eficaz
    • Alterar o contexto de computação (rxHadoopMR, rxSpark, rxLocalseq, e rxLocalParallel); identificar qual o contexto computacional deve ser usado para diferentes tarefas; usar objetos de fonte de dados diferentes, dependendo do contexto (RxOdbcData e RxTextData); identificar e usar fontes de dados apropriados para diferentes fontes de dados e contextos de computação (HDFS e SQL Server); depurar processos em diferentes contextos de computação, identificar casos de uso para RevoPemaR
  • Otimizar tarefas usando contextos de computação local
    • Identificar e executar tarefas que podem ser executadas apenas no contexto de computação local, identificar tarefas que são mais eficientes para executar no contexto de computação local, escolher entre os perfis rxLocalseq e rxLocalParallel, em diferentes contextos de computação.
  • Executar análises no banco de dados usando SQL Server
    • Escolher quando realizar cálculos no banco de dados versus fora do banco de dados, identificar as limitações dos cálculos no banco de dados; usar contextos de computação de banco de dados versus fora do banco de dados apropriadamente, usar procedimentos armazenados para etapas de processamento de dados, serializar objetos e escrever de volta para campos binários em uma tabela, escrever tabelas, configurar R para otimizar o Servidor SQL (chunksize, numtasks, e computecontext), comunicar efetivamente propriedades de desempenho para administradores e arquitetos SQL (SQL Server Profiler)
  • Implementar fluxos de trabalho de análise no ecossistema Hadoop e Spark
    • Usar as funções apropriadas R Server no Spark; integrar com o Hive, Pig, e Hadoop MapReduce; integrar com o ecossistema Spark de ferramentas, como SparklyR e SparkR; analisar e ajustar em diferentes contextos de computação, use doRSR para paralelizar o código que foi escrito usando fonte aberta foreach
  • Implantat modelos de previsão para o SQL Server e o Azure Machine Learning
    • Implantar modelos de previsão para o Servidor SQL como um procedimento armazenado, implantar uma função arbitrária para o Azure Machine Learning usando o pacote AzureML R, identificar quando usar o DeployR

Quem deve fazer este exame?

Os candidatos para este teste são cientistas de dados ou analistas que processam e analisam grandes conjuntos de dados usando R. Os candidatos devem ter experiência com R, familiaridade com estruturas de dados, familiaridade com conceitos básicos de programação (tais como controle de fluxo e escopo), e familiaridade com escrita e depuração de funções R.

Os candidatos devem estar familiarizados com métodos estatísticos comuns e com as melhores práticas de análise de dados. Os candidatos também devem ter um alto nível de entendimento de plataformas de dados, tais como ecossistema Hadoop , SQL Server e recursos básicos do T-SQL

Mais informações sobre exames

Preparação para um exame

Recomendamos que você leia todo este guia de preparação para o exame e familiarize-se com os recursos deste site antes de agendar o seu exame. Consulte a Microsoft Certification exam overview para obter informações sobre registro, vídeos de formatos típicos de pergunta do exame e outros recursos de preparação. Para obter informações sobre políticas e pontuação do exame, consulte as Microsoft Certification exam policies and FAQs.

Observação

Este guia de preparação está sujeito a alterações a qualquer momento sem aviso prévio e a critério exclusivo da Microsoft. Os exames Microsoft podem incluir tecnologia de testes de adaptação e itens de simulação. A Microsoft não identifica o formato em que os exames são apresentados. Utilize este guia de preparação para se preparar para o exame, independentemente do seu formato. Para ajudá-lo a preparar-se para este exame, a Microsoft recomenda que você tenha experiência prática com o produto e use os recursos de treinamento especificados. Estes recursos de treinamento não necessariamente abrangem todos os tópicos listados na seção "Habilidades avaliadas".