Öffnen Sie mehr Türen mit funktionaler Zertifizierung. Certify with Confidence bietet Ihnen mehr Chancen zu bestehen.

Prüfung
70-773

Microsoft SQL Server logo

  • Veröffentlicht:
    Dienstag, 3. Januar 2017
  • Sprachen:
    Englisch
  • Zielgruppen:
    Datenwissenschaftler
  • Technologie:
    Microsoft R Server, SQL R Services
  • Anrechnung für Zertifizierung:
    MCSA, MCSE

Analyse großer Datenmengen mit Microsoft R

Diese Prüfung ist bis zum Sonntag, 30. Juni 2019 gültig. Eine Ersatzprüfung kann verfügbar sein. Um mehr zu erfahren, besuchen Sie unseren Blog: https://www.microsoft.com/en-us/learning/community.aspx und überprüfen Sie unsere Prüfungsabgaben.

* Die Preise berücksichtigen keine Werbeangebote oder reduzierten Preise für Programmmitglieder der Microsoft Imagine Academy , Microsoft zertifizierte Trainer und Programmmitglieder des Microsoft-Partnernetzwerks. Preise können sich ohne vorherige Ankündigung ändern. In den Preisen sind keine Steuern enthalten. Bitte lassen Sie sich die genauen Preise vom Prüfungsanbieter bestätigen, bevor Sie sich für die Teilnahme anmelden.

Mit Wirkung zum 1. Mai 2017 wird die bestehende Stornierungsrichtlinie in vollem Umfang durch die folgende Richtlinie ersetzt: Die Stornierung oder Neuterminierung Ihrer Prüfung innerhalb von 5 Werktagen nach der registrierten Prüfungszeit ist kostenpflichtig. Wenn Sie Ihre Prüfungstermine nicht enhalten oder nicht neu vereinbaren oder Ihren Termin mindestens 24 Stunden vor Ihrem vereinbaren Termin stornieren, verfällt Ihre gesamte Prüfungsgebühr.

Schauen Sie sich eine Sitzung zur Prüfungs Prep für Microsoft Ignite 2017 an

Bewertete Fähigkeiten

Mit dieser Prüfung werden Ihre Fähigkeiten bei der Ausführung der unten aufgeführten technischen Aufgaben bewertet. Sehen Sie sich Video-Tutorials zu den variety of question types in Microsoft-Prüfungen an.

Bitte beachten Sie, dass sich die Prüfungsfragen auf die Themen in den nachfolgenden Aufzählungen beziehen, jedoch nicht darauf beschränkt sind.

Haben Sie Feedback zur Relevanz der Fähigkeiten, die in dieser Prüfung bewertet werden? Bitte senden Sie Ihre Kommentare an Microsoft. Sämtliches Feedback wird überprüft und gegebenenfalls unter Beibehaltung der Gültigkeit und Zuverlässigkeit des Zertifizierungsprozesses umgesetzt. Beachten Sie, dass Microsoft nicht direkt auf Ihr Feedback reagiert. Wir schätzen Ihre Anregungen zur Gewährleistung der Qualität des Microsoft-Zertifizierungsprogramms.

Wenn Sie Bedenken zu spezifischen Fragen innerhalb dieser Prüfung haben, reichen Sie bitte eine exam challenge.

Wenn Sie weitere Fragen oder Feedback zu Microsoft Certification Exams oder das Zertifizierungsprogramm, zur Registrierung oder Promotionen haben, wenden Sie sich bitte an Ihre Regional Service Center.

Lesen und erkunden Sie Big Data
  • Lesen Sie Daten mit dem R-Server
    • Daten mit R Server lesen Lesen Sie unterstützte Datendateiformate wie Textdateien, SAS und SPSS; Daten in das XDF-Format umwandeln; Identifizieren von Kompromissen zwischen XDF und flachen Textdateien; Daten über Open Database Connectivity (ODBC) Datenquellen lesen; Dateien aus anderen Dateisystemen einlesen; Verwenden Sie einen internen Datenrahmen als Datenquelle. Prozessdaten aus Quellen, die nicht nativ von R Server gelesen werden können
  • Daten zusammenfassen
    • Berechnen Sie Kreuztabellen und univariate Statistiken, wählen Sie, wann Sie rxCrossTabs oder rxCube verwenden, integrieren mit Open-Source-Technologien, indem sie Pakete wie dplyrXdf verwenden, verwenden Sie Gruppe nach Funktionalität, erstellen Sie komplexe Formeln, um mehrere Aufgaben in einem Durchlauf der Daten durchzuführen, extrahieren Sie Quantile, indem Sie rxQuantileverwenden
  • Daten visualisieren
    • Visualisieren Sie In-Memory-Daten mit Basis-Plot-Funktionen und ggplot2; Erstellen Sie benutzerdefinierte Visualisierungen mit rxSummary und rxCube; Visualisieren Sie die Daten mit rxHistogram und rxLinePlot, einschließlich facettierten Plots
Verarbeiten großer Datenmengen
  • Datenverarbeitung mit rxDataStep
    • Unterordnen von Zeilen von Daten, Ändern und Erstellen von Spalten mithilfe des Transforms-Arguments, wählen Sie, wann die On-the-Fly-Transformationen im Vergleich zu In-Data-Transformations-Kompromissen verwendet werden sollen, behandeln Sie fehlende Werte durch Filtern oder Ersetzen, erzeugen Sie einen Datenrahmen oder eine XDF-Datei, verarbeiten Sie Daten ( POSIXct, POSIXlt )
  • Führen Sie komplexe Transformationen durch, die Transformationsfunktionen verwenden
    • Definieren Sie eine Transformationsfunktion; formen Sie Daten unter Verwendung einer Transformationsfunktion um; verwenden Sie Open-Source-Pakete, wie z. B. lubridate; übertragen Sie Werte unter Verwendung von transformVars und transformEnvir; Verwenden Sie interne . rx-Variablen und Funktionen für Aufgaben, einschließlich der Cross-Chunk-Kommunikation
  • Datensätze verwalten
    • Sortieren Sie Daten in verschiedenen Reihenfolgen, wie auf- und absteigend; verwenden Sie die rxSort-Deduplizierung, um doppelte Werte zu entfernen. führen Sie Datenquellen mit rxMerge () zusammen; führen Sie Optionen und Typen zusammen; kennzeichnen Sie, wann Alternativen zu rxSort und rxMerge verwendet werden sollen
  • Text mit RML-Paketen bearbeiten
    • Erstellen von Features mit RML-Funktionen wie z.B featurizeText (); Erstellen von Indikatorvariablen und Arrays mit RML-Funktionen wie categorical() und categoricalHash (); Durchführen der Merkmalsauswahl mit RML-Funktionen
Erstellen Sie Vorhersagemodelle mit ScaleR
  • Schätzen Sie lineare Modelle ein
    • Verwenden Sie rxLinMod, rxGlm und rxLogit, um lineare Modelle einzuschätzen; setzen Sie die Familie für ein verallgemeinertes lineares Modell ein, indem Sie Funktionen wie rxTweedie verwenden; Prozessdaten über die entsprechenden Argumente und Funktionen, wie die F-Funktion und das Transforms-Argument; gewichten Sie Beobachtungen durch Häufigkeits- oder Wahrscheinlichkeitsgewichtung; wählen Sie zwischen verschiedenen Arten von automatischen variablen Selektionen, wie schnelle Suchvorgänge, wiederholtes Scoring und Nebenprodukte der Schulung; identifizieren Sie die Auswirkungen fehlender Werte bei der automatischen Variablenauswahl
  • Erstellen und Verwenden von Partitionierungsmodellen
    • Verwenden Sie rxDTree, rxDForest, und rxBTrees um Partitionierungsmodelle zu bauen; Anpassung der Gewichtung von falschen Positiven und Auslassen durch Verlustnutzung; wählen Sie Parameter, die Bias und Varianz beeinflussen, wie z. B. Beschneidung, Lernrate und Baumtiefe; benutzen Sie as.rpartum mit offenen Ökosystemen zu interagieren
  • Vorhersagen und Residuen erzeugen
    • Verwenden Sie rxPredict, um Vorhersagen zu erzeugen. führen Sie Parallelscoring mit rxExec durch; erstellen Sie verschiedene Arten von Vorhersagen, wie Link und Response Scores für GLM, Antwort, Probe und Abstimmung für rxDForest; generieren Sie verschiedene Arten von Residuen, wie Usual, Pearson und DBM
  • Auswertung von Modellen und Abstimmung von Parametern
    • Fassen Sie die bewertete Modelle zusammen. Lassen Sie einen beliebigen Code aus dem Prozess durchlaufen, wie parallele Parametrierung unter Verwendung von rxExec; werten Sie Baummodellen mit Hilfe von RevoTreeView und rxVarImpPlot aus; berechnen Sie Modellbewertungsmetriken durch Verwendung von eingebauten Funktionen; Berechnen Sie Modellbewertungsmetriken und Visualisierungen mithilfe von benutzerdefinierten Codes, wie z. B. dem mittleren absoluten Prozentsatzfehler und Präzisions-Rückrufkurven
  • Erstellen Sie zusätzliche Modelle mit RML-Paketen
    • Erstellen und verwenden Sie eine Ein-Klasse-Support-Vektor-Maschine, erstellen und verwenden Sie lineare und logistische Regressionen, die L1 und L2-Regularisierungen verwenden, erstellen und verwenden Sie einen Entscheidungsbaum mit FastTree, verwenden Sie FastTree als Recommender mit Rankingverlust (NDCG), bauen und verwenden ein einfaches dreischichtiges Feed-Forward-Neuronennetzwerk
Verwenden Sie den R-Server in verschiedenen Umgebungen
  • Verwenden Sie verschiedene Berechnungskontexte, um den R-Server effektiv auszuführen
    • Ändern Sie den Berechnungskontext (rxHadoopMR, rxSpark, rxLocalseq, and rxLocalParallel); identifizieren Sie, welcher Berechnungskontext für verschiedene Aufgaben zu verwenden ist; verwenden Sie unterschiedliche Datenquellenobjekte abhängig vom Kontext (RxOdbcData und RxTextData); identifizieren und verwenden Sie geeignete Datenquellen für verschiedene Datenquellen und Berechnungskontexte (HDFS und SQL Server); debuggen Sie Prozesse über verschiedene Rechenkontexte hinweg; identifizieren Sie Anwendungsfälle für RevoPemaR
  • Optimieren Sie Aufgaben, indem Sie lokale Berechnungskontexte verwenden
    • Identifizieren und führen Sie Aufgaben durch, die nur im lokalen Berechnungskontext ausgeführt werden können, identifizieren Sie Aufgaben, die effizienter im lokalen Berechnungskontext ausgeführt werden können, wählen Sie zwischen rxLocalseq und rxLocalParallel, profilieren Sie über verschiedene Berechnungskontexte hinweg
  • Führen Sie in-Datenbank-Analytics mit dem SQL Server aus
    • Wählen Sie aus, wann in-Datenbank- im Vergleich zu Out-of-Datenbak-Berechnungen durchgeführt werden sollen, identifizieren Sie die Einschränkungen von In-Datenbank-Berechnungen, verwenden Sie in-Datenbank gegenüber Out-of-Datenbank- Berechnungskontexten entsprechend, verwenden Sie gespeicherte Prozeduren für Datenverarbeitungsschritte, serialisieren Sie Objekte und schreiben Sie Binärfelder in eine Tabelle zurück, schreiben Sie Tabellen, konfigurieren Sie R, um SQL-Server zu optimieren (chunksize, numtasks, and computecontext), kommunizieren Sie effektiv Performance-Eigenschaften für SQL-Administratoren und Architekten (SQL Server Profiler)
  • Implementieren Sie Analyse-Workflows im Hadoop-Ökosystem und Spark
    • Verwenden Sie geeignete R Server-Funktionen in Spark; integrieren Sie sie mit Hive, Pig und Hadoop MapReduce; integrieren Sie sie mit dem Spark-Ökosystem von Werkzeugen wie SparklyR und SparkR; profilieren Sie und passen Sie sie über verschiedene Berechnungskontexte an; verwenden Sie doRSR für die Parallelisierung von Codes, die mit Open Source für jeden geschrieben wurden
  • Bereitstellung von Vorhersagemodellen für SQL-Server und Azure Machine Learning
    • Stellen Sie Vorhersagemodelle an SQL Server als gespeicherte Prozedurbereit, stellen Sie eine beliebige Funktion für Azure Machine Learning mit dem AzureML R-Paket bereit, identifizieren Sie, wann man DeployR verwendet

Wer sollte diese Prüfung ablegen?

Kandidaten für diese Prüfung sind Datenwissenschaftler oder Analytiker, die Datensätze verarbeiten und analysieren, die größer sind als der Speicher mit Einsatz von R. Die Kandidaten sollten Erfahrung mit R, mit Datenstrukturen, mit grundlegenden Programmierkonzepten (wie Kontrollfluss und Umfang) und mit dem Schreiben und Debuggen von R-Funktionen haben.

Die Kandidaten sollten mit den üblichen statistischen Methoden und den besten Praktiken der Datenanalyse vertraut sein. Die Kandidaten sollten auch ein umfassendes Verständnis auf hohem Niveau von Daten-Plattformen, wie dem Hadoop Ökosystem, SQL- Server und T-SQL-Kernfähigkeiten haben.

Weitere Informationen zu Prüfungen

Auf eine Prüfung vorbereiten

Wir empfehlen, dass Sie diesen Leitfaden zur Prüfungsvorbereitung komplett durchlesen und sich mit den Ressourcen auf dieser Website vertraut machen, bevor Sie Ihren Prüfungstermin festlegen. In der Microsoft Certification exam overview finden Sie Informationen über die Registrierung, Videos zu typischen Prüfungsfragenformaten und anderen Ressourcen zur Vorbereitung. Informationen zu Prüfungsrichtlinien und Bewertung finden Sie in den Microsoft Certification exam policies and FAQs.

Hinweis

Dieser Leitfaden für die Vorbereitung kann jederzeit ohne vorherige Ankündigung und nach eigenem Ermessen von Microsoft geändert werden. Microsoft-Prüfungen enthalten unter Umständen adaptive Testtechnologien und Simulationen. Microsoft gibt nicht das Format vor, in dem Prüfungen dargestellt werden. Bitte verwenden Sie diesen Leitfaden für die Vorbereitung auf die Prüfung, unabhängig von deren Format. Um Sie bei der Vorbereitung auf die Prüfung zu unterstützen, empfiehlt Microsoft, dass Sie praktische Erfahrungen mit dem Produkt sammeln und die angegebenen Trainingsressourcen verwenden. Diese Ausbildungsressourcen decken nicht unbedingt alle der im Abschnitt “Bewertete Fähigkeiten“ aufgeführten Themen ab.