Öffnen Sie mehr Türen mit funktionaler Zertifizierung. Certify with Confidence bietet Ihnen mehr Chancen zu bestehen.

Prüfung
70-775

Microsoft Azure

  • Veröffentlicht:
    Mittwoch, 22. Februar 2017
  • Sprachen:
    Englisch
  • Zielgruppen:
    Datenwissenschaftler
  • Technologie:
    Azure HDInsight
  • Anrechnung für Zertifizierung:
    MCSA, MCSE

Führen Sie Daten Engineering auf Microsoft Azure HDInsight durch

Diese Prüfung ist bis zum Sonntag, 30. Juni 2019 gültig. Eine Ersatzprüfung kann verfügbar sein. Um mehr zu erfahren, besuchen Sie unseren Blog: https://www.microsoft.com/en-us/learning/community.aspx und überprüfen Sie unsere Prüfungsabgaben.

* Die Preise berücksichtigen keine Werbeangebote oder reduzierten Preise für Programmmitglieder der Microsoft Imagine Academy , Microsoft zertifizierte Trainer und Programmmitglieder des Microsoft-Partnernetzwerks. Preise können sich ohne vorherige Ankündigung ändern. In den Preisen sind keine Steuern enthalten. Bitte lassen Sie sich die genauen Preise vom Prüfungsanbieter bestätigen, bevor Sie sich für die Teilnahme anmelden.

Mit Wirkung zum 1. Mai 2017 wird die bestehende Stornierungsrichtlinie in vollem Umfang durch die folgende Richtlinie ersetzt: Die Stornierung oder Neuterminierung Ihrer Prüfung innerhalb von 5 Werktagen nach der registrierten Prüfungszeit ist kostenpflichtig. Wenn Sie Ihre Prüfungstermine nicht enhalten oder nicht neu vereinbaren oder Ihren Termin mindestens 24 Stunden vor Ihrem vereinbaren Termin stornieren, verfällt Ihre gesamte Prüfungsgebühr.

Bewertete Fähigkeiten

Mit dieser Prüfung werden Ihre Fähigkeiten bei der Ausführung der unten aufgeführten technischen Aufgaben bewertet. Sehen Sie sich Video-Tutorials zu den variety of question types in Microsoft-Prüfungen an.

Bitte beachten Sie, dass sich die Prüfungsfragen auf die Themen in den nachfolgenden Aufzählungen beziehen, jedoch nicht darauf beschränkt sind.

Haben Sie Feedback zur Relevanz der Fähigkeiten, die in dieser Prüfung bewertet werden? Bitte senden Sie Ihre Kommentare an Microsoft. Sämtliches Feedback wird überprüft und gegebenenfalls unter Beibehaltung der Gültigkeit und Zuverlässigkeit des Zertifizierungsprozesses umgesetzt. Beachten Sie, dass Microsoft nicht direkt auf Ihr Feedback reagiert. Wir schätzen Ihre Anregungen zur Gewährleistung der Qualität des Microsoft-Zertifizierungsprogramms.

Wenn Sie Bedenken zu spezifischen Fragen innerhalb dieser Prüfung haben, reichen Sie bitte eine exam challenge.

Wenn Sie weitere Fragen oder Feedback zu Microsoft Certification Exams oder das Zertifizierungsprogramm, zur Registrierung oder Promotionen haben, wenden Sie sich bitte an Ihre Regional Service Center.

Verwalten und Bereitstellen von HDInsight Clustern
  • Bereitstellen von HDInsight-Clustern
    • Erstellen Sie einen Cluster in einem privaten virtuellen Netzwerk, erstellen Sie einen Cluster, der über einen benutzerdefinierten Metastore verfügt, erstellen Sie einen Domänenclip, wählen Sie einen geeigneten Clustertyp aus, der auf Workload-Überlegungen basiert, passen Sie einen Cluster mithilfe von Skriptaktionen an, stellen Sie einen Cluster mithilfe von Portal bereit, stellen Sie einen Cluster mit Hilfe von Azure-CLI-Tools bereit, stellen Sie einen Cluster mit Hilfe von Azure Resource Manager (ARM) -Modellen und PowerShell bereit, verwalten Sie verwaltete Datenträger, konfigurieren Sie vNet-Peering
  • Bereitstellung und Sicherung von Multi-User-HDInsight-Clustern
    • Bereitstellung von Benutzern mit unterschiedliche Rollen; Verwalten von Benutzern, Gruppen und Berechtigungen durch Apache Ambari, PowerShell und Apache Ranger; Konfigurieren von Kerberos; Konfigurieren von Dienstkonten; Implementieren von SSH-Tunneling; Zugriff auf Daten beschränken
  • Daten für Batchverarbeitung und interaktive Verarbeitung eingeben
    • Daten aus Cloud- oder Vor-Ort-Daten aufnehmen; Daten in Azure Daten Lake speichern; Speichern von Daten in Azure Blob Storage; Durchführen von routinemäßigen kleinen Schriften auf einer kontinuierlichen Basis mit Hilfe von Azure CLI-Tools; Daten in Apache Hive und Apache Spark unter Verwendung von Apache Sqoop, Application Entwicklung Framework (ADF), AzCopy und AdlCopy; Daten von einem Hadoop-Cluster vor Ort aufnehmen
  • Konfigurieren sie HDInsight-Clustern
    • Verwalten von Metastore-Upgrades; Anzeigen und Bearbeiten von Ambari-Konfigurationsgruppen; Anzeigen und Ändern von Servicekonfigurationen über Ambari; Zugriffsprotokolle, die in den Azure-Tabellenspeicher geschrieben wurden; Aktivieren von Heap Dumps für Hadoop-Dienstleistungen; Verwalten der HDInsight-Konfiguration, Verwenden von HDInsight .NET SDK und PowerShell; Cluster-Level-Debugging durchführen; Stoppen und starten von Diensten über Ambari; Verwalten von Ambari-Alarmen und Metriken
  • Verwalten und Debuggen von HDInsight-Jobs
    • Beschreiben Sie die YARN-Architektur und -operation; YARN-Jobs über ResourceManager-Benutzeroberfläche (UI) untersuchen und laufende Anwendungen überprüfen; Nutzen Sie YARN CLI, um Arbeitsplätze zu vernichten; Finden Sie Protokolle für verschiedene Arten von Arbeitsplätzen; Debuggen Sie Hadoop- und Spark-Jobs; Verwenden Sie die Azure Operations Management Suite (OMS), um Warnungen zu überwachen und zu verwalten und Voraussagemaßnahmen durchzuführen
Implementieren von Big Data Batch Processing-Lösungen
  • Implementieren Sie Batch-Lösungen mit Hive und Apache Pig
    • Definieren Sie externe Hive-Tabellen; laden Sie Daten in eine Hive-Tabelle; verwenden Sie Partitionierung und Bucketing, um die Hive-Performance zu verbessern; verwenden Sie halbstrukturierte Dateien wie XML und JSON mit Hive; verbinden Sie Tabellen mit Hive mithilfe von Shuffle-Joins und Broadcast-Joins; rufen Sie Hive UDFs mit Java und Python auf; entwerfen Sie Skripte mit Pig; identifizieren Sie Abfrage-Engpässe mit dem Hive-Abfrage-Diagramm; identifizieren Sie das entsprechende Speicherformat wie Apache Parkett, ORC, Text und JSON
  • Entwerfen Sie Batch-ETL-Lösungen für große Datenmengen mit Spark
    • Teilen Sie Ressourcen zwischen Spark-Anwendungen mithilfe von YARN-Warteschlangen und Preemption, wählen Sie Spark Executor und Treibereinstellungen für optimale Performance aus, verwenden Sie Partitionierung und Bucketing, um die Spark-Performance zu verbessern, eine Verbindung zu externen Spark-Datenquellen herzustellen und benutzerdefinierten Python- und Scala-Code in einem Spark DataSets-Programm einzubeziehen, identifizieren Sie Abfrage-Engpässe mit dem Spark SQL Abfrage-Diagramm
  • Operationalisieren von Hadoop und Spark
    • Erstellen und Anpassen eines Clusters mithilfe von ADF; Anhänge an einen Cluster anhängen und eine ADF-Aktivität ausführen; wählen Sie zwischen Bring-Your-Own und On-Demand-Clustern; verwenden Sie Apache Oozie mit HDInsight; zwischen Oozie und ADF wählen; teilen Sie Metastore- und Speicherkonten zwischen einem Hive-Cluster und einem Spark-Cluster, um die gleiche Tabelle über die Cluster-Typen zu aktivieren; wählen Sie einen geeigneten Speichertyp für eine Datenpipeline wie Blob-Speicher, Azure Daten Lake und lokales Hadoop Distributed File System (HDFS)
Implementieren von Big Data Interactive Processing-Lösungen
  • Implementieren Sie interaktive Abfragen für große Datenmengen mit Spark SQL
    • Führen Sie Abfragen mit Spark SQL aus, verbergen Sie Spark DataFrames für iterative Abfragen, speichern Sie Spark DataFrames als Parquet-Dateien, verbinden Sie BI-Tools mit Spark-Clustern, optimieren Sie Join-Typen wie Broadcast-Versus-Merge-Joins, verwalten Sie den Spark Thrift-Server und ändern Sie die YARN-Ressourcenzuweisung, kennzeichnen Sie Fälle für verschiedene Speichertypen für interaktive Abfragen
  • Führen Sie eine explorative Datenanalyse durch, indem Sie Spark SQL verwenden
    • Verwenden Sie Jupyter und Apache Zeppelin für die Visualisierung und die Entwicklung von sauberen Spark DataFrames für die Modellierung, verwenden Sie Spark SQL's Zwei-Tabellen-Joins, um DataFrames und Cache-Ergebnisse zusammenzuführen, speichern Sie gesäuberte Spark DataFrames zum performanten Format für das Lesen und Analysen (Apache Parquet), verwalten Sie interaktive Livy-Sessions und Ihre Ressourcen
  • Implementieren Sie interaktive Abfragen für große Datenmengen mit Interactive Hive
    • Aktivieren Sie Hive LLAP über die Hive-Einstellungen, verwalten und konfigurieren Sie die Speicherzuweisung für Hive LLAP-Aufträge, verbinden Sie BI-Tools mit Interactive Hive-Clustern
  • Führen Sie eine explorative Datenanalyse durch, indem Sie Hive verwenden
    • Führen Sie interaktive Abfragen und Visualisierung durch, verwenden Sie Ambari-Ansichten, verwenden Sie HiveQL, analysieren Sie CSV-Dateien mit Hive, verwenden Sie ORC im Vergleich zu Text für das Caching, verwenden Sie interne und externe Tabellen in Hive, verwenden Sie Zeppelin, um Daten zu visualisieren
  • Führen Sie eine interaktive Verarbeitung durch, indem Sie Apache Phoenix auf HBase verwenden
    • Verwenden Sie Phoenix in HDInsight; verwenden Sie Phoenix Grammar für Abfragen; konfigurieren Sie Transaktionen, benutzerdefinierten Funktionen und sekundäre Indizes; identifizieren und optimieren Sie die Phoenix-Leistung; wählen Sie zwischen Hive, Spark und Phoenix auf HBase für die interaktive Verarbeitung; kennzeichnen Sie, wann man Metastore zwischen einem Hive-Cluster und einem Spark-Cluster teilen soll
Implementieren von Big Daten Real-Time Processing-Lösungen
  • Erstellen Sie Spark-Streaming-Anwendungen mit DStream API
    • Definieren Sie DStreams und vergleichen Sie es mit Resilient Distributed Dataset (RDDs), starten und stoppen Sie Streaming-Anwendungen, transformieren Sie DStream (FlatMap, reduceByKey, UpdateStateByKey), behalten Sie Langzeit-Datenspeicher in HBase und SQL, behalten Sie Long Term Daten Azure Data Lake und Azure Blob Storage, streamen Sie Daten von Apache Kafka oder Event Hub, visualisieren Sie Streaming-Daten in einem PowerBI Echtzeit-Dashboard
  • Erstellen Sie Spark-strukturierte Streaming-Anwendungen
    • Verwenden Sie DataFrames und DataSets APIs, um Streaming DataFrames und Datasets zu erstellen. Erstellen von Windows-Operationen in Ereigniszeit; definieren Sie Windows-Transformationen für Stateful und Stateless Operations; streamen Sie Windows-Funktionen, reduzieren Sie durch Schlüssel und Windows, um Streaming-Daten zusammenzufassen; behalten Sie Langzeitdaten HBase und SQL; behalten Sie Langzeit-Daten Azure Data Lake und Azure Blob Storage; streamen Sie Daten von Kafka oder Event Hub; visualisieren ie Streaming-Daten in einem PowerBI Echtzeit-Dashboard
  • Entwickeln Sie Echtzeit-Processing-Lösungen für große Datenmengen mit Apache Storm
    • Erstellen Sie Storm-Cluster für Echtzeit-Jobs, behalten Sie Langzeit-Daten HBase und SQL, behalten Sie Langzeit-Daten Azure Data Lake und Azure Blob Storage, streamen Sie Daten von Kafka oder Event Hub, konfigurieren Sie Window in Storm, visualisieren Sie Streaming-Daten in einem PowerBI Echtzeit-Dashboard, definieren Sie Storm-Topologien und beschreiben Sie Storm Computation Graph Architecture, erstellen Sie Storm-Streams und führen Sie Streaming-Joins durch, führen Sie Storm-Topologien im lokalen Modus zum Testen durch, konfigurieren Sie Storm-Anwendungen (Workers, Debug-Modus), führen Sie Stream-Gruppierungen durch, um Tupel über Komponenten zu verbreiten, debuggen und überwachen Sie Storm-Jobs
  • Erstellen Sie Lösungen, die Kafka verwenden
    • Erstellen Sie Spark- und Stormcluster im virtuellen Netzwerk, verwalten Sie Partitionen, konfigurieren Sie MirrorMaker, starten und stoppen Sie Dienste über Ambari, verwalten Sie Themen
  • Erstellen Sie Lösungen, die HBase verwenden
    • Identifizieren Sie HBase-Anwendungsfälle in HDInsight, verwenden Sie HBase Shell, um Updates zu erstellen und HBase-Tabellen zu löschen, überwachen Sie einen HBase-Cluster, optimieren Sie die Leistung eines HBase-Clusters, identifizieren Sie Fälle für die Verwendung von Phoenix zur Analyse von Echtzeitdaten, implementieren die Replikation in HBase

Optionen für die Vorbereitung

Online-Schulung
Ausbildergeführte Schulung
Bücher

Exam Ref 70-775 Daten Engineering auf Microsoft Azure HDInsight
Veröffentlicht: Dienstag, 24. April 2018

Direkt von Microsoft kommend, ist dieser Exam Ref der offizielle Studienführer für die Microsoft 70-775 Perform Daten Engineering on Microsoft Azure HDInsight Zertifizierungsprüfung. Prüfung Ref 70-775 Perform Data Engineering on Microsoft Azure HDInsight bietet professionelle Vorbereitung, die den Kandidaten hilft, ihre Prüfungsleistung zu maximieren und ihre Fähigkeiten am Arbeitsplatz zu schärfen. Sie konzentriert sich auf die spezifischen Kompetenzbereiche, die moderne IT-Fachleute benötigen, um HDInsight-Cluster erfolgreich zu verwalten und bereitzustellen und effektive Big Data Processing-Lösungen mit HDInsight zu implementieren.

Dieses Buch beim Microsoft Press Store kaufen

Microsoft Press Bücher und eBooks können innerhalb von 90 Tagen nach Erscheinen des Buches vorbestellt werden.

Praxistest

Take a Microsoft Official Practice Test for exam 70-775

Ab April 2017 werden nacheinander Praxistests in mehreren Sprachen verfügbar sein, darunter Spanisch, Chinesisch (vereinfacht), Chinesisch (traditionell), Französisch, Deutsch, Japanisch, Portugiesisch (Brasilien) und Russisch. Um zu sehen, wann eine bestimmte Sprache für diesen Praxistest angeboten wird, bitte die Termine überprüfen.

Wer sollte diese Prüfung ablegen?

Diese Zertifizierungsprüfung richtet sich an Dateninformatiker, Datenarchitekten, Datenwissenschaftler und Datenentwickler, die große Data Engineering Workflows auf HDInsight implementieren. Die Kandidaten für diese Prüfung sollten über einschlägige Berufserfahrung in Big Data Analytics-Lösungen verfügen.

Die Kandidaten sollten auch mit den Funktionen und Fähigkeiten der Batch-Datenverarbeitung, der Echtzeitverarbeitung und der interaktiven Verarbeitung vertraut sein.

Kandidaten, diese Prüfung ablegen, werden voraussichtlich in der Lage sein, das Microsoft Cloud-Ökosystem anzuwenden, um große Daten-Engineering-Workflows zu entwerfen und zu implementieren und Open-Source-Technologien für strategische Wertschöpfung zu nutzen.

Weitere Informationen zu Prüfungen

Auf eine Prüfung vorbereiten

Wir empfehlen, dass Sie diesen Leitfaden zur Prüfungsvorbereitung komplett durchlesen und sich mit den Ressourcen auf dieser Website vertraut machen, bevor Sie Ihren Prüfungstermin festlegen. In der Microsoft Certification exam overview finden Sie Informationen über die Registrierung, Videos zu typischen Prüfungsfragenformaten und anderen Ressourcen zur Vorbereitung. Informationen zu Prüfungsrichtlinien und Bewertung finden Sie in den Microsoft Certification exam policies and FAQs.

Hinweis

Dieser Leitfaden für die Vorbereitung kann jederzeit ohne vorherige Ankündigung und nach eigenem Ermessen von Microsoft geändert werden. Microsoft-Prüfungen enthalten unter Umständen adaptive Testtechnologien und Simulationen. Microsoft gibt nicht das Format vor, in dem Prüfungen dargestellt werden. Bitte verwenden Sie diesen Leitfaden für die Vorbereitung auf die Prüfung, unabhängig von deren Format. Um Sie bei der Vorbereitung auf die Prüfung zu unterstützen, empfiehlt Microsoft, dass Sie praktische Erfahrungen mit dem Produkt sammeln und die angegebenen Trainingsressourcen verwenden. Diese Ausbildungsressourcen decken nicht unbedingt alle der im Abschnitt “Bewertete Fähigkeiten“ aufgeführten Themen ab.