役割ベースの認証資格でさらなる道を切り開きます。 Certify with Confidence 合格のチャンスを与えます。

試験
70-773

Microsoft SQL Server logo

  • 配信開始:
    2017年1月3日
  • 言語:
    英語
  • 対象者:
    データ科学者
  • テクノロジ:
    Microsoft R Server, SQL R Services
  • 対応資格:
    MCSA、MCSE

Microsoft Rでのビッグデータの分析

この試験は 2019 年 6 月 30 日に廃止されます。代替試験を受けることができます。詳細については、当社のブログをご覧ください。https://www.microsoft.com/en-us/learning/community.aspx そして試験の廃止に関する投稿を確認ください。

* 価格には、Microsoft Imagine Academy プログラム メンバー、マイクロソフト認定トレーナー、およびマイクロソフト パートナー ネットワーク プログラム メンバー向けのプロモーション内容や価格割引は反映されません。価格は予告なく変更されることがあります。価格には適用される税は含まれていません。試験の予約をする前に、試験提供者に正確な価格をご確認ください。

2017年5月1日より、既存のキャンセポリシーが次のポリシーに全て置き換わります、 ポリシー:登録した試験日より5営業日以内のキャンセルもしくは日程変更には料金がかかりますスケジュールされていたアポイントメント時より24時間以内に現れなかった、もしくはキャンセルしたか日程変更した場合、全額がかかります。

Microsoft Ignite 2017から試験準備セッションを見る

スキルの評価

この試験では、次の一覧に示す技術タスクを遂行する能力を評価します。マイクロソフト試験の variety of question types について、ビデオ チュートリアルを参照してください。

箇条書きテキストで記述されているトピックに関する質問が出題されますが、これらに限定されるものではないことに注意してください。

この試験で評価されるスキルの妥当性に関するフィードバックをご提供いただける方は、マイクロソフトまでコメントをお送りください。すべてのフィードバックは確認されており、認定資格プロセスの有効性および信頼性を依然として維持しながら、必要に応じて反映されます。マイクロソフトからは、皆様のフィードバックに直接返信されないことにご注意ください。マイクロソフト認定資格プログラムの品質確保のために、皆様からのご意見をお待ちしております。

試験に特定の質問がある場合は、提出してください exam challenge

マイクロソフト認定資格試験のフィードバック、その他の認定資格プログラム、登録、プロモーションや質問がある場合は連絡してください Regional Service Center

ビッグデータの読み取りと書き込み
  • Rサーバーでデータを読み取る
    • テキストファイル、SAS、SPSSなどのサポートされているデータファイル形式を読み込みむ。 データをXDF形式に変換する。 XDFとフラットテキストファイル間のトレードオフを特定する。 オープン・データベース接続(ODBC)データ・ソースを介してデータを読み取る。 他のファイルシステムからファイルを読み込む。 内部データフレームをデータソースとして使用する。 R Serverでネイティブに読み取ることができないソースからのデータを処理する
  • データの要約
    • クロス集計や単変量統計を計算する。rxCrossTabs rxCube の使用時期を選択する。dplyrXdf などのパッケージを使用したオープンソース技術と統合する。機能別のグループ化を実行する。複雑な数式を作成する。データの1回のパスでの複数の作業を実行する。rxQuantile を使って分位数を抽出する
  • データ視覚化
    • ベースプロット関数とggplot2でメモリ内のデータを視覚化する。rxSummary rxCube; でカスタムビジュアライゼーションを作成する。 ファセットプロットを含む rxHistogram rxLinePlot, でデータを視覚化する
ビッグデータを処理する
  • rxDataStep でデータを処理する
    • データのサブセット化を実行する。Transforms 引数を使用して列を変更および作成する。オンザフライ変換とデータ変換のトレードオフを使用するかどうかを選択し、フィルタリングまたは置換によって欠損値を処理し、データフレームまたはXDFファイルを生成する 。日付を処理する(POSIXctPOSIXlt
  • 変換関数を使用する複雑な変換を実行する
    • 変換関数を定義する。 変換関数を使用してデータを再形成する。 lubridate などのオープンソース パッケージを使用する。 transformVars transformEnvir を使用して値を渡す。クロス チャンク通信を含むタスク用の内部.rx 変数と関数を使用する。
  • データセットを管理する
    • 昇順や降順などのさまざまな順序でデータを並べ替える。 rxSort 重複排除を使用して重複値を削除する。 rxMerge()を使用してデータソースをマージする。 オプションとタイプをマージする。 rxSort rxMerge の代替がいつ使用されるべきかを特定する
  • RML パッケージを使用してテキストを処理する
    • featurizeText()などの RML 関数を使用してフィーチャを作成する。 categorical() categoricalHash()などの RML 関数を使用して標識変数と配列を作成する。 RML 機能を使用して機能選択を実行する。
ScaleR で予測モデルを構築する
  • 線形モデルを推定する
    • 線形モデルを推定するには、rxLinModrxGlm、および rxLogit を使用する。 rxTweedie などの関数を使用して一般化線形モデルのファミリを設定する。F 関数や Transforms 引数などの適切な引数と関数を使用して、オンザフライでデータを処理する。 頻度または確率重みによる重み付け観測; 欲張り検索、繰り返しスコアリング、トレーニングの副産物など、さまざまなタイプの自動変数選択を選択可能。 自動変数選択時に欠損値の影響を特定する
  • パーティション化モデルの構築と使用
    • パーティショニングモデルを構築するには、rxDTreerxDForest、および rxBTrees を使用する。 損失を使用して偽陽性とミスの重み付けを調整する。 プルーニング、学習率、ツリーの深さなどのバイアスと分散に影響を与えるパラメータを選択する。 オープンソースのエコシステムと対話するために as.rpart を使用する
  • 予測と残差を生成する
    • rxPredict を使用して予測を生成する。 rxExec を使用して並列スコアリングを実行する。 rxDForest に対する GLM、レスポンス、prob、および投票のリンクとレスポンスのスコアなど、さまざまなタイプの予測を生成する。 通常、ピアソン、DBM など、さまざまなタイプの残差を生成する
  • モデルの評価とパラメータのチューニング
    • 推定モデルを要約する。 rxExec を使用してパラレル・パラメータをチューニングするなど、プロセス外の任意のコードを実行する。RevoTreeView rxVarImpPlot を使用してツリーモデルを評価する。 組み込み関数を使用してモデル評価メトリックを計算する。 平均絶対誤差パーセンテージや精度リコールカーブなどのカスタムコードを使用して、モデル評価メトリックと視覚化を計算する
  • RML パッケージを使用した追加モデルの作成
    • 1 クラスのサポートベクターマシンを構築および使用する。L1 と L2 の正則化を使用する線形およびロジスティック回帰を構築および使用する。FastTree を使用した意思決定ツリーを構築および使用する。ランキング・ロス(NDCG)を推奨する FastTree を使用する。単純な 3 層フィード フォワード ニューラル ネットワークを構築して使用する
異なる環境で R Server を使用する
  • 異なる計算コンテキストを使用して R Server を効果的に実行する
    • 計算コンテキスト(rxHadoopMRrxSparkrxLocalseq、および rxLocalParallel)を変更する。 異なるタスクにどの計算コンテキストを使用するかを特定する。 コンテキスト(RxOdbcData および RxTextData)に応じて、異なるデータ ソース オブジェクトを使用する。 さまざまなデータ ソースと計算コンテキスト(HDFSとSQL Server)に適切なデータ ソースを特定して使用する。 異なる計算コンテキスト間でプロセスをデバッグする。 RevoPemaR のユースケースを特定する
  • ローカルの計算コンテキストを使用してタスクを最適化する
    • ローカル コンピューティング コンテキストでのみ実行できるタスクを特定して実行する。ローカル コンピューティング コンテキストで実行するのが効率的なタスクを特定する。、rxLocalseq rxLocalParallel を選択する。異なる計算コンテキストをプロファイルする
  • SQL Server を使用してデータベース内の分析を実行する
    • データベース内計算とデータベース外計算を実行するタイミングを決定する。データベース内計算の制限を特定する。データベース内とデータベース外の計算コンテキストを適切に使用する。データ処理手順にストアド プロシージャを使用する。オブジェクトをシリアル化して書き戻しする。 テーブルのバイナリ フィールドへの変換を実行する。テーブルの書き込みを実行する。SQL Server の最適化( chunksizenumtasks、および computecontext)を設定する。パフォーマンス プロパティについて SQL 管理者および設計者(SQL Server Profiler) に効果的に伝える
  • Hadoop エコシステムと Spark で分析ワークフローを実装する
    • Spark で適切な R サーバ機能を使用する。 Hive、Pig、および Hadoop MapReduce と統合する。 SparklyR や SparkR などのツールの Spark エコシステムと統合する。 さまざまなコンピューティング コンテキストにわたってプロファイルとチューニングを行うことができる。 foreach を使って書かれたコードを並列化するために doRSR を使用する
  • 予測モデルを SQL Server および Azure 機械学習に導入する
    • 予測モデルをストアド プロシージャとして SQL Server に展開する。AzureML R パッケージを使用して Azure 機械学習に任意の関数を展開する。いつ DeployR を使用するかを識別する

受験対象者

この試験の受験者は、R を使用してメモリー容量より大きなデータセットを進行分析するデータ サイエンティストかアナリストです。受験者は R の経験を持つ必要があり、データ構造に詳しく、基本プログラミング コンセプト(たとえばコントロール フローやスコープ)に詳しく、R 関数の作成やデバッグに詳しい必要があります。

受験者は、共通の統計的方法とデータ分析のベストプラクティスに精通している必要があります。また、受験者は、Hadoop エコシステム、SQL Server、コア T-SQL 機能などのデータ プラットフォームについても、高度に理解している必要があります。

試験に関する追加情報

試験のための準備

試験のスケジュールを検討する際は、この試験準備ガイド全体を確認し、 Web サイト上のリソースをよく理解することをお勧めします。次の を参照して、 Microsoft Certification exam overview 登録、よくある問題形式の動画、その他の準備リソースをご参照下さい。試験方針や採点については、次を参照 Microsoft Certification exam policies and FAQs

注意

この準備ガイドは、Microsoft の判断に従っていつでも予告なく変更されることがあります。マイクロソフトの試験には、適応型テストの技術およびシミュレーション アイテムが含まれる場合があります。試験の提供形式は特定しません。試験の形式に関係なく、準備にはこの準備ガイドを使用してください。この試験の準備に役立つよう、Microsoft はこの製品に関する実地経験を積むこと、および指定されたトレーニング リソースを使用することをお勧めします。これらのトレーニング リソースは、「スキルの評価」 セクションの一覧に示されたトピックすべてに必ずしも対応しているわけではありません。