Silverlight をインストールするには、ここをクリックします*
Japan変更|すべてのMicrosoft のサイト
MSDN
|MSDN ライブラリ|デベロッパー センター|ダウンロード情報|開発ツール製品|コミュニティ|ご意見・ご要望|サイトマップ
MSDN Home  
MSDN Home > Windows Media > コンテンツ制作 > Windows Media エンコーダ 7 を使用したロング フォーマット コンテンツのエンコード

Windows Media エンコーダ 7 を使用したロング フォーマット コンテンツのエンコード

Tricia Gill
Digital Media Division
Microsoft Corporation

January 2001
日本語版最終更新日 2002 年 3 月 20 日

概要 : この記事では、Windows Media エンコーダ 7 を使用して、オンライン ストリーミングおよびダウンロード再生という両方のシナリオで利用される高品質のマスタをエンコードする際のヒントとコツを説明します。また、エンコードプロセスを現在のビデオ制作プロセスにシームレスにはめ込むために、エンコード前に実行すべき手順についても説明します。

はじめに

フィルムやビデオの業界で制作されるコンテンツには、映画、コマーシャル、ドラマなどがあります。このようなコンテンツは、最高の品質水準を満たすため、細心の注意を払って制作されます。オリジナルの媒体は、フィルム、ビデオテープ、デジタル ビデオテープ、またはこれらの組み合わせです。配布前には、これらのコンテンツには、不完全な色の修正、特殊効果の追加、シーンを組み合わせた編集、オーディオとビデオ トラックの同期といった、さまざまな特殊処理が施されます。最後の手順は、コンテンツをさまざまなマスタ形式に変換することです。ストリーミング メディアが普及するにつれ、スタジオでは、これらのマスタを配布するために Microsoft® Windows Media 形式のファイルを作成できるようになってきました。

この記事では、Windows Media エンコーダ 7 を使用して、オンライン ストリーミングおよびダウンロードして再生という両方のシナリオで利用される高品質のマスタをエンコードする際のヒントとコツを説明します。また、エンコード プロセスを現在のビデオ制作プロセスにシームレスに適合させるためにエンコード前に実行すべき手順についても説明します。

この記事には以下の内容が含まれています。

  • コンテンツの準備。コンテンツのエンコード前に実行すべき調整について説明します。
  • ハードウェアの構成。エンコードと表示を最適化するために推奨される、エンコードおよびクライアント コンピュータの構成を紹介します。
  • エンコードのシナリオ。フィルムやビデオのプロフェッショナルが、エンコード プロセス中に経験する一般的なシナリオについて説明します。
  • 最高品質の実現。コンテンツを最も効果的にエンコードするためのテクニックについて説明します。
  • 詳細情報

コンテンツの準備

Microsoft Windows Media エンコーダで作業を行う前に、コンテンツの編集、クリーニング、その他の処理はすべて完了している必要があります。エンコーダは、実際のコンテンツと画像ノイズを区別できないため、すべて同等にエンコードします。ビデオ ノイズやフィルムのスクラッチといった画像ノイズをエンコードしてしまうと、エンコード リソースが消費され、貴重な帯域幅が無駄に使用されて、場合によってはエンコードされたビデオにブロックノイズが発生します。コンテンツからこのような画像ノイズを除去または削減しておけば、実際のコンテンツの細部を再現するために、より多くのエンコード リソースと帯域幅を割り当てることができます。 これにより、エンコードされたビデオの品質が向上します。入力がくっきりとしてきれいであればあるほど、エンコード後の出力もきれいになります。

コンテンツのエンコード準備として、以下のテクニックを使用できます。すべてのテクニックがあらゆるコンテンツに適しているわけではありません。作業するコンテンツの種類と、エンコードして出力したものの最終的な利用方法によって、どのテクニックを利用すべきかが決まります。

ノイズ フィルタリング

このテクニックは、ノイズを減らしてビデオの品質を向上させるために広く使われています。ノイズ フィルタは、空間に対して、および時間に対して適用されるテクニックの1つで、感知できない高周波のノイズ(これは帯域幅を消費します)を除去します。

空間に対してのノイズフィルタを調整することで、映像中の鮮鋭なエッジの部分などは残したまま、イメージをスムーズにすることができます。 時間に対してのノイズフィルタは、映像の動きが速い場合にぼけが発生することがありますが、その代わり、画像の品質を向上させます。

時間に対するフィルタを、フィルムのスクラッチ除去システムの一部として使用する場合も、スタンドアロンのエンコード プリプロセッサとして使用する場合も、動きのノイズの発生に注意してください。時間に対するフィルタを調整することで、全体のノイズ レベルを低くすることはできますが、完全に除去することはできません。

ブリック ウォール フィルタとアパーチャ補正

ブリック ウォール フィルタは、画像全体を等しくぼかすことによって高周波のノイズを低減します。アパーチャ補正は、スナップをソフト イメージに復元させるパラメトリック イコライザです。ビデオのくっきりした見た目を保持するには、ブリック ウォール フィルタをおよそ 3.2 メガヘルツ(MHz)のローパスになるよう設定し、アパーチャ補正を使用して、およそ 2.5 MHz のブロードなピークを与えます。

黒レベル (Pedestal Level)

黒レベルを増加させることにより、暗い黒色が目立たないように和らげることができます。VGA ディスプレイの明るさ調整に関するビデオ グラフィック アダプタ (VGA) の不適応を補正するには、ペデスタル レベルをわずかに上げます。

グレイン (粒状性)

フィルムのグレインを隠すには、テレシネの過程でスクラッチ除去を行います。これを実行するには、最大ブロック サイズを選択し、モーションのしきい値を最大にします。

ハードウェアの構成

エンコードは多くのリソースを必要とする処理であり、コンテンツに多くのモーションや精細な部分が含まれる場合はなおさらです。リアル タイムでライブの画像をエンコードするときは、プロセッサの速度が最も重要です。ファイルからエンコードする場合やトランスコーディングする場合、特に AVI 形式のファイルからエンコードする際は、コンピュータのバスの速度が限界速度となります。

Microsoft で行われたラボ テストでは、以下のハードウェア構成を使用しました。

  • デュアル Pentium III 1 ギガヘルツ (GHz) プロセッサ
  • PIII マザーボードと内蔵の U160W SCSI コントローラ、および Intel 10/100 BaseT ネットワーク アダプタと AC97 互換のオンボード オーディオおよびデュアル PCI バス
  • 3 個の 36 ギガビット (GB) Ultra 160 SCSI 10Krpm ハード ディスク
  • AGP 4X 64 メガバイト (MB) DDR RAM ビデオ コントローラ
  • Viewcast Osprey-500WM キャプチャ カード
  • DVD-ROM 内蔵ドライブ
  • 1.44 MB 内蔵フロッピー ドライブ
  • 512 MB 800 MHz ECC RDRAM
  • 21 インチ モニタ

高品質オーディオを実現するには、44 および 48 キロヘルツ (KHz) でのオーディオ入力をサポートしているデジタル オーディオ キャプチャ カードも必要です。

高品質ビデオのエンコードに多くの力が必要なだけでなく、満足できる品質で画像を表示して楽しむには、ユーザー側にもパワフルなコンピュータが必要となります。クライアント コンピュータには、高速なプロセッサ、多くのメモリ、そして Microsoft DirectX® アプリケーション プログラミング インターフェイス (API) をサポートするグラフィック カードが必要です。

以下の表に、各種解像度およびフレーム レートでエンコードされたコンテンツの表示に最適な構成をまとめます。

この解像度でご覧ください 利用できる最小構成は以下のとおりです
320 ピクセル × 240 ピクセル、30 fps (1 秒間に 30 フレーム) 300 MHz 以上のプロセッサと 64 MB RAM
640 ピクセル × 480 ピクセル、30 fps 700 MHz 以上のプロセッサと 128 MB RAM
320 ピクセル × 240 ピクセル、60 fps 700 MHz 以上のプロセッサと 64 MB RAM
コンテンツをエンコードする前に、利用者について考慮してください。対象ユーザーのほとんどが高解像度ビデオ表示に必要な設備を持っていない場合、利用者に合わせて、敢えて低品質におさえなければならない場合もあります。

エンコード時に最適なパフォーマンスを得るには、以下のことを実行してください。

  • ハード ドライブをデフラグする。
  • コンテンツのキャプチャ中にほかのユーザーがハード ドライブにアクセスしてこないよう、ネットワーク共有やドライブ共有をオフにする。
  • ほかのすべてのアプリケーション、特にハード ディスクにアクセスするアプリケーションを閉じる。

問題が発生した場合、特にフル解像度 (640 × 480 ピクセル) でキャプチャしているときは、ハードウェアがデータの供給に追いついているかどうか確認してください。また、キャプチャ カードと SCSI カードの間でダイレクト メモリ アクセス (DMA) バッファの競合が発生している場合があります。これを解消するには、デュアル PCI バス システムを使用するか、または SCSI コントローラとキャプチャ カードを分離して、同じバスを共有しないようにします。

エンコードのシナリオ

以下に、Windows Media エンコーダの一般的な使い方のシナリオをいくつか紹介します。それぞれのシナリオについて、コンテンツを最も効果的にエンコードするための推奨事項と参照先のリンクも記載されています。

エンコーダとテープ デッキの同期

エンコーディング スタジオでは多くの場合、ソース内の特定のフレーム位置で、Windows Media エンコーダを開始および停止するプロセスを同期させる必要があります。また、同じマスタから、異なるビット レートの複数の Windows Media ファイルを作成しなければならない場合があります。これらのファイルを個別のプロセスで作成する代わりに、エンコーディング スタジオでは、複数のテープ デッキとエンコーダを中央から操作して、すべてのマスタを一度に作成することができます。すべてのデッキは、ソース リールと一緒に開始および停止するよう同期されています。その環境に、Windows Media エンコーダを実行しているコンピュータといったコンピュータベースのコンポーネントを追加すると、ハードウェアおよびソフトウェア システムが元来持っている遅延によって完全な同期が妨げられるため、作業が困難になります。しかし通常この遅延は、特定の構成の下では常に一定です。

Windows Media Resource Kitに含まれる新しいツールであるEncoder Controllerを使用すると、フレームに忠実な再生コントロールを実現できます。Encoder Controllerは、Windows Media エンコーダ 7 ソフトウェア開発キット (SDK) を使用して構築されており、Sony RS422 通信プロトコルをサポートしています。

Encoder Controllerでは、エンコーダがエンコードを開始するフレームを設定できるため、[開始] コマンドが実行されてから実際のエンコードが開始するまでの遅れを補うことができ、遅延問題が解決されます。

遅延時間に対応するフレーム数を決定するには、それぞれのシステムで実験する必要があります。遅延の長さに対応するフレーム数がわかったら、そのフレーム数だけエンコーダを早く開始するようEncoder Controllerで設定します。たとえば、[開始] を押してから 10 フレーム後にコンピュータがエンコードを開始する場合で、フレーム 1 からエンコードを開始したい場合は、Encoder Controllerを使用して、エンコーダを -9 の時点 (実際に開始したいフレームより 9 フレーム前) で開始するよう設定します。これは In 設定です。Encoder Controllerの詳細については、Encoder Controllerの Readme ファイルを参照してください。

Windows Media Resource Kitの詳細については、Windows Media の Web サイトを参照してください。

複数のリールからのエンコード

フィルムのソースが複数のリールで構成されている場合、Windows Media Resource Kitに含まれるStitcher toolを使用することができます。

Stitcher toolは、複数のファイルを処理してそれらを一緒に単一の Windows Media ファイルにエンコードします。スティッチャは、.asf、.avi、.bmp、.mp3、.mpg、.wav、.wma、.wmv などの拡張子を持つファイルを含め、Windows Media エンコーダがサポートしているすべての入力形式を取り扱うことができます。

Stitcher toolを使用して複数のリールから単一のファイルをエンコードするには、以下の手順を実行します。

  1. 個々のリールを個別のファイルとしてエンコードします。
  2. Stitcher toolを開始します。
  3. エンコードしたファイルを、最終的なビデオで表示したい順序で追加します。
  4. 出力ファイルを指定します。
  5. プロファイルを選択します。これは、Windows Media エンコーダで使用できるのと同じプロファイルです。

入力ファイルをすべて合わせたサイズがバッファの許容量を越えている場合は、2 つのファイルの結合部分でフレーム落ちが発生することがあります。

Stitcher toolの使用方法の詳細については、Windows Media Resource Kitを参照してください。Windows Media Resource Kitは、Windows Media の Web サイトから入手できます。

レターボックス コンテンツのエンコード

レターボックス プロセスでは、16:9 アスペクト比の画像を、4:3 アスペクト比の画面表示に変換します。その結果、各フレームの上下に黒い余白が表示されます。

ビデオをエンコードすると、この余白部分には画像データが含まれていないにもかかわらず、ほかのコンテンツと同様にコーデックによって圧縮されます。16:9 のアスペクト比を維持したまま余白部分を切り落とせば、フィルムのコンテンツだけがエンコードされるため、貴重な帯域幅をエンコード後のビデオの細部を再現するために確保できます。

レターボックス コンテンツのエンコードは、ほかのあらゆる種類のコンテンツのエンコードとほとんど同じですが、以下の 2 つの手順を追加する必要があります。

  1. ビデオの上下を切り落として黒い余白部分を削除します。
  2. 適切な出力サイズをプロファイルに設定します。

以下に、レターボックス コンテンツをハーフ解像度およびフル解像度でキャプチャする方法を紹介します。

フル解像度のレターボックス ビデオのキャプチャ

  1. 新しいセッション ウィザードを使用して、エンコード セッションをセットアップします。
  2. [セッション] メニューの [プロパティ] をクリックし、[プロファイル] タブをクリックします。
  3. [編集] をクリックし、[ストリームの共通設定] ページが表示されるまで [次へ] をクリックします。
  4. [ビデオ サイズ][ユーザー設定] をクリックし、「640 x 360」と入力します。(640 ピクセル × 480 ピクセルの画像をキャプチャして、640 ピクセル × 360 ピクセルの画像になるように出力サイズを切り落とすことができます。)
  5. [完了] をクリックします。
  6. [ソース] タブをクリックしてソースを選択し、[変更] をクリックします。
  7. [ビデオのトリミング] タブをクリックします。
  8. [上] および [下] の両方に「60」と入力します。
  9. [OK] をクリックし、もう一度 [OK] をクリックします。
  10. Windows Media エンコーダのメイン ウィンドウで [開始] をクリックします。

ハーフ解像度のレターボックス ビデオのキャプチャ

  1. 新しいセッション ウィザードを使用して、エンコード セッションをセットアップします。
  2. [セッション] メニューの [プロパティ] をクリックし、[プロファイル] タブをクリックします。
  3. [編集] をクリックし、[ストリームの共通設定] ページが表示されるまで [次へ] をクリックします。
  4. [ビデオ サイズ][ユーザー設定] をクリックし、「320 x 180」と入力します。(320 ピクセル × 480 ピクセルの画像をキャプチャして、320 ピクセル × 180 ピクセルの画像になるように出力サイズを切り落とすことができます。)
  5. [完了] をクリックします。
  6. [ソース] タブをクリックしてソースを選択し、[変更] をクリックします。
  7. [ビデオのトリミング] タブをクリックします。
  8. [上] および [下] の両方に「60」と入力します。
  9. [OK] をクリックし、もう一度 [OK] をクリックします。
  10. Windows Media エンコーダのメイン ウィンドウで [開始] をクリックします。

アーカイブの作成

エンコードしてアーカイブされた高品質ファイルは、将来のエンコード セッションのソースとして使用できます。これらのファイルは、クライアントが使用できる帯域幅および接続速度に応じた各種の低ビット レートでエンコードする際のマスタ入力ソースとして利用可能です。

ブロードキャスト中に同時にアーカイブを作成することもできますが、最高品質のアーカイブを作成するには、直接ファイルにエンコードすることをお勧めします。これにより、ブロードキャストのシナリオで多くの場合に問題となる帯域幅やネットワークの制約を受けることがなくなります。

常に、できる限り品質の高いソースから始めてください。コンテンツのプリプロセッシングや編集はすべて完了させておいてください。また、画像ノイズやスクラッチもできる限りすべて除去しておいてください。次に、プロファイル マネージャを使用してプロファイルを作成し、ストリームに使用するよりも高いビット レートを指定します。現在のPCスペックで、Windows Media Player で 6 Mbps (1 秒間に 6 メガビット) 以上といった非常に高いビット レートでエンコードされたコンテンツを再生することは現実的ではありません。このファイルは、高品質マスタとして使用するだけで、ストリーミングには使用しません。

プロファイルが完成したら、新しいセッション ウィザードを使用して、エンコード セッションをセットアップし、[接続したビデオまたはコンピュータの画面から、オーディオまたはビデオを取り込む] オプションを選択します。ファイル名を指定し、作成したプロファイルを使用してコンテンツをエンコードします。

作成したアーカイブを使用して、低いビット レートでコンテンツをエンコードするには、新しいセッション ウィザードでエンコード セッションをセットアップし、[オーディオまたはビデオ ファイルを Windows Media ファイルに変換する] オプションを選択します。クライアントがさまざまな速度で接続する場合は、複数ビット レート (MBR) プロファイルを選択して、エンコーダにコンテンツを複数の異なるビット レートでエンコードさせることができます。 エンコード セッションをセットアップしたら、コンテンツをエンコードします。エンコードの結果、アーカイブから低いビット レート形式にトランスコードされたファイルが作成されます。

エンコード セッションと MBR プロファイルのセットアップの詳細については、Windows Media エンコーダのヘルプを参照してください。

リアル タイムでのエンコードと AVI のキャプチャ

リアル タイムでエンコードするかどうか決定する際は、ソースの品質と、エンコード後のビデオの用途を考慮してください。

Windows Media エンコーダを使ってリアル タイムでコンテンツをエンコードする場合、1 ステップでプロセスを実行できるという利点があります。中間ファイルを作成したり保管したりする必要がなく、オーディオもビデオも、元のソースの単一パスでキャプチャおよびエンコードできます。複数のソースからエンコードして、エンコード セッション中にソースを切り替えることもできます。またリアルタイムでエンコードすることにより、モニタ上での色およびエンコードの画像ノイズの原因となる RGB/YUV 色空間の変換が少なくて済みます。

ただし、リアルタイムでのエンコードには、パワフルなコンピュータが必要になります。推奨される構成は次のとおりです。

  • デュアル Pentium III 733 MHz 以上のプロセッサ (画像サイズが 640 ピクセル × 480 ピクセルの場合は、1 GHz プロセッサ)
  • 256 MB RAM (推奨は 512 MB)
  • デュアル PCI バス

ビデオ キャプチャ カードも重要なコンポーネントです。Viewcast Osprey-500WM を推奨します。これは、Windows Media 形式に完全な形で直接デジタル リアルタイム キャプチャできる唯一のソリューションです。Osprey-500WM では、高品質デジタル ビデオ (DV)、SDI ビデオ、およびデジタル オーディオ入力ソースを使用できます。さらに Osprey-500WM は、時系列/空間ノンインターレース化フィルタ、デジタル ビデオ デコーダ、ビデオ スケーリングといったハードウェア ビデオ プロセッシングも実行できます。

リアル タイムでエンコードする際は、システムがデータに追いついていることを確認するためにモニタし続ける必要があります。キャプチャ カード、ドライバ、プロセッサ、ハード ディスク、メモリといった、エンコードするコンピュータの多くのコンポーネントが使用されます。プロセッサはエンコードの進行中にもほかのシステム プロセスを処理しなければならないため、CPU の利用率は 80% を越えてはなりません。

AVI にキャプチャすることによって、Windows Media エンコーダは、AVI ファイルから Windows Media 形式への変換にすべての時間をかけられます。さらに時間をかければ、エンコーダは、帯域幅、ビット レート、品質、フレーム レート、およびバッファ サイズの最適な組み合せを決定して、できる限り最高品質のエンコード ビデオを作成できます。AVI ファイルをエンコードする前に、ファイル内のセグメントの並べ替え、ノイズの低減、コントラストや明るさの調整といった編集を行うこともできます。バッファの問題により、エンコードした Windows Media ファイルを正しく編集することはできないため、編集作業が必要な場合は、AVI にキャプチャするのが最適なソリューションです。

しかし、AVI へのキャプチャには確かに短所もあります。まずデータをキャプチャしてからエンコードしなければならないため、2 ステップの作業になります。また AVI は非圧縮形式であるため、ファイルが非常に大きくなることがあります。これらのファイルをハード ディスクからメモリに移動すると、システムのバスに大きな負担がかかります。640 ピクセル × 480 ピクセルの解像度で AVI にキャプチャするには、以下の構成を推奨します。

  • 133 MHz システム バス
  • 64 ビット U2 または Ultra 160 SCSI コントローラ
  • SCSI U2 または Ultra 160 ハード ディスク (10,000 〜 15,000 RPM)
  • RAID 0 ストライプ
  • Viewcast Osprey-500WM ビデオ キャプチャ カード

エンコード前に AVI にキャプチャする場合は、2 GB のファイルの制約について考慮する必要があります。オリジナルの AVI 形式仕様では、その仕様に合わせて構築されたハードウェアおよびソフトウェア ツールが、2 GB 以下の AVI ファイルをサポートするよう設定されていました。最近仕様が変更され、2 GB より大きなファイルも使用できるようになりましたが、AVI をサポートするハードウェアやソフトウェア ツールの中には、この新しい仕様をサポートしていないものもあります。この新しい AVI 形式は、AVI Type II または拡張 AVI などと呼ばれます。

Windows Media エンコーダは AVI Type II 形式をサポートしており、2 GB を越える AVI ソースをエンコードすることができます。Windows Media Resource Kitには、DirectShow SDK を基盤に構築された WMcap ツールも含まれており、これを使用すると、2 GB を越える AVI ファイルをディスクにキャプチャすることができます。Windows Media Resource KitWindows Media の Web サイトから入手できます。

AVI ファイルをエンコードする前に編集する場合で、2 GB を越えることが予測される場合は、編集ツールが AVI Type II 形式をサポートしていることを確認してください。

DVD レベル品質のコンテンツのエンコード

エンコードしたコンテンツを DVD レベルの品質にするには、パワフルなコンピュータが必要です。このようなコンテンツのエンコードには多くのリソースが必要となるため、まず AVI にキャプチャすると最適な結果が得られます。AVI にキャプチャすることにより、エンコード前に編集できる非圧縮ファイルが作成されます。このためエンコーダは、リアル タイムでエンコードするよりも長い時間をかけてコンテンツを圧縮できます。これにより、データ フローに追いつこうとしてフレーム落ちが発生することがなくなり、高品質の出力が実現されます。

DVD レベル品質のコンテンツをエンコードする際は、プロファイルを作成または編集して、以下の設定を含めてください。

  • ビデオ サイズ : 640 x 480
  • フレーム レート : 24 fps (逆テレシネ) または 30 fps ビデオ
  • ビット レート (コンテンツに依存) : 750 Kbps 以上、最高 1 〜 2 Mbps 以上
  • オーディオ形式 : 64 Kbps 44 KHz ステレオ以上

これらはすべてプロファイル マネージャで設定できます。プロファイルの編集の詳細については、Windows Media エンコーダのヘルプを参照してください。

エンコード中のソースの切り替え

Windows Media エンコーダを使用すると、エンコード セッション中に、カメラ、ファイル、その他のデバイスといった複数のソースを定義し、ソース間で切り替えることができます。ファイルと画面以外の各ソースは、個別のキャプチャ カードに接続されている必要があります。 ソースは、エンコーダのメイン ウィンドウの左側にボタンとして表示され、それらのボタンをクリックするだけでソースを切り替えることができます。

新しいセッション ウィザードを使用して、エンコーディング セッションを構成する際に、ソースを 4 つまで作成できます。5 つ以上のソースが必要な場合、または既存のソースを修正したい場合は、エンコーダのメイン ウィンドウにある [セッション] メニューの [プロパティ] を選択します。

Windows Media エンコーダは、サードパーティのハードウェアまたはソフトウェア スイッチャとも協調して動作することができます。ハードウェア スイッチャを使用する場合、さまざまなソースをスイッチャに接続し、そのスイッチャを、エンコードするコンピュータに取り付けたキャプチャ カードに接続します。スイッチャの出力は、National Television Standards Committee (NTSC) 信号でなければなりません。その後、キャプチャ カードからの入力を受け取れるようにエンコーダを設定します。

ソフトウェア スイッチャを使用する場合は、コンピュータに取り付けた 1 つまたは複数のキャプチャ カードにデバイスを接続します。各デバイスからの入力は、サードパーティ ソフトウェアから制御します。多数のアプリケーションで、各環境内でエンコードを行い、Windows Media エンコーダをプログラム的に呼び出すことができます。

Windows Media エンコーダ内でのソースの設定に関する詳細は、Windows Media エンコーダのヘルプを参照してください。サードパーティのハードウェア ツールおよびソフトウェア ツールに関する詳細は、Windows Media の Web サイトにあるサードパーティ製品およびサービスのページを参照してください。

最高品質の実現

高品質のエンコード ビデオは、決められた特定のパラメータで実現できるものではありません。実現したい出力のレベルに応じて、コンテンツ、ハードウェア、ソフトウェアなどに各種の調整が必要です。このセクションでは、コンテンツを最も効果的にエンコードするために実行できる微調整について説明します。以下の推奨内容は、固定ビット レートでエンコードしていることを前提としています。可変ビット レート エンコードを実行したい場合は、Windows Media の Web サイトから Windows Media 8 エンコード ユーティリティを入手して使用してください。

品質、バッファ、ビット レート、キー フレーム

固定ビット レートのストリームでは、画像品質、バッファ、ビット レート、およびキー フレーム間隔の各設定は、互いに密接に結びついています。これらの設定のいずれかを調整すると、ほかの設定にも影響が出ます。これら 4 つの設定を適切にバランスさせるには試行錯誤が必要で、最適な設定は実現したい出力効果によっても異なります。たとえば、画像品質のレベルを高く設定し、ビデオにクリアな画像を実現させるためには、いくつかのフレームがドロップしても構わない場合もあります。4 つのうちどれが最も重要な設定であるかをまず決定し、ほかの設定はそれに合わせて調整してください。以下にいくつかのガイドラインを示します。

これらの設定はすべてプロファイル内に含まれています。調整するには、Windows Media エンコーダのプロファイル マネージャを開きます。エンコーダのメイン ウィンドウからプロファイル マネージャを開くには、[ツール] メニューの [プロファイルの管理] をクリックし、画面の指示に従います。プロファイル マネージャの詳細については、プロファイル マネージャのヘルプを参照してください。

品質

[画像の品質] 設定では、[より滑らかな動き] または [より鮮明な画像] を選択します。画像が鮮明であるほど、ビデオのストリームにより大きな帯域幅が必要となります。利用可能な帯域幅やバッファ サイズに対して画像の品質レベルを高くしすぎると、要求された品質を維持するため、コーデックがフレームをドロップします。コンテンツに適用する品質レベルを選択するときは、以下のヒントを参考にしてください。

  • 多くの動きや精細な部分が含まれていないコンテンツの場合は、[画像の品質] を 80 〜 100 に設定します。
  • 多くの動きや精細な部分が含まれているコンテンツの場合は、[画像の品質] を 50 〜 70 に設定します。

フレーム落ちを発生させずに最高の品質を得られる設定を見つけるには、コンテンツで実験してみてください。選択した品質設定が、出力品質に許可される最低のしきい値となります。

バッファ

バッファは、Windows Media Player がレンダリングする前のコンテンツを一時的に保管するための、クライアント コンピュータ上の記憶域です。バッファを使用することで、コンテンツがサーバーから送られる間、クライアントが待機せずに済みます。これにより、ビデオのギャップや中断が減少し、快適な表示が実現されます。ただし、コンテンツをバッファに保管するとメモリが消費されます。バッファが大きいほど、情報の保管に多くのメモリが必要となります。特に高解像度ビデオのためなどにバッファ サイズを大きくすると、コンピュータのメモリが過負荷になり、コンピュータが情報をエンコードする能力に支障が出ることがあります。

バッファリングと可変ビット レート

フレームごとに含まれる動きや細部の量は、すべてのコンテンツでそれぞれ異なります。動きや精細な部分が多いコンテンツをストリーミングするには、動きや精細な部分が少ないコンテンツと比べ、同じ品質で表示するにも、より大きな帯域幅が必要となります。

固定された接続を使用して配信するためにエンコードする場合は、すべてのコンテンツを一定のビット レートでエンコードします。そのビット レートが高い場合は、コンテンツのストリーミングに、より大きな帯域幅が必要となります。しかし、より大きなバッファを使用することで、低いビット レートを設定し、フレーム間の可変性を実現できます。ここで重要なのは、ビット レートとバッファ サイズの適切な組み合せを見つけることです。

コンテンツのストリーミングを含むシナリオの場合、秒数で表したバッファのサイズが、ユーザーがストリームを受け取るまでの待機時間となります。しかし Windows Media Player 7 では集中読み込みを行うため、エンコーディング プロファイルで使用したビット レートよりもクライアント接続のほうが高速の場合は、プレーヤーが接続の最大レートでデータをキャッシュに読み込みます。

ダウンロードして再生するシナリオでは、いったんダウンロードされたコンテンツはローカルで再生されるため、ロード時間が長くなるという不利益をこうむることなく、バッファの値を大きく設定できます。バッファを大きくするほど、再生中のビット レートの可変性が大きくなります。これは、元のオーディオまたはビデオの可変性に非常に近いものになります。

最適なバッファ サイズは、エンコードするコンテンツの種類によって異なります。以下のガイドラインを参考にしてください。

  • 320 ピクセル × 240 ピクセルの解像度でダウンロードして再生する場合は、90 秒間のバッファを使用してください。再生の前にバッファ全体がメモリ内にキャッシュされる必要があるため、クライアントが持っていると予測されるメモリの量によっては、より小さなバッファ (640 ピクセル × 480 ピクセルの再生の場合で 20 秒など) を使用すべき場合もあります。
  • ストリーミングの場合は、クライアントがストリームを待機する時間を最小限に抑えるため、バッファを 20 秒以下に制限してください。バッファを 20 秒に近い設定にするほど、高ビット レート セグメントのエンコードが向上しますが、クライアント側の待機時間が長くなります。バッファを 20 秒以下に設定することにより、クライアント側のシーキングの待機時間を短縮できます。
    Windows Media 8 エンコード ユーティリティを使用すると、ダウンロードして再生するシナリオ用に真の可変ビットレート ストリームをエンコードすることができます。このユーティリティには、複数パス機能も備えられており、ビデオ オンデマンドの作成に使用できます。Windows Media エンコード ユーティリティの詳細については、Windows Media の Web サイトを参照してください。

エンコーディング プロファイル内でバッファサイズを変更するには、以下の手順を実行します。

バッファ サイズの変更

  1. 新しいセッション ウィザードを使用して、エンコード セッションをセットアップします。
  2. [セッション] メニューの [プロパティ] をクリックし、[プロファイル] タブをクリックします。
  3. [編集] をクリックし、[ストリームの共通設定] ページが表示されるまで [次へ] をクリックします。
  4. [詳細設定] をクリックします。
  5. [ユーザー設定] をクリックし、バッファ サイズを秒数で入力します。

キー フレーム

ビデオはキー フレームとデルタ フレームで構成されています。キー フレームには画像全体が含まれており、デルタ フレームには最後のキー フレームから変化した部分の画像だけが含まれています。デルタ フレームはキー フレームと比べて非常に小さな帯域幅しか必要としないため、各フレームの画像品質を維持するためにより多くのビットを確保するには、デルタ フレームを最大化することが推奨されます。たとえば、固定ビット レートのファイルをストリーミングする際に多くのキー フレームを使用すると、各キー フレームの生成にビットが必要となるため、画像品質を保つために使えるビットが少なくなります。一方、デルタ フレームが前のフレームから少ししか変化していない場合は、そのフレームの生成に必要なビットが少なくて済むため、より多くのビットをビデオ品質の向上に使用できます。

一般に、動きの多いコンテンツではシーンが頻繁に変化するため、より多くのキー フレームが必要となります。キー フレーム間の時間を長くすると、より多くのデルタ フレームが使用されるため、ビデオのサイズ (バイト数) が小さくなります。同様にキー フレーム間の時間を短くすると、より多くのキー フレームが使用されるため、ビデオのファイル サイズが大きくなります。キー フレーム間の秒数を短くすると、ファイル内のシーキングが向上しますが帯域幅を消費します。

キー フレームの生成間隔は、エンコーディング セッションを構成する際に設定できます。キー フレーム間隔はプロファイルの一部であり、キー フレーム間の秒数を制御します。最適な間隔はエンコードするコンテンツのタイプとバッファ、イメージ品質、およびビット レートの設定によって異なります。

指定したキー フレーム間隔に関係なく、Windows Media エンコーダはフレーム間の変化のレベルが特定のしきい値に達した場合 (画像の 50% 以上が異なるなど)、自動的にキー フレームを生成します。このため、ビデオで急速な変化が発生する場合、エンコーダは、指定した間隔で作成されるキーフレームのほかに、変化が発生するたびに追加のキー フレームを生成します。キー フレームを最適化する 1 つの方法は 20 秒などの大きな値をキー フレーム間隔に設定しておき、コーデックに必要な追加キー フレームを生成させることです。

MBR と複数オーディオ トラック

現在 Windows Media エンコーダでは、単一のストリームに複数のオーディオ トラックやビデオ サイズを含めることはできません。しかし、対象となるクライアントの接続速度に応じて複数の MBR ファイルを作成することで、同じような結果を得ることができます。たとえば、1 つの MBR ファイルを高帯域幅接続用 (300、500、700 Kbps) にし、もう 1 つの MBR ファイルを低帯域幅接続用 (28.8、56 Kbps) にすることができます。各 MBR ストリームには 1 つのオーディオ トラックと複数のビデオ トラックが含まれます。これらのストリームを同時にエンコードするには 1 台のコンピュータ上で 2 つのインスタンスのエンコーダを開くか、または 2 台のコンピュータを使用します。または、連続してエンコードすることもできます。1 台のコンピュータで同時にエンコードする場合はキャプチャ カードが 1 度に 1 つのプロセスでしか使用できないことに注意してください。複数のキャプチャ カードが必要になる場合があります。

コンテンツを複数の異なるビット レートでエンコードする際、特にリアル タイムでエンコードする場合はプロセッサに多大な負荷がかかります。MBR ストリームをアーカイブする場合、複数のストリームが 1 つのファイルに保管されるため、単一のストリームをエンコードする場合よりもファイルが大きくなります。後でオンデマンドで使用するためにアーカイブする場合は、MBR ファイルのダウンロードと再生には時間がかかることに注意してください。

MBR ストリーミングの主な利点は、Windows Media サービスがそのインテリジェント ストリーミング機能を使用できることです。インテリジェント ストリーミング機能は、サーバーとクライアント間で使用可能な帯域幅を判断し、最適なストリームを配信します。また Windows Media サービスはクライアント接続の帯域幅の変化に応じて、配信レートを連続的に調整します。これらの理由と、Web サーバーがインテリジェント ストリーミングをサポートしていないという理由から、MBR は Windows Media サービスとともに使用する場合のみ推奨されます。

フィルタ

テレビや映画館の画面用に作られたビデオをコンピュータ モニタで表示する場合、特殊な問題が発生します。たとえば、インターレース ビデオをプログレッシブ画面で表示すると、モニタのリフレッシュ レートがビデオのレート (30 fps のビデオで 60 Hz または 120 Hz) と同期されていない場合、コーミングやちらつき、縞といった現象が起こります。

また、テレシネおよび編集プロセスの結果として、モニタ上に画像ノイズが発生することもあります。新しくテレシネ処理したコンテンツには、インターレース化された一貫性のある 3:2 パターンがあります。フィルムのテレシネ後にビデオ編集を実行すると、一貫性のある3:2 パターンが中断され、一貫性のないソースになります。これらの問題を解決するため、逆テレシネおよびノンインターレース化フィルタを使用できます。フィルタは、エンコード プロセスの実行前または実行中に適用することができます。

適用するフィルタは、元のコンテンツのソースによって決まります。たとえば、24 fps フィルムで撮影された後テレシネされたコンテンツには、逆テレシネ フィルタを適用します。ビデオ撮影された後ノンインターレース化フィルタが適用されたコンテンツの場合は、3:2 プルダウン パターンがないため、逆テレシネを使用する意味はありません。コンテンツのソースが不明な場合は、ノンインターレース化フィルタを使用してください。

逆テレシネ

テレシネされたソースをプログレッシブ画面で表示すると、画像のジャーキネスやブロックノイズといった画像ノイズが発生します。これらのノイズを除去または最小化するには、テレシネ プロセスによって生じた効果を削除するために、コンテンツに逆テレシネ フィルタを適用します。

逆テレシネ ソリューションは、ハードウェア形式でもソフトウェア形式でも使用できます。ハードウェア プリプロセッサおよびエンコーダでは、非常にクリーンな結果が得られます。ただしこれらは高価すぎて入手できない場合があります。これに比べてソフトウェアベースの逆テレシネ フィルタは非常に安価で、一貫性のあるソースでの使用に適しています。これらのフィルタは、3:2 パターンの非干渉を処理することはできません。

ハードウェア

ハードウェア ソリューションでは、ソースを逆テレシネ プロセッサに通すことによってクリーンな可干渉のソースにします。その後ソースを AVI にキャプチャするか、またはエンコーダに直接送ることができます。ビデオ キャプチャ カードは NTSC 30 fps インターレース ビデオしかサポートしていない場合が多いので注意してください。ハードウェア プリプロセッサを使用する場合は、キャプチャ カード用に一貫性のあるテレシネ ソースを作成し、Windows Media エンコーダで逆テレシネ ソフトウェア フィルタをオンにしてください。このフィルタは、一貫性のあるコンテンツを簡単に処理することができます。

または、以前マスタ化した MPEG1 ファイルを Windows Media 形式に変換することもできます。

ソフトウェア

逆テレシネ フィルタは、いくつかのサード パーティ ツールと Windows Media エンコーダで使用可能です。Windows Media エンコーダ フィルタを使用すると、以下の条件の下で、30 fps ビデオを 24 fps に変換できます。

  • 30 fps でテレシネ化された NTSC ソースにフィルタを適用すること。
  • キャプチャするソースが、ライブの非圧縮ソースでないこと。
  • .wmv 拡張子の Windows Media ファイルを .asf 拡張子のファイルに変換したものではないこと。
  • コンテンツに時間圧縮が適用されていないこと。
  • ハーフ解像度のビデオであっても、、両フィールドとも縦方向に 480 線でキャプチャしてあること (320 ピクセル × 240 ピクセルのコンテンツを作成するには、まず 320 ピクセル × 480 ピクセルでキャプチャします。その後エンコーダ内で出力ビデオ サイズを 320 × 240 に設定します)。

このフィルタを適用することで、追加された余分なフレームが取り除かれ、ビデオを元の 24 fps 形式に戻し、テレシネ プロセスで生じた画像のジャーキネスやブロックノイズが削減されます。このフィルタは、フィルムから作成したコンテンツだけに適用してください。

逆テレシネ フィルタをオンまたはオフにするには、以下の手順を実行します。

  1. 新しいセッション ウィザードを使用して、エンコード セッションをセットアップします。
  2. [ソース] タブをクリックしてソースを選択し、[変更] をクリックします。
  3. [ビデオの最適化] タブをクリックします。
  4. 逆テレシネ フィルタをオフにするには、[最適化][なし] をクリックします。逆テレシネ フィルタをオンにするには、[逆テレシネ] をクリックします。
  5. [OK] をクリックし、もう一度 [OK] をクリックします。

ノンインターレース化

通常、デジタル ビデオ カメラ、VHS テープ、8mm フィルム、ケーブル テレビなどのソースからエンコードされたコンテンツは、30 fps でインターレース化されているため、プログレッシブ ディスプレイでは画像ノイズが発生します。Windows Media エンコーダを使用すると、以下の条件の下で、コンテンツをノンインターレース化できます。

  • ソースがインターレース化されていること。
  • キャプチャするソースが、ライブの非圧縮ソースでないこと。
  • .wmv 拡張子の Windows Media ファイルを .asf 拡張子のファイルに変換したものではないこと。
  • コンテンツに時間圧縮が適用されていないこと。
  • ハーフ解像度のビデオであっても、両フィールドとも縦方向に 480 線でキャプチャしてあること (320 ピクセル × 240 ピクセルのコンテンツを作成するには、まず 320 ピクセル × 480 ピクセルでキャプチャします。その後エンコーダ内で、出力ビデオ サイズを 320 × 240 に設定します)。

ビデオテープをソースとしているコンテンツの場合は、ノンインターレース化フィルタを適用すると、30 fps フル解像度 (640 ピクセル × 480 ピクセル) または 60 fps ハーフ解像度 (320 ピクセル × 240 ピクセル) にすることができます。ノンインターレース化すると、フル解像度では、奇数フィールドと偶数フィールドが単一のフレームにブレンドされ、ハーフ解像度では、フィールドごとに 1 つのフレームが作成されます。

PAL ビデオの場合は、単純にノンインターレース化フィルタを適用してください。

ノンインターレース化フィルタをオンまたはオフにするには、以下の手順を実行します。

  1. 新しいセッション ウィザードを使用して、エンコード セッションをセットアップします。
  2. [ソース] タブをクリックしてソースを選択し、[変更] をクリックします。
  3. [ビデオの最適化] タブをクリックします。
  4. ノンインターレース化フィルタをオフにするには、[最適化][なし] をクリックします。ノンインターレース化フィルタをオンにするには、[ノンインターレース化] をクリックします。

混合コンテンツと 60 fps

コンテンツによっては、フィルム撮影後ビデオで編集されたなど、複数のソースを持つ場合があり、テレシネとインターレース化の両方によって生じた画像ノイズがコンピュータ画面に表れてしまいます。逆テレシネまたはノンインターレース化のどちらかのフィルタだけを適用すると、ノイズの一部は除去されますが、ほかのノイズは残ります。混合コンテンツをエンコードする際にノイズを削減するには、コンテンツを 60 fps でエンコードします。 インターレース化されたコンテンツを 60 fps でエンコードすると、すべてのノンインターレース化フィルタをバイパスできますが、解像度は元のフル フレーム解像度の半分になります。

エンコード プロセスの実行中、高さが半分の 30 fps フレームが 2 つ作成されます。これらは 1 つのフレームに結合されて 60 fps で再生されます。1 秒間に圧縮するフレームが 2 倍になるため、エンコードするコンピュータには、このような負荷に耐えられる十分なメモリと高速なプロセッサが必要です。

60 fps でエンコードする際は、ターゲットのビット レートが最低 300 Kbps でなければなりません。このビット レートを最も効果的に実現するには、プロファイルを以下のように編集します。

  • 可変ビット レートに容易に適応できるようにするため、バッファ サイズを増加させる。
  • イメージ品質の滑らかさを増加させる。
  • 必要なキー フレームだけを生成するよう、キー フレーム間隔を増加させる。

混合コンテンツを 60 fps でエンコードするセッションをセットアップする際、以下のいずれかを実行できます。

  1. 出力サイズ 320 ピクセル × 240 ピクセル (または 640 ピクセル × 240 ピクセル) および 60 fps の動きの多いプロファイルを使用する。縦 480 線でキャプチャする必要があります。ノンインターレース化フィルタがオフになっていることを確認してください。このソリューションは、テレシネとインターレース化の両方によって生じた画像ノイズを解決します。
  2. 出力サイズ 640 ピクセル × 480 ピクセルおよび 30 fps のプロファイルを使用します。ノンインターレース化フィルタがオンになっていることを確認してください。画像のジャーキネスなど、テレシネ プロセスによるノイズは多少残りますが、フィールドがブレンドされるため、インターレース化によるノイズは除去されます。

オーディオとビデオのレベル

エンコードされたオーディオおよびビデオ ストリームのノイズを最小限に抑えるためには、エンコード元となるオーディオおよびビデオ デバイスと、コンピュータ上のオーディオおよびビデオ オプションを正しく設定する必要があります。

オーディオ ソースおよびコンピュータ上のオーディオ オプションを設定する際は、以下のヒントを参考にしてください。

  • バランス出力からサウンド カードのアンバランスへ入力する場合は、入出力を分離および一致させるためにオーディオ アダプタを確実に使用してください。
  • ディストーションを防止するため、システムのライン入力のオーディオ レベルを調整してください。オーディオ カードによっては、録音レベルが高すぎたり低すぎたりするときの通知用にオーディオ メーターがあるものもあります。 高すぎる場合はデジタル ディストーションが発生します。低すぎる場合はオーディオ システムのノイズが聞こえやすくなります。オーディオ メーターがあるかどうか調べるには、システム トレイの [音量] アイコンをダブルクリックして、オーディオ ミキサーのプロパティを表示します。
  • Sonic Foundry, Inc. の Sound Forge またはほかのサードパーティ アプリケーションを使用して、ソースのオーディオ レベルを標準化してください。

ビデオ ソースを設定する際は、以下のヒントを参考にしてください。

  • SMPTE カラー バーを使用して、ビデオ モニタを調整してください。
  • SMPTE バーの高解像度ビット マップを使用して、コンピュータ モニタが一致するよう調整してください。Windows Media Resource Kitには、モニタの色を適切に設定するためのMonitor Calibration Tool が含まれています。Windows Media Resource Kitは、Windows Media の Web サイトから入手できます。
  • キャプチャ カードの明るさ、コントラスト、鮮やかさ、および色合いがビデオ モニタと一致するように調整してください。

詳細情報

Windows Media エンコーダの使い方の詳細については、Windows Media エンコーダのヘルプを参照してください。Windows Media Resource Kitおよびその他の Windows Media テクノロジの詳細については、Windows Media の Web サイトを参照してください。


Microsoft