動画・音声の規格について ~コーデック・コンテナ~

昔は、動画と言えばTVやビデオカメラ、音声(音楽)であればカセットテープやCDくらいで多くの規格を必要としませんでした。

しかし、現在ではインターネットも普及したため、Webページに埋め込むタイプの動画も登場しました。また、iPodやウォークマン・PSPなどの持ち運び用小型端末が音楽や動画の再生をサポートしたため、それぞれに適した規格の動画や音声が必要になりました。

結果、今では多くの動画・音声規格が存在する状況となっています。それぞれが特徴を持っているため、再生できる機器(ソフトウェア)とそうでない機器(ソフトウェア)がでてきます。例えば、PSPで再生できる動画形式はMP4形式、iPodやウォークマンはMP3形式・WMA形式の音声が再生に対応しています。

そして、これら対応している形式以外のファイルは開くことができません。

携帯端末に入れて動画や音声を持ち運びたい方も多いですが、以上のようにコンテンツには様々な形式があり、また機器(ソフト)のサポートしている形式が異なるため「パソコン内・外出先で再生したいのにできない、困った」という現象が起きやすくなります。

これを回避するには、世の中にどういった形式のファイルがあるのか、その特徴と共に理解し、再生をサポートしている形式へファイルを「変換(エンコード)」する、あるいは再生に対応したソフトを用意することが必要になります。

この記事では、まず適切に再生・変換するために必要な概念となる「コンテナとコーデック」、それと「動画・音声の形式と特徴」をメインに書いていこうと思います。

※かなりざっくり解説しているので、内容が間違っている、あるいは簡素にしすぎて誤解を与えてしまうような書き方になっている場合もありますので、詳しく知りたい方は専門サイトを参照してください。


エンコード・デコード

エンコード【encode】とは、「符号化する」という意味を持ちます。動画や音声のデータをそのまま扱うと非常に容量の大きなデータとなってしまうので、コンピューターが膨大な計算を行なって符号化し、保存する容量を小さくします。この作業をエンコードといいます。なので「圧縮」という言葉も使われます。

デコード【decode】は、これと逆の意味で「復号」とか「伸張」「再生」という意味を持ちます。エンコードした動画・音声はエンコード方法別に「コーデック【Codec】」という圧縮伸張プログラムでデコードを行い再生をすることができます。

再生が主な作業になるのでzipなどのアーカイブファイルに使われる「解凍」「展開」という言葉は用いられません。

コンテナ・コーデック

動画・音声規格の話を始める前にまず「コンテナ」と「コーデック」について話します。

コーデック

コーデック【Codec】とは、エンコード(符号化)とデコード(復号)をすることができる装置・ソフトウェア、またアルゴリズムのことを指します。上でも書いたとおり、動画や音声の圧縮・伸張に関わる要素です。

コーデックの種類によって圧縮や再生方法も異なって、データ容量や再生負荷などにも違いがでるため、それぞれ適した再生環境が存在します。

コンテナ

正確には「コンテナ フォーマット【container format】」といいます。

コンテナとは、動画・音声のデータがどのように格納されるのかを定義するファイルフォーマットの一種です。簡単に言えば、動画・音声データを入れる「箱」です。コンテナ(箱)には種類があって、それぞれ中に入れることができるデータ形式が異なります。

動画と音声を一緒に保存する場合は、このコンテナにデータを収めることが必要になります。コンテナに保存することができるデータ形式(コーデックによる違い)には制限があるため、注意してエンコードなどをする必要があります。

コーデックの種類・特徴

動画

以下のコーデックは画質の劣化が全くないか、非常に少ないコーデックとなります。動画編集用として用いるとエンコードによる画質の劣化が最小限になります。また、圧縮時・再生時ともに負荷が低く、逆再生なども得意としています。その代わり、データ容量は大きくなりがちです。

Motion JPEG Motion JPEG【モーション ジェイペグ:MJPEG】と読みます。名前の通り、動画の1コマ1コマをJPEG圧縮したものです。JPEG圧縮するので多少画質が劣化しますが、フレーム間の圧縮は行わないため、再生・圧縮の負荷が少なく、フレームを一枚ずつ取り出すことも容易です。デジタルカメラの録画部分でよく利用されます。
可逆圧縮コーデック この形式で圧縮すると、色空間を除き動画の劣化が全く起きません。有名なものとしてHuffyuv【ハーフワイユーブイ】、 Lagarith Lossless Video Codec【通称 レガリス】があります。画質を劣化させたくないが容量を少なくしたいとき、または動画編集時の中間フォーマットとして利用するといいでしょう。

以下のコーデックは、編集・作製した動画を保存、配布をすることを目的とした形式です。データ容量が非常に小さくなりますが、オリジナルの動画と比べると劣化が起きています。また、複雑な圧縮アルゴリズムを使っているので動画同士つなぎ合わせたり、カットや挿入といった編集作業には不向きです。基本的に再生負荷は高め。

H.263 低ビットレート向けに開発された動画形式です。テレビ電話などでよく利用されます。DivX、Xivd等を利用するとこの形式になります。ほかのコーデックと比べると再生負荷が低いため利用者も多いです。しかし、少々容量は大きめ。
H.264 現在、非常によく利用されている動画形式です。地上波デジタル放送、携帯電話、次世代DVDなどに普及しています。圧縮率が高く、画質の劣化も少ない優秀なコーデックです。低~中ビットレートの動画の再生が得意。その代わり、再生負荷がかなり高めなので、再生するにはそれなりのマシンパワーが必要となります。容量の大きな動画をエンコードをするとコマ落ちなども発生しやすくなります。「MPEG-4」とも呼ばれることがあります。
MPEG-1 MPEG-1【エムペグワン】と読みます。Moving Picture Experts Group(MPEG)という組織によって作られました。ビデオCDなどに利用されています。VHS画質の動画をCDで再生できるようにと考えられた形式ですが、VHSが廃れてDVDやBDなどが普及した今、この形式で圧縮する必要性は少なくなったと言わざるを得ません。再生負荷は低め、しかし容量は大きくなります。
MPEG-2 MPEG系の動画ではこっちが主流です。中~高ビットレートの再生が得意なため、高画質を求めるDVDや地上波デジタル放送で採用されています。非可逆圧縮なので圧縮率もそれなりに高く、データ容量を小さくすることができます。データ転送速度が再生時に動画と音声合わせて4〜15Mbps程度必要なので、低ビットレートの動画には不向き。

音声

PCM 昔からある無圧縮音声コーデックです。パルス符号変調【PCM:pulse code modulation】と呼ばれる、アナログデータをデジタルデータに変換する方式のひとつです。ほとんどのパソコンで再生ができます。非常に高音質ですが、容量も大きくなります。単体では、WAVコンテナに入っていることがほとんど。
LPCM リニアPCMと読みます。PCM方式のひとつで、同じく無圧縮音声。非可逆圧縮は一切しないため、これも非常に高音質。ですが、同じく容量も大きくなります。DVDやBDの音声部分、プレイステーション3用のゲームなどで幅広く利用されています。
MP2 MPEG系のオーディオ用コーデック。拡張子は「.mp2」あるいは「.mpc」。MPEG1、MPEG2動画とセットで利用されることが多いです。DVDの中には、この形式で録音されているものもあります。圧縮率は高くもないが、低くもない。
MP3 1998年以降から爆発的に普及した音声コーデックです。皆さんも聞いたことはあるでしょう。非常に圧縮率が高いため、データ容量を抑えることができます。しかも、人間の聴覚心理を利用した圧縮をするため、高圧縮率にも関わらず、音質的な劣化を感じることは少ないです。非常に優れた形式であるため、ほとんどの機器・ソフトウェアが再生に対応しています。因みに、正式名称は「MPEG Audio Layer-3」。
AAC AAC【エーエーシー、Advanced Audio Coding】は、MP3などを超える高音質・高圧縮を目指して標準化された形式です。iPodやウォークマンなどの携帯音楽プレイヤー、プレイステーション・DSなどのゲーム機、携帯電話など多くの機器やソフトウェアが再生に対応しています。「MP3より性能を上げる」が目的ですが、実際比べてみるとそこまで大きな性能の差は無いような気もします(主観)。気になる方は比較サイトが多数あるので調べてみるといいでしょう。
WMA 正式名称「Windows Media Audio」。マイクロソフト社が開発した音声コーデックです。よって、Windowsであれば標準で必ず再生出来ます。MP3と比べると汎用性に劣りますが、同じく非可逆圧縮ではあるのでデータ容量を少なくすることができます。また、「Windows Media Rights Manager」と呼ばれるコンテンツ管理システム(DRMシステム)によって暗号化することができるため、音楽の有料コンテンツ化がし易かったり、コピー製品の氾濫を防ぐこともできます。
Apple Lossless Apple Lossless Audio Codec(Apple ロスレス:ALAC)は、Apple社が開発した音声コーデックで、「iTunes」や「iPod」で再生ができます。iTunesではCDからこの形式で取り込むことも可能。可逆圧縮フォーマットのひとつで、音質の劣化なく圧縮することができます。つまり、音楽CDと同じ音質を維持できます。しかし、可逆圧縮であるため、非可逆圧縮のMP3などと比べると容量は非常に大きくなります。
FLAC 最近、ちょっとずつ再生できる機器やソフトウェアが増えてきた可逆圧縮フォーマットのひとつ。これも音質が劣化することなく音声を圧縮することができます。ただし、まだ汎用性に乏しいため、再生できる環境が限定されます。圧縮率は任意で変更でき、高いと容量が少なくなるが再生負荷が高くなり、低いと容量が大きくなるが再生負荷が低くなります。

コンテナの種類・特徴

avi Audio Video Interleave(オーディオ ビデオ インターリーブ)。古くからあるコンテナでWindows標準規格。広く普及していますが、ブラウザとの相性が悪いため動画共有サイトなどではほとんど利用されません。編集ソフトの多くがこのAVI形式をサポートしているため、とても編集がしやすい。編集するときはこれを基準に使うといいでしょう。また、格納できるデータも豊富。 動画部分:「MPEG-1/-2」「H.263」「H.264」など
音声部分:「リニアPCM」「MP3」「AAC」など
mov こちらはMacintoshの標準規格。QuickTimeなどで再生可能。ブラウザとの相性はよく、格納できるデータもAVIよりも幅広い。Macを利用している方は、編集するにも再生するにも基本となるコンテナです。 動画部分:「H.263」「H.264」「Pixlet」など
音声部分:「MP3」「AAC」「Apple Lossless」など
wmv 正式名称「Windows Media Video」。Windows標準の規格です。Webページとの相性はそれなりによい。ただし、aviと比べて格納できるデータ形式が少ないため、愛用者は少ない。編集にも向かない。デジタル著作権管理(DRM)対応なので企業や団体の一般向け動画配信用として使われることがほとんどです。 動画部分:「H.264」など
音声部分:「WMA」など
mpg mpegと同義。aviなどと比べると格納できる動画データは「MPEG2」「MPEG1」のみと非常に少ない。インターネット上で映像コンテンツとして配布されていることが多い形式です。 動画部分:「MPEG-1/-2」のみ
音声部分:「MPEG2」「AC3」「LPCM」「DTS」など
wav マイクロソフトとIBMにより開発された音声データ専用のコンテナフォーマットです。「WAVE」とも記述されます。読み方は「ウェーブ」「ウェブ」。Web(ウェブ)との混乱を避けるため一般的には「ウェーブ」と呼ばれます。通常は非圧縮、リニアPCMのサンプリング用として使われることが多いですが、「MP3」「WMA」などの圧縮音声データも入れることができます。 動画部分:なし
音声部分:「MP3」「WMA」「LPCM」など
mp4 コーデックにも似た名前のモノがありますが、こちらはコンテナ。YouTubeなどの動画共有サイトなどで「高画質」を謳っているものによく利用されます。音声単体で配布されていることも多く、この場合は携帯電話の着メロなどで利用されています。 動画部分:「H.263」「H.264」など
音声部分:「MP3」「AC3」「AAC」など
flv YouTubeなどでよく利用される、フラッシュ形式の動画コンテナです。中身は「H.263/H.264」が主流。Webページとの相性が非常に良いため、動画共有サイトなどで広く利用されています。正式名称は「Flash Video(フラッシュ ビデオ)」 動画部分:「H.263」「H.264」など
音声部分:「MP3」「PCM」「ADPCM」「AAC」など
3gp 3GPPで記録された動画ファイルです。NTTドコモが提供する携帯電話サービス「FOMA」の「iモーション」機能などに採用されています。ドコモ携帯で動画を再生したい場合はこの形式で保存すること。(スマートフォンは例外) 動画部分:「H.263」「H.264」など
音声部分:「AAC」「AMR」など
3g2 3GPP2で記録された動画ファイルです。MP4形式がベースとなっています。KDDIの携帯電話サービス「au」における「EZムービー」機能などに採用されています。au携帯で動画を再生したい場合はこの形式で保存すること。(スマートフォンは例外) 動画部分:「H.263」「H.264」など
音声部分:「AAC」「AMR」など

用語補足

いくつか新しい用語がでてきたのでここで簡単に解説します。詳しくはまた別の記事で書きたいと思います。

フレーム

1枚の静止画のこと。動画は何枚もの静止画を高速で表示させることで動いて見えるように見せています。毎秒30フレームとは一秒間に30枚の静止画が表示されていることを示します。単位は「fps」(フレームレートは30fpsである、などと言います)。 この値が高いと動画が滑らかに動きます。(Frames Per Second、フレームス パー セコンド)

圧縮率

ファイル容量をどれだけ抑えているか、その指標として用いられることが多いです。

ビットレート

1秒間に送受信できるデータ量(ビット数)を表す表現です。単位はビット毎秒(bps)です。この値が大きいと1秒間に送受信できるデータ量が増えるため音楽や動画の質が上がります。

自分が何をしたいか考えてみよう

以上、コーデックとコンテナについて簡単ですが解説してみました。

データの内容としては動画と音声のふたつしかないのですが、それを保存・圧縮する手段は非常に多く驚いた方もいるでしょう。IT化が進んでいる現在、それぞれに適したデータ形式が必要になるのでこれは仕方のないことなのかもしれません。

これをすべて覚えることは難しいので、まずは「自分が何をしたいか」を考えて勉強してみましょう。

例えば、あるデータをパソコン上で再生させたいときは「どのような形式のデータ」なのかを調べ「そのデータの再生に対応した」ソフトを探してくればいいわけです。携帯端末で再生させたいときは、どのようなデータが再生に対応しているのかを調べ、必要があったら再生させたいデータを適切にエンコードさせなくてはいけません。

「どのような動画を」「どのように保存したいか」「何で再生させたいか」など目的をはっきりさせなくては、情報も多すぎて追いつかないでしょう。

これが決まったならば、あとは検索して勉強してみましょう。インターネット上では、多くの人が自分の目的を達成させるための勉強し、実践した過程を紹介してくれています。その中には、あなたと同じような目的を持った方もいることでしょう。そのページを探して自分も勉強すればいいのです。

このブログでもいくつか紹介していこうかと思います。

用語補足

この記事古いもので大分見難いので下記サイトも一緒に参考にしてください。

スポンサーリンク

Track Back

Track Back URL

Comments [4]

とても参考になりました!

お力になれたようで嬉しいです。
この記事はまとめ的なものなので細部はかなり省略しています。
もっと凝ったことをするようでしたら、他のサイトの記事も読んでみてください。

動画編集の必要にせまられ困っている時にこのページにたどり着きました。
知識を得るのに、ちょうどいいまとまり方で非常に参考になりました。感謝です!

お役に立てたようで良かったです。中々数が多くて大変ですよね。
ただ、この記事色々省いているので詳しくはまた別のサイトで勉強なさってみてください。

コメントする

非公開。必須ではありません。

(いくつかのHTMLタグ(a, strong, ul, ol, liなど)が使えます)

このページの上部へ

サイト内検索

広告

最近のコメント

Powered by Movable Type 6.3.2