動画・音声のコーデックとコンテナについて

当ページのリンクには広告が含まれています。
  • URLをコピーしました!

昔は、動画と言えばTVやビデオカメラ、音楽であればカセットテープやCDくらいで再生環境が限られていました。

現在ではインターネットも普及したため、YouTubeに代表されるWebページに埋め込むタイプの動画も登場しました。また、スマートフォンやウォークマンなどの携帯端末が音楽や動画の再生を広くサポートしたため、ユーザーのニーズに合わせて様々な動画、音声の規格が考え出されました。

結果、かなりの数の規格が存在することとなり、少し煩雑化してしまったところがあります。

テレビ局のスタッフではなく個人の人も動画や音楽を制作、配信できる時代です。必然、動画や音声データに対してある程度の知識が必要になってくるかと思います。

この記事では、適切に再生や変換をするために必要な概念となる「コンテナ」と「コーデック」、それと「動画・音声の形式と特徴」をメインに書いていこうと思います。

※かなりざっくり解説しているので、内容が間違っている、あるいは簡素にしすぎて誤解を与えてしまうような書き方になっている場合もありますので、詳しく知りたい方は専門サイトを参照してください。

目次

エンコード と デコード

動画や音声を編集していきたいとお考えの方は必須となる単語です。

エンコード【encode】

エンコード【encode】とは、「符号化する」という意味を持ちます。

情報をある規則に基づいてデータ化することを「エンコード」と呼びます。例えば、アナログ的な「光」や「音声(空気の振動)」をエンコードすることでコンピューターで扱える「映像」「音声」データへ変換することができます。

また、すでにデジタルデータ化されたものもエンコードすることができます。例えば、「WAV形式」で保存した音声データを「MP3形式」へ変換することも「エンコード」と呼びます。これもMP3という規格に基づいて再データ化していますのでエンコードといえます。

エンコードを行うことができるプログラムのことを「エンコーダ【encoder】」と呼びます。

デコード【decode】

デコード【decode】は、エンコードと逆の意味で「復号」「伸張」「再生」という意味を持ちます。

エンコードした動画や音声は符号化されていますので、これを再生(デコード)するためには「エンコードしたデータの規則」を知る必要があります。例えば、MP3データを再生するためにはMP3がどのような規則に基づいてエンコードしているのか理解しているプログラムが必要になります。

このエンコードしたデータの規則を知っていて再生させることができるデコード機能を持ったプログラムを「デコーダ【decoder】」と呼びます。

コンテナ と コーデック

次に必須の用語となる「コンテナ」と「コーデック」についてお話します。

コーデック

コーデック【Codec】とは、エンコード(符号化)とデコード(復号)をすることができる装置やソフトウェア、またアルゴリズムのことを指します。

つまり、「エンコーダ」と「デコーダ」の両方が入っているものです。

コーデックの種類によってエンコードやデコードできるデータ形式が異なります。

コンテナ

正確には「コンテナ フォーマット【container format】」といいます。

コンテナとは、動画・音声のデータがどのように格納されるのかを定義するファイルフォーマットの一種です。

簡単にいうと、動画・音声データを入れる「箱」のことです。

コンテナ(箱)には種類があって、それぞれ中に入れることができるデータ形式が異なります。複数のファイルを1つのコンテナに入れることができるため、例えば「動画」と「音声」のデータを1つのコンテナに入れることで「音声が流れる動画ファイル」を作ることができます。

動画と音声を1つのファイルに保存する場合は、このコンテナにデータを収めることが必要になります。コンテナに保存することができるデータ形式(コーデック)には制限があるため、注意してエンコードをする必要があります。

動画コーデック

ここからコンテナやコーデックを確認していきたいと思います。まずは動画コーデックについてです。

非圧縮 動画コーデック

RAW

非圧縮形式。録画する機器のメーカーによりRAW形式は異なりますが、いずれもオリジナルのデータを保存しています。RGBやYUVのデータをそのまま記録しているため、高品質なデータで保存できます。色味の調整など編集作業も調整幅が広く柔軟に行えます。

ただし、圧縮処理がされていないためデータ容量が膨大になりやすく、転送や完成品データとして保存することには向いていません。4Kや8K映像をRAWで保存すると1時間でテラバイト級のデータを作り出します。あくまで編集用のデータです。

可逆圧縮 動画コーデック

以下のコーデックは、圧縮処理を行ってデータ容量を抑えつつ、画質の劣化を発生させない「可逆圧縮形式(ロスレス:lossless)」のコーデックです。

可逆圧縮はデコード時に元の非圧縮状態のデータへ完全な状態で復元できるため、データ容量をある程度抑えながら画質の劣化も発生しません。ただ、それでもデータ容量は大きめなので、こちらも基本的には編集用(中間フォーマット)のデータです。

今回は無料のコーデックを紹介していますが、有料のコーデック(MagicYUVやAMV4等)もあります。

Ut Video (Ut Video Codec Suite)

日本人の方による開発がされている国産の可逆圧縮動画コーデック。特に人気がある可逆圧縮コーデックで、取り敢えず可逆圧縮の動画コーデックに迷ったらこちらでよいかと思います。開発が続けられており、圧縮率やエンコード・デコード速度のバランスがよく、マチスレッドにも対応しています。キャプチャー用途にも耐えられるエンコード速度があり、現在ではYouTube用のオプションもあって大きな弱点が少ない使いやすいコーデックです。

HuffYUV

かつでは可逆圧縮の動画コーデックとしてよく使われましたが、公式サイトが消滅してしまったため、有志により開発されているバージョンが主流になっています。こちらは64bit版やマルチスレッド版の開発がされています。「ffdshow」のVFWコーデックにも入っています。ただ、時代遅れ感がでており、現在あえて選ぶコーデックではないように思えます。

Lagarith (Lagarith Lossless Video Codec)

HuffYUVと双璧を成していた可逆圧縮の動画コーデック。64bit版と32bit版を同時にインストールできるため、広い環境に対応しています。エンコード・デコード速度や圧縮率のバランスがよく、また速度優先であればキャプチャーにも使える使いやすいコーデックです。Ut Videoの次の候補。

MLC (MLC Codec)

圧縮率に優れた可逆圧縮の動画コーデック。多くの可逆圧縮形式の中でも特にデータ容量を小さくできます。圧縮率の指定も可能で、エンコード速度が犠牲になりますがより高圧縮にすることも可能です。ただ、エンコード速度に難があり、キャプチャー用途には向いていません。編集用の中間フォーマットとして利用するのが吉。少々マイナーな形式のため、今後のサポートには少し不安が残ります。

非可逆圧縮 動画コーデック

以下のコーデックは、圧縮処理の際に一部データを切り捨てるため、必然的に画質の劣化が発生しますが、圧倒的な圧縮率を誇り、データ容量を大きく抑えることができます。

圧縮率と品質のバランスを調整しやすく、また非圧縮や可逆圧縮形式と比べてデータ容量を非常に小さくできるため、編集のほか完成品の配信・配布用としても広く使われます。

H.263

低ビットレート向けに開発された動画形式です。かつてはテレビ電話等でよく利用されていましたが、1996年の承認から分かる通り古い規格であり、現在は後継のコーデックの「H.264」や「H.265」が主流となっています。

H.264/MPEG-4 AVC

高い圧縮率と画質の良さから広く利用されている非可逆圧縮の動画コーデックです。YouTubeなどの動画配信サービスで配信するほか、編集用としても使いやすい。後継の「H.265」などはありますがエンコード速度もそれなりに速く、汎用性の高さから現代でもまだ多くの場所で利用されています。ただ、徐々に利用率は下がってくると思われます。オプション次第で可逆圧縮も可能ですがあまり見かけません。

H.265/HEVC

H.264よりさらに高い圧縮率でありながら同様かそれ以上の画質を得られるとされる非可逆圧縮の動画コーデックです。さらに4Kや8Kなどの高解像度映像もサポートされましたので、多くの動画配信サービスで利用されていますが、こちらも後継の「VVC(H.266)」や「AV1」が発表されたため、徐々に移行が進むかと思います。可逆圧縮も可能。

AV1

AOMedia Video 1とも書かれる、現時点での最新動画コーデックのひとつ(2018年3月28日に公開)。非営利団体のAlliance for Open Media(AOMedia)により開発されています。H.265のライセンスが複雑で使いづらい問題があることから、オープンかつロイヤリティフリー(特許の問題がない)のコーデックとして開発されました。Google・Apple・Amazon・Meta・Microsoft・Intel・NVIDIAなど名だたる大企業がAOMediaへ参加しており、その本気度が見てとれます。

Googleの「VP9」に基づきながらさらに追加の技術を組み込み開発されています。Bitmovinという企業の検証によれば・・・

同じ画質で比較したさい、AV1はVP9比で22~27%、HEVC比で30~43%ほどビットレートを削減できるという。

https://pc.watch.impress.co.jp/docs/news/1114268.html

とのことです。H.265/HEVCから置き換えることを目指しており、今後の動画圧縮コーデックの主流となる見込みです。ただ、エンコード速度が遅い(高い処理能力が必要)というデメリットがあり、現時点では一般ユーザーよりNetflixなどの商業系動画配信サービスで徐々に利用が広がっているところです。

因みに、現在のYouTubeはこのAV1の元になった「VP9」にて再エンコードされるようです。

H.266/VVC

AV1と並んで現在最新の動画コーデックのひとつです。2020年に最終標準規格の完成が発表されたばかり、正式名称は「Versatile Video Coding」。4Kから16Kの高解像度に対応しているほか、360°ビデオにも対応しています。H.265/HEVCよりもさらに高い圧縮率で、Wikipediaによると「HEVCから40%効率的に動画を圧縮」できるとのことです。

ただ、こちらはAV1と異なりライセンスの課題は引き続き存在しているため、これから普及していくかどうかは未知数です。対応エンコーダーもまだ少なめ。また、エンコード速度も非常に遅く、一般ユーザーではまだ広まらないと思われます。可逆圧縮にもできる様子。

日本では次世代地上デジタルテレビ放送の規格としてH.266/VVCが採用されました。

MPEG-1

「エムペグワン」と読みます。Moving Picture Experts Group(MPEG)という組織によって作られました。VHS画質の動画をCDで再生できるようにと考えられた形式ですが、VHSが廃れてDVDやBlu-rayなどが普及した今、この動画規格でエンコードする必要はほとんど無くなりました。ただ、画質が悪いながら古くから存在している規格のため、互換性は高く古い機器であっても再生できる可能性はあります。

MPEG-2

DVDや地上デジタル放送に用いられているコーデックです。「MPEG-1」の後継でより高画質を求めて開発されました。日本の地上デジタル放送ではコンテナ「MPEG-2 TS」の中にMPEG-2ビデオが入っています。DVDはコンテナ「MPEG2-PS」がよく使われます。

別名が「H.262」となっていることからも分かる通り、1995年7月に決められたとても古い規格のため、圧縮率や画質などは最新規格に大きく劣り、4Kなどの高解像度には対応しておらず、一般ユーザーが使うメリットはほとんありません。放送以外では利用されなくなっています。

MPEG-4

MPEG-2の後継です。MPEG-3は理由があり欠番です。「mp4」という名前の「コンテナ」もあり混乱しやすいですが、MPEG-4はコーデックです。インターネットが一般に広がり始めたころ、低速回線でも高画質な動画配信ができるよう作られました。現在のインターネット回線は当時と比べものにならないくらい高速となっており、さらに後継の「H.264/MPEG-4 AVC」が主流となっているため、古い方のMPEG-4は使われなくなっています。

音声コーデック

ここからは音声コーデックについて主流のものを書いていきます。

非圧縮 音声コーデック

リニアPCM

パルス符号変調【PCM:pulse code modulation】と呼ばれる、アナログデータをデジタルデータに変換する方式のひとつです。この方式で記録した音声データは圧縮処理されず、音質の劣化が発生しませんが、データ容量が大きくなるため保存や転送には大きな容量や帯域が必要となります。

一般的に、Windows用のリニアPCMは「WAV(.wav)」、Mac用が「AIFF(.aiff)」というファイル形式で保存、利用されています。

可逆圧縮 音声コーデック

以下のコーデックは、圧縮処理を行ってデータ容量を抑えつつ、音質の劣化を発生させない「可逆圧縮形式(ロスレス:lossless)」のコーデックです。

可逆圧縮はデコード時に元の非圧縮状態のデータへ完全な状態で復元できるため、データ容量をある程度抑えながら音質の劣化も発生しません。データ容量はMP3などの非可逆圧縮形式と比べて大きくはなりますが、動画と違って極端に大きなデータ容量にはなりにくいため、スマートフォンやウォークマンなどの携帯音楽プレーヤーでも保存しやすく、一般ユーザーでも広く利用されています。

FLAC

恐らく現時点で最も利用が広まっている可逆圧縮の音声コーデック。圧縮率はほどほどでそこまでデータ容量は小さくできませんが、エンコード・デコード速度に優れ、また古くから開発が続けられているためか再生に対応しているソフトウェアや機器が多く、可逆圧縮形式の中でも特に汎用性に優れています。オプションによって圧縮レベルを指定でき、圧縮率と処理速度を天秤にかけることができます。拡張子は「.flac」。

ALAC(Apple ロスレス)

Apple社が開発した可逆圧縮の音声コーデックです。かつてはApple製品でないと利用できないことが多かったのですが、2011年10月にオープンソース化したので、現在では多くのソフトウェアや機器で再生できるようになっています。圧縮率や処理速度に関してはFLACとそこまで大きな差はなく、利用はお好みでよいかと思います。ただ、iTunesはFLAC非対応なので、iTunesで可逆圧縮形式の音声データを扱いたい場合はALACでの利用となります。通常はコンテナのMP4ファイル(.m4a)へ格納されています。

TAK

FLACのコードをベースにして開発された可逆圧縮の音声コーデックです。Monkey’s Audio並の高圧縮率でありながら、FLAC並の高速なエンコード・デコード速度、ハイレゾ対応、内部cueシート対応、また多くのタグ情報を格納できるなど、かなり高機能なコーデックとなっています。アンケートによるとFLACに次いで人気があるようですが、現時点では対応環境が少なく、再生できるソフトウェアや機器はあまりありません。公認DirectShowフィルターがあるので、コーデックパックなどで再生に対応できます。拡張子は「.tak」。

Monkey’s Audio

高圧縮率の可逆圧縮音声コーデックとして知られます。APE v2タグを利用したタグ付けに対応。「Monkey’s Audio」というエンコードソフトウェアで変換できますが、再生に対応したソフトウェアや機器も少なく、圧縮率以外のメリットが少ないため、あまり利用はされていないように思えます。拡張子は「.ape」。

非可逆圧縮 音声コーデック

以下のコーデックは、圧縮処理の際に一部データを切り捨てるため、必然的に音質の劣化が発生しますが、圧倒的な圧縮率を誇り、データ容量を大きく抑えることができます。

データ容量がかなり小さくなるため配信用としても適しており、幅広く利用されています。

MP3

1998年以降から爆発的に普及した音声コーデック。皆さんも一度は聞いたことはあるかと思います。人間の聴覚心理を利用した圧縮をするため、高圧縮率にも関わらず、高ビットレートならば音質的な劣化を感じることは少ないです。現在ではAACやVorbisなどの新しいコーデックの方が音質やデータ容量など総合的に優れているのですが、あまりにも普及してしまったため現在でも多くのソフトウェアや機器で再生することができ、未だ廃れる気配がありません。互換性が非常に高く、今でも最も利用率が高いコーデックとなっています。因みに、正式名称は「MPEG Audio Layer-3」。

AAC

正式名称は「Advanced Audio Coding」。現在、MP3と並んで最も普及している非可逆圧縮の音声コーデックです。MP3と比べて、特に低~中ビットレートにおいて音質の改善が見られます。近年ではBluetoothの転送コーデックとしても利用されています。MPEG系の動画の音声部分として利用されることも多く、特に普及しているH.264ビデオコーデックとセットでよく利用されています。

WMA

正式名称は「Windows Media Audio」。マイクロソフト社が開発した音声コーデックのため、特にWindowsとの親和性が高い。実はMP3より効率的に圧縮でき、かつ同程度の音質が得られるため、性能的にはMP3より上と言えるのですが、あまり普及しているとは言えず、互換性もMP3ほど無いことから過去のコーデックになりつつあります。

Vorbis

「ヴォルビス、ヴォービス」などと読みます。Xiph.orgが開発したオープンフォーマットで、特許の制限がなく誰でも自由に使うことができます。あまり馴染みがないかもしれませんが、YouTube動画の音声部分としてよく利用されていたため、割と身近な音声コーデック。MP3よりも音質面では全ビットレート域で上回るように設計されており、また特許の問題も無いことからPCゲームの音声部分としても利用されることがあります。ただ、基本的にVBR(可変ビットレート)を基準としているため、AVIなどVBR音声コーデックを想定していないコンテナでは音ズレなどの問題が発生しやすい。音声のみの場合は主にOggコンテナに入っています。拡張子は「.ogg」「.ogx」など。

Opus

「オーパス」と読みます。英国のIETFにて開発されたコーデック。特に遅延が少なく「低レイテンシ」を売りにしたコーデックで、かつオープンフォーマットであり特許の問題もありません。低遅延を活かしたストリーミング再生やVoIPなどのインターネット通話を得意としており、かつMP3と比べても音質がよいとされています。低遅延であるためYouTubeのほか、ゲーマー向けボイスチャットソフトの「Discord」でも利用されています。Vorbisと比べて優れたストリーミング性能のため、現在のYouTubeはOpusがメインで利用されているようです。拡張子は「.opus」。Oggコンテナに入れることができます。

コンテナの種類・特徴

ここからは、以上のコーデックを格納するためのコンテナの主流を書いていきます。

AVI

正式名称は「Audio Video Interleave」。Windows標準の動画用コンテナ形式です。古くから存在していますが、多くのコーデックが使えるため、編集用のコンテナフォーマットとして現代でも広く利用されています。ただ、流石に機能面では時代遅れ感もでてきており、特にストリーミング再生は不得手のため、動画配信サービスでアップロードしようとすると再エンコードされることが多いです。拡張子は「.avi」。

利用可能なコーデック例

動画部分は「MPEG-1/-2/-4」「H.263」「H.264」「Motion JPEG」「Huffyuv」など

音声部分は:「リニアPCM」「MP3」「AAC」「FLAC」「WMA」「Vorbis」など

MP4

現在、最も人気のあるコンテナフォーマットのひとつ。Apple社のQuickTimeコンテナフォーマット「MOV」をもとに策定されました。AVIよりも高機能、かつ多くの新しい規格のコーデックが使え、YouTubeなどの動画配信サービスのほか、スマートフォンやゲーム機なども再生に対応していることが多いです。よほど古いソフトウェアや機器でなければ、MP4ファイルが再生できない環境はほとんどないと思われます。拡張子は「.mp4」。

利用可能なコーデック例

動画部分として「MPEG-1/-2/-4」「H.264」「H.265/HEVC」「AV1」など

音声部分として「MP3」「AAC」「FLAC」「ALAC」「Opus」など

MOV

Mac OSの標準コンテナ。WindowsのAVI的な存在。幅広いコーデックが使用できるため、Mac OSで編集する際にはよく利用されています。ただ、徐々にMP4へ主流が移行しつつあります。Windowsでも一応利用はできますが、Windows版QuickTimeのサポートが終了したため、Windows環境での利用は難しくなっています。拡張子は「.mov」。

利用可能なコーデック例

動画部分として「MPEG-4」「H.261」「H.263」「H.264」「H.265/HEVC」など

音声部分として「MP3」「AAC」「ALAC」など

WAV

正式名称は「RIFF waveform Audio Format」。「WAVE」とも記述されます。読み方は「ウェイブ」「ウェブ」、日本ではWeb(ウェブ)と区別するため「ワブ」と呼ばれる場合もあります。音声データ用のコンテナ規格で、特に非圧縮であるリニアPCMの音声データ格納に使われます。ほとんどはこのリニアPCMが格納されていますが、コンテナフォーマットなのでMP3、WMAなどの非可逆圧縮の音声データも格納はできます。

タグ付けはサポートされていますが、メタ情報を正しく読み込んでくれないソフトウェアも多く(特にiTunesはWAVタグを読み込まないことで有名)、タグ付けに関しては少し汎用性に劣ります。ファイル容量の上限があり「4GB」以上のデータは扱えません。制限を超えたWave64 (.w64)というフォーマットもありますが、ソフトウェア側での対応が必要です。拡張子は「.wav」。Wave64形式の場合でも同じ拡張子(.wav)が使われることもあります。

利用可能なコーデック例

音声部分として「リニアPCM」「MP3」「WMA」など

AIFF

正式名称は「Audio Interchange File Format」。WAVと同様に音声データ用のコンテナ規格で、同じく非圧縮のリニアPCMが格納されていることがほとんどです。圧縮処理がされていないことがほとんどなので、サンプリング用コンテナとしての利用がメインです。

WAVと同じく4GBの制限(RF64形式にすれば上限を超えられます)はありますが、タグ付けなどのメタ情報を正しく読み込んでくれるソフトウェアが多く、またMP3などで広く利用されているID3なども使えるため、音楽の管理にはWAVより向いています。一応、非可逆圧縮形式の音声も記録はできます。拡張子は「.aiff」「.aif」、非可逆圧縮を利用した場合は「.aifc」。

利用可能なコーデック例

音声部分として「リニアPCM」「Apple IIGS ACE」など

MKV

Matroska(マトリョーシカ)とも呼ばれます。ロシアの入れ子人形マトリョーシカにちなんで名付けられました。その名前の通り、あらゆるコーデックの格納が可能で、動画編集用ファイルとしてはAVIよりも自由度が高い。字幕などもサポートしており、字幕表示のオン・オフも可能。さらに「英語」「日本語」などのマルチトラックにも対応した高機能コンテナです。動画編集をしたい場合の最有力候補です。拡張子は「.mkv(映像)」 「.mka(音声のみ)」「.mks(字幕のみ)」など。

利用可能なコーデック例

動画部分として「MPEG-1/-2/-4」「H.264」「H.265/HEVC」「VP9」「AV1」など

音声部分として「PCM」「MP3」「AAC」「FLAC」「WavPack」など

FLV

ストリーミング再生に最適化されたコンテナ。かつてはインターネット上で動画を配信するため、特にAdobe Flashによく利用されていましたが、現代ではMP4などに移行しています。ただ、インターネットが急速に整備されてきた2005年以降、動画配信用としては本当によく利用されていて、インターネット文化の発展に大きく貢献しました。拡張子は「.flv」。

利用可能なコーデック例

動画部分として「H.263」「H.264」など

音声部分として「リニアPCM」「MP3」「AAC」など

まとめ

以上、コーデックとコンテナについて簡単ですが解説してみました。

データの内容としては動画と音声のふたつしかないのですが、それを保存・圧縮する手段は非常に多く驚いた方もいるかと思います。IT化が進んでいる現在、状況に応じたデータ形式が必要になるのでこれは仕方のないことなのかもしれません。

それでも、汎用性の高いコーデック、コンテナの組み合わせがありますので、最初はこれらのフォーマットから始められるとよいかと思います。動画投稿をお考えの場合は、「MP4」で動画部分を「H.264/MPEG-4 AVC」や「H.265/HEVC」、音声部分を「MP3」「AAC」「FLAC」にすると、現時点では汎用性の高いデータとなると思います。

ここからさらに高品質の映像を作りたい場合に、最新規格などを利用していただければ理解も早くなるかと思います。

長くなりましたが、ご参考なりましたら幸いです。

更新履歴
  • 2024年1月7日:内容を更新
  • 2011年6月23日:初出
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

長野県在住。化学系の学科へ在学後、現在は植物の生産を仕事にしています。このブログは趣味と実益を兼ねて、仕事の合間に書いています。農家ではありますが、ECサイトの管理なども業務として行っています。

最近はカメラにも興味がでてきました。商材写真の撮影なども勉強したいところです。カメラ系の記事も書くかもしれません。

コメント

   コメント欄を開く

コメント一覧 (6件)

  • お力になれたようで嬉しいです。
    この記事はまとめ的なものなので細部はかなり省略しています。
    もっと凝ったことをするようでしたら、他のサイトの記事も読んでみてください。

  • 動画編集の必要にせまられ困っている時にこのページにたどり着きました。
    知識を得るのに、ちょうどいいまとまり方で非常に参考になりました。感謝です!

  • お役に立てたようで良かったです。中々数が多くて大変ですよね。
    ただ、この記事色々省いているので詳しくはまた別のサイトで勉強なさってみてください。

  • お力になれてよかったです。
    少し古い記事なので現在の事情とは異なる部分もあるかと思いますが、有名なコンテナやコーデックを広く簡単に見れるようにはなっているかと思います。また時間がとれましたら記事も書き直してみたいと思います。

コメントする

目次