Date:2024-04-17
フィールドレコーディング入門|音声ファイル形式のすべて【初心者向け】
フィールドレコーディングに必要な知識として録音する際のセッティングがあります。どのファイル形式で、どのくらいのデータで録音したら良いか、また、その後使用目的に応じたデータ設定などを解説します。
barbe_generative_diary の フィールドレコーディング
私の音の収集目的は、“Sound Visualization(音の視覚化)”というコンセプトアートの制作使用です。日常に溢れている目に見えない音の世界をグラフィックで視覚化し、ジェネラティブにミキシングすることで、新たなクリエイティブ表現やよりミニマルな表現に取り組んでいます。多種多様な国々のアーティストとのコラボレーションも行っています。
これまで録音してきた多くの音源を音楽プラットフォームbandcamp(BGD_SOUNDS)にて公開し、共有・販売を始めています。ほぼすべての音源は、192kHz-32bit floatで録音され、ロイヤリティーフリーにて自由に使用できます。定期的にリリースされますので、音源が必要な方はフォローにて最新情報をチェックしてみてください。
Sample |Original Heidelberg Printing Machine Sounds ”活版印刷機の稼働音”
フィールドレコーディング入門|音声ファイル形式のすべて【初心者向け】
この記事では、フィールドレコーディングでのファイル形式と音声ファイルに関する技術用語(サンプリング周波数・ビット深度・ビットレート)についての解説です。
音声ファイル形式について。
音声ファイル形式とは
音声ファイル形式は、デジタル化された音声をコンピュータ上で保存するためのフォーマットです。サンプリング周波数、ビット深度、圧縮方式などの要素によって、音質やファイルサイズなどが決まります。
フィールドレコーディングでのファイル形式
フィールドレコーディンで使用するファイル形式について、結論から言えば、WAV(.wav)を主に使用します。高音質で劣化がなく、マスターデータの保管などに用いられ、後に行う音響編集や音楽制作などに利用します。
代表的な音声ファイル形式
非圧縮形式
- WAV (Waveform Audio File Format):Windows標準の音声ファイル形式。高音質だがファイルサイズが大きい。
- AIFF (Audio Interchange File Format):Mac標準の音声ファイル形式。WAVと同様の高音質で、Macとの互換性に優れる。
非可逆圧縮形式
- MP3 (MPEG-1 Audio Layer III):最も普及している音声ファイル形式。圧縮率が高く、ファイルサイズが小さいが、音質は劣化してしまう。
- AAC (Advanced Audio Coding):MP3の後継規格。MP3よりも高い圧縮率と音質を実現。
- WMA (Windows Media Audio):マイクロソフトが開発した音声ファイル形式。MP3と同様の圧縮率と音質だが、Windowsでのみ再生可能。
音声ファイル形式にはそれぞれの特徴があり、用途によって使い分けることが重要です。高音質を求める場合は非圧縮形式、ファイルサイズを小さくしたい場合は圧縮形式を選ぶようにしましょう。
近年は、可逆と非可逆の両方の利点を兼ね備えた新しい形式も開発されています。音声ファイル形式を選ぶ際は、再生機器はもちろん、音質、ファイルサイズ、など用途に応じた対応状況などを考慮しましょう。
サンプリング周波数、ビット深度、ビットレートの基礎解説
デジタル音声の世界において、「サンプリング周波数」、「ビット深度」、「ビットレート」は、音質を語る上で欠かせない三要素です。フィールドレコーディングを行う際は知っておく必要があります。
サンプリング周波数
録音は、マイクから入ってくるアナログ音声をデジタルに変換し記録します。サンプリング周波数は、その際に、1秒間に取得するサンプル数を表します。
用途にもよりますが、一般的にフィールドレコーディングでは、汎用性の高いデータとして記録するため、できるだけ高いサンプリング数、192kHzや96kHzでの記録がおすすめです。
高いサンプリング周波数は、より広い周波数帯域を再現できるため、音声のクオリティを向上させます。しかし、高いサンプリング周波数はファイルサイズを増やすため、バランスを考える必要があります。ちなみに、一般的なCD音質では、44.1kHz(44,100サンプル/秒)が標準です。
ビット深度
ビット深度は、各サンプルがデジタルデータで表現される際の精度を示します。ビット深度が高いほど、より細かい音の差異を捉えることができます。
前回の記事「フィールドレコーディング入門|32bit float レコーディング」でも触れていますが、ビット深度は小さな音から大きな音までをどのくらい忠実に録音するかにより選択します。
たとえば、24ビットの深度では、16ビットよりもはるかに細かい音の変化を表現できます。しかし、高いビット深度はファイルサイズを増やすため、ストレージや帯域幅を考慮する必要があります。一般的に人間の耳は16bit程度のビット深度であればノイズを聞き分けることができません、よってCD音質では、16ビットが使用されています。
フィールドレコーディング場合、やはり汎用性あるデータの記録したいので、できるだけ高いビットを選択します。24bit以上であれば十分ですが、最近では以前紹介した32bit floatでの録音がおすすめです。
ビット深度は、音を歪ませることなく捉えるダイナミックレンジを表します。下記はその参考数値です。
- 16bit = 約96dB(ダイナミックレンジ)
- 24bit =約144dB(ダイナミックレンジ)
- 32bit float =約1680dB(ダイナミックレンジ)
ビットレート
ビットレートは、1秒間にどれだけ多くのデータ量を伝送するかを表す値です。ビットレートが高いほど、より多くの情報を伝送することができ、より高音質な音声を再生することができます。ビットレートは、サンプリングレートとビット深度を掛け合わせて計算されます。例えば、44.1kHzのサンプリングレートと16bitのビット深度の場合、ビットレートは705.6kbpsとなります。
ビットレート(ビット/秒) = サンプリングレート(Hz) × ビット深度(ビット) × チャンネル数
三要素のバランスが音質を決める
サンプリング周波数、ビット深度、ビットレートは、それぞれ音質に異なる影響を与えます。フィールドレコーディングの際はできるだけ高い数値での録音を行いますが、これらの要素を理解し、その後用途に応じて、適切な値を選ぶことで、目的に合った高音質の音声ファイルを生成することができます。
高音質を追求する場合
- サンプリング周波数:96kHz~192kHz
- ビット深度:24bit~32bit
ファイルサイズを抑えつつ、ある程度の音質を確保する場合
- サンプリング周波数:44.1kHz
- ビット深度:16bit
用途や目的に合わせて、最適な三要素の組み合わせを選択することが重要です。
フィールドレコーディング おすすめの機材
フィールドレコーダーに人気の高いTASCAM Portacapture X8は、多機能なハンドヘルド・レコーダーです。ラージダイアフラムコンデンサーマイクを搭載、バックから取り出してすぐに録音を行うことができます。また左右に二つづつ、計4つのインプットがあり、外部マイク入力も行え自由なセッティングが可能です。