Fieldrecordingのための音響学習

私たちが日々フィールドレコーディングで扱う「音」について、その構造や性質を理解することは、より深く音と向き合い、録音・編集・創作のクオリティを一層高めることができます。また、Sound viusalization(音の視覚化)・オーディオリアクティブといった表現の観点からもこれら知識はとても役立ちます。

音とは何か? 音の三要素

音とは、媒質(空気・水・固体など)中を伝わる振動波です。特に私たちが日常で聞いている音は、空気中を伝わる縦波(疎密波)で、音源から放たれた振動が空気分子を押し縮めながら周囲に伝播していきます。

このときの空気の圧力変化を波形として可視化すると、時間軸に沿った「音のかたち」が見えてきます。録音・可視化・解析という一連の行為は、この物理現象を捉えることができます。

音の基本構造は周波数(音程)/振幅(音量)/波形(音色)といった音の三要素によって決定されます。

要素内容録音への影響
周波数(Frequency)1秒あたりの振動数(Hz)高い音・低い音の識別。マイクや録音機材の周波数特性に大きく関与。
振幅(Amplitude)振動の大きさ音量。距離、環境ノイズ、風の影響などを受けやすい。
波形(Waveform)音の形(正弦波、矩形波など)音色の決定因。倍音構造と深く関係。

音は、これらが組み合わさり環境音から楽器音、声まで、多様な音を構成しています。フィールドでの録音対象は、しばしば非周期的・複雑な波形を持つため、次回以降後述するスペクトル分析(FFT)が重要になります。

デシベルと「聞こえる音」「聞こえない音」

dBとは?

音の強さを表す単位であるdB(デシベル)は、対数スケールで表現されます。対数スケールが用いられるのは、人間の耳が音の強さの対数的な変化を感知するためです。つまり、音圧が10倍になると、音の大きさが2倍に聞こえ、100倍になると4倍に聞こえる、という具合に、線形的なスケールでは表現できない人間の感覚に合わせた表現方法になります。

  • 0 dB SPL(Sound Pressure Level)=聴こえる限界
  • 20〜40 dB:静かな環境(図書館、森)
  • 85 dB以上:長時間の暴露で聴覚リスク
  • 130 dB〜:痛覚を伴う音圧(ジェット機近く)

また、「音の大きさ」にはSPLラウドネスといった2つの異なる概念があります。

用語説明
SPL(Sound Pressure Level)実際の音圧。機械が測定する「物理的な大きさ
ラウドネス(Loudness)人が感じる「主観的な音の大きさ

2つの概念があるのは、人間の聴覚の特性によるもので、周波数によって聞こえやすい帯域と聞こえにくい帯域があるためです。たとえば、同じdBの音でも、ある一定の周波数の音が大きいとうるさく感じることがあります。これは人間の聴覚特性によるものです。

尚、録音時、「聞こえないから不要」と切り捨てるのではなく、音の存在としての痕跡を受け取る姿勢が、より繊細な創作へとつながります。

人間の聴覚の特性とその限界 – 聴こえる音・聴こえない音

音は耳で捉えられ、鼓膜→耳小骨→蝸牛(内耳)という物理的プロセスを経て、最終的には脳で「音」として解釈されます。この聴覚システムには以下の特徴があります。

  • 感度のピークは中高域(2kHz〜5kHz):これは子音や警報音と一致し、進化的に重要な音域とされています。
  • 等ラウドネス曲線(フレッチャー・マンソン曲線):同じdBでも、周波数によって「大きさの感じ方」が異なります。(次回以降後述)
  • マスキング効果:ある音が別の音を覆い隠す現象。風音や低周波ノイズは録音の「邪魔者」としても、「隠し役」としても働きます。

可聴域とその外側

人間が聞くことができる音の周波数範囲(可聴域)は、一般的に約20Hz〜20,000Hz(20kHz) とされています。

領域周波数
可聴域20Hz〜20kHz人の声、鳥のさえずり
超低周波(Infrasound)20Hz以下地震、風、象の通信
超音波(Ultrasound)20kHz以上コウモリの音、イルカの通信

フィールドレコーディングにおいて、マイクはそれよりも広い周波数帯を拾うことができ、可聴外の音が録音に影響を及ぼすこともあるため、録音時や編集時に意識することが重要です。

RMS・Peak・ラウドネス -「大きさ」をどう捉えるか?

録音やミキシングにおいて「音の大きさ」は重要な要素ですが、この“大きさ”には複数の異なる定義があります。物理的な音圧瞬間的なピーク値、そして人間の「聞こえ方」(ラウドネス)といった、それぞれの違いを整理します。

Peak(ピーク):瞬間的な最大音圧

ピークとは音波が持つ一瞬の最大振幅値を指します。ピークが大きい音はアタックが強いと表現されたりします。ピークがあることにより音のメリハリが生まれます、ですが、極端にピークが大きすぎると耳障りな音になることもあり、そのバランスが重要です。

録音・マスタリングでは、クリップ(音割れ)を防ぐためにこの値をモニターすることが基本となります。瞬間的な振幅の大きさなため、実際の音の大きさ感とは一致しません。

RMS(Root Mean Square):平均的なエネルギー量

人が音の大きさを感じるには1秒前後の時間が必要になります。その時間内の音を平均し、ひとつの音の大きさとして感じています。

RMSを簡単にいうと音の平均的な大きさです。その値は音の振幅を二乗、平均し、ルート(平方根)を取った値になります(二乗平均平方根)。これは「音のエネルギーの平均値」として捉えることができ、実感される音量感により近いと言われます。

先ほどの瞬間的な音の大きさであるピークとは違い、RMSは人が感じる実際の音の大きさと一致します。

また、よく聞くボリュームという言葉は、特定の時点での音の大きさのコントロールを指します。

ラウドネス(Loudness):主観的な大きさ

ここまでのPeakやRMSはあくまで物理量に基づいた指標でしたが、人間の耳が感じる「うるさい」「小さい」といった評価は、知覚(聴覚心理)によるもので、これがラウドネスになります。(詳細は次回以降に詳しくまとめます。)

特徴:

  • 等ラウドネス曲線(フレッチャー・マンソン曲線)により、人間の耳は中高域(2〜5kHz)に最も敏感
  • 同じdB値でも、低音や高音は「小さく感じられる」ことがある
  • 音量だけでなく、周波数構成や持続時間も知覚に影響を与える

録音や編集時、人間の知覚として、「聴こえやすい音」と「物理的に大きい音」は一致しません。

このように録音や編集、ミックス時において、音の方向性を探りながら、ピークやRMS、ラウドネスを意識しながら音のバランスを調整します。

ノイズの色(種類)とスペクトル構造

自然音や都市音の中に含まれる「ノイズ」には、周波数構成によっていくつかの「色」があります。

ノイズの種類特徴印象・用途
ホワイトノイズ全帯域に均等シャーという刺激的な音。測定やマスキングに使われる。
ピンクノイズ1/fスペクトル(低域が強め)自然界に多く、リスニングに心地よい。雨音や葉擦れなど。
ブラウンノイズさらに低域が強調雷、遠雷、濁流。重く温かみがある。

ホワイトノイズとピンクノイズを聴き比べてみると、人間が「自然に感じる音」の傾向が分かります。録音時のマスキング効果などにも影響します。これらは単なる技術的分類ではなく、録音対象の質感を解釈する手がかりにもなります。

実験的に聴く:音とその輪郭

以下のような体験的学習を通じて、「聞こえる音」の再定義をしてみるのも有効です

  • 自作ホワイトノイズジェネレーターで室内を満たし、周囲の音がどう変わるかを観察する
  • ハイレゾマイクを用いて20kHz以上の音を録音し、スペクトル表示で確認する
  • 耳を塞ぎ、身体を通じて音を感じる状況を意図的に作る(床に接地して聞くなど)

録音の技術は、しばしば「見るように聞く力」に支えられています。

音を「記録する」以前に、「理解する」

音の性質を知ることは、ただの理論的教養ではありません。それは録音機材の選定、設置角度、録音位置の判断、そして後処理の全てに直結する、実践的な知識です。

また、物理的に捉えきれない「聞こえない音」たちとどう向き合うかは、レコーディングという行為を単なる収集から創造へと変える鍵でもあります。

BGD_SOUNDS on bandcamp

BGD_SOUNDSでは、bandcamp上にて、安価で利用できる膨大な著作権フリーのサウンドライブラリーを目指して日々様々な音源ライブラリーを増やしています。音源のほとんどは、192kHzの32bitの高音質にて録音。音楽制作や映像制作など用途に合わせて利用可能です。また、Sound visualization Penplot artも定期的に販売しています。

BGD_CLUB(月額サブスクリプション)も低価格から始めており、すべてのライブラリーにアクセスし自由にダウンロードすることも可能です。

Link / BGD_SOUNDS on bandcamp

関連記事 ► フィールドレコーディング入門|導入篇〜レコーディングの手順やオススメ機材【初心者向け】

field-recording-beginner-01-00