소리의 기초(5)
소리의 높이와 마스킹 효과 사람의 주파수 분해 지각능력에 관하여는 두 가지 이론이 있다. 우선 가장 많이 추종되고 있는 가설은 Von Bekesy가 주장한 위치이론(place theory)이다. 이는 고주파수 대역은 내이쪽이 그리고 저주파수 대역은 Helicotrema쪽의 기저막에 연결된 섬모세포에서 감지되어 분류된 후 뇌에 전달된다는 것이다. 반면 주기이론(periodicity theory)은 청각신경을 통해 전달되는 임펄스들의 시간적 분포가 분해 (encoding)되어, 음파의 일시적 데이터 구조를 형성함에 따라 뇌에서 주파수 혹은 피치를 지각한다는 것이다.
 [달팽이관의 펼친 모양 및 주파수 민감도]
소리의 기초(1)에서 다루었지만, 이번에는 소리의 지각에 대해 좀더 자세히 알아보도록 하겠다. 중이를 구성하는 세개의 청소골은 외이와 내이의 임피던스 매칭(impedance matching)을 담당하고 있다. 망치뼈에서의 높은 임피던스를 등자뼈에서 낮은 임피던스로 바꿈으로서, 외이의 높은 압력을 내이의 유효한 속도 성분으로 바꾸는 역할을 하게 된다. 여기서 망치뼈와 등자뼈의 면적비는 30:1이며, 기계적 이득은 3:1에 해당한다.
이렇게 소리의 음높이를 표현하는 방법으로는 주파수(frequency)와 피치(pitch)가 있는데, 인간의 주관적인 응답을 더 잘 표현하는 것이 피치라 할 수 있다. 피치는 소리의 파형(wave form)이 반복되는 율에 관계하는데, 주관적 피치는 'mel' 이라는 단위로 표현한다. 일반 성인의 가청범위인 20Hz~20kHz 사이의 주파수 범위는 0~5,400mels로 다시 나타낼 수 있다.
 [주파수와 피치와의 관계도]
한편 소리의 음높이를 나타내는 피치는 주파수에 대한 의존성 뿐만 아니라, 소리의 세기와도 밀접한 관계를 갖고 있다. 일반적인 경향을 말하자면, 약 1kHz를 기준으로 하여 같은 주파수의 소리라도 소리의 세기가 높아질수록 고주파수에서는 높게, 저주파수에서는 낮은음으로 들리게 된다. 아래의 그림은 주파수에 따른 피치와 세기와의 관계를 나타낸 그래프이다.
 [주파수에 따른 피치와 세기와의 관계]
한편, 귀에 순음이 주어질 경우라도 인간은 주어진 음의 정수배에 해당하는 고조파음(harmonics : overtones)들을 함께 느끼게 되는데, 이를 Aural Harmonics라고 부르며, 아래의 그림에 그 특성을 볼 수 있다. 이 밖에도 귀, 특히 외이에서는 스스로 작은 소리를 생성할 수 있는데, 이러한 상황들 때문에 인간이 느끼는 소리의 크기 및 높이를 정확하게 알아내는 작업은 매우 어려운 일이다.
 [Aural Harmonics의 특성]
마스킹 효과(masking effect) 어떤 소리가 다른 소리를 듣는 능력을 감소시키는 현상을 마스킹효과(masking effect)라 한다. 즉 사람이 A의 소리를 들을 때 다른 소리인 B의 소리가 생겨서 크게 될수록 A의 소리는 듣기가 어려워 진다. 이 때 A의 소리는 B의 소리에 마스크가 되었다고 한다.
또한 음의 마스킹은 신경의 생리적 및 심리적 현상으로 매우 복잡하며 두 음의 주파수 구성, 음강도레벨 및 듣는 사람의 심리적 태도에 따라서 달라진다.
소리는 내이의 달팽이관내에서 위치에 따라 포함하고 있는 각 주파수 성분의 에너지로 분해되어 뇌에 전달된다. 각 길이 방향 위치에 따른 주파수는 순음에 대한 응답인 경우에도, 아래의 그림과 같이 일정한 밴드폭(bandwidth)을 갖게 된다.
 [마스킹효과의 간략화 된 설명도]
그림에서 보듯이 두개의 인접한 밴드가 겹쳐지는 부분의 주파수 및 세기를 갖는 소리의 경우에는 그 보다 높은 크기의 동일주파수 대역의 소리에 묻혀서 들리지 않게 되는데, 이를 마스킹효과라고 부른다. 이렇게 마스킹효과를 갖게하는 밴드폭은 자극의 레벨에 따라 증가하여 더 넓은 주파수 대역을 관장하게 되는데, 이 대역폭의 증가는 무한정 커지는 것이 아니라, 한계가 있고, 이를 한계대역폭(critical band)이라고 부른다. 한 개의 한계대역폭은 기저막을 따라서 약 1.3mm의 길이에 집중되어 있으며, 그 단위를 1 bark라고 한다.
한계대역폭 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
중심주파수 |
50 |
150 |
250 |
350 |
450 |
570 |
700 |
840 |
대역폭 |
100 |
100 |
100 |
100 |
110 |
120 |
140 |
150 |
한계대역폭 |
9 |
10 |
110 |
12 |
13 |
14 |
15 |
16 |
중심주파수 |
1000 |
1170 |
1370 |
1600 |
1850 |
2150 |
2500 |
2900 |
대역폭 |
160 |
190 |
210 |
240 |
280 |
320 |
380 |
450 |
한계대역폭 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
중심주파수 |
3400 |
4000 |
4800 |
5800 |
7000 |
8500 |
10500 |
13500 |
대역폭 |
550 |
700 |
900 |
1100 |
1300 |
1800 |
2500 |
3500 |
[각 bark에 관련된 중심주파수에 대한 한계 대역폭]
위의 표에서 볼 수 있듯이, 고주파수 대역을 분해하는 중이측 기저막에서의 한계대역폭은 대략 23%에 해당한다. 이는 주파수분석을 수행할 때 1/3 옥타브 분석을 수행하도록 규정된 수 많은 국제 규격의 근거가 되는 것으로, 인간의 청감 특성을 충분히 고려한 것으로 생각할 수 있다. 또한 1/3 옥타브 해석기법이 아직까지 유용하게 쓰이고 있는 이유라고도 할 수 있다.
이러한 마스킹효과의 특성은 다음과 같이 요약될 수 있다.
첫째, 협대역폭(narrow band)의 소리가 같은 중심주파수를 갖는 같은 세기의 순음보다 더 큰 마스킹효과를 갖는다. 덧붙이자면 마스킹 소음의 레벨이 커질수록 마스킹되는 주파수 범위가 점점 늘어난다.
둘째, 마스킹 효과는 마스킹 소음의 중심주파수보다 고주파수 대역에서 보다 큰 값을 갖게 되는 비대칭성을 갖고 있다.
셋째, 마스킹 소음의 대역폭은 어느 한계(한계대역폭) 이상에서는 그 중심주파수에 있는 순음에 대해 영향을 미치지 못한다.
아래의 그림에는 마스킹효과의 비대칭성을 소리의 세기를 높여가며 측정한 결과를 보여주고 있다. 그림에서는 이러한 마스킹효과의 예로서 암 소음(back ground noise)이 존재할 때, 그 레벨에 따라 사람들 사이에서의 대화를 어느 정도의 크기로 하여야 하는지에 대한 내용을 나타내고 있다.

[1kHz의 소리에 대해 레벨을 높여감에 따른 마스킹 대역폭의 변화]
이렇게 마스킹을 생리학적으로 고찰하면 어떤 소리의 자극에 따라 방전하는 신경체계는 다른 정보를 뇌에 전달할 수 없게 되어 있다. 소음으로 인하여 듣고자 하는 소리가 마스크가 되는 것은 좋지 않다. 그러나 역으로 마스킹 효과를 이용하여 소음을 음악으로 마스크 할 수 있다. 예를 들어서 호텔 등의 로비 또는 엘리베이터 안에서 사용하는 백그라운드 음악(back ground music)은 마스킹 효과를 이용한 것이다. 사람이 아주 조용한 곳에서 장시간 있으면 이상한 심리 상태로 되는 수도 있다. 그러므로 약간의 백 그라운드 소음이 있는 것이 생리적으로 좋다.
|