• TOP
  • BLOG TOP
  • 「電話の自分の声に違和感を覚える理由」

ブログトップへ

「電話の自分の声に違和感を覚える理由」

「よそ行きの声」というのは誰でもあると思います。例えば、家族で話しているときの自分の声と、職場の上司などに話しかけているときの自分の声を想像してみてください。全く同じという方は少ないのではないでしょうか。他にも、話す相手が同姓か異性かによっても話し方や声のトーンが変わるという方もいます。このような例は、意識的にやっている場合もあれば、無意識にやっていることもあります。しかし考えてみると、多くの方が当たり前のように行っているのです。このように、「自分の声」とはいっても、時と場合によって実はいろいろと使い分けをしており、それぞれに意味があるのです。

それでは次にもう1つ、多くの方が「この声自分の声じゃないみたい」と感じる場面を挙げてみたいと思います。それが「電話」です。自分が電話で話している声を自分で聞く、という場面はそれほど多くないかもしれません。しかし、例えば留守電に録音された自分の声を聞いて違和感を覚えたことがあるという人も多いのではないでしょうか。

先ほど「人は声を使い分けている」という話をしましたが、この電話から聞こえる自分の声の違和感も、声の使い分けによって自らが行っていることなのでしょうか。それとも何か別の理由があるのでしょうか。今回の記事では、電話から聞こえる自分の声に違和感を覚える理由やその声の正体に迫っていきます。

1.電話の声は本当の自分の声ではない?

まず結論から申し上げましょう。「え?いきなり結論から言っちゃうの?」と思う方もいるかもしれませんが、今回はまず結論から理解した方が分かりやすいと思いますので、そちらから紹介します。「電話から聞こえている声は、その人の声ではありません」これが結論です。

これは自分に限ったことではありません。誰かと電話しているとして、電話口から聞こえているその人の声「らしきもの」は、あくまでその人「っぽく」聞こえているだけであって、その人の声ではありません。「じゃあ誰の声なの?」というのは当然の疑問として浮かび上がってくると思いますが、それについては後ほど説明していきたいと思います。

結論について頭に入れていただいた上で、まずは声が音となる仕組みについて紹介していきましょう。みなさん、声がどこから出るか知っていますか?「もちろん口でしょ?」と答える方が多いでしょう。当然声は口から出てくるのですが、より正確に答えるとどうでしょう。「喉」と答えるかもしれません。惜しい、もう少し正確に考えてみましょう。正解は「声帯」です。聞いたことありますよね?

声帯が震えることによって、空気に振動を与えることになり、その振動が相手の耳の鼓膜に届き音として表現されます。それぞれの音は、空気の振動が異なります。例えば、「あ」の音と「か」の音では空気の震え方が全く違います。私たちの耳はその振動をうまく聴きとっているのです。これが私たちの耳が声を聞きとることができる仕組みです。

そして、この「音を聞き取る力」には「慣れ」が大きく関わっています。空気の揺れ方にはさまざまなパターンがあるのですが、慣れていない振動はうまく聞き取ることができません。みなさんは、ネイティブの英語を聞き取ることはできますか?学生時代に英語を勉強して単語も知っているにもかかわらず、実際に本場の英語に触れると全く聞き取ることができないということは日常茶飯事です。

これには「慣れ」が影響しています。つまり、英語の音の揺れは耳が普段聞き慣れていないため、何を言っているか理解できないのです。ただし逆に言えば、ある程度慣れてしまえば聞き取ること自体はできるようになります。もちろん、その意味を理解できるかどうかはまた別の問題ですが。

2.電話の声の正体は?

それでは本題に戻りましょう。先ほど、「電話から聞こえてくる声は、その人の声ではない」ということを説明しました。そこで当然の疑問が浮かんできます。「それなら電話から聞こえてくる声は誰の声なのか」ということです。

そこで問題です。電話から実際に聞こえてくるのは誰の声でしょうか。
1.声が似ている別の人の声
2.機械で作られた音
3.天の声
さあ、どれでしょうか。

もっともあり得そうなのは1番の「声が似ている別の人の声」でしょうか。あらかじめ、いろいろな声のサンプルを取っておいて、電話相手に似ている声の人を選びだして再現しているというパターンです。

正解は1番と2番の両方です。「合成音声」と言います。つまり、「声が似ている人の声をたくさん集め、その声を機械で合わせることによって電話口の声に似せた声」を作っています。あくまで似せた声なので、電話で話していると「なんか普段と声が違うなあ」という印象を受けることがあるのです。

具体的には、「コードブック」というものに、数千種類の音や声が録音されていて、電話で話すとその音の中から似ている音をいくつも組み合わせて、その人の声に聞こえるようになっています。「そんなこと可能なの?」と思うかもしれませんね。そこで出てきた技術が、「CELP」というものです。

「CELP」とは、音をデータ化して、番号を割り振ることによって上記のようなシステムを実現している技術です。つまり、ある声や音をそのまま録音して保存していては、電話のたびにどの音が似ているのかということを確認しなければならず、膨大な時間やコストがかかっていします。

そこで「CELP」では、音の波形ごとにデータを取り、番号を振ります。先ほど、「音は空気の振動で伝わる」ということを説明しましたが、振動で伝わるということは「波形」で表すことができるということにもつながります。そこで「この波形は1番、こっちの波形は2番」というように、音のそのものではなく、あくまでデータに番号を振るということをしています。そして、電話を利用する際には、電話口で聞こえる声を波形に表し、その波形に似た音を組み合わせて相手の電話口に送信しているのです。これにより、ある程度近い声を表現しています。

このようなシステムを、ほとんどラグもなく実現しているわけですから、いかに電話というものが優れたものかは分かっていただけると思います。

3.電話は、なぜ本当の声を再生しないのか

電話がその人自身の声でないことは理解していただいたと思いますが、ここでもう1つ疑問が浮かんできます。それは、「なぜ電話は本当の声を再生していないのか」ということです。その人の声自体をそのまま届けていれば、「CELP」というシステムすら不要で、よりコストを下げることもできるはずです。

しかしそれは行われていません。その理由は、「回線がパンクしてしまうから」です。あくまで電話は、その2者の間で直接つながっているわけではなく、電話会社などを通じてつながっているにすぎません。そのため、すべての声について識別し、それぞれの電話相手に同じ音を届けるとなると、ただでさえ複雑で特徴のある多くの人の声を忠実に再現しなければならず、回線がパンクしてしまうのです。

現在のシステムは、「CELP」を利用して、あくまでデータで保管・管理することによって成り立っているのであって、それを本物の音で管理してしまうと、データ容量がいっぱいになってしまうのです。

近年でも、年末年始など電話がなかなかつながらない、という時期があると思います。容量を圧縮したデータで管理していてもそのような事態が起こるのですから、もし生の音でやり取りをしていた場合、日常的に通信障害が発生することは容易に想像ができます。

4. まとめ

いかがだったでしょうか。これで電話の自分の声に対する違和感が少しはなくなったのではないでしょうか。