紙と鉱質インク

これらのスケッチは明暗さまざまな心象を(そのとおり)写実した言語記録(紙と鉱質インク)です

声の人間性は一人歩きしがち

人間の肉体からVTuberの声が聞こえるというのは、何かバグってる感じがする。それはちょうど、VTuberの肉体から人間の声が聞こえるのと正反対の位置にあるように思うかもしれない。しかし、現実には正反対ではない。「VTuberの声」は厳密には「人間の声」だけでなく「ソフトを用いた電子音」も含まれるからだ。つまり、VTuberの肉体から聞こえるのは人間の声だけに限らない。

  • VTuberの肉体→人間の声 or ソフトを用いた電子音

一方で、通常人間の肉体からは特例(物理学者ホーキングなど)を除いて人間の声しか聞こえない。

  • 人間の肉体→人間の声 (or ソフトを用いた電子音)

ここに非対称性がありバグの発生源があるように思える。

つまり、人間の肉体からVTuberの声が聞こえるという現象について、「VTuberの声」が聞こえることを「VTuberの肉体から聞こえる声」で話されると考えるなら、

  • VTuberの肉体→VTuberの声=人間の声 or ソフトを用いた電子音

このVTuberの肉体から聞こえる声のうち、

①電子音であれば、それは先述の特例となり(つまり人間の肉体からノラキャットの声が聞こえるような事例。面白そうなので一考してもよさそうだが、これは脱線なので略)

②人間の声であれば、ある別の人間Aの肉体から、よく知った人間Bの声が聞こえる感じを与える。

この「ある別の人間Aの肉体からよく知った人間Bの声が聞こえる感じ」こそA=B等式が自然に連動せず、肉体と声の紐づけが上手くいかないことからくるバグの根本だといえそうだ。

私を含めたオタクは人間Bをよく知っており、人間Aを知らないような印象をもってしまう。しかしオタクは人間Bそのひとをまるで知らない*1ばかりか、ただ人間Bの声しか知りえないという当たり前の事実が再確認されるのだ。*2

となると、たとえ会ったことがなくとも、よく知った声を聞くと、なぜ人間Bを仮想的に置いて人間Bの声として考えるのだろうか。電車内のアナウンスを聞いて人間Bの声だと判断するのはなぜか。

また、ソフトを用いて出力された電子音を前提としたが、人間の声をソフトに入力して出力された電子音は、厳密に電子音なのか人間の声なのかという問題もある(ボイスチェンジャー)

もう少し考えてみたい。

*1:人間Bそのひとを仮想されたVTuberそのものに同一化させていることが挙げられよう

*2:「よく知った人間Bの声」という文について、「よく知った」→「人間B」ではなく「よく知った」→「声」と修飾されるべき

/* コピー禁止 */