山本先生の研究室にはドラムやギター、キーボードなどが備わっている。学生たちが研究中でも、知らない人が見たらロックバンドの練習風景にしか見えないだろう。山本先生は情報工学科の所属だ。音楽とどんな関係があるのだろうか?
——音楽そのものが研究対象なのですか?
「もともと私はコミュニケーションに興味があって、人のコミュニケーションとかを解析していたのですが、なかなかこういった人同士の会話は、何を言い出すのか分からないので実験対象としてやるとなると難しいのです。
言葉を変えますと、人の会話は解析的に解けない、科学的に再現性を十分追求できないのです。そこでコミュニケーションの一形態として音楽の共同演奏に着目したのです。東工大の大学院の時にそのテーマで学位をとったのです。」
——もう少し詳しく説明していただけますか?
「音楽の共同演奏だと、同じ演奏を何回やっても別に変じゃないでしょう。例えばジャズのセッションとか同じ曲目で5回演奏しても別におかしくありませんよね。
でも人間がしゃべっている時に同じことを5回も繰り返していたら気持ち悪いじゃないですか? 普段の人の対話の中ではむしろ変わっていくことが当たり前で、変わることが対話の本質なのです。
その点、音楽だと再現性を確保できます。さらにプラスして音楽は言語を使いませんが、音のリズムとかメロディを使ってリアルタイムの反応があります。それも一つのコミュニケーション形態と見なせるだろうと。いわば原始的なコミュニケーション形態として音楽の演奏をとらえて、ずっとそれを解析しているのです」
昔、音楽理論を学んでいた友人から狩猟民族の音楽は遠くの仲間と獲物を追い込むためのコミュニケーションが起源で、日本人のような農耕民族の音楽は田植え歌のように皆でリズムを合わせるための手段が始まりと聞いたことを思い出した。
——それは狩猟民族がつかう太鼓のような音楽ですか?
「そういうノリですね。その意味では情報工学の研究ではないようにみえるのですが。論文を書くときは音楽の共同演奏のデータをとって、例えば演奏が盛り上がっている時には、どのようにリズムが変化しているか、音が合っているか、演奏がどれくらい揺らいでいるかを科学的に調べて、それをまとめるということになります」
——先生自身も演奏するのですか?
「私自身は演奏はやらなくて歌うだけボーカル専門です(笑)。KITには音楽を専門としていらっしゃる先生がいますし、趣味の演奏が玄人はだしという先生もいらっしゃいます。私は音楽をコミュ二ケーションという観点から解析しているという点で、他の先生とは違う感じです。でも最近は対話とかも解析し始めたりしています」
言葉にならない動作や間が重要
——それはどんな“対話”ですか?
「最初に話したように、いきなり自由に対話させると何をしゃべるか分からないので、ある程度対話の内容を固定して繰り返します。本当に簡単な内容です。
目の前に積み木を10個置いて、“積み木を取ってください”と言ったら、相手が“はい”と言って取るだけなのです。その時の発話のリズムとうなずいてから取るときのリズム。あと発話してから“はい”と言うまでの時間を全部調べます。
そうすると、例えば早口で言われた時には素早く答えてすぐ取るし、ゆっくり、“つーみーきをー”と言われると“アー、ハーイー”とゆっくり取るのです。人間の対話にはこうした仕組みがあるのです」
——確かに電話でコンピュータによる案内がでてくると会話のリズムが合わなくてイライラすることがあります。
「三菱重工がワカマルという黄色いロボットを作っています。これは人と暮らす家庭用ロボットという、今までにないコンセプトのものです。例えば、“お茶持ってきて”と頼まれて、いかにもロボットらしく“はい、分かりました”というのではちょっとまずいだろうということで、ここの実験で得たデータを使うことになっているのです。
今のロボットの対話は本当に遅いのです。使っていてイライラする、間の悪いロボットよりも、“間の良い”ロボット、“間に合う”ロボットを目指しています」
——通常の制御工学、機械工学からのアプローチのロボット研究とは違いますね。
「私の東工大での恩師は三宅美博先生で、KITでも7年間、教鞭を取られていたこともあり、そのご縁で私が現在ここにきているのです。三宅先生は黄色いアメーバ状の菌である粘菌の研究をされています。KIT時代も情報工学科で粘菌の研究をしていたので、あの研究室はなんだろうと不思議がられたそうです。
その三宅先生は、生命科学者でありながら“場”の研究でも有名な清水博先生の弟子でして、私は清水先生の孫弟子というわけです」
——なるほど、“場”とか“間”とか何か繋がるものがありそうです。最初に戻りますが、先生はなぜコミュニケーションに興味を持たれたのですか?
「人は何で人の言っていることが分かるのだというのが僕の疑問なのです。逆に言うと何で機械は人がしゃべることが分からないのかというのが根本的な問題意識としてあります。さらに、対話をしている時に、単純に文章とか言葉で表される明在的な情報、シンボル化できる情報とは他に、例えば声の高さとか話している時の動作など言葉にできない非言語情報というものが人のコミュニケーションでは重要な役割を果たしているのではないかと考えるようになりました。
言葉とそれ以外の非言語情報がうまいこと重なり合ってコミュニケーションが行われているのではと、大学院時代からその両方を解析してきたのです。この二つが分かると始めて人の代わりをやってくれるロボットが実現できると思います。
80年代には人工知能という分野で人間の代わりをやろうとしたのですけど、ことごとく失敗したのです。今、世界のあちこちで本来、人がやっている非言語のコミュニケーションの研究が行われているところです」
山本先生はこの他、複数のスピーカーを使って3次元の音響空間を実現するという具体的なシステム作りにも挑戦している。これも言葉でなく人の心に直に訴えるというコミュニケーションなのだという。失礼ながら、若いのに細かい技術改良ではなく大局的な技術観をもって研究に取り組んでいらっしゃるのが印象的だった。