麻生英樹先生インタビュー（その1） – 人と情報テクノロジーの共生のための人工知能の哲学2.0の構築

麻生英樹先生（産業技術総合研究所招聘研究員）は、第2次人工知能ブーム期よりニューラルネットワークを続けられています。このインタビューでは、ニューラルネットワークのパターン認識的な知能と古典的AIの記号操作的な知能をどのように統合するかという問題を中心に、お話しを伺いました。

人工知能研究と人間の脳の研究

【ーー】　　今日は麻生英樹先生にお話を伺っていきたいと思います。
【麻生】　　よろしくお願いします。
【ーー】　　よろしくお願いいたします。麻生先生は、現在は深層学習を中心とした人工知能の研究をされていると思いますが、第2次人工知能ブームの時代からニューラルネットワークの研究をされています。そういったことも含めて、これまでどういった研究をされていたかということをまずは教えていただけますでしょうか。
【麻生】　　私は、高校までは物理学に興味があって、大学で専攻を選ぶときに物理学科に行こうと思っていました。でも、ちょうど私が専攻を選ぶ頃は、理論物理の主流は素粒子論でしたが、既に南部先生のような方々のお仕事があって、新しいことをするのは難しそうだなという印象があり、たまたま工学部の計数工学科にオリエンテーションを聞きに行ったら、脳の情報処理のモデリングをやっておられる甘利先生がお話しされていて、面白そうだなと思い、そちらに進学して、修士まで神経回路モデルの数理的研究をしました。
　それが80年代の前半、1982年頃で、まだ、いわゆる第2次のニューラルネットワークブームは明確な形では現れていなくて、少数の研究者がニューラルネットの研究をしているという状態でしたので、その後、電子技術総合研究所、その頃は通商産業省の研究所だったんですけれども、そこに入所した後は、しばらくは、ニューラルネットワークの研究はせずに、「柔らかな論理」という調査研究プロジェクトで確率的推論の研究をしていました。ところが、しばらくしたら、アメリカで、コネクショニズムという名前でニューラルネットの研究が盛り上がっているということを、アメリカに留学されていた甘利研出身の先輩の方が教えてくれて、いろいろな文献を送ってくれたりしたので、また勉強を始めました。その中に、バックプロパゲーション（誤差逆伝播）学習の論文もあって、最初に読んだときは、技術的に新しい感じはしませんでしたが、その後、この分野の研究がさらに盛り上がったため、教科書的な本を書きました。それからしばらくは、ニューラルネットワークの振舞いですね、特に多変量データ解析という、線形のベクトル行列を使うデータ解析の研究分野があるのですが、それを非線形にしたものがニューラルネットワークだと解釈ができるので、その対応関係を少し研究していました。
　その後、ニューラルネットワークの研究はずいぶん盛り上がったんですけれども、やはり当時は性能に限界があって、また、ヴァプニックのサポートベクトルマシンがニューラルネットワークよりも学習が容易で高い性能を達成したこともあって、エンジニアリング的な研究は下火になったので、私も、ニューラルネットワークの研究はやめて、より広い統計的機械学習の研究に移りました。もともと脳の情報処理に興味があって研究を始めたのですが、ニューラルネットワークのアーキテクチャー自体が、ほかの機械学習のモデルに比べて優秀だという理由はあまりないと思っていたので、もっと一般的な機械学習の数理的な研究、いわゆる「統計的学習理論」の研究を少ししました。
　ベイズ的な学習なども含めて一通りいろんな機械学習手法を、その発展に沿って勉強したのですけれども、その後、通産省に1年間出向して――電総研は通産省所属だったので、研究者が霞が関に出向することがあったのです――そこでリアルワールドコンピューティングというプロジェクトの立ち上げのお手伝いをしました。ご承知のとおり、「第5世代コンピューター」というプロジェクトが80年代にあって、論理ベースのAI用のためのコンピュータとして並列推論マシンをつくったんですけれども、その後のプロジェクトとして、機械学習にもとづくパターン認識AIの研究開発が中心の内容でした。
　その後ドイツに１年間留学して帰国した後、理論的な研究はあまり向いてないという気持ちもあって、少し応用的な研究をしてみようと思って、リアルワールドコンピューティングプロジェクトの中で、自律的に学習するロボットの研究をしました。
　その頃は対話エージェントの研究が盛んになった時期で、特にマルチモーダル対話エージェント、画面にエージェントが映って何か話しかけると答える、というシステムの研究が増えていたのですが、それを実際の移動ロボットで作ってみようと思って、電総研には移動ロボットの技術や音声認識の技術をお持ちの方がいろいろおられたので、それらを組み合わせて、対話から学習するロボットを作りました。対話しながら情報を入手して学習して、自分の環境についての事情通になる、ということで「事情通ロボット」と、私ではなくて、一緒に研究していた人が名前をつけたんですけど、呼んでいました。
　その研究が、これまでやった研究の中では一番面白かったと思いますが、対話はとても難しくて、当時は音声認識の技術もまだまだ十分ではなかったですし、それほど賢いことはできなくて、オフィスを一緒に連れて歩きながら「ここはAさんのブースですよ」、などと言って地図を覚えさせたり、スケジュール表から情報を取って受付の対応をさせたり、といった案内ロボットの萌芽的な研究をしていました。
　その後、電総研が産総研になって――2001年に産総研になったんですけども、企業との共同研究も多くなって、機械学習を医療データや購買データに適用して、個人にあった医療的な措置やサービスをレコメンドするような推薦システムの研究もしていたところ、人工知能の第3次のブームが起こって、2015年に産総研で人工知能研究センターをつくることになり、その後は、副研究センター長として、研究というよりはマネジメント、自分で研究するよりは皆さんに研究していただく、という仕事になりました。
　というわけで、対話ロボットをやっていた頃が、私としては一番面白かったと思います。ただ、一貫して興味があるのは脳の情報処理がどうなっているんだろうということです。1988年にニューラルネットワークの本を書いたときに、「柔らかな記号」という言葉を使って記号処理とパターン処理の融合の可能性について書いたのですが、例えば言語と画像、視覚情報の結びつけにはずっと興味があります。ただ、なかなか難しくて、それを正面から研究することはできませんでした。最近、ディープラーニングがその辺を研究できるくらいに発展しているので、少しずつですが、また考えているところです。
　研究の最前線でも、システム2ディープラーニングといった議論がされているのですが、それと同じ方向に今は一番興味がありますし、そういう方向の研究が進展することを期待しています。
【ーー】　　ありがとうございます。関連する質問をもう少し伺っていこうと思います。さきほども最後におっしゃいましたが、もともとの関心はむしろ人間の脳のメカニズムにあるということですが、そういう意味では、これまでの研究には、人工知能研究の完全に応用的な面もあれば、人間の認知のモデルを探るというような、より理論的な面もあるということでしょうか。
【麻生】　　そうですね、最初のモチベーションは、人間の脳ってどうなっているのかを知りたい、ということでした。ちょうど私が電総研に入った頃、大型の科研費で、ニューラルネットワークの理論的あるいは工学的な研究をしている研究者と、実際の脳を生理学的に研究している研究者がジョイントして、高次の脳機能の研究をしましょうというプロジェクトが何年か続いていました。
　猿の脳を研究されている方が電総研にもいらっしゃって、そういう方たちと一緒に研究会に出て脳の研究の話も聞いていたのですけれども、やっぱりなかなか難しい。一生懸命実験しても、当然ですけども、脳の情報処理の原理についてわかることはたくさんあるわけではないという感じでした。そういう理学的な興味以外にも、面白いものをつくりたいとか、物をつくって動かしてみたいという興味もあったので、最終的には、そういう応用のほうを、仕事としては中心にやっていた感じです。仕事としてやる場合には、そっちのほうがやりやすかったということでもありますけど。（笑）
【ーー】　　ニューラルネットベースの研究をずっとされているのは、一つには人間の脳と共通性があるということもあるわけですね。
【麻生】　　そうですね。最終的には、賢いAIシステムができるだけではなくて、人間の脳の仕組みにたどり着けると一番いいと思っています。
【ーー】　　人間の脳のメカニズムに関する研究と人工知能研究との関係は、距離が縮まったり遠ざかったり、時代的にかなり変化していると思います。
【麻生】　　そうですね。おっしゃるとおりです。
【ーー】　　いままた、いろいろなところでつながりが再び見えてきているところなのかなという感じもあります。たとえば、ベイズ推論は純粋な人工知能研究でも使いますが、脳のモデルもそれなのではないかという話も最近流行っています。
【麻生】　　はい。自由エネルギー原理ですね。つかず離れずじゃなくて、ついては離れ、ついては離れというのを繰り返しているのは、やっぱりお互いに期待があるのだと思います。AIの側も脳の研究から何かヒントを得たいし、脳の研究もAI的な機械学習とかニューラルネットの研究から何かを得たいという。
　脳の研究でも、初期のパーセプトロンの学習モデルが先にあって、シナプスが時間的に変化していることが生理学的に検証されました。そういうフィードバック、やり取りがあるわけなので、お互いに期待があって一緒にやるんですけど、一緒にやっていると疲れてきて、やっぱりそれぞれやったほうがいいという感じになったりします。自然言語処理と言語学もそういう関係があるようですが。
　今はまた、近づいている感じがあると思います。逆に言うと、ディープラーニングがすごく盛り上がって、いろいろ発展がありましたが、少し踊り場のようになってきているので、次のフェーズに行くために、何か脳のほうからの知見が欲しいという思いが、明確に意識されているかされていないかは別として、あるのではないかと思います。

【ーー】　　さきほどのお話に関してもう一つ質問です。対話から学習するロボット、「事情通ロボット」の研究が面白かったというお話ですが、ロボットであること、実世界で実際に動くことやマルチモーダルであることも、昔から重視されていたのでしょうか。
【麻生】　　そうですね。「ロボットじゃないと」というようなすごく強い思い入れはないんですけれども、やっぱりマルチモーダル性は絶対重要ですし、少なくとも言語と視覚はないと、たとえば言語だけ研究するというのは、私はあまり興味がなかったです。マルチモーダリティーは重要だと思います。最終的には、身体性というところまで行くと思いますけれども、その前にもやることはたくさんあるとい思います。（笑）
【ーー】　　結果的には、事情通ロボットは、視覚も言語処理も…
【麻生】　　視覚、聴覚、言語、はい、そうですね、一応全部入っています。
【ーー】　　実際に自分も動くわけですね。
【麻生】　　はい、そうです。ヒューマノイドのように多自由度ではなく、ドラム缶型の移動ロボットでしたが。
【ーー】　　そういう意味では、結構意欲的なプロジェクトですね。
【麻生】　　そうですね。あの頃ちょうど、そういう円筒形の移動ロボットを使った研究が盛んになっていて、アメリカでそういう研究用のロボットを売っている会社が二つあったんです。一つは東海岸のリアルワールドインテリジェンスという会社で、MITの人たちがスピンアウトした会社。もう一つは西海岸のノマディックという会社で、こちらはスタンフォードの人たちがスピンアウトしてつくった会社でした。そのどちらかを使った移動ロボットの知能化の研究があちこちでやられたという、という背景もありました。
　どちらにするかを考えて、結局、西海岸のほうが安かったので、ノマディックのロボットを買ったんですけど、何年かしたら会社が潰れて――潰れてというか、ロボットをやめてしまって、メンテナンスができなくなって大変だったりしました。（笑）
　そういう時代でしたね。でも、いろいろな人の協力があって、マルチモーダルで、しかも物理的な移動もするものをつくれたのはよかったと思います。
【ーー】　　そういう意味では、例えば画像認識だったら画像認識だけ、機械翻訳だったら機械翻訳をするだけというよりは、もう少しマルチモーダルな課題のほうが面白いと。
【麻生】　　はい。一貫して興味はありますね。
【ーー】　　理論的にもより重要なことがそこから出てくるのではないかということでしょうか。
【麻生】　　そうですね。理論というか、人間の脳の情報処理の仕組みの理解につながることがあるんじゃないかと思います。
【ーー】　　そういう意味では、単純な画像認識や機械翻訳だけでは、人間あるいは生物の知能の理解に直結するとはかぎらないわけですね。
【麻生】　　いや、もちろん個別的にもあると思うんですけど、やっぱり言葉の理解にこだわりがあって、言葉を使うというのは人間の知能の大きな特色なので、そこが入っていないと、ちょっと物足りない、と言うと怒られてしまいますけど、視覚だけでもやることは山のようにあるのですが、個人的には視覚と言語の関係に至りたいですね。
【ーー】　　やはり、言語を使う人間の知能の理解につながることに関心があると。
【麻生】　　そうですね、やっぱり人間は言語や道具を使うというところで他の動物と差別化されると思うので。

その2に続く

その3へ
その4へ