シリーズ白眉対談14「実験と理論とシミュレーション」(2018)
ディープランニング
(下野)応用側の立場からすれば予測ができればいい。株式でも高精度に予測できれば、それだけで目的を果たしているっていうような話になるので、その間を求めなくてもいいって。ただ、サイエンスとして現象や対象を強く意識している立場からすると、そこに逆に物足りなさを感じるっていうそのジレンマは、われわれの世代が、ある意味で初めて味わっているかもしれないですね。私、囲碁がすごく好きで、囲碁の世界のトップのプロが人工知能に負けてしまいましたけど、あれも本当に衝撃的でした。あんな複雑なことを脳はしている、だから脳はすごいっていうことを思っていて、脳を研究の対象としてきたっていうところがありますが、ある意味それとは全く違うかたちで、勝つか負けるかっていうほうに関しては、ブラックボックスが目的を達成してしまったっていう。じゃあ、それにどう向き合って生きていくのかっていうのは、非常に根本的なところで悩むことで、それは現象が何であってもそうなんではないかなというのは思うんですけど、どうなんですかね、皆さん。
(中島)物理はとりあえず数式に落として頑張るところから始まる気がするのですが、今その話でいくと、もう結局何か具体的な数式として書き下すということはできてなくて、インプットとアウトプットしかないってことなんですよね?どういう式で書けているかわからないけど、複雑なことがブラックボックスの中で起きていて、関数はあるらしいけど、その関数の具体的な形が我々にはわからないと。でも、その関数はうまいこと構築されている、という理解でいいのでしょうか?
(下野)いや、先ほど多体系っていう話がありましたけど、多要素っていうのがある種の前提なんで、いっぱいデータを入れると。その結果として、答えをシンプルに、イエスとノーであったりとか、そういったかたちで出力してくる訳ですが。データの入力と出力の間をどういうふうにつなぐのか、このつなぎ方を、抽象化した多レイヤーの中での足す、引くという重みづけの計算の中で表現をすると。でも、その計算をどうするかっていう、どういうふうに情報圧縮していくかっていうのに関しては、つまるところは最適化で、答えからラーニングして、つなぎ方の形を作って、それが未知のデータに対してもちゃんと予測できるっていう理屈ですね。
(高棹)じゃあ基本的には、とにかくいっぱいデータを食わせるって感じですかね?
(下野)そうですね。ディープラーニングで驚かれている話の一つとしては、聞かれたことがあるかもしれないですが、データをいっぱい入れると、データそのものが持ってるノイズっていうのがありますから、それによって結局精度っていうのは頭打ちになるっていうのが、ある種の常識だったんですけれど、それを、なぜかデータをどんどん入れていっても、うまくいくと、エラーを回避して精度が頭打ちせずに上がっていってしまうっていう現象が見えて、それもある種の現象的ブレイクスルーって言われてますね。
(高棹)それは面白いですね。ある意味、生データ食わせるっていうのは良いことだと思うんです。なぜかっていうと、僕らの主観で、「これはノイズだ」と思って消したのが実はノイズじゃなかったかもしれないし、ディープラーニングによってどこがノイズかを彼らが正確に判断して、それでさらに精度が上がったのかもしれない。
(中島)ちょっとその図に戻るんですけど、普通は物理現象があって、いろいろ実験した結果、こういう法則があるって人間が考えるわけですよね。今の場合だと、現象に対応するのは生データだと思って、生データがいっぱい入ってきて、何か関数っていうか法則みたいなものをディープラーニングが見いだすってことでいいんですか?ただし、どういうかたちで見いだしたかは僕らにはわからないと、そういうことですか?
(下野)その理解で正しいと思います。私はディープラーニングの様な方向を掘り下げる専門家ではなくて、どちらかというと、我々の理解できる法則っていうものの表現をできる研究の姿っていうのを求めています。現象って多面的なんですよね。ある一側面だけを見ると、モデリング、最適化っていうニューラルネットワークの問題で設定できるんですけど、実際の脳の中では細胞の種類がまた多様に内在的に存在してますし、またそれが組み合わさっての全体がいきなり作られてるわけでなくて、ある種のレイヤーの構造ができたり、レイヤーの間でのスペシフィックなつながり方とかっていうのがあったり、さらに、活動の仕方でどういうタイプのものが、どういうスペシフィックなつながり方をしているのかって、そういったビルドアップの中で全体の機能を発現してると考えると、今ある知識から答えにいきなり向かってパフォーマンスを最適化されたとしても、そのモデルに対して次に得られた実験事実を、さらにどう組み込んだらよいかに、常に困るだろうと思うんです。でも、ちゃんとここは細胞が個々にあって、こういう配置になって、あるつながり方は未知で、ある種のランダムさは仮定していたけど、いずれわかってくれば具体化してゆける、っていう形で表現できていれば、データが積み上がっていく。またデータが出てくれば、分からないところを埋めればいいという形なら、ちゃんと積み上がっていくので、建設的に知識が現実に近づけていけるというストラテジーを、われわれは考えられている。ある側面だけを見て最適化すると、一瞬ぼんってある方向性では話が進むんですけど、それをじゃあ次のステップ、次のステップっていうのを多面的な情報を積み上げるときには、どうしていくんだろうっていうところが個人的に悩むところです。 一方で、最適化っていうのは、それとは別に予測性能が上がればいいっていう現象に対して使う。そういうのでいい問題ってあるんですね。例えば、モデルの素材をたくさん用意して、適切に入力して、現実に非常にうまく予測するそれらの組み合わせ方として得ようという様な問題。そういう問題には、ブラックボックス的なアルゴリズムっていうのも結構使っていこうとしてるというところはありますね。
(川中)いや~、面白いって。私、人工知能とはちょっと離れるんですけども、要するに、基本原理はよくわかんないけど、予測ができればいいってする立場って、宇宙物理でも実はあるんですね。超新星爆発は星が一生を終えるときに起こるんですが、タイプが二つあって、一つは Ia 型超新星爆発っていうのと、もう一つは重力崩壊型超新星爆発。で、Ia型超新星爆発っていうのは、白色矮星と呼ばれる太陽ぐらいの星が一生を終えたあとに作る高密度天体があるんですけども、大きさが地球ぐらいで温度は1万°Cぐらいっていう。何らかの機構で、こいつの質量が外からガスが降り積もることによって増えると、核暴走反応が起こって爆発するっていう現象なんですね。で、この Ia 型超新星爆発って、もう宇宙のあちこちで結構見つかってるんですけども、これの特徴として、明るさが大体どの Ia 型超新星爆発も同じだっていうのがあるんですね。明るさがどんな Ia 型超新星爆発も同じだということは、それを見ると、そこまでの距離が推定できるってことなんですね。見かけの明るさがこれぐらい。でも、実際の明るさはこれぐらいのはずだから、この Ia 型超新星爆発は、これぐらい離れてるはずだっていうのが。そうすると、ある銀河の中で Ia 型超新星爆発が起これば、その銀河までの距離が推定できると。で、いろんな銀河までの距離を推定することで、実は宇宙がどのように膨張してるかっていうことがわかるわけなんですね。それを大規模にしていくことによって宇宙の膨張の歴史っていうのがわかって、実は最近の宇宙は膨張速度が加速してるっていうことが前世紀にわかったんですね。これはノーベル物理学賞を受賞するぐらい大きな発見なんです。それまで宇宙膨張っていうのは、どちらかというと減速してるんじゃないかと思ってた人が多いんですけど、むしろ膨張は加速しているということがある。問題は、Ia型超新星爆発がいかにして実現するかっていうことは、実はまだわかってないんです。だから、それで言うと、本来ならば Ia 型超新星爆発っていう現象がありますと。で、それの法則を一旦見いだして、爆発の様子っていうのを、①,②,③の矢印をたどって現象に適用するっていう、これが完成して初めてそれを道具として使うっていうことがなされれば一番理想なのかもしれないですけども、すっ飛んでるわけですね、ここは。どういう法則が絡み合って爆発するかっていうのが完全にわかってない。
(中島)じゃあ、シミュレーション上では爆発してくれないとか、そういうことですか。
(川中)シミュレーションで爆発してくれないんです(笑)。だから、爆発させるようなシミュレーションっていうのは、どこか本当にわかってないようなところをつけ足したりしてるわけですよね。観測を完全に再現するっていうことはできてないけど、何か予測はできるっていう話ですよね。だから、宇宙がどのように膨張してるかっていうことは実際わかったわけなんです。これはこうらしいぞっていうことで、宇宙の進化だったり宇宙の現象っていうのを予測する能力のある理論っていうのは、それはそれで重要視されると。一方で、宇宙の現象から何か法則を見いだすっていうことも大事で、私はこっちはすごい大事だなと思って、割とこっちは力を入れてるとこではあるんですけども、決して相反するものじゃ全然なくって、協力していかなくちゃいけない話ではありますよね。
(下野)そうですね。

コンピュータ
(中島)僕の研究は、現象aと現象bが同じ方程式、同じモデルで書けるというところからスタートするので、ディープラーニングで法則のアウトプットだけわかったとしてもそのままでは使えなくて。だから、それを逆に使える方法があれば面白いかなと。どうだろう、例えば現象aで実験から得られるデータというのは決まっているんですよ。材料だったら材料の温度は絶対零度にはできないとか、得られるデータやパラメータの範囲が決まっている。現象bについても同じで、それぞれについて実験でデータ取得が得意な範囲は決まっている。だから(方程式の具体的な形は分からないけど)現象bも同じ方程式で書けると思って、現時点では現象aでは到達できないパラメータ領域のデータを現象bで取って、それをディープラーニングにデータとして入力してやって、もっと広い範囲を理解するとか。でも、それはaとbが同じ物理で書けるというところが、また別のことでわかってないといけないのですが。うまく使えれば、それはいいんですけど。
(川中)大体同じ数式で書けるっていうのが仮定になってるわけですけども、でも多分書けると思って、だから進める立場もある一方で、本当に全く同じく書けるのかっていうのを追求する立場っていうのはあるわけですね。それってディープラーニングでできるってことなんですか?
(下野)そもそも対象がやっているのと同じ様な数式として書けるということに、そんなに興味を持っていないというか。だから、完全にもう対象がわからなくても、ブラックボックスで、最終的には答えをちゃんと当てられればよいと。そもそも現象っていうのは、ある意味二つに分かれてまして、インプットの現象と、答えを検証するアウトプットの現象がありますね。インプットの現象をデータとして入れたときに結果的に出てくる答えは、ちゃんとアウトプット側で用意されてる現象のデータに合致してればいいっていう、そういう発想なので、一義的には、ここの間を結ぶ表現が人間の理解しやすいようなかたちになってるかどうかというのは問うていない。
(川中)だから、やっぱりそこは人間がやるとこなんですか。人間がアクセスできるような法則を見つけないと、人間にとっては理解したと言えないっていうような気がするんですけどね。
(下野)その理解したいという気持ちとの葛藤ですよね。囲碁の例でも、世界のトップ棋士が負けてしまったわけですね。そうすると、勝つという目的に関しては、どんな人間もできないわけですよね。そんな対象をわれわれが理解できるのか? それにも関連した話題ですごく昔に悩んだことがあって、それがある意味、今の研究のアプローチにもつながってるんです。どう悩んでいたかと言いますと、ある脳を対象とするときには、その脳と同質の複雑性を持ったものしか個々の自分は持っていないわけですよね。その同質の複雑性しか持ってないのに、研究対象としての脳の現象を完全に理解できるかっていうと、そもそも論理矛盾してるんですね。じゃあ、そのためにはどうすればいいかっていうと、1人では難しくて、みんなでその部分の知識を持ち寄って、それをうまく組み上げることによって、何とかその完全な理解、よりいい理解に近寄っていけるっていうアプローチができるんではないかっていうのを昔思っていて、今は、まさにインフォマティクスっていう言葉が存在していて、ある意味、そういうアプローチで研究は進んでいっているんですね。
(高棹)理解したいってなってくると、数学だと割と方程式をシンプルにしちゃうんですよね。例えば化学の反応に関する式が数十本、数百本とかあったとして、「本質的なのはこれだ!」みたいのを選んで、実は3本の連立式で大体の雰囲気はわかるみたいな。もちろん誤差はどっと出てくるんだろうけど、「これが大事だ」っていうのを選ぶっていうのが、それがある意味で理解するというものの一つなのかなって。
(川中)物理もそういうとこはありますね。だから、本当にいろんなすべての効果を考えようと思ったら、方程式もむちゃくちゃ長くなったり、何本も持ってきたり連立させなくちゃいけなかったりするんだけど、「要はこれとこれでしょ?」みたいなのをピックアップするっていうところに物理のセンスっていうのが出てくるわけですよね。物理のセンスっていうか人間のセンスですよね。だから、そこを人工知能とかはできんのかなというのは(笑)、ずっと前から思って、実は本質を見抜くっていうのも、本質っていうのは人間の感情が決めるもんであって…。
(下野)それを囲碁ではやってるんですよ。今、最強とされるソフトウェアは、本当にすごく良い手を打つんですよ。これまでの棋譜という表現型では、人のセンス的なものが、もう囲碁では感じられてきている。
(川中)確かに、それも不思議なんですよね。だから、そのセンスって誰が与えたんだとか、どうやって育ったものなんだって。私、将棋好きなんですけど、将棋ももうプロ棋士はソフトに勝てないんですよね。だから、いい手ってどうやって…?
(下野)目的がはっきりしてるんです。勝つか負けるかなんですよ。だから、勝ちやすいほうのルートを選んでいく。目的自体は単純ですが、勝ちやすい方向に常に手を選んでいくっていうときに、その途中の部分で出てくる手というのは、パッとみた瞬間、人の目には、それまでの文脈上は非常に不可思議であるものがあって、その後、20手とか経つと活きてくる。それは、ある種のセンスだって感じるわけなんです。
(中島)じゃあ例えば、人間が物理的なセンスで「これが本質だろう」と思って見いだすということとディープラーニングがやってることって同じなんですか?物理現象というモデルとして。
(下野)同じ側面もあるとは思います。例えば京大だと将棋の羽生さんと山中伸弥先生が対談されたりとか、いろんなものが出ていると思うんですが、違いがあるところとして一つ挙げるとすれば多面的である部分。将棋とか囲碁って、勝つとか負けるかっていうところで、ある意味で目的がはっきりしてる。でも、サイエンスとか文化的活動にとっての勝つ負ける、っていったい何なのかとか、っていうのを表現し始めたときに、いろんな多面性があるわけですよね。どういう軸で自分のアイデンティティが表現されていくのかっていうのは、人間社会やサイエンスでは非常に多面的なんですよね。
(中島)じゃあ、人間の、例えば感情とか意識みたいなものは、もう多面的すぎて、とりあえずシミュレーションはまだしばらく無理ってことですか。せっかくなので聞かせてください。
(下野)いや、残念ながら、私はそれにお答えをしきれないです。それは研究者によってまちまちで、ある意味で研究者の信条の部分もかかわりますよね。そこが大事な問題であるだけに、そこに直進的にいきたいという人もあれば、大事であるからこそ、むしろここを積み上げに時間が長くかかっても、長期的な視点でそこに到達するのがよしという人もいれば、そもそもそこからずれたところに見ている人もいれば、人それぞれですね。
(川中)思うのは、現象を予測するやり方なり、人間が納得する法則を見つけるとかいう方針なりは決して相対するものではなくて、ちゃんと両輪でやんないと本当にこの世界を理解することはできないなっていうのは、これ常々思ってることなんですね。だから、よくシミュレーションという手法に対する批判だったり、でも、実験ではこんなことわかんないじゃないかって言い合ってる人っていうのは見かけるんだけども、私のいる業界からすると全然おかしくって、その実験、理論、シミュレーション三位一体で現象に向かってアプローチしないと、わかんないじゃないっていうのは常々思ってることなんですね。
(下野)だから集合知みたいなものが建設的に組み上がっていくような研究を含む社会の姿みたいなのが、シミュレーションなり、“ 次のかたちの理解 ” っていうものの姿なりをどれぐらい花開かせるのか、っていうのを左右するような気がしています。
(高棹)そういう意味では、僕も他の分野の人と、どんどん関わりを持たなきゃなって思いますが、幸いなことに僕らには白眉センターって場所があるわけですね。
(川中)割と自分のやってることを客観的に見れるようになったっていうのは、白眉入って思ったことですね。このサイクルに限らないですけど、いろんな研究という、こういう図式ですね。その中のどこを担ってるのかっていうのを、改めて認識した気はしますね、白眉入ってから。
(高棹)じゃあ、今日はこのへんで。ありがとうございました。