AI学習の4つのレベルとは～AI配車とAI将棋の違い～

From:朴成浩

将棋界が大変なことになっていますね。

プロ棋士が対局中に次の一手をスマホの将棋プログラムでカンニングしていたのではないか？という前代未聞の疑惑。

おまけに今回、疑いをもたれているのはあの三浦九段！

3年前に現役のトッププロとして初めてコンピューター将棋に敗れる、という歴史に残る衝撃の一局を指した方です。

三浦九段は、ある意味では誰よりもコンピューター将棋の強さを味わっているわけで、今回の「事件」はまるでマンガみたいな話です。不正はなかったと信じたいです。

ところで、今回の件に関して、

「もはやスマホですらプロを超えた！」

みたいな言い方をされているのですが、これは本当でしょうか？

AIは人間に勝ったのか
AIの学習には4つのレベルがある

AIは人間に勝ったのか

何をもって「プロを超えた」とか「人間を超えた」というか、ということはありますが、個人的な見解としては、コンピューター将棋あるいは囲碁でも、まだまるで人間を超えてはいません。個人的な見解とはいいましたが、私と同じような見方をする方は情報科学系の研究者の方々には多いと思います。

確かに、ゲームとしてみれば、もはや将棋や囲碁で人間がコンピューターに勝つことは難しいでしょう。しかし、コンピューターは独力で、つまり人間の助けなしにそこまで強くなれるのか、といえばそれはNOです。

今のコンピューターの将棋や囲碁は、まず人間の膨大な棋譜を学習する、というプロセスが不可欠なのです。単にゲームのルールを教えただけでは、そこからコンピューターが勝手に強くなることはできません。

実は、この状況は結構、衝撃的です。というのは、バックギャモンのような一部のゲームでは、単にゲームのルールを教えただけの状況から、あとはコンピューターが勝手に試行錯誤して勝手にどんどん強くなる、ということが実現しているからです。

ところが、将棋や囲碁ではいまだにこういう、

ゼロベースから出発して

コンピューターが勝手に試行錯誤して

勝手にどんどん強くなる

ということは実現していないのです。それどころか、そんなことが可能なのか、まだ糸口すらつかめていない、というのが現状ではないでしょうか？

Googleのアルファ碁が囲碁のトッププロに勝利したことは記憶に新しいですが、ある意味、あの事件で本当に衝撃だったのは、Googleでさえ「人間の棋譜からの学習」というプロセスを抜きにしては強い囲碁プログラムを作れなかった、ということです。

というのは、α碁を開発したDeepMindチームが囲碁に挑戦する前にブロック崩しなどの単純なアーケードゲームで実現していたことというのがまさに、コンピューターが勝手に試行錯誤して勝手にどんどん強くなる、ということだったからです。

当然、囲碁でもそういう成果を期待したわけですが、結局、α碁が「人間の棋譜からの学習」というプロセスを採用したということは、裏を返せばGoogleをもってしても、囲碁はブロック崩しのようにはうまくいかなかった、ということを物語っているのです。

AIの学習には4つのレベルがある

コンピューターにどこまで教えてあげれば

物事をうまく処理してくれるようになるのか？

というテーマは、将棋や囲碁だけに限った話ではありません。今後、人間の勘と経験に代わってコンピューターに判断をさせることを試みる場合、あらゆる分野において重要なテーマになります。

一般に、「コンピューターにどこまで教えれば良いのか？」には次のように４つのレベルが考えられます。

レベル１：

どういう判断が良い判断なのか、大量の優れた判断実績（将棋で言う棋譜）をコンピューター用に学習例として用意してあげる必要がある。

レベル２：

どういう判断が良い判断なのか、判断の良し悪しについての適切な指標を人間が用意してあげる必要がある。

レベル３：

ゲームのルールだけは教えてあげる必要がある。後はコンピューターが試行錯誤して勝手に良い結果を出してくれる。

レベル４：

ルールすら教える必要はない。自分が置かれた現在の状況において、自分が何を求められているのかをコンピューターが勝手に学習して良い結果を出してくれる。

囲碁や将棋、画像認識はレベル１の段階ですね。これらの分野は、従来はレベル２のアプローチで取り組まれていたのですが、判断についての適切な指標を用意することが難しく、実はたった10数年前までは完全に行き詰まった状態になっていました。

これを、大量の優れた判断実績さえ用意すればそれと同じようなマネができるようにした、というのがディープラーニングの大きな成果です。今までうまくいかなかった分野に突破口を開いたわけで、そういうわけで、現在、AIが盛り上がっているわけですね。

私たちが取り組んでいる「LYNA 自動配車デスクトップ」の配車計画は、言ってみればレベル３の状況です。コンピューターに教えてあげなくてはいけないのはゲームのルール、つまり、配車において守らなければいけない条件（積載上限や時間指定などの軒先条件）だけです。後はコンピューターが勝手に試行錯誤して良い配車計画を組んでくれます。

たとえば、まず遠いところからルートを組んだ方が良い、というような、「どのようにすれば良い配車が組めるのか」という手順については一切、コンピューターに教えてあげる必要はないわけですね。ここが、旧世代のいわゆる「コンピューター配車」との大きな違いです。

私たちとしては、これをレベル４まで持って行きたいと考えています。つまり、守らなくてはいけない条件すら、コンピューターが勝手に学習するというのが理想です。

まだまだ道は遠いですが・・・。

いずれにしても、一口にAIや学習といっても、分野によって様々なアプローチと段階があるということです。「人間を超える」というのは、かくも難しいものなのです。

＋＋朴成浩

弊社の自動配車システムは、物流にかかわる事業者様に広くお使いいただけるよう、
物流現場で見られるあらゆる制約・条件に対応しております。

30日間の無料試用も承っておりますので、お気軽にお問い合わせください。