2011年2月17日木曜日

コンピュータがクイズチャンピオン破る

今日という日は自然言語処理業界はもとより,コンピュータの歴史の中で大変重要な日になったことでしょう.IBMのProject Watsonが,アメリカの人気クイズ番組Jeopardy!で,歴代のチャンピオンに勝利したのです.

IBMスパコン、クイズ王者2人と対決し完勝 米番組
コンピュータWatson vs クイズ王の対戦 - Jeopardy!

このプロジェクトは私が入社したころからすでに始まっていて,こういうチャレンジは本当にすごいなぁ,と思っていました.本当はこの日記も対戦日が決まったときに書こうと思って忘れていたのですが.

では,何がそんなに画期的なのか.それは,クイズに答える,もう少し汎用的に言えば質問に答える,という作業はコンピュータにとってもっとも難しいタスクのひとつなのだということです.自然言語処理のタスクのひとつで,Question Answering (QA) と呼ばれます.Googleがあるだろう,難しいことはないだろう,と思われるかもしれません.検索 (Information Retrieval; IR) はQAの一段前のタスクで,QAはもう一段難しくなります.では,何が難しいのか.それは,質問文をそのまま検索しても答えはでてこない,というところです.たとえば,「1715年9月1日ルイ14世は,自身が建てた宮殿のある,この都市で死にました」という問題.答えはベルサイユです.どうでしょう,この質問文そのものをGoogleに投げて,検索結果から機械的に「ベルサイユ」という単語を抜き出せるでしょうか.たとえば,「この都市」と書いてあるから都市名に違いない,都市名のデータベースをもっておいて参照するなどが必要です.しかし,検索結果をちらりと見ると,「パリ」などの別の都市名もたくさん見られます.この中から正しく「ベルサイユ」を当てるのはそんなに簡単なことではありません.と,書いておきますが頻度が高いのでベルサイユを選ぶのは割りと簡単でしょう:) 問題がもっと複雑で,「ベルサイユ宮殿を建てた人が死んだのはいつでしょう」なんて問題になると,問題を2段階に解かないといけません.
コンピュータは決められた演算を高速に大量に処理する道具です.一方で,こうした推論を直接行うことはできず,人間は逆にこの推論をきわめて高速に正確に行います.こうした人間の推論を機械的な手順に落とすことは現代になっても難しく,言語のような曖昧でもやもやしたものの扱いはいまだに簡単なことしかできないのです.いかにコンピュータが高性能になったとしても,どうやったら推論を演算に直せるのか.こうした部分に,このチャレンジの難しさがあるのです.
ところでGoogleなどの検索エンジンのすばらしさというのは,このもっとも難しい「推論」の部分を人間に任せて,検索を行うという「演算」の部分だけに注力しているところだと思っています.そして,人間の「推論」をサポートするようなサマリーやランキングに注力することで,直接「推論」しなくても十分有用なツールに仕上げている点もすばらしいと思います.実は私はこういう,一番伸びしろのあるところをやれ的な考え方の方が好きで,QAというタスクは無駄に難しいところに注力しているようであまり好きではありませんw

よく,この対決をすばらしいコンピュータ性能の進歩と捉える記述が目立ちます.たとえばCPUの性能や記憶容量などの記述です.それは真実なのですが,もっとも重要な点が抜け落ちているように感じます.コンピュータがすばらしい演算性能を達成してきた,という事実は何もクイズに答えなくても,さまざまなスーパーコンピュータの出現やそれによる大規模なシミュレーションなどのアプリケーションですでに示されてきた過去があります.しかし,そうしたことが可能となった現代においても,特定のクイズ形式に答えるという形に限ったとしても,人間と同等の質問応答を達成することは過去に一度もなかったのです.今の1000倍の時間がかかってもいいから同じアプリケーションが今までにできたかというと,そんなことはなかったのです.
コンピュータの行う「演算」と,人間の行う「推論」には大きなギャップがあります.よく,人間の「推論」を模倣したわけではない,コンピュータの「演算」で無理やり解いたに過ぎない,と反論する方がいらっしゃいます.しかし,手法がどうあれ人間と同等の「結果」を出すことが,少なくともクイズに関して可能になったことがはじめて確認されたのです.鳥のように羽ばたくわけではないが,飛行機が空を飛んだようなものです.それは,今までに誰も実現できないことが可能になった瞬間なのです.それを可能にしたのは,単純にエンジンの性能(コンピュータの性能)の向上のみではなく,羽やプロペラなどの画期的な発明(自然言語処理技術,検索技術,機械学習技術)の賜物だったのです(いや,飛行機あんまり知らないけど・・・).まぁ,あれです.ボクらもがんばってるんだよアピールですw


さて,最後に.チェスのときもそうですが,機械という異生物に人間が敗北したのだ,という見方をされる方をたまに見ます.しかし,こうしたものを作り上げてきたのが,技術者や研究者などのまぎれもない人間だということを忘れないで欲しいのです.この勝利は,人間の技術が人知に対して部分的に勝利した,それはまさしく人間の勝利なのです.

0 件のコメント:

コメントを投稿