2010年9月18日土曜日

NLP若手の会シンポジウム

NLP若手の会シンポジウムで発表しました.前々から何度も参加はしてたんですが,発表は初めて.タイトルは緩い感じの会議ですが,発表者も参加者も30台前後のポスドクや助教,博士課程学生が中心で,議論も活発,新規な内容が多い.特に自分の同世代,近い世代の人たちがこんなに活躍しているというのを見れて,とてもよい刺激になります.そういうのは,会議の前に書けって? すいません.

私の発表の内容なんですが,一言で言うとKWIC (KeyWord In Context)をかっちょよくしました,という内容です(片側しか見てないからKWICじゃ無いじゃん,と突っ込まれました.実は事前に坪井さんにも突っ込まれてました).KWICは検索結果を俯瞰するのに便利なんですが,ヒット数が多いと全体を見られなくなります.なので,うまい単位でまとめたい.これを探索問題として定式化してあげると,動的計画法に落とし込めます.さらに,最大値を求めるということは,一番最大っぽいところを探索したら,残りはそれを超えないことを確認すればOKという感じで,スコアの上限を求める関数で枝刈りをします.最後に,あらかじめ接尾辞木を頻度順に並べておくことで,TRIEの構築もサボれます.もともと,入力支援に使おうと思っていて,発表の1週間前に狙ったようにGoogle Scribeがでて困りました.デモ画面そっくり.
枝刈りのアイデアは,オセロのαβ枝刈りからインスパイアされました.αβ枝刈りは,最大値を求めるときに,超えなければいけない上限を渡して探索する方法です.学部時代にオセロプログラム大会をやったことがあって,move orderingとか色々知識を持っていました.どこでどういう知識が役にたつかなんてわからない,知れる機会があれば何でも知るべき,ということを少し体現できたかなと思います.

他の発表ですが,奨励賞の松林さんは同じセッションで聞けなかったのが残念.高村さんの語彙をつくる話は,「言語とは何ぞや」という問題に対して新しいアプローチで迫っていて面白かったです.私ももっと夢のある話をした方がよかったかなぁ.それから,内田さんがオノマトペと動詞の対応みたいな話をしてました.一応,私も言語処理学会でオノマトペネタを(共著で)発表したので気になります.当時色々アイデアを出して,ほとんどやってなかったので少しやろうかな.


いくつか聞いてて,やっぱり自分は応用よりだ,と思いました.工藤さんの講演での回帰テストの話とか,それに対する岡野原さんの質問とか,T2ミーティングでの橋本さんの話とかがやっぱり自分にはピンとくるところがあって,企業系の人(あるいはアプリ屋さん)がもってる問題意識とアカデミックの問題意識でギャップが進んでいるように思いました.もっとも,そこはちゃんと住み分けが進んでていいとも思っています.むしろ,アカデミックには短期の実用より,長期的に見て必要な基礎研究を進めて欲しい.ただ実用まで持っていくにはこれだけ必要なステップがあるよ,そしてどこも手を抜けないよ,ということが一歩引いたところから俯瞰して共有できればいいなと思います.

0 件のコメント:

コメントを投稿