2011年10月22日土曜日

社内セミナーで形態素解析について話しました

持ち回りの社内セミナーが自分の番になったので、形態素解析についてまとめてみて、発表しました。係り受け解析入門に引き続き、自然言語処理チュートリアルシリーズ第2弾になります。結構ボリュームがあって、力作になってます。


今回の狙いは3つくらいありました。
ひとつは自分自身昔の文献などを読んだことがなかったので読んでみたこと。見ると、昔は多くの論文を企業の人が書いていて驚きます。初期の文献で引用したものはほとんどが企業系研究者の方の論文です。日本語入力の文脈で研究されていたからなのかな、という気がします。
もうひとつは現在の問題点と問題意識をまとめる。書いたとおり、アプリケーションに対して最適なことをすべき、という思いがあります。それは単にアプリケーションごとに形態素解析器を作るべき、ということではないです。そもそも形態素解析というソリューションは適切ですか?という問いかけです。実際に弊社では、普通の人が形態素解析するところで形態素解析しないで処理している所も幾つかあります。
最後は、研究者とエンジニアのマッチングです。以前より研究者は企業の問題意識を共有していない、企業は最新の研究に興味がない、という悲しい状態にあると思ってました。自分自身は研究者とのコネクションもあり、またPFIとしては様々なエンジニアの方とコネクションがあるので、ここで発表したらお互いに意識や知識を共有できるかな、と思うところもありました。結果的には、反応を見るかぎり様々な業種の方に聞いていただけたのかなと思っています。

当日、視聴していただいた皆様は、どうもありがとうございました。

0 件のコメント:

コメントを投稿