MeCabのソースを読んでみる。

C++とかCの勉強は中途半端にやってはやめを繰り返していた。
やっぱり仕事でがしがし使わないのでなかなかモチベーションを維持できないのが大きい。

でも幅を広げたいのでちょっと頑張ってみることにした。会社で技術発表が2ヶ月おきくらいに
回ってくるのでそれに間に合うように形態素解析の薀蓄をコードを読んで、C++がある程度
書けるようになってプレゼンできればなと思う。

いきなりコードを読むのではなく下調べとして自然言語処理というジャンルにおける形態素解析
位置づけみたいなのをざっくりとまとめた。それが以下。


形態素解析は4つの解析ステップの内の一つということになる。「自然言語処理の基礎」(コロナ社)を読んだ限りでは、
形態素解析の役割は大きくわけて3つでマインドマップに書いた通り、「単語分割」・「品詞付与」・「原型の復元」となる。
MeCabのソースを見るとクラス名も役割に応じた名前になっていたりするのでなんとなくイメージしやすい印象があった。
アルゴリズムとかも鼻血が出るほど難しいというわけでもなさそうなので、なんとかなるかな。

2ヶ月かけてC++のお勉強とともにやっていきます。毎日1.5時間を当てられたらスゴイなー。
頑張れ自分。