好きなアルゴリズム
Rekisaでも使ってるLongest Common SequenceとかShortest Edit Sequenceとか呼ばれてる配列比較アルゴリズムが一番好きだな、と思ったら既に一番最初に回答されてた。
やっぱり、あのアルゴリズムを知ると感動するよね。
ベイズ理論
アルゴリズムとはちょっと違うけど、今のRekisaの文字コード判別に使ってるベイズ統計も感動した。
テキストファイルを学習させると、手書きで書いた文字判別コード以上の精度が出るプログラムができてしまうってのが面白い。
Rekisaの文字コード判別にベイズ統計を使ってなかった頃に、
- ユーザ:文字コードが判別がうまく動かないよ。
- 私:直したよ〜
- ユーザ:別のファイルが判別失敗するようになった!(`へ´*)プンプン!
- 私:文字コード判別は「あっちを立てるとこっちが立たず・・」みたいな処理なんだよ。
- 私:というかそれ。判別不能データじゃん!
みたいなやり取りがあったんだけど、ベイズ統計を使ってれば、ユーザ毎に文字コード判別処理も学習可能だったなぁ・・・、と後から思ったり。
とはいえ、今のRekisaも追加学習には対応せず、学習済みデータを搭載してるだけだけど。