好きなアルゴリズム

question:1195950564

Rekisaでも使ってるLongest Common SequenceとかShortest Edit Sequenceとか呼ばれてる配列比較アルゴリズムが一番好きだな、と思ったら既に一番最初に回答されてた。

やっぱり、あのアルゴリズムを知ると感動するよね。

ベイズ理論

アルゴリズムとはちょっと違うけど、今のRekisaの文字コード判別に使ってるベイズ統計も感動した。

テキストファイルを学習させると、手書きで書いた文字判別コード以上の精度が出るプログラムができてしまうってのが面白い。

Rekisaの文字コード判別にベイズ統計を使ってなかった頃に、

  • ユーザ:文字コードが判別がうまく動かないよ。
  • 私:直したよ〜
  • ユーザ:別のファイルが判別失敗するようになった!(`へ´*)プンプン!
  • 私:文字コード判別は「あっちを立てるとこっちが立たず・・」みたいな処理なんだよ。
  • 私:というかそれ。判別不能データじゃん!

みたいなやり取りがあったんだけど、ベイズ統計を使ってれば、ユーザ毎に文字コード判別処理も学習可能だったなぁ・・・、と後から思ったり。

とはいえ、今のRekisaも追加学習には対応せず、学習済みデータを搭載してるだけだけど。