このところ、迷惑メール対策は、S25R+taRgreyでほぼ満足の行く結果を得ているが、もう少し強めのフィルタをかけたいという要望もあるようなので、今まで放ってあったbogofilterのメンテナンスをすることにした。
実のところbogofilterは比較的最初の頃のバージョンから結構お世話になってきていたのだが、それだけに途中での仕様変更についてゆけず、データベースはぼろぼろになっていた。この際データベースを作り直すことにしたのである。幸い学習させる迷惑メールだけなら何万通もあるといいたいところだが、ここではたと少し困った。最近のスパムはtaRgreyのおかげであまりやってこなくなってしまったのだった。つまり古いパターンの迷惑メールしかない。しかし、そこは目をつむることにした。
ホワイトリストの学習も少し面倒だが、とにかく手元の何万通かで構築することにした。
それから、日本語の迷惑メールはnkfで変換したりkakasiで単語を切ってあげる必要がある。これもやや面倒な作業ではある。
これで様子を見てみたのだが、多くの場合taRgrey+Spamassassinで駄目なものは、bogofilterでも駄目なようである。ただ、bogofilterはベイズ学習以外のことは考慮しないので、DKIMを付加する迷惑メールなどをはじくのには役立っている。反面フォルスネガティブもあるため、十分効果的とまではいえない。
それにしても米国では早くから迷惑メールの多くがDKIMを付加してくると指摘されていたとはいえ、その量は必ずしも少なくないのにはいささか驚く。こういう迷惑メールが増えてくると、そろそろS25RやtaRgreyだけではやっていけないという時代がくるのかもしれない。