« 一分咲き | トップページ | 空飛ぶ法王、墜つ »

POPFileその後

POPFileより

スパムメールフィルタ「POPFile」導入から2週間ほど経過したので、その後の経過を報告。

現在、英語系スパム、日本語(そのほとんどが出会い系(--;)スパム、それ以外のまともなメール、の3種類で分類中。現時点での振り分け判定精度は95%までになった。もちろんこれは導入当初でエラーが多かった頃の分も含めての数字なので、実際は99%ぐらいの確率で分類しているようだ。

ただ、ほんのごくまれなケースだが、まともなメールなのに日本語スパムとして分類されてしまうことがある。逆の場合(スパムをまともだと判断)ならまだ影響は少ないが、このエラーは致命的だ。今のところ試験期間中ということで、スパムと判定されたものでも一応タイトルまではチェックの上で削除しているが、最終的にはスパム判定分は一瞥もせずゴミ箱直行にするつもりだからだ。

というわけで、個人的にメールを送られる際は、スパムメールにありがちな表現・単語はなるべく避けて、まっとうな長めの文章を送るようにしましょう(^^;。

|

« 一分咲き | トップページ | 空飛ぶ法王、墜つ »

パソコン・インターネット」カテゴリの記事

コメント

「こんにちは」とか「メールくれました?」とか、そういうのですかね?

投稿: ピカピカ | 2005/04/04 23:06

単語ごとに点数が付けられており、それらの総合得点で判定します。

ちなみに「こんにちは」は現時点では96%の確率でまともなメールに分類されてます。逆に「出会い」だと99%の確率でスパム(^^;。

従って、単語数が少ないと誤差が大きくなり、ちょっとした単語の影響で誤判定につながるのです。

実はこれを逆手にとって、一見してまともな長い文章を中に書き込んでいるスパムメールもあるようです。

なお、「くりりん」は98%の確率でまともなメールと判断されますので、短いメールでも大丈夫かと。
#残り2%は何やねん(爆)

投稿: くりりん | 2005/04/04 23:37

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: POPFileその後:

« 一分咲き | トップページ | 空飛ぶ法王、墜つ »