7 October 2004

Database Spam Indonesia?

Posted under: at 02:40

Rekan Jay melakukan posting beberapa spam berbahasa Indonesia yang ia terima ke mania.or.id. Saya jadi punya ide untuk mengumpulkan spam berbahasa Indonesia ke dalam satu tempat. Database ini dapat berguna untuk usaha-usaha menangkal spam misalnya untuk membuat corpus awal untuk keperluan Bayesian filtering. Atau untuk melakukan test run SpamAssassin terhadap spam-spam berbahasa Indonesia. Sehingga nantinya akan dapat dibuat filter yang dapat secara efektif menangkal spam-spam dari dalam negeri.

Hal ini sebelumnya sudah dilakukan oleh SpamArchive. Proyek SpamAssassin pun memiliki database spam untuk keperluan pengawasan kualitas sebelum melakukan rilis.

8 Responses

Trackback: Use this URI to trackback this entry. Use your web browser's function to copy it to your blog posting.

Comment RSS: You can track conversation in this page by using this page's Comments RSS (XML)

Gravatar: You can have a picture next to each of your comments by getting a Gravatar.

Leave a Comment

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Warning: Comments carrying links to questionable sites will be removed!