Database Spam Indonesia?

Rekan [Jay](http://yulian.firdaus.or.id) melakukan posting beberapa *spam* berbahasa Indonesia yang ia terima ke [mania.or.id](http://www.mania.or.id). Saya jadi punya ide untuk mengumpulkan spam berbahasa Indonesia ke dalam satu tempat. Database ini dapat berguna untuk usaha-usaha menangkal spam misalnya untuk membuat *corpus* awal untuk keperluan [Bayesian filtering](http://en.wikipedia.org/wiki/Bayesian_filtering). Atau untuk melakukan *test run* [SpamAssassin](http://www.spamassassin.org) terhadap spam-spam berbahasa Indonesia. Sehingga nantinya akan dapat dibuat filter yang dapat secara efektif menangkal spam-spam dari dalam negeri.

Hal ini sebelumnya sudah dilakukan oleh [SpamArchive](http://www.spamarchive.org/). Proyek SpamAssassin pun memiliki database spam untuk keperluan pengawasan kualitas sebelum melakukan rilis.

8 comments

  1. Wah, ini ide bagus… beberapa minggu terakhir ini saya juga tiba2 kebanjiran spam Indonesia :(

    Kalau saya boleh usul, bagaimana kalau kita mulai mengkampanyekan penggunaan Razor:
    http://razor.sourceforge.net/

    Kelebihan Razor adalah begitu satu penggunanya dapat spam dan melapor, maka semua mailserver yang menggunakan Razor langsung dapat menolak spam tsb – sebelum spam tsb masuk ke mailbox user.

    Yuk ramai2 pakai Razor…. sebelum spam Indonesia menjadi masalah besar ?

    Kuncinya mungkin adalah mempermudah orang untuk men-submit spam – kalau saya boleh usul, kita buat satu email account, untuk kita forward spam-spam yang kita dapatkan kesitu:
    http://razor.sourceforge.net/docs/doc.php?type=pod&name=razor-report

    Saya bisa sih install semua ini di server saya, tapi lebih baik lagi kalau ini di-setup di server yang berlokasi di Indonesia.

    Bagaimana .. ?

  2. sy butuh database spam bahasa indonesia untuk penelitian thesis saya. dimana sy bisa mendapatkan datanya untuk sy downlaod? trims

Leave a Reply to amal Cancel reply

Your email address will not be published. Required fields are marked *