Kebijaksanaan Menangani Spam Pada Blog

Dua kolumnis Tempo, [Budi Putra](http://thegadget.wordpress.com/) dan [Pujiono](http://jalansutera.com/) bersilang pendapat mengenai bagaimana cara menangani spam pada blog. Budi Putra [tidak suka dengan sistem moderasi](http://thegadget.wordpress.com/2006/04/20/sistem-moderate-pada-komentar-blog/), sedangkan Pujiono berpendapat bahwa [komentar pertama dari masing-masing pengunjung harus dimoderasi](http://jalansutera.com/2006/04/21/1000-spam).

Bagaimana dengan saya?

Inti dari sistem penanganan spam di blog ini adalah plugin [WPBayes](https://priyadi.net/archives/2005/10/07/wpbayes-naive-bayesian-comment-spam-filter-for-wordpress/) buatan saya sendiri. Plugin ini bekerja dengan algoritma [Bayesian](http://en.wikipedia.org/wiki/Bayesian_filtering), mirip dengan filter spam yang terdapat pada sebagian besar aplikasi email. Plugin ini bertugas untuk mengidentifikasi komentar yang masuk spam atau bukan berdasarkan klasifikasi komentar-komentar sebelumnya yang masuk. Plugin ini saya set untuk bekerja berdasarkan parameter-parameter:

* Komentar langsung dianggap sebagai spam jika ada 95% atau lebih kemungkinan komentar ini spam.
* Komentar dianggap sebagai bukan spam jika ada 20% kemungkinan atau lebih kecil daripada itu bahwa komentar tersebut spam.
* Masukkan ke antrian moderasi jika probabilitas spam berada di antara kedua angka itu.

Sayangnya, plugin ini hanya bekerja untuk WordPress 1.5 yang telah sedikit dimodifikasi dan saya belum punya waktu untuk memperbaharui plugin ini untuk WordPress 2.0. Dari sisi pengguna, fungsi plugin WPBayes ini sebenarnya tidak jauh berbeda dengan Akismet, hanya saja cara penggunaannya yang agak berbeda.

Selain itu, sama seperti Pujiono, saya juga menyalakan opsi ‘komentator baru dimoderasi’. Jika ada komentar yang berasal dari pengunjung yang belum pernah meninggalkan komentar sebelumnya, maka komentar tersebut akan masuk antrian moderasi.

Berdasarkan pengalaman saya, moderasi komentar pertama tidak terlalu menyebabkan masalah. Sebagian besar komentar yang melalui tahap ini adalah berasal dari pengunjung yang ‘hanya lewat’, dan bukan komentator tetap. Sedangkan komentar dari komentator langganan hanya perlu dimoderasi satu kali saja. Tanpa plugin apapun sebenarnya moderasi komentar pertama sudah cukup ampuh untuk mencegah spam.

Jika saya meloloskan seluruh komentar tanpa *filtering* sedikitpun, maka saya perlu menghapus puluhan bahkan ratusan spam setiap harinya dari antrian komentar ‘approved’. Akan sangat repot untuk memilah-milah mana komentar yang spam dan mana yang bukan. Selain itu, komentar spam akan sempat dilihat oleh pengunjung. Tentunya hal ini tidak sedap untuk dipandang.

Jika saya menggunakan sistem ‘komentator baru dimoderasi’ tanpa plugin tambahan, maka saya biasanya hanya perlu berurusan dengan antrian moderasi. Saya hanya perlu memilah-milah komentar dari pengunjung yang baru sekali meninggalkan komentar. Masalahnya: komentar spam berjumlah puluhan dan bahkan bisa mencapai ratusan dalam satu hari. Walaupun sudah merupakan peningkatan ketimbang tanpa *filtering* sama sekali, cara ini masih menyisakan pegal-pegal menghapus spam :).

WPBayes (dan Akismet) berfungsi untuk mereduksi jumlah komentar termoderasi yang yang harus saya tangani dalam satu hari. Jika dulu saya harus berurusan dengan puluhan atau ratusan spam dalam satu hari, kini mungkin paling banyak hanya ada belasan spam yang perlu saya tangani.

Saya tidak menyukai [Captcha](http://en.wikipedia.org/wiki/Captcha) karena [alasan-alasan yang pernah saya kemukakan sebelumnya](https://priyadi.net/archives/2005/01/06/why-not-captcha/):

* Menyulitkan pembuatan komentar, terutama bagi orang cacat dan orang-orang yang menggunakan perangkat seperti perambah berbasis teks atau gambar sengaja dimatikan karena sedang menggunakan koneksi yang mahal.
* Tidak dapat menghentikan spam melalui [Trackback](http://en.wikipedia.org/wiki/Trackback) dan [Pingback](http://en.wikipedia.org/wiki/Pingback).
* Tidak sulit dibobol dengan cara menggunakan kembali Captcha sebagai syarat untuk memperoleh sesuatu pada situs lain.

Saya sebenarnya juga sependapat dengan pendapat Mas Budi Putra bahwa diskusi melalui komentar di blog seharusnya berlangsung secara *real-time*. Tetapi saya masih sulit untuk mematikan fasilitas ‘komentator baru dimoderasi’ karena masih khawatir ada spam yang lolos. Dan akan jauh lebih repot memburu satu spam di antara 100 komentar daripada menangani 10 komentar spam dan 10 komentar bukan spam.

Karakteristik setiap situs blog memang berbeda-beda, tetapi apapun metoda penanggulangan sampahnya, yang terpenting adalah jangan sampai pengunjung tidak merasa nyaman karena banyaknya sampah di blog kita, tetapi jangan sampai pula pekerjaan membuang sampah mengganggu penulisan blog dan aktivitas lainnya.

83 comments

  1. contoh komentar spam:

    anda ingin sukses meraup uang 10-50 juta perbulan dari internet ?, tidak diperlukan pengalaman didunia IT, tidak perlu jago programming/networking, tidak diperlukan pendidikan tinggi, tidak diperlukan modal mahal. yang anda perlukan hanyalah yakin pada diri sendiri kalau anda bisa menipu diri sendiri dan bisa menipu orang lain. kalau saya bisa menipu 1000an orang, kenapa anda tidak bisa ?. jangan kawatir, anda akan dibimbing oleh kami dari cupu hingga expert. panduan manual e-books kami yang lengkap akan menjelaskan step by step cara menipu yang baik dan benar

    hehehe…kira-kira masuk nggak ya komentar ini ? :-“:-“:-“

  2. spammers-spammers…
    enaknya di kasih sanksi apa ya kalo ada orang yang ketangkep basah nyepam? kayak yang disini , agak gak nyambung memang (yang ini SPAM di milis-milis) pada kasus ini si spammers (dr warnet miliknya) ketangkep basah membanjiri lumayan banyak milis dg sepamnya.
    hmmm..

  3. – filter bertingkat, autentikasi bertingkat (tidak langsung hajar pake captcha)
    – auto-moderate jika mendapati grey comment
    – auto-moderate as spam untuk comment yang dianggap spam
    – ada fitur blacklist dan whitelist

    Long live Spam Karma 2!! :)>-

    *spam* :-“

  4. ||yang terpenting adalah jangan sampai pengunjung tidak merasa nyaman karena banyaknya sampah di blog kita||

    kesan tidak nyaman juga akan dialami oleh visitor yang beneran ketika komennya di moderasi. Bisa jadi habis itu dia udah gak bakalan balik lagi ke blog itu.

    kalau emank cuma komentar pertama yg dimoderasi, usul donk.. kalau ada pesan seperti itu habis seseorang ngisi komentar.

  5. #12: sejak wordpress 1.5 kan sudah begitu? kalau komentar masuk moderasi maka si komentator bisa lihat komentarnya dengan catatan “this comment is awaiting moderation”

  6. #13 : maksud saya ada keterangan kalo moderasi hanya untuk komentar pertama, om .. :)

    jadi si komentator lebih merasa nyaman karena paham seleksi komen hanya untuk masalah teknis (spam dsb) bukan karena takut berbeda pendapat …

  7. oh ya mo nanya nih om pri saya kan ngepost ini komen dr indonesiya koq munculnya dari amrik sono yah
    posted from USA
    binun……:-?

  8. Loh, Akismet itu banyak ngasih sinyal false positive loh. Itu dulu memang sebelum saya menggunakan WPBayesnya Pri. Sekarang pilihan saya jatuh pada spam karma (SK2). False positive-nya nyaris engga ada!

  9. Sampe saat ini dan semoga tetap jadi :x hatiku.. saya masih Make Akismet karena di Blog saya masih berjalan dengan GOOD GOOD aja…..

    Walaupun kadang ada Komentar yang masih masuk ke Moderasi… (bagi Komentar baru…)

    tapi SPAM adalah TANTANGAN…. :D dan BERKAH kalau boleh di bilang begitu =))

  10. Sementara ini saya tidak menginstall Akismet maupun SK2 di WP 2.0.2, masalahnya kadang spam masih saja masuk, cukup komentar pertama saja yang dimoderasi. Selanjutnya untuk menghindari spam bot, saya tidak memakai Captcha, cukup dengan satu WP plugin: Did You Pass Math? Inikah yang namanya spam?

  11. #14: hmmm seharusnya pengunjung tahu kalau filtering tidak bisa mengetahui maksud yang dikandung dari suatu komentar. jadi tidak bisa digunakan untuk mendeteksi apakah suatu komentar setuju atau tidak dengan pendapat kita.

    #25: ada hubungannya dong :). semakin tinggi kualitas blog dari wartawan, maka media itu sendiri semakin kredibel :). atau kira2 seperti itu

    #32: semua jenis turing test tidak bisa mencegah spam lewat trackback atau pingback

  12. Spam!!!,siapa takut?,spam itu adalah cobaan. kita mesti bersabar.orang sabar disayang allah.

    nyambung nggak?.ini spam nasehat

  13. Iya, gw paling sebel ama yang nama spam ini. Jangan2 publikasi email gw disini ada yang nyepam gw lagi :-w

    Yang paling bikin bete spam2 dari luar negeri. masak gw di tawarin cialis, viagra dan sebangsanya. Dia kira gw butuh itu :d

    Gw belum perlu itu dah…

  14. Saya juga pake wordpress, tapi spam otomatis menunggu moderasi dulu. padahal fasilitas moderasi komentar baru sudah sy matikan. WordPress memang keren

  15. wah… syang banget pluginnya blum support wp 2.0,kasus di salah satu situs saya juga sama dgn mas aswad.cuman blum sempet tak pasangin plugin akismet.

  16. wah, saya mah bersyukur deh kang belum ada spam (moga-moga tidak akan!) \:d/ wong malah nggak ada yang mau comment :(( wass. salam kenal.

  17. Mas Pri, dengan menggunakan algoritma Bayesian itu ‘kan si spam-filter kudu diajarin dulu. Adakah batasan proses pembelajarannya, atau bergantung tempat untuk menyimpan kata-kata yang terlarang aja? Bagaimana klo spamnya pake kata-kata “alat untuk membantu anda menjadi pria sebenarnya” sebagai ganti “obat kuat”, kan bahaya tuh! Pinter-pinternya dia main bahasa dan kata-kata?

  18. #51: ini pertanyaan umum tentang bayesian, coba baca plan for spam dari paul graham. tapi memang buat komentar blog gak bakalan seefektif email karena panjang komentar relatif jauh lebih pendek dan metadatanya sedikit.

  19. bagaimana kalau strategi ini:

    SPAM diperbolehkan, tapi yang mau spam harus daftar dulu, registrasi, dan ada biaya administrasi untuk masa hidup comment spamm-nya… :)

    nah lumayan kan, jadi bukan cuma dia doang yang dapet duit, setidaknya kita juga dapet.. he he he…

  20. Wah, spam paling bete deh kalo di lawan. Gua pake Spam-karma dulu yg ada Captcha, tp entah kenapa tiba2 udah corrupted, and trackback spam bertumpuk deh. Kadang2 satu hari bisa dapat 500 spams. Pusing hapusnya. Sekarang dah di biarkan membiak, toh tar dah upgrade wordpress baru di pikirkan lagi.

    Sebagian orang yang spamnya udah tingkat bahaya, mereka biasanya bakal mengadakan registrasi untuk memberikan comment. Jadi, yang nga register, nga bisa comment. Registrasinya jg di moderate oleh pemilik blog sendiri. Kadang2, verifikasi number bagi setiap comment, juga berguna.

    Just some view from me on spam.

  21. Kalau saya, add BadList IP via Cpanel hosting. Lumayan berfungsi, meski saya tau mereka pasti akan make IP² lainnya. Kalau ada comment teman/bagus yg kena blok, kan tinggal di Approve.
    Alhamdulillah Blog saya tidak seramai pengunjung Blognya mas Pri …. so, masih enteng nanganinnya.
    -=he509xâ„¢=-

  22. Dear mas Pri, :) :)
    Wah masih tetap aktif ngisi bloqnya.
    Sukses terus yha.
    Sekali-kali nengok blog saya yha.

    BTW, blog saya mah masih sedikit yang kasih komentar, jadi masalah spam mungkin belum terlalu ada. Jangan sampai dech.

    Salam
    Erik Tapan

  23. kebetulan masih pake SK2 pada WP. Hmm, kalo pingback sama trackback ngga terlalu memperhatikan (alias ga ngerti hehehe).

  24. Sebenarnya saya pingin baca tulisan Mang Pri (bukan om atau pak lho) diatas. Tapi sibuk sama yang lain. Ya, entar deh… May Day after April Mop he..he..

  25. ini enggak mau nyepam, cuman pengen ngetes akses asal negara saya sekarang ini ketahuan gak ?

    ps : mumpung inget, plugin komentar untuk real time preview bikin berat komputer client mbah pri. P III 500 RAM 324 kadang2 lelet banget kalo mau kirim komen.

    :)>-

  26. SPAM = sepaham… :d
    Priyadi = Pakar Blog Indonesia (dan “hanya” mengaku sebagai orang biasa yang tinggal di Depok). Salut..!

  27. Sebaiknya yg ngirim spam introspeksi, buat apa seh ngisengin orang, tul nggak? kyk gak ada kerjaan ajah!

  28. kalau blogku nggak apapa dispam :) orang komentarnya cuma 2 itu pun spam semua. :) ya itung-itung perasaan dikomentari :P nanti kalau posting lagi baru spamnya diapus :d

  29. alhamdulillah anti-spam buatan sendiri lumayan bagus (sejak terpasang ampir sebulan lalu), blom ada 1 pun spammer yg berhasil masuk, bahkan masuk moderasi pun enggak! bener-bener galak neh! :D

    hiks… sayang belom sempet dibuat sebagai plugin wp, pdhl dah aku jalanin di wp 2.0.2 :)>-

    ntar deh dibuat plugin… nunggu ada waktu *sok sibuk neh =))*

  30. Spam bot pun sekarang udah bisa nyamar. Pura2 ngasih komentar pujian, “Hello admin, nice site you have!”, “Hello there! Just want to say that I find your site enough interesting for me.”, atau “Thank you for your work. I will visit your site more ofter from now”, dll.

    Tapi kalo dilihat link websitenya kalo nggak viagra ya poker :d

  31. TErima kasih penjelasannya. Kebetulan blog saya sekarang lagi dibanjiri banyak spam tiap harinya, dari website dan orang gak jelas di ujung dunia sana.. Sebel banget, harus ngapusin banyak comment spam tiap hari

  32. hmm, kalo di blog lama ku dulu pernah ada spam masuk, kalo yg skrng lum ngalamin

    mungkin semakin besar tingkat “keterkenalan” suatu blog maka semakin besar pula kena spam, bukan begitu ? :)

  33. wah..makasih infonya Om Priyadi…
    jadi rajin datang ke sini…ternyata seluruh infonya sangat menarik…

    Tap sayang, belom ada buat blogspot yah :((

Leave a Reply to jefri Cancel reply

Your email address will not be published. Required fields are marked *