Spam telah menjadi musuh bersama di Internet mulai dari e-mail, IRC, IM, forum, wiki, hingga blog. Untuk mendukung aktivitas ilegalnya, para spammer menciptakan mesin-mesin pengirim spam bernama spambot yang bekerja 24 jam sehari, mengirimkan pesan-pesan sampah di semua layanan Internet. Salah satu upaya meminimalisasi penyebaran spam di WWW diciptakanlah CAPTCHA, sebuah metode untuk membedakan manusia dan spambot.
Di akhir pendaftaran account email baru, terletak persis di atas tombol submit,kini jamak terdapat tes sederhana, yakni memasukkan rangkaian huruf, angka, atau kombinasi keduanya, yang tertera pada sebuah image. Bagi manusia, tes semacam ini mungkin sangat mudah, tetapi tidak bagi computer (baca:spambot).
Metode pengujian yang meminta pengguna mengetikkan objek yang ada pada image inilah yang disebut dengan CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart), sebuah tipe HIP (Human Interaction Proof) yang paling banyak digunakan WWW saat ini.
Sebagian besar CAPTCHA menggunakan image berisi rangkaian huruf dan angka yang dicetak tak beraturan (terdistorsi sehingga tidak dapat dikenali oleh spambot yang dilengkapi dengan teknologi OCR (Optical Character Recognizer) sekalipun. Jika teks yang diketik sesuai dengan objek yang tertera pada image, maka Anda manusia!
CAPTCHA dan Turing Test
Meski berbalik arah, ide dasar CAPTCHA sejalan dengan Turing Test. Alan Turing, ilmuwan computer berkebangsaan Inggris, pada 1950 pernah mengajukan pengujian, apakah computer bias berpikir seperti manusia. Pada Turing Test, seorang penguji yang terisolasi mengajukan pertanyaan kepada dua panelis: manusia dan computer.
Dari jawaban kedua panelis, si penguji harus menentukan dengan pasti mana jawaban yang diberikan manusia, dan mana yang di-generate oleh computer. Bila si penguji tidak bias membedakan “dengan pasti” mana manusia dan mana computer, maka computer dinyatakan lulus ujian.
Dalam CAPTCHA, yang terjadi adalah kebalikannya. Yang bertindak sebagai penguji adalah computer, sementara objek yang diuji tetap manusia dan computer. Bila penguji “bisa" membedakan dengan pasti mana manusia dan mana computer, maka manusia dinyatakan lulus ujian.
Pareidolia dan CAPTCHA
Meski tidak semuanya, sebagian besar CAPTCHA menggunakan tes visual. Komputer kesulitan memproses data visual, sementara tidak dengan manusia. Manusia dapat melihat gambar dan menemukan sebuah pola di dalamnya secara lebih cepat dan lebih mudah dibandingkan dengan computer.
Pikiran manusia tidak jarang menangkap sebuah pola atau bentuk kendati hal tersebut tidak ada. Misalnya, kita sering “melihat” bentuk wajah atau hewan pada gumpalan awan atau permukaan bulan (ingat acara TV yang sering mereka-reka bentuk dan wajah “setan” dari bayangan di dinding gua).
Otak manusia akan mengasosiasikan informasi acak yang tertangkap oleh mata tersebut menjadi sebuah pola atau bentuk. Dalam psikologi, fenomena ini dikenal dengan istilah pareidolia. Meski demikian, tidak semua CAPTCHA mengendalikan tes visual ini. Beberapa tipe CAPTCHA menggunakan suara atau audio.
Di akhir pendaftaran account email baru, terletak persis di atas tombol submit,kini jamak terdapat tes sederhana, yakni memasukkan rangkaian huruf, angka, atau kombinasi keduanya, yang tertera pada sebuah image. Bagi manusia, tes semacam ini mungkin sangat mudah, tetapi tidak bagi computer (baca:spambot).
Metode pengujian yang meminta pengguna mengetikkan objek yang ada pada image inilah yang disebut dengan CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart), sebuah tipe HIP (Human Interaction Proof) yang paling banyak digunakan WWW saat ini.
Sebagian besar CAPTCHA menggunakan image berisi rangkaian huruf dan angka yang dicetak tak beraturan (terdistorsi sehingga tidak dapat dikenali oleh spambot yang dilengkapi dengan teknologi OCR (Optical Character Recognizer) sekalipun. Jika teks yang diketik sesuai dengan objek yang tertera pada image, maka Anda manusia!
CAPTCHA dan Turing Test
Meski berbalik arah, ide dasar CAPTCHA sejalan dengan Turing Test. Alan Turing, ilmuwan computer berkebangsaan Inggris, pada 1950 pernah mengajukan pengujian, apakah computer bias berpikir seperti manusia. Pada Turing Test, seorang penguji yang terisolasi mengajukan pertanyaan kepada dua panelis: manusia dan computer.
Dari jawaban kedua panelis, si penguji harus menentukan dengan pasti mana jawaban yang diberikan manusia, dan mana yang di-generate oleh computer. Bila si penguji tidak bias membedakan “dengan pasti” mana manusia dan mana computer, maka computer dinyatakan lulus ujian.
Dalam CAPTCHA, yang terjadi adalah kebalikannya. Yang bertindak sebagai penguji adalah computer, sementara objek yang diuji tetap manusia dan computer. Bila penguji “bisa" membedakan dengan pasti mana manusia dan mana computer, maka manusia dinyatakan lulus ujian.
Pareidolia dan CAPTCHA
Meski tidak semuanya, sebagian besar CAPTCHA menggunakan tes visual. Komputer kesulitan memproses data visual, sementara tidak dengan manusia. Manusia dapat melihat gambar dan menemukan sebuah pola di dalamnya secara lebih cepat dan lebih mudah dibandingkan dengan computer.
Pikiran manusia tidak jarang menangkap sebuah pola atau bentuk kendati hal tersebut tidak ada. Misalnya, kita sering “melihat” bentuk wajah atau hewan pada gumpalan awan atau permukaan bulan (ingat acara TV yang sering mereka-reka bentuk dan wajah “setan” dari bayangan di dinding gua).
Otak manusia akan mengasosiasikan informasi acak yang tertangkap oleh mata tersebut menjadi sebuah pola atau bentuk. Dalam psikologi, fenomena ini dikenal dengan istilah pareidolia. Meski demikian, tidak semua CAPTCHA mengendalikan tes visual ini. Beberapa tipe CAPTCHA menggunakan suara atau audio.
Beberapa bentuk CAPTCHA
Langkah pertama dalam mendesain CAPTCHA adalah melihat perbedaan antara manusia dan computer dalam memproses informasi. Komputer mengikuti serangkaian instruksi. Komputer tidak dapat menjangkau sesuatu yang berada di luar dunianya (dunia instruksi).
Ketika membuat sebuah tes, seorang desainer CAPTCHA harus memperhatikan hal ini. Sebagai contoh, membuat sebuah program yang dapat membaca metadata (informasi pada web yang terbaca oleh computer, namun tidak oleh manusia) adalah hal yang mudah.
Jadi, tidak ada gunanya membuat CAPTCHA visual bila mencantumkan solusinya pada metadata image yang digunakan. Sama kurang bijaknya dengan membuat CAPTCHA tanpa mendistorsi huruf dan angka. Beberapa spambot dilengkapi dengan OCR yang mampu membaca dan mengenali huruf dan angka pada image.
Satu-satunya cara dengan membuat CAPTCHA adalah mendefinisikan image dan solusinya dalam sebuah database. Menurut peneliti dari Microsoft Research, 80% CAPTCHA dapat dipecahkan oleh manusia, sementara computer hanya mampu memecahkan 1 dari 100 tes (1%).
Distrorsi pada huruf dan angka digunakan untuk membingungkan spambot dengan OCR. Beberapa huruf dan angka diberi bentuk yang tidak lazim (seperti melihat tulisan dari balik kaca yang meleleh). Sebagian memecah bentuk huruf dan angka seperti menuliskannya pada kisi-kisi jendela.
Sebagian lagi menggunakan warna yang berbeda, atau menambahkan elemen lain seperti titik atau bercak yang tidak beraturan. Itu semua dilakukan dengan satu tujuan yang sama : mempersulit spambot membaca rangkaian huruf an angka yang tertera pada image.
Sumber : PC Mild Edisi 16/2009