Bagi Anda yang sering mengunjungi forum online seperti
Kaskus, reCAPTCHA bukan hal baru. Namun, tahukah Anda apa dan maksud
keberadaan reCAPTCHA sebenarnya?
Semi-kata yang
membingungkan ini sering kali muncul saat Anda akan membalas posting
yang ada pada Kaskus atau saat membeli tiket konser di TicketMaster.com
atau menjual barang antik di Craigslist.
Anda mungkin mengira
semi-kata ini bukanlah kata-kata nyata namun faktanya adalah
kebalikannya. Semi-kata ini sebenarnya adalah gambar dari laman buku dan
berkat teknologi reCAPTCHA, semi-kata ini menjadi alasan utama Google
mendigitalkan lebih dari 15 juta buku sejak 2004.
Proyek ‘Google
Books’ telah jauh meningkatkan kualitas teks digitalnya berkat tulisan
melekuk itu bahkan terkadang tulisan warna-warni di web yang muncul 200
juta kali sehari, papar profesor ilmu komputer Luis von Ahn dari
Carnegie Mellon University yang menemukan sistem reCAPTCHA ini.
“Manusia
tak memiliki masalah membaca karakter yang terdistorsi ini selain
mereka yang memang memiliki gangguan visual di mana program komputer tak
bisa membacanya dengan baik,” kata von Ahn.
Google menempatkan
kata dari buku yang tak bisa ia pindai sepenuhnya di sistem reCAPTCHA
dan sisanya terserah pada manusia untuk menentukan apa kata-kata itu
sebenarnya dan dengan memecahkan kata-kata yang membingungkan itu, Anda
membantu proyek besar ini.
‘Enthsba’ mungkin tampak seperti kata
Yunani bagi Anda dan mungkin saja Anda benar. Pasalnya, Google
mengatakan, ratusan kata-kata dari banyak negara serta dari lebih dari
400 bahasa merupakan bagian program CAPTCHA (Completely Automated Public
Turing Test to Tell Computers and Humans Apart) yang diakuisisinya pada
2009.
Dengan demikian, para pengguna internet di dunia resmi
bekerja sebagai tukang arsip paruh waktu meski tak semuanya begitu.
CAPTCHA sendiri merupakan program gratis von Ahn yang dikembangkan pada
2000 untuk membantu Yahoo! mengatasi masalah email spam.
“Anda
mengetik karakter terdistorsi ini guna mencegah calo penulisan program
yang bisa membeli dua jutaan tiket pada satu waktu,” kata von Ahn. Pasa
sistem ini, dua kata muncul dalam CAPTCHA.
Sistem
mengetahui jawaban untuk salah satu kata dan mengasumsikan pengguna
mengetik kata lain dengan benar. Jawaban untuk kedua kata ini kemudian
dibandingkan dengan apa yang ditulis pengguna lain dan dimasukkan ke
kolam kata-kata yang diverifikasi.
“Awalnya saya benar-benar
merasa bangga dengan ciptaan ini kemudian saya bertanya-tanya apakah
bisa melakukan hal berguna secara bersamaan,” katanya. Pertanyaan itu
muncul bersamaan reCAPTCHA pada 2007 yang saat ini ada di lebih dari 100
situs, termasuk Facebook dan Twitter.
Ia mencontohkan isu lama New York Times
dan menempatkannya dalam sistem reCAPTCHA. Hasilnya menurut laporan von
Ahn, 20 tahun edisi berhasil didigitalkan. Sistem ini jelas sebuah
kesuksesan di mana von Ahn melakukan perhitungan dan mendapat 200 juta
CAPTCHA diisi tiap hari hanya butuh 10 detik tiap mengisi.
Tergantung
kondisi kata-kata di laman, karakter individu bisa masuk siklus sistem
reCAPTCHA sebanyak beberapa kali. “Saat kita tak yakin pada kata di
dalam buku, kita tunjukkan kata itu pada sejumlah orang,” kata direktur
teknik Google Books Jimi Crawford.
Crawford mengaku bermitra
dengan lebih dari 40 ribu penerbit di dunia dan reCAPTCHA membantunya
meningkatkan misi mereka mendigitalisasi buku. “Ini membuat perbedaan
besar dalam pengalaman membaca buku,” kata Crawford.
Teks dari
buku-buku yang dipindai tampak sama di Google Books dan tentunya,
gambar-gambar dari buku yang dibuat pemindai tak berubah. Namun,
kata-kata tak jelas yang ada tiba-tiba dikenali dalam pencarian.
Crawford
melaporkan, buku di Amerika Serikat (AS) terbitan sebelum 1923 berada
di bawah domain publik dan hak ciptanya tidak ada. Kini, ada dua juta
buku-buku yang tersedia untuk diunduh secara gratis di Google Books.
Lebih
dari 13 juta buku baru juga tersedia namun tergantung penerbit, hanya
1% teks yang bebas dibaca. Google memiliki banyak buku tua yang menunggu
untuk dipindai, ungkap Crawford. Namun kini, perusahaan ini terus
berupaya untuk mendapat popularitas. Jadi, terima kasih untuk semua
bantuan para pengguna Web di dunia.
sumber: http://teknologi.inilah.com/read/detail/1797346/pengguna-internet-jadi-arsiparis
sumber: http://teknologi.inilah.com/read/detail/1797346/pengguna-internet-jadi-arsiparis
By : blankerz
Tidak ada komentar:
Posting Komentar