Kategori

Artikel Populer

Total Tayangan Halaman

isi BLOG

Kamis, 17 November 2011

Pengguna Internet Jadi Arsiparis

 

Bagi Anda yang sering mengunjungi forum online seperti Kaskus, reCAPTCHA bukan hal baru. Namun, tahukah Anda apa dan maksud keberadaan reCAPTCHA sebenarnya?
Semi-kata yang membingungkan ini sering kali muncul saat Anda akan membalas posting yang ada pada Kaskus atau saat membeli tiket konser di TicketMaster.com atau menjual barang antik di Craigslist.
Anda mungkin mengira semi-kata ini bukanlah kata-kata nyata namun faktanya adalah kebalikannya. Semi-kata ini sebenarnya adalah gambar dari laman buku dan berkat teknologi reCAPTCHA, semi-kata ini menjadi alasan utama Google mendigitalkan lebih dari 15 juta buku sejak 2004.
Proyek ‘Google Books’ telah jauh meningkatkan kualitas teks digitalnya berkat tulisan melekuk itu bahkan terkadang tulisan warna-warni di web yang muncul 200 juta kali sehari, papar profesor ilmu komputer Luis von Ahn dari Carnegie Mellon University yang menemukan sistem reCAPTCHA ini.
“Manusia tak memiliki masalah membaca karakter yang terdistorsi ini selain mereka yang memang memiliki gangguan visual di mana program komputer tak bisa membacanya dengan baik,” kata von Ahn.
Google menempatkan kata dari buku yang tak bisa ia pindai sepenuhnya di sistem reCAPTCHA dan sisanya terserah pada manusia untuk menentukan apa kata-kata itu sebenarnya dan dengan memecahkan kata-kata yang membingungkan itu, Anda membantu proyek besar ini.
‘Enthsba’ mungkin tampak seperti kata Yunani bagi Anda dan mungkin saja Anda benar. Pasalnya, Google mengatakan, ratusan kata-kata dari banyak negara serta dari lebih dari 400 bahasa merupakan bagian program CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart) yang diakuisisinya pada 2009.
Dengan demikian, para pengguna internet di dunia resmi bekerja sebagai tukang arsip paruh waktu meski tak semuanya begitu. CAPTCHA sendiri merupakan program gratis von Ahn yang dikembangkan pada 2000 untuk membantu Yahoo! mengatasi masalah email spam.
“Anda mengetik karakter terdistorsi ini guna mencegah calo penulisan program yang bisa membeli dua jutaan tiket pada satu waktu,” kata von Ahn. Pasa sistem ini, dua kata muncul dalam CAPTCHA.
Sistem mengetahui jawaban untuk salah satu kata dan mengasumsikan pengguna mengetik kata lain dengan benar. Jawaban untuk kedua kata ini kemudian dibandingkan dengan apa yang ditulis pengguna lain dan dimasukkan ke kolam kata-kata yang diverifikasi.
“Awalnya saya benar-benar merasa bangga dengan ciptaan ini kemudian saya bertanya-tanya apakah bisa melakukan hal berguna secara bersamaan,” katanya. Pertanyaan itu muncul bersamaan reCAPTCHA pada 2007 yang saat ini ada di lebih dari 100 situs, termasuk Facebook dan Twitter.
Ia mencontohkan isu lama New York Times dan menempatkannya dalam sistem reCAPTCHA. Hasilnya menurut laporan von Ahn, 20 tahun edisi berhasil didigitalkan. Sistem ini jelas sebuah kesuksesan di mana von Ahn melakukan perhitungan dan mendapat 200 juta CAPTCHA diisi tiap hari hanya butuh 10 detik tiap mengisi.
Tergantung kondisi kata-kata di laman, karakter individu bisa masuk siklus sistem reCAPTCHA sebanyak beberapa kali. “Saat kita tak yakin pada kata di dalam buku, kita tunjukkan kata itu pada sejumlah orang,” kata direktur teknik Google Books Jimi Crawford.
Crawford mengaku bermitra dengan lebih dari 40 ribu penerbit di dunia dan reCAPTCHA membantunya meningkatkan misi mereka mendigitalisasi buku. “Ini membuat perbedaan besar dalam pengalaman membaca buku,” kata Crawford.
Teks dari buku-buku yang dipindai tampak sama di Google Books dan tentunya, gambar-gambar dari buku yang dibuat pemindai tak berubah. Namun, kata-kata tak jelas yang ada tiba-tiba dikenali dalam pencarian.
Crawford melaporkan, buku di Amerika Serikat (AS) terbitan sebelum 1923 berada di bawah domain publik dan hak ciptanya tidak ada. Kini, ada dua juta buku-buku yang tersedia untuk diunduh secara gratis di Google Books.
Lebih dari 13 juta buku baru juga tersedia namun tergantung penerbit, hanya 1% teks yang bebas dibaca. Google memiliki banyak buku tua yang menunggu untuk dipindai, ungkap Crawford. Namun kini, perusahaan ini terus berupaya untuk mendapat popularitas. Jadi, terima kasih untuk semua bantuan para pengguna Web di dunia.

sumber: http://teknologi.inilah.com/read/detail/1797346/pengguna-internet-jadi-arsiparis

By : blankerz

Tidak ada komentar:

Posting Komentar