CAPTCHA Nedir? Nasıl Gelişti?

CAPTCHA Nedir? Nasıl Gelişti?

Mayıs 23, 2021 0

Günümüzde her internet kullanıcısı, neredeyse her ziyaret ettiği sitede çeşitli süreçler yaparken, hatta siteye girerken bile muvaffakiyetle tamamlamaları gereken bir teste giriyorlar: CAPTCHA. Carnegie Mellon Bilgisayar Bilimleri Okulu’ndaki takım tarafından geliştirilen bu test, siteyi ziyaret eden kişinin gerçek bir kişi olup olmadığını anlamak için kullanılıyor.

CAPTCHA, bugüne kadar pek çok farklı temayla karşımıza çıktı. Günümüzdeyse bize ya trafik ışıkları seçtiriyor, ya da birkaç fotoğraf ortasından içinde belirli bir objenin olduğu fotoğrafları seçmemizi istiyor. Pekala, vakit zaman başarısız olup hudut krizi geçirmemizi sağlayan, “Sanki robot muyum ben?” diye düşünmemize neden olan CAPTCHA, hangi emelle ve nasıl geliştirildi ve günümüze kadar nasıl bir gelişimden geçti? Gelin her gün karşılaştığımız bu testi tanıyalım.

Not: Teknoloji, daima üstüne katarak geliştirildiğinden yazının tamamını okumanızı tavsiye ederim. Aksi halde değerli noktaların ilişkilerini kaçırabilirsiniz.

Öncelikle CAPTCHA nedir?

CAPTCHA, “Completely Automated Public Turing test to tell Computers and Humans Apart (Bilgisayarları ve İnsanları Ayırmak İçin Büsbütün Otomatik Genel Turing testi” tabirinin kısaltmasıdır. Bu testte Turing testinin işleyişinde yer alan sorgulayıcı, CAPTCHA’nın algoritmasının ta kendisidir. Sorgulayıcımıza, CAPTCHA’ya verdiğimiz karşılıklarda bizim bir bilgisayar olmadığımızı kanıtlamamız gerekir. Lakin yanlışsız karşılık verirsek, Turing testini geçmiş ve istediğimiz içeriğe erişmiş oluruz.

CAPTCHA nasıl ortaya çıktı?

CAPTCHA, Carnegie Mellon Bilgisayar Bilimleri Okulu’nda Luis von Ahn tarafından yönetilen, beraberindeki Manuel Blum, Nicholas J. Hopper ve John Langford tarafından geliştirildi. Sistemi geliştirme fikriyse dev bir şirket sayesinde ortaya çıktı. Luis von Ahn, sistemin geliştirilme kıssasını kendi ağzıyla anlattı.

2000 yılında, şimdi doktorasının birinci yılında olan Luis, o vaktin en dev şirketlerinden Yahoo’nun başmühendisinin verdiği konuşmaya katıldı. Konuşmanın konusu, Yahoo’nun bir türlü çözemediği 10 sorundu. İşte bu sorunlardan birisi de Luis ve takımının bugün terler dökmemizi sağlayan, yıllar içinde yapay zekâ tartışmaları açan CAPTCHA fikrini ateşledi.

Yahoo, o periyotta milyonlarca e-posta adresi açmak için program yazan kullanıcılarıyla baş etmeye çalışıyordu ve bunun önüne bir türlü geçemiyordu. Yazılan programlar, Yahoo’da sadece formu doldurarak e-posta adresi oluşturuyor ve bunu hiç durmadan yapabiliyordu. Koskoca Yahoo, bunun önüne bir türlü geçemedi.

Luis von Ahn ve grubu de bunun için ziyadesiyle mantıklı bir tahlille geldi: Bilgisayarları ve insanları birbirinden ayırt edebilecek bir test. Bu test, her yaştan ve dünyanın her yerinden, kısaca rastgele bir insan tarafından çözülmek zorundaydı, ama bilgisayarlar bu testi geçmemeliydi. İşin güç kısmı da aslında buydu. Ama grup, bunun için insan tabiatına başvurdu: Biz, karakterleri ve metinleri kolay bir biçimde hangi halde ve ortamda olurlarsa olsun, lisanı fark etmeksizin tanıyabiliyorduk. Ama bilgisayarlar, bu karakterleri sırf kendilerine gösterilen formda tanıyabiliyorlardı. Doğal bu, o vaktin bilgisayarları için geçerliydi. Bu bahse da birazdan değineceğiz.

Birinci CAPTCHA sistemi de böylece ortaya çıktı:

CAPTCHA’da kullanıcıya gösterilen testlerini birinci sürümü, değişmeyen iki sözcükten oluşan ve biçimi bozulmuş bir biçimde gösterilen bir diziydi. Bilgisayara bu sorunun karşılığı gerçek bir formda veriliyor ve kullanıcıdan o yanıt isteniyordu. Beşerler, hali bozulmuş karakterleri tanıyabilirken bilgisayarlar bu karakterleri tanıyamadığından otomatik olarak algılayamıyorlar, hasebiyle testi tamamlayamıyorlardı.

Yahoo, CAPTCHA’nın bu birinci sürümünü sorun yaşadığı e-posta oluşturma sayfasında kullanmaya başladı. CAPTCHA’nın eklendiği birinci haftalarda sistem, milyonlarca kere kullanıldı ve hakikaten de insanları bilgisayarlardan ayırmada başarılı oldu. Ama bu sistemle birlikte aslında büyük de bir sorun oluşmaya başladı: Yapay zekâ, verilen karşılıklarla gelişiyor, hatta CAPTCHA yanıtları kara borsaya düşüyordu.

CAPTCHA, bilgisayar ve insanı ayırırken bilgisayarı akıllandırdı:

Kullanıcıların CAPTCHA’ya verdikleri karşılıklarla birlikte bu yanıtlar aslında bir yere kaydoluyordu. Böylece bir bilgisayar, karşılığı bilinen bir CAPTCHA’yla karşılaştığında o karşılığı yapıştırarak testten muvaffakiyetle geçiyor, bilgisayar tarafından ‘insan’ olarak tanımlanıyordu. Hatta bu durum o kadar önemli bir hale geldi ki ‘CAPTCHA çiftlikleri’ kuruldu ve parayla çalışan beşerler, binlerce CAPTCHA çözerek bu testlerin gerçek yanıtlarını botlar için kaydetti. Böylelikle CAPTCHA, ikinci sürüme geçmeye zorlandı.

İkinci sürüm CAPTCHA: reCAPTCHA:

CAPTCHA’nın bir sonraki gelişimi 2005’te gerçekleşti. Bu kere CAPTCHA, ‘reCAPTCHA’ olarak isimlendirildi. Bu sürümde artık iki sözcük değişmez değil, bunlardan birisi değiştirilebilir hale getirildi. Sözcüklerden birisi bilgisayarın karşılığını bildiği bir sözcük, başkasıysa kitaplardan, makalelerden yahut rastgele bir içerikten alınan ve karakterleri düzgün olmayan rastgele bir sözcüktü. Bilgisayar, bu sözcüğün karşılığını bilmiyordu. Pekala, bilgisayar, bu ikinci sözcüğün yanıtının yanlışsız olup olmadığını nasıl anlıyordu?

reCAPTCHA, birisi bilgisayar tarafından bilinen ve başkası bilinmeyen tıpkı iki sözcüğü tek bir kullanıcıya değil, birden fazla kullanıcıya gösteriyordu. Böylelikle birden fazla kullanıcı, tıpkı soruya birebir karşılığı verdiğinden yanıt yanlışsız olarak algılanıyordu. Bu süreç boyunca bozuk yazıma yer veren binlerce makale ve kitap elle taranıyor, ikinci sözcük oluşturuluyordu.

Google’ın reCAPTCHA’yı satın alması sistemi daha da akıllandırdı:

2009 yılına gelindiğinde Google, reCAPTCHA’yı satın aldı. Şirketin gerçekleştirdiği birinci işlerden birisi ikinci sözcüğün oluşturulması için gereken taramayı otomatikleştirmekti. Gördüğümüz o eski kitaptan alınmış üzere gözüken gri art planlı sözcükler, sahiden de eski kitaplardan alınmıştı. Şirketin bu usulüyle metinleri tarayan bilgisayar, sözcüklerin bozuk hallerini tanıyabilir hale geldi. Artık bozuk yazılmış bir sözcük gösterildiğinde bilgisayarlar bunu tanımakta zahmet çekmiyordu. Bilgisayarlar, bozuk metinleri okumayı öğrenmiş oldu.

2014 yılında Google’ın makine tahsili alanında gerçekleştirdiği bir test, bilgisayarların ne derece akıllandığını da fecî bir formda ortaya koydu. Bu testin sonuçlarına nazaran beşerler, bozuk yazılmış sözcükleri %33 oranında hakikat okuyabiliyordu. Bir vakitler genişletilmiş karakterleri bile algılayamayan yapay zekâysa bu testten %99,8 oranında doğruluk sonucu aldı. Böylece CAPTCHA metodunda de devrimsel bir değişikliğe gidildi.

İkinci sürümün ikinci sürümü: reCAPTCHA V2 ve No CAPTCHA reCAPTCHA

Birebir yıl testin akabinde reCAPTCHA V2 sürümüne geçiş yapıldı. Bu sürümde artık kullanıcılar metinlerle karşılaşmıyor, günümüzdeki üzere fotoğraflarla karşılaşıyordu. Kullanıcılara belirtilen bir objenin bulunduğu görselleri seçmeleri söyleniyordu. Bununla birlikte Google, “No CAPTCHA reCAPTCHA (CAPTCHA Olmayan reCAPTCHA)” ismini verdiği bir sistemi de bununla birlikte yürürlüğe soktu.

O devirde sistemi kullanan birinci isimler Snapchat, WordPress ve HumbleBundle’dı. Yeni sistemle birlikte kullanıcılar, sitelerde “I’m not a robot (Ben robot değilim)” denetim kutusunu görmeye başladı. Sistemin çalışma biçimiyse aslında zaten teste gelmeden evvel kullanıcıları bilgisayarlardan büyük oranda ayırmayı başarıyordu.

“Gelişmiş Risk Analizi” isimli daima geride çalışan bir sistem, kullanıcıların siteyle etkileşimini izliyordu. Evet, internette daima izleniyoruz. Hatta sayfada nasıl gezindiğimiz bile kaydoluyor, teknolojileri geliştiriyor. Kullanıcının davranışları, gerçek beşerden beklenen davranışlarla uyuşuyorsa, I’m not a robot seçeneğine bastığınızda karşınıza hiçbir test çıkmıyor, insan olduğunuz doğrulanıyordu. Ancak etkileşim bir insanın etkileşimiyle uyuşmuyorsa, yani bilgisayar, siteye bir bilgisayarın girdiğini düşünüyorsa onlara CAPTCHA’yı gösteriyordu. Bu CAPTCHA da reCAPTCHA V2’yle gelen fotoğraflı CAPTCHA’lardı.

reCAPTCHA V2’nin fotoğraflı doğrulamasıysa elbette yeniden yapay zekâyı geliştiriyordu. Lakin bu sefer verdiğiniz yanıtlar yüklü olarak korsanlar tarafından değil, Google tarafından kullanılıyordu. Google, günümüzde bile bir manzara içindeki objeleri ayırt edebilmek için bizim CAPTCHA’lara verdiğimiz yanıtları kullanıyor. Böylelikle, örneğin, kendi kendine giden bir otomobil bir ağacı, bir yangın musluğunu, bir trafik ışığını yahut bir yaya geçidini algılayabiliyor. Anlayacağınız, interneti inançla kullanmamızı sağlayan bu sistem, Google’ın daha da gelişmesini sağlıyor. Kazan – kazan durumu.

Günümüz reCAPTCHA’sı: reCAPTCHA V3

Google, reCAPTCHA’nın yazılar gösteren birinci sürümünü 4 Nisan 2018 tarihinde büsbütün kullanımdan kaldırdı. Günümüzde birçok internet sitesi, hala reCAPTCHA V2’yi kullanmaya devam edebiliyor. Lakin fizikî olarak mevcut olan bu testin yanı sıra bir de 29 Ekim 2018’de piyasaya sürülen reCAPTCHA V3 kullanılıyor. reCAPTCHA V3, reCAPTCHA V2’yi alarak daha da gelişmiş bir hale getirmiş durumda.

2018 yılından bu yana reCAPTCHA V2 yerine V3 kullanan internet siteleri, kullanıcı tarafından rastgele bir etkileşim gerektirmiyor. Bu sitelerde CAPTCHA testi gösterilmiyor. Bilakis, internet sitelerinin sahiplerine riskli bir trafikle karşılaşılması durumunda bilgi veriyor. Kullanıcı tecrübesi, CAPTCHA tarafından rastgele bir halde bozulmuyor. Risklerin masrafımı büsbütün internet sitesi sahiplerine bırakılıyor.

Bu çalışma mantığını Google’ın örneğiyle anlatmakta yarar var. Bir alışveriş sitesi sahibisiniz ve son vakitlerde sitenize yüksek ölçüde trafik girdiğini görüyorsunuz. Ancak bu trafik hiçbir halde dönüşümlere çevrilmiyor. Hasebiyle bunların gerçek müşteri olmadıklarını düşünüyorsunuz. Bu noktada tek bildiğiniz şeyse sitenize yüksek trafik geldiği. Lakin gelen bu trafiğin neyi amaçladığını, sitenizde ne yaptığını bilmiyorsunuz.

İşte reCAPTCHA V3 de tam olarak bunu bilmenizi sağlıyor. Her sayfaya farklı başka eklediğiniz reCAPTCHA V3 sistemi, siteye yapılan her girişi takip ediyor. Örneğin eser incelemeleri sayfanıza eklediğiniz sistem, size botların yorum yapmak maksadıyla bu sayfaya girdiğini gösteriyor. Yapılan her bir süreç reCAPTCHA tarafından puanlanıyor ve site sahibi, gerçek yorumlarla bot yorumlarını ayırt edebiliyor. Botların ayırt edilmesiyse No CAPTCHA reCAPTCHA’da kullanılan, sitedeki etkileşimin gerçek insan etkileşimiyle karşılaştırılması formülüyle yapılıyor.

Tüm bu gelişim, Yahoo’nun yaşadığı probleme bir tahlil olarak çıkan teknolojinin günümüzde ne kadar büyüyebileceğini ve yapay zekâya nasıl bir katkı yapabileceğini göstermiş oldu. Tıpkı vakitte internetteki parmak izimizin de takip edilebilmesi için yeni teknolojilerin de gelişmesine aracı oldu. reCAPTCHA hakkındaki niyetlerinizi aktardığınız, gelecekte nasıl bir noktaya gelebileceğini anlattığınız yorumlarınızı bekliyoruz.

Kaynaklar: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9