Günümüzde ürün ile servis incelemelerinin ve yorumlarının satışları etkilediği herkesçe bilinen bir gerçek. Tüketicilerin yaklaşık %71'i, öbür bireylerin izlenimlerini okuduktan sonra bir eseri satın almanın daha iyi sonuç verdiğini söylerken %88'i de incelemelerin satın alma kararlarını etkilediğini söylüyor. Bu nedenle kötü niyetli üçüncü taraflarca yazılmış spam ve aldatıcı incelemeleri azaltmak için ciddi çalışmalar yürütülüyor. Hartman Group ve Washington Üniversitesi'ndeki bilim insanları, bu kuvvetli alanda büyük bir ilerleme kaydetti.
Arxiv.org'da yayınlanan bir makalede araştırmacılar, “spamGAN”ı (Yarı Kontrollü Görüş Spam Tespiti için GAN) açıkladılar. GAN, makine tahsili sisteminde üretken karşıt ağlar sınıfına verilen isimdir.
Makalenin müellifleri, “İstenmeyen incelemeler ve yorumlar; e-ticaret sitelerinde, toplumsal medyada, seyahat sitelerinde ve sinema inceleme sitelerinde yaygın bir sorun. Spam incelemelerini bir sınıflandırma sorunu olarak tanımlamanın ve bir inceleme verildiğinde ‘spam’ yahut ‘spam olmayan’ formunda sınıflandırılmanın gerektiğini düşünüyoruz” açıklamasında bulundular.
Bu usulde, etiketlenmemiş içerikler az ölçüde etiketlenmiş içeriklerle birlikte kullanılır. Bu sayede, makine öğrenmesinde düzgünleştirme sağlanır ve bu tekniğe ‘denetimli öğrenme’ ismi verilmiştir.
Makalenin muharrirleri, “Spam incelemeler hakkındaki mevcut araştırmaların birçok (derin öğrenme yolları dışında), spam davranışını sınıflandırmak ve tanımlamak için deneyimsel yaklaşımları kullanmaktadır. Ancak GAN tabanlı yaklaşımımızda özellikler hudut ağı tarafından öğreniliyor. Birebir vakitte SpamGAN'ın, kesin gerçekliği olmayan durumlarda yapay bilgi üretimi için kullanılabilecek spam ve spam olmayan içerikler de oluşturabileceğine inanıyoruz” açıklamasında bulundular.
Ayrıyeten spamGAN, gelecekteki çalışmalarda ve deneylerde kullanılmak üzere veri setleri ve daha sofistike bir sınıflandırıcı sağlayacaktır.