Öneri algoritmaları “Telefonlar bizi dinliyor mu?” sorusunu sordurtabilir. Ancak bu yaptıkları bizi dinlemekten ziyade hassas bir analizdir.
Diyelim ki yeni bir spor ayakkabıya ihtiyacınız var ve bunu bir arkadaşınızla konuştunuz. Kısa bir süre sonra telefonunuza baktığınızda muhtemelen karşınıza bir sürü spor ayakkabısı reklamı çıkacaktır. Sizce bunun nedeni nedir? Telefonlar bizi dinliyor olabilir mi?
Az önce bahsettiğimiz durum günlük hayatta neredeyse herkesin başına gelmiştir. Hatta bazen spor ayakkabı hakkında hiç konuşmasanız sadece düşünseniz bile karşınıza reklamı çıkar, öyle değil mi? Öyleyse telefonlar aklımızı da mı okuyor?
Bu tarz spekülatif fikirlere gitmeden önce işin arka planını öğrenmek çok daha faydalı olacaktır. Ve hiç şaşırtıcı olmayan bir şekilde, telefonunuzun tam da ihtiyacınız olan ürünün reklamını size göstermesinin ardında matematik yatmaktadır. Çünkü kullandığımız alışveriş, müzik ve özellikle de sosyal medya uygulamaları bir dizi öneri algoritmalarını kullanarak çalışır.
Söz konusu bu öneri algoritmaları ise temelde iki yaklaşımla size önerilerde bulunur. Bunlar işbirlikçi filtreleme ve içerik tabanlı filtreleme yaklaşımlarıdır. O halde gelin, bu yöntemlere yakından bakarak telefonlarımızın bizi gerçekten dinleyip dinlemediğini anlamaya çalışalım.
İşbirlikçi Filtreleme Nedir?
Temel itibariyle bu yöntem, benzer ilgilere sahip kişilerin verilerinden yola çıkarak kişilere önerilerde bulunur. Bunu bir örnek üzerinden daha iyi açıklayabiliriz. Diyelim ki 5 farklı kullanıcı ve 6 filmden oluşan bir film izleme platformunuz var.
Yukarıdaki tabloda olduğu gibi bu 5 kullanıcı, en beğendikleri filme 5 puan verecek şekilde 1’den 5’e kadar izledikleri filmleri puanlandırmışlar. Bu durumda mevcut puanlandırmalar üzerinden kullanıcılarınıza yeni filmler önerebilirsiniz. Ancak tabloda da görüldüğü üzere her kullanıcı her filmi izlememiş. İşte işbirlikçi filtreleme yapan algoritmaların en çok zorlandığı yer burasıdır.
Tıpkı bu tabloda olduğu gibi kullanıcılardan gelen veriler yetersiz olduğunda algoritma şöyle bir yol izler. Diyelim ki algoritma, kullanıcı 1’e yeni bir film önerecek. Bunun için algoritmanın zevkleri kullanıcı 1’e benzeyen başka bir kullanıcıdan yola çıkarak kullanıcı 1’e yeni bir film önermesi gerekecektir. Peki algoritma bunu nasıl yapacak?
Algoritmalar veri yetersizliği sorununun üstesinden vektörleri kullanarak gelir. Örneğin yukarıdaki görselde kullanıcı 1,2 ve 3’ün filmlere verdiği puanlar üzerinden kullanıcıları temsil eden vektörlerin birbirleriyle yaptıkları açıların ölçüsünü karşılaştırabiliriz.
İki vektör arasındaki açıyı hesaplamak içinse vektörleri skaler çarpıp iki vektör uzunluğuna böleriz. Yukarıdaki örnek için bunu yaptığımızda kullanıcı 1 ve 2 arasındaki açı daha küçük olduğu için bu iki kullanıcının daha benzer zevklere sahip olduğunu söyleyebiliriz.
Az önce bahsettiklerimiz küçük örneklerdi. Gerçek hayatta alışveriş ya da sosyal medya uygulamalarının milyonlarca kullanıcısı vardır. Bu uygulamalar o kadar veriyi nasıl organize ediyor dersiniz? Elbette yine matematik sayesinde.
Söz konusu şirketler muazzam miktardaki bu verilerdeki örüntüleri tespit etmek için tekil değer ayrıştırması veya temel bileşen analizi gibi lineer cebirdeki yöntemleri kullanır. Temelde yaptıkları şey ellerindeki verilerden oluşan karmaşık matrisi, basit matrislerin çarpımı olarak ifade etmektir. Daha basit matrislerse algoritmaların kullanıcı tercihlerini daha kolay analiz etmesine olanak sağlar.
Öneri Algoritmalarının Kullandığı Bir Diğer Yöntem: İçerik Tabanlı Filtreleme Nedir?
Öneri (tavsiye) algoritmalarının bize çeşitli önerilerde bulunurken kullandığı bir diğer yöntem de içerik tabanlı filtrelemedir. İsminden de anlaşılacağı üzere bu filtreleme yönteminde algoritmanın odaklandığı şey kullanıcı beğenileri değil, içeriklerdir. Algoritma bu yaklaşımda içeriklerin birbiriyle olan bağlantısına odaklanır.
Örneğin mayo satın almak istiyorsunuz. Bu durumda algoritma karşınıza mayo ile birlikte alınabilecek bone, deniz gözlüğü, güneş kremi gibi ürünleri çıkarır. Böylece öneri algoritmasının kullanıcılardan bir sürü veri toplamasına gerek kalmaz.
Günümüzdeyse çoğu öneri algoritması hem içerik tabanlı hem de işbirlikçi filtreleme yöntemlerini birlikte kullanıyor. Böylece zaman zaman çok isabetli önerilerde bulunup bizi şaşırtıyorlar. O halde bir ürünü sadece düşündüğümüz halde bile nasıl karşımıza reklamı çıkabiliyor?
Aslında burada söylenmesi gereken 2 şey var. Birincisi; algıda seçicilik nedeniyle aklımızda sadece düşündüğümüz ürünlerin reklamlarının çıktığı anların kalmasıdır. İkincisi ve asıl önemli olansa bazı uygulamaların onlara sunduğumuz bilgilerimizi ne kadar iyi bir şekilde analiz ettiğini unutmamızdır. Konumumuz ve çevrimiçi davranışlarımızı analiz eden bu algoritmalar “Telefonlar bizi dinliyor mu?” sorusunu sordurtabiliyor. Ancak bu yaptıkları bizi dinlemekten ziyade hassas bir analizdir.
Kaynaklar ve İleri Okumalar
- How Recommendation Algorithms Work And Why They May Miss the Mark; Kaynak site: Scientific America. Yayınlanma tarihi: Bağlantı: How Recommendation Algorithms Work And Why They May Miss the Mar
Size Bir Mesajımız Var!
Matematiksel, 2015 yılından beri yayında olan ve Türkiye’de matematiğe karşı duyulan önyargıyı azaltmak ve ilgiyi arttırmak amacıyla kurulmuş bir platformdur. Sitemizde, öncelikli olarak matematik ile ilgili yazılar yer almaktadır. Ancak bilimin bütünsel yapısı itibari ile diğer bilim dalları ile ilgili konular da ilerleyen yıllarda sitemize dahil edilmiştir. Bu sitenin tek kazancı sizlere göstermek zorunda kaldığımız reklamlardır. Yüksek okunurluk düzeyine sahip bir web sitesi barındırmak ne yazık ki günümüzde oldukça masraflıdır. Bu konuda bizi anlayacağınızı umuyoruz. Ayrıca yazımızı paylaşarak da büyümemize destek olabilirsiniz. Matematik ile kalalım, bilim ile kalalım.
Matematiksel