Collaborative Filtering Algorithms’ Bias Towards Highly-liked Items


Creative Commons License

YALÇIN E.

Bilecik Şeyh Edebali Üniversitesi Fen Bilimleri Dergisi, vol.8, no.1, pp.279-291, 2021 (Peer-Reviewed Journal) identifier

Abstract

Recommender systems are automated tools that suggest appropriate products/services to individual users based ontheir preferences in the past and characteristics without requiring any personal effort. In these systems,collaborative filtering algorithms are the most utilized approaches to produce individual predictions or a rankedlist of preferable items for users. Although such algorithms' efficiency is generally assessed with the accuracy ofprovided recommendations, beyond-accuracy evaluations such as item catalog coverage are also consideredcritical factors in qualified recommendations. However, many recent studies demonstrate that these algorithmstend to feature certain items than others in the produced ranked lists because of their specific properties (e.g.,popularity). In this study, we scrutinize item profiles with a different point of view, the degrees of being liked, andinvestigate whether there is any bias of collaborative filtering algorithms towards highly-liked items or not. Tothis end, we adopt nine prominent collaborative filtering algorithms in three different categories and performvarious experiments on two real-world datasets. The experimental results demonstrate that almost all algorithms are strongly biased towards highly-liked items, and matrix factorization based algorithms such as SVD and SVD++are more successful than others in producing high-quality recommendations.
Öneri sistemleri, bireysel kullanıcılara herhangi bir kişisel çaba gerektirmeden geçmişteki tercihlerine veözelliklerine göre uygun ürünleri/hizmetleri öneren otomatikleştirilmiş araçlardır. Bu sistemlerde, işbirlikçifiltreleme algoritmaları, ürünler için bireysel tahminler veya kullanıcılar için tercih edilir ürünlerin sıralı birlistesini üretmek için en çok kullanılan yaklaşımlardır. Bu tür algoritmaların verimliliği genellikle sağlananönerilerin doğruluğu ile değerlendirilse de, ürün kataloğu kapsamı gibi doğruluk-üstü değerlendirmeler de nitelikliönerilerde kritik faktörler olarak kabul edilir. Ancak, son zamanlarda yapılan birçok çalışma, bu algoritmaların,belirli özellikleri (örn. popülerlik) nedeniyle bazı ürünleri üretilen sıralı listelerde diğerlerinden daha çok öneçıkarma eğiliminde olduğunu göstermiştir. Bu çalışmada, ürün profillerini farklı bir bakış açısıyla, beğenilmedereceleriyle irdeliyor ve işbirlikçi filtreleme algoritmalarının çok beğenilen ürünlere yönelik bir yanlılığının olupolmadığını araştırıyoruz. Bu amaçla, üç farklı kategoriden dokuz önemli işbirlikçi filtreleme algoritmasınıkullanıyoruz ve iki gerçek-dünya veri kümesi üzerinde çeşitli deneyler gerçekleştiriyoruz. Deneysel sonuçlar,hemen hemen tüm algoritmaların çok beğenilen ürünlere yönelik güçlü bir yanlılığının olduğunu ve SVD ileSVD++ gibi matris çarpanlarına ayırma tabanlı algoritmaların yüksek kalitede öneriler üretmede diğerlerindendaha başarılı olduğunu göstermiştir.