7th International Researchers, Statisticians, and Young Statisticians Congress , İstanbul, Türkiye, 2 - 05 Kasım 2023, ss.94
Türk asıllı büyük düşünür Farabi (872) mutluluğu erdemli bir toplum tarafından elde edilmeye
çalışılan en yüksek değer olduğunu belirtmiştir. Politika yapıcıların, bireylerin mutluluğunu ve
dolayısıyla toplumun refahını arttırmaya yönelik alacağı kararları belirlemek ve bu kararları etkin
bir biçimde uygulaması yolunda var olan mutluluk seviyesinin etkin bir şekilde ölçülmesi önem
arz etmektedir. Bu amaç doğrultusunda belki de en önemli adım, ölçmede kullanılan göstergelerin
doğru bir şekilde tespit edilmesidir. Bu göstergelerin belirlenmesinde toplanan veriye dayalı bir
analitik model aramak ve belirlenen uygun modelin geçerliliğini ortaya koyarak politika yapıcılara
yol göstermek, veri bilimi ile uğraşan araştırmacıların en temel görevlerinden biridir. Bu
çalışmanın amacı, 2022 yılına ait Dünya Mutluluk Raporu veri seti üzerinde mutluluk endeksine
ilişkin etkili değişkenleri saptamak ve makine öğrenmesi modelleri ile bir sınıflandırma
uygulaması yapmaktır. Uygulamanın ilk aşamasında en uygun sayıda ve nitelikte değişkenlerin alt
kümesinin belirlenmesi amacıyla sarmal teknikler ailesinde yer alan yinelemeli öznitelik eleme
yönteminde açgözlü arama (greedy search) kullanılmış ve böylece model performansını optimize
etmek amaçlanmıştır. Etkili ve optimal sayıda değişkenlerin yer aldığı değişken altkümesi, lojistik
regresyon, rasgele orman, destek vektör makinesi, gradian boosting ve k-nn gibi farklı denetimli
öğrenme metodları kullanılarak modellenmiştir. Çalışmada kullanılan makine öğrenmesi
modellerinin kendine has parametreleri bulunmaktadır ve modellere ait aşırı uyum (overfitting) ve
az uyum (underfitting) dengesini sağlamak amacıyla hiperparametre optimizasyonu yapılmıştır.
Çalışmanın sonuçları arasında sosyal destek değişkeninin mutluluk skoru için en kritik gösterge
olduğu tespit edilmiştir. Farklı performans metrikleri kullanılarak kıyaslanan makine öğrenmesi
modellerinden en yüksek performansın ise destek vektör makineleri olduğu söylenebilmektedir.