Mutluluk Endeksinin Makine Öğrenmesi Yaklaşımlarıyla Analizi


Öztürk K. N., Yiğit Ö. E.

7th International Researchers, Statisticians, and Young Statisticians Congress , İstanbul, Türkiye, 2 - 05 Kasım 2023, ss.94

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: İstanbul
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.94
  • Bilecik Şeyh Edebali Üniversitesi Adresli: Evet

Özet

Türk asıllı büyük düşünür Farabi (872) mutluluğu erdemli bir toplum tarafından elde edilmeye çalışılan en yüksek değer olduğunu belirtmiştir. Politika yapıcıların, bireylerin mutluluğunu ve dolayısıyla toplumun refahını arttırmaya yönelik alacağı kararları belirlemek ve bu kararları etkin bir biçimde uygulaması yolunda var olan mutluluk seviyesinin etkin bir şekilde ölçülmesi önem arz etmektedir. Bu amaç doğrultusunda belki de en önemli adım, ölçmede kullanılan göstergelerin doğru bir şekilde tespit edilmesidir. Bu göstergelerin belirlenmesinde toplanan veriye dayalı bir analitik model aramak ve belirlenen uygun modelin geçerliliğini ortaya koyarak politika yapıcılara yol göstermek, veri bilimi ile uğraşan araştırmacıların en temel görevlerinden biridir. Bu çalışmanın amacı, 2022 yılına ait Dünya Mutluluk Raporu veri seti üzerinde mutluluk endeksine ilişkin etkili değişkenleri saptamak ve makine öğrenmesi modelleri ile bir sınıflandırma uygulaması yapmaktır. Uygulamanın ilk aşamasında en uygun sayıda ve nitelikte değişkenlerin alt kümesinin belirlenmesi amacıyla sarmal teknikler ailesinde yer alan yinelemeli öznitelik eleme yönteminde açgözlü arama (greedy search) kullanılmış ve böylece model performansını optimize etmek amaçlanmıştır. Etkili ve optimal sayıda değişkenlerin yer aldığı değişken altkümesi, lojistik regresyon, rasgele orman, destek vektör makinesi, gradian boosting ve k-nn gibi farklı denetimli öğrenme metodları kullanılarak modellenmiştir. Çalışmada kullanılan makine öğrenmesi modellerinin kendine has parametreleri bulunmaktadır ve modellere ait aşırı uyum (overfitting) ve az uyum (underfitting) dengesini sağlamak amacıyla hiperparametre optimizasyonu yapılmıştır. Çalışmanın sonuçları arasında sosyal destek değişkeninin mutluluk skoru için en kritik gösterge olduğu tespit edilmiştir. Farklı performans metrikleri kullanılarak kıyaslanan makine öğrenmesi modellerinden en yüksek performansın ise destek vektör makineleri olduğu söylenebilmektedir.