World Happiness Report 2020

R ile Veri Analizi

Dilan Kaya
5 min readJan 26, 2021

2011 yılından bu yana Birleşmiş Milletler Konseyi tarafından, dünyadaki tüm ülkelere gönderilen anket çalışmasında insanlardan; Hayat Kalitesi (Quality of Life) faktörlerini dikkate alarak, ülkelerindeki gündelik yaşantılarında hissettikleri Ulusal Mutluluk (National Happiness) seviyesini derecelendirmeleri istenir. Bu çalışma her ülkeden özel olarak seçilen 1000 kişiyle yapılır. Kişilere ilk basamağı “0” , son basamağı “10” olarak belirtilen bir merdiven tasvir edilir ve şu anda kendilerini hangi basamakta hissettikleri sorulur.

Biz bu yazıda en son duyurulmuş olan 2020 World Happiness raporunu, R ortamında genel hatlarıyla inceleyeceğiz.

Öncelikle buradan xls formundaki verileri indiriyoruz. xls formundaki veri setimizi içe aktarırken “readxl” paketini yüklememiz gerekli.

library(readxl) worldhappiness<-read_excel(“C:\\Users\\Dilan\\Desktop\\2020\\WHR20_DataForFigure2.1.xls”, sheet=1)

2020 Dünya Mutluluk Raporunu keşfetmek adına birkaç şeye bakalım. Veri setimizin içinde bulunan satır ve sütun sayılarını görmek için nrow() ve ncol() komutlarını kullanıyoruz.

nrow(worldhappiness)

ncol(worldhappiness)

Raporda 153 ülke ve 20 sütun olduğu görülüyor. Bu sütun başlıkları; “Country Name”, “Regional indicator”, “Ladder score”, “Standard error of ladder score”, “upper whisker”, “lower whisker”, “Logged GDP per capita”, “Social Support”, “Healthy life expectancy”, “Freedom to make life choices”.. vs

Veri setimizin tipini görmek için class() komutunu kullanalım.

class(worldhappiness)

Bir dataframe olan veri setimizin boyutunu ve ilk birkaç değerini görelim.

dim(worldhappiness)

head(worldhappiness)

2017, 2018 ve 2019 yıllarında dünyanın en mutlu ülkesi seçilen Finlandiya, 2020'de de birinciliğini koruyor. Finlandiya’da ikamet edenler, OECD ülkelerine göre düşük eşitsizlik ve yoksulluk düzeyi ile yüksek yaşam kalitesi, güvenlik ve kamu hizmetlerinden yararlanıyor.

Şimdi de table() fonksiyonuyla verileri kategorik tablo haline getirelim ve bunu verimizde yer alan bölgelere göre yapalım.

table(worldhappiness$`Regional indicator`)

“tidyverse” paketini kullanarak veri setimizi kendi belirlediğimiz kriterlere göre keşfedelim.

library(tidyverse)

glimpse() komutu konsolda sütun isimlerini görerek daha rahat işlem yapmamızı sağlayacaktır.

dplyr::glimpse(worldhappiness)

Sadece ülkelerin isimlerini ve merdiven skorlarını görmek istersek select() komutunu kullanabiliriz.

select(worldhappiness, `Country name` , `Ladder score`)

Merdiven skorları büyükten küçüğe sıralı bir şekilde verilmiş olan verimizde 2020 yılına göre en mutlu ülkenin Finlandiya olduğu görülüyor. Bir de mutluluk skorlarını küçükten büyüğe sıralayarak en mutsuz ülkemize bakalım. Bunun için burada arrange() komutunu kullanabiliriz.

arrange(worldhappiness, `Ladder score`)

Bu sonuca göre en mutsuz ülkenin 2020 yılına göre Afganistan olduğu görülüyor. Zimbabwe, Güney Sudan ve Afganistan, şiddetli çatışmalar ve aşırı yoksulluk oranlarına sahip.

Genel hatlarıyla birkaç grafik inceleyelim. Bu grafikleri görmek için plot(), hist(), boxplot() komutlarını kullanalım.

plot(worldhappiness$`Ladder score`, main=”2020 happiness score by frequency”, xlab=”frequency”,ylab=”happiness score”)

hist(worldhappiness$`Ladder score`, main=”histogram of happiness score in 2020", xlab=”happiness score”)

boxplot(worldhappiness$`Healthy life expectancy` ~ worldhappiness$`Regional indicator`, xlab=”region”, ylab=”happiness score”, main=”boxplot of happiness score by country for 2020")

TÜRKİYE MUTLU MU?

Öncelikle mutluluk verilerimizin özetini summary() ile görelim.

summary(worldhappiness$`Ladder score`)

Burada tüm dünya bazında merdiven skorlarına baktığımızda minimum ve maksimum değerlerini 2.567 ve 7.809 olarak görmekteyiz. Aynı zamanda setin ortasında yer alan 5.515 medyan değerini de görüyoruz.

middleeast<- subset(worldhappiness, `Regional indicator` == “Middle East and North Africa”) middleeast

turkey<-filter(middleeast,`Country name` == “Turkey”) turkey

Bu sonuca göre ülkemiz 2020 dünya mutluluk skoruna göre ortalamanın altında kalıyor. Veri keşfimizi sadece Orta Doğu için sürdürerek ülkemizin Orta Doğu ülkeleri arasında kaçıncı sırada olduğuna da baktık. Buna göre ülkemiz çalışmada yer alan tüm ülkeler arasında merdiven skoruna göre 93. sırada yer alırken Orta Doğu ülkeleri arasında 7. sırada yer almaktadır. Yine head() fonksiyonu kullanarak Orta Doğu’da yer alan ilk 6 ülkenin mutluluk sıralamasını büyükten küçüğe görebiliriz.

head(middleeast)

Son olarak Orta Doğu ülkeleri için birkaç grafik inceleyelim.

hist(middleeast$`Ladder score`, main= “Hist of happiness score in Middle East and North Africa “, xlab=”Happiness Score”, breaks=17)

boxplot(middleeast$`Ladder score`~ middleeast$`Country name`, main= “Boxplot of happiness score ME and NA in 2020”, xlab=”Country”, ylab=”Happiness Score”)

plot(middleeast$`Ladder score` ~ middleeast$`Perceptions of corruption`, xlab=”trust”, ylab=”happiness score”)

plot(middleeast$`Ladder score` ~ middleeast$Generosity, main= “scatterplot of happiness score and generosity in 2020 in Middle East and North Africa”, xlab=”generosity”, ylab=”happiness score”)

--

--

No responses yet