Cari Blog Ini

Rabu, 18 November 2015

Application of Variable Selection Methods to determine the Dominant Factors that Affect Education and Health

Education and health are the main components that affect human development. The degree of education and health is influenced by various factors. However, there are several factors that most influential. Therefore, the aim of this paper is to determine the dominant factors that affect education and health using variable selection methods. The main principle of variable selection method is to determine the variables included in the regression model, in order to obtain the best regression model. Variable selection method that used in this script are all possible regression method, stepwise regression method, backward elimination method, and forward substitution method. Selected variables are intersection between stepwise regression method, backward elimination method and forward substitution method. The selected variables then were compared with variables resulted from all possible regression method. In the health sector, the indicators used are life expectancy rate and infant mortality rate. The process of variable selection on both indicators produces the same dominant factors, that is doctor and paramedic. In the education sector, the indicators used are years of schooling and the literacy rate. In the years of schooling indicator, the number of colleges and gross enrolment rate of junior high school become the most influential factors. While in the literacy rate indicator, the selected factor is gross enrolment rate of primary school. Based on the results of the variables selections on each method, stepwise regression method can be taken as the best method. In stepwise regression method, combination of forward substitution method and backward elimination method can be seen. This method also produces the same selected variables with all possible regression methods.
 
Pendidikan dan kesehatan merupakan komponen utama yang mempengaruhi pembangunan manusia. Derajat pendidikan dan kesehatan dipengaruhi oleh berbagai faktor. Akan tetapi terdapat beberapa faktor yang paling berpengaruh. Oleh karena itu, tujuan dari karya ilmiah ini adalah untuk menentukan faktor dominan yang mempengaruhi pendidikan dan kesehatan dengan menggunakan metode variable selection. Prinsip utama dari metode variable selection adalah menentukan peubah yang dimasukkan ke dalam model regresi, sehingga pada akhirnya diperoleh model regresi terbaik. Metode variable selection yang digunakan adalah metode semua kemungkinan regresi, metode regresi bertatar, metode eliminasi langkah mundur, dan metode substitusi langkah maju. Peubah terpilih merupakan irisan antara metode regresi bertatar, metode eliminasi langkah mundur, dan metode substitusi langkah maju. Kemudian peubah terpilih tersebut dibandingkan dengan peubah yang dihasilkan dari metode semua kemungkinan regresi. Pada bidang kesehatan, indikator yang digunakan adalah Angka Harapan Hidup dan Angka Kematian Bayi. Proses variable selection pada kedua indikator tersebut menghasilkan faktor dominan yang sama, yaitu dokter dan mantri. Pada bidang pendidikan indikator yang digunakan adalah lama sekolah dan Angka Melek Huruf. Pada indikator lama sekolah, jumlah perguruan tinggi dan Angka Partisipasi Kasar SMP menjadi faktor yang paling berpengaruh. Sementara itu pada indikator Angka Melek Huruf, faktor terpilih adalah Angka Partisipasi Kasar SD. Berdasarkan hasil pemilihan peubah pada setiap metode, metode regresi bertatar dapat diambil sebagai metode terbaik. Pada metode regresi bertatar dapat dilihat kombinasi antara metode substitusi maju dan metode eliminasi mundur. Metode ini juga menghasilkan peubah terpilih yang sama dengan metode semua kemungkinan regresi.
 

Tidak ada komentar:

Posting Komentar