Friday, February 20, 2015

Logistic Regression

Catatan Logistic Regression ini saya ambil dari banyak situs, semoga informasinya bermanfaat bagi siapa saja yang ingin belajar.
Dari situs : https://teorionline.wordpress.com saya mendapat beberapa informasi tentang Logistic Regression.

Regresi logistic merupakan salah satu analisi multivariate, yang berguna untuk memprediksi dependent variabel berdasarkan variabel independen.

bercanda aja...

Ada 3 macam Logistic Regression yang telah saya pelajari, yaitu Binary Logistic Regression, Multinominal Logistic Regression dan Ordinal Logistic Regression.

Jika dilihat dari datanya, dependen variabel, maka pada Logistic Regression, dependen variabel adalah variabel dikotomi (kategori).

Ketika kategori variabel dependennya berjumlah dua kategori maka digunakan Binary Logistic, dan ketika dependen variabelnya lebih dari dua kategori maka digunakan Multinominal Logistic Regression. Lalu ketika dependen variabelnya berbentuk ranking, maka disebut dengan Ordinal Logistic Regression, contohnya variabel dependen pada data set Vermont voters yang menghitung tingkat kepuasan sistem pengadilan bidang kriminal (Doble, 1999) [1], yang menilai hakim dengan skala Poor (1), Only Fair (2), Good (3) dan Excelent (4).

Seringkali kita merasa bingung, mau menggunakan yang mana untuk data set kita. Berikut saya menterjemahkan dari situs http://stats.stackexchange.com
Judul pertanyaannya adalah :
Using logistic regression for a continuous dependent variable
Anda bisa klik judul pertanyaan untuk masuk ke halaman situs aslinya.
Di sana, penanya memiliki jenis data tabel seperti yang ada di gambar berikut ini :


Dimana score merupakan variabel dependent nya. Pada paper yang dibuat, si penanya menggunakan linear regression dan mendapat komentar :
"Hasil yang diperoleh dari satu model tidak cukup meyakinkan terutama regresi linier biasanya memiliki kekurangan dalam menangani outlier. Saya sarankan penulis juga mencoba regresi logistik dan membandingkan hasil yang sesuai dengan hasil saat ini. Jika pengamatan yang sama diperoleh, hasilnya akan lebih solid."

Pertanyaannya Apakah tabel data diatas dengan score sebagai dependent variable dapat dimodelkan dengan regresi logistik yang secara teori dikatakan bahwa variabel dependen pada logistic regression bersifat dikotomi.

Professor Frank Harrell dari Department of Biostatistics at Vanderbilt University School of Medicine, Nashville TN USA, menjawab : "Kemungkinan proporsional ordinal model regresi logistik dapat bekerja dengan baik untuk masalah ini. Untuk implementasi yang efisien yang dapat memungkinkan ribuan nilai Y yang unik coba lihat fungsi orm dalam paket R rms."

Professor Frank Harrell juga memberikan handout tentang jawabannya tersebut, klik disini.

[1] http://www.norusis.com/pdf/ASPC_v13.pdf halaman 72

No comments:

Post a Comment