Analisis Statistik Kenali Regresi Logistik, Yuk!
Analisis statistika sering banget ditemukan saat kita harus berurusan dengan data. Apa sih yang kalian pikirkan ketika berbicara tentang data? Biar aku tebak, pasti tanpa sadar kalian akan memikirkan tentang statistika juga. Statistika memang tidak bisa jauh-jauh dari data, itulah mengapa para praktisi data dituntut untuk memiliki kemampuan statistika, tidak perlu mahir namun setidaknya memahami basic nya. Statistika akan banyak digunakan dalam proses analisis data, bahkan kita sudah bisa memanfaatkan statistika dari tahap awal menentukan sampel data.
Salah satu jenis analisis data statistika yang masuk ke dalam bagian Machine Learning adalah regresi, dimana dengan metode ini kita bisa melihat hubungan antara variabel independen (X) dengan variabel dependen (Y). Regresi ini sangatlah bermacam-macam jenisnya, tidak hanya regresi linear saja. Ada beberapa keadaan yang membuat kita harus memperhatikan distribusi dari data, hal ini kemudian akan melahirkan jenis regresi yang berbeda, misalnya regresi logistik binomial dan regresi logistik multinomial. Nah, untuk memahami tentang regresi logistik ini, yuk kita bahas bareng!
1. Apa Sih Analisis Statistik Itu?
Tahukah kamu bahwa ilmu Statistika itu bisa gunakan untuk pemrosesan data dari awal hingga akhir? Statistika sendiri adalah ilmu yang mempelajari tentang cara merencanakan, mengumpulkan, menganalisis, menginterpretasikan, sampai akhirnya mempresentasikan data. Dalam penelitian, kita tidak hanya dituntut untuk memperhatikan pemilihan metode analisis yang akan digunakan, namun kita harus mulai memperhatikan dari tahap awal merencanakan berapa sampel yang akan diambil, pengujian kevalidan dan reliabilitas dari data, serta cara menyajikan hasil analisis juga harus diperhatikan.
Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik
2. Analisis Regresi Logistik Biner (Binomial)
Dalam artikel œBelajar Statistika, Kenali Distribusi Data dalam Metode yang Tepat, kita sudah sempat membahas tentang distribusi data, beberapa diantaranya adalah binomial dan multinomial. Dalam analisis regresi logistik biner akan memanfaatkan data yang berdistribusi binomial, dimana hanya ada dua kemungkinan yang akan terjadi di variabel Y yaitu sukses atau gagal. Pada dasarnya, distribusi binomial ini merupakan generalisasi dari distribusi bernoulli, dimana jika pada bernoulli percobaan yang dilakukan hanya 1 kali, sementara pada binomial percobaannya dilakukan n kali. Sehingga fungsi dari variabel Y untuk regresi logistik biner bisa mengikuti fungsi di distribusi bernoulli.
3. Analisis Regresi Multinomial
Regresi logistik multinomial merupakan salah satu jenis regresi logistik yang dimana isi variabel Y nya berupa data kualitatif dengan lebih dari dua kategori serta variabel X nya adalah satu atau bisa lebih dari satu variabel independen. Regresi multinomial juga sering disebut sebagai model logit politomus. Kira-kira kalian bisa tebak gak apa distribusi yang digunakan dalam regresi jenis ini? Yup, betul sekali. Data-data yang digunakan untuk analisis regresi logistik multinomial adalah data-data yang berdistribusi multinomial juga.
4.Teknik Memilih Model Terbaik
Dalam regresi logistik, pasti akan ada tahapan untuk memilih model mana yang terbaik untuk digunakan. Ada beberapa cara, yaitu dengan metode forward dan backward.
Metode forward adalah algoritma memungkinkan kita untuk menambahkan variabel secara berurutan berdasarkan kriteria yang telah ditentukan sebelumnya, serta membuang variabel dari model secara bertahap. Proses ini akan dimulai dari model yang paling sederhana.
Metode backward adalah proses menyusun model lengkap dimana semua variabel akan dimasukkan ke dalam model. Kemudian variabel tersebut akan diuji apakah signifikan di dalam model atau tidak atau apakah mempengaruhi model atau tidak. Variabel yang tidak mempengaruhi model akan dibuang satu persatu hingga didapatkan model terbaik.
Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika
5. Belajar Metode Statistik di DQLab, Yuk!
Untuk menguasai ilmu Data Science, tentu kamu harus menguasai ilmu yang mendasarinya. Salah satunya adalah statistika. Kamu bisa mempelajari tentang basic statistika di DQLab loh. Caranya sangat gampang, kamu cukup bergabung untuk menjadi member DQLab dengan biaya yang sangat murah. Namun jika kamu masih ragu, kamu juga bisa mencoba free modul yang disediakan, yaitu œIntroduction to Data Science with R dan œIntroduction to Data Science with Python. Yuk, tunggu apa lagi? Buruan gabung dan nikmati semua fasilitasnya!
Penulis: Gifa Delyani Nursyafitri