Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Pengolahan Data Statistik Parametrik dan Non-Parametrik

Belajar Data Science di Rumah 07-Februari-2021
https://dqlab.id/files/dqlab/cache/ff59ae0723432c4c544051a204e470df_x_Thumbnail800.jpg

Salah satu kegunaan dilakukannya sebuah penelitian atau riset adalah menemukan jawaban atas pertanyaan penelitian yang diajukan oleh peneliti. Namun, sebagai seorang researcher atau bahkan peneliti pemula tentunya merasakan kebingungan untuk memilih pengolahan data statistik yang tepat. Pertanyaan ini muncul di benak seorang peneliti seperti uji statistik apa yang sekiranya cocok digunakan untuk penelitian yang akan dilakukan. Perlu untuk diketahui sahabat data, penggunaan pengolahan data statistik yang tepat akan memberikan kekuatan (power) terhadap hasil penelitian atau goals yang ingin dicapai melalui penelitian tersebut. Penelitian yang dilakukan harus berlandaskan ilmiah Artinya, penelitian yang telah dilakukan sudah dapat teruji dan terbukti jika peneliti lain menggunakan cara yang sama pasti akan memperoleh hasil yang sama pula. Dengan demikian, sebagai seorang peneliti dituntut perlu menguasai seputar metode penelitian sebelum melakukan sebuah penelitian. Setiap pengolahan data statistik tentunya memiliki tingkat kerumitan dan dasar analisisnya masing-masing. Oleh karena itu, peneliti perlu memutuskan penggunaan teknik pengolahan data statistik mana yang akan digunakan dalam sebuah riset.


Dalam statistika, pengolahan data statistik dibagi menjadi 2 tipe pengujian data yaitu statistik parametrik dan statistik non-parametrik. Penentuan kedua tipe pengujian ini didasarkan atas tujuan penelitian yang ingin dijawab, jenis data yang diperoleh maupun ukuran jumlah sampel yang digunakan dalam penelitian. Biasanya, seorang peneliti akan menggunakan salah satu dari kedua uji pengolahan data statistik ini. Misalnya ketika ingin menggunakan statistik parametrik berarti peneliti harus membutuhkan jenis data interval dan rasio. Sedangkan, penggunaan pengolahan data statistik non-parametrik memuat data nominal dan ordinal yang dibutuhkan oleh peneliti. Sebelum membahas lebih lanjut, perlu diketahui dan didalami terlebih dahulu penggunaan kedua tipe pengolahan data statistik ini agar tidak salah kaprah dan keliru dalam melakukan analisis data. Pada artikel DQLab kali ini, kita akan membahas tentang pengolahan data statistik parametrik dan non-parametrik yang biasanya digunakan dalam penelitian. Untuk itu, pastikan kalian simak baik-baik dan baca selengkapnya artikel berikut ini.


1.Mengenal Lebih Dalam Statistik Parametrik

Statistik parametrik adalah teknik statistik yang dapat digunakan untuk menguji hipotesis dengan melibatkan parameter populasi. Keterbatasan yang dimiliki oleh statistik parametrik adalah penggunaan jenis data minimal yaitu jenis data interval dan rasio. Syarat menggunakan statistik parametrik apabila kita dapat mengetahui sebaran populasi yang kita amati telah memenuhi distribusi normal. Penerapan penggunaan statistik parametrik biasanya diaplikasikan pada metode uji-z (1 atau 2 sampel), uji-t (1 atau 2 sampel), korelasi pearson, Perancangan Percobaan (1 or 2-way ANOVA parametrik), dan lain-lain. Statistik parametrik merupakan pengolahan data statistik yang dianjurkan dalam penelitian. Hal ini dikarenakan banyak kelebihan dari segi output yang dihasilkan, namun persyaratan pengujian yang juga terbilang rumit. Salah satu persyaratan pengujian dalam pengolahan data statistik adalah ukuran sampel. 

Parametric and Non-parametric tests for comparing two or more groups |  Health Knowledge

Ukuran sampel yang biasanya menjadi perdebatan bahwa dengan menggunakan statistik parametrik harus memiliki sampel dalam jumlah yang besar. Berdasarkan temuan dari Statmat.id, pernyataan ini belum tentu benar. Ukuran besar kecilnya sampel sangat relatif. Hal ini diindikasikan bahwa besar kecilnya sampel tidak serta-merta menjadi patokan apakah kita menggunakan statistik parametrik atau non parametrik. Banyak literatur yang mengatakan bahwa ukuran sampel yang dikatakan besar lebih besar dari 40, ada juga yang berpendapat bahwa sampel dikatakan besar jika lebih besar atau sama dengan 30. Hal ini mengasumsikan bahwa sampel besar atau kecil dibatasi 30 keatas dikategorikan "besar" dan jika 29 kebawah berarti digolongkan sebagai sampel "kecil". Asumsi diatas berdasarkan central theorem limit (teorema limit terpusat).


Baca juga : Ini yang Akan Kamu Pelajari di Kelas Data Science DQLab!


2.Mengenal Lebih Dalam Statistik Non-Parametrik

Lain halnya dengan statistik non parametrik, pengolahan data statistik ini tidak melakukan pendugaan sebelumnya. Jika dalam pengolahan data statistik parametrik perlu dilakukan pendugaan maka untuk statistik non-parametrik tidak melibatkan pendugaan dalam nilai populasi. Statistik non-parametrik adalah salah satu metode statistik yang dapat digunakan sebagai alternatif apabila metode statistik parametrik tidak dapat dilakukan. Jika uji parametrik dapat digunakan untuk melihat perbedaan antara rata-rata nilai tengah 2 kelompok daratan yang sudah diberi ranking, dengan data yang sama metode uji statistik non parametrik dapat digunakan untuk melihat perbedaan antara median mediannya. Penggunaan statistik non-parametrik dapat diuji melalui jenis data nominal dan ordinal. Penerapan statistik non-parametrik juga biasanya banyak dijumpai di kasus-kasus penelitian ilmu sosial. Contoh metode yang dipakai dalam pengolahan data statistik non-parametrik adalah chi-square test, korelasi spearman, probabilitas fisher, wilcoxon test dan masih banyak lagi yang lainnya. Singkat kata perbedaannya kalau datanya memiliki sebaran atau distribusi normal, maka digunakan statistika parametrik. Kalo data tidak memiliki sebaran normal, maka digunakan statistika nonparametrik


Baca juga : Mengenal Profesi Data Scientist


3.Keuntungan dan Kerugian Pengolahan Data Statistik Parametrik dan Non-Parametrik

Meskipun demikian, tentunya kita sebagai peneliti perlu memposisikan penelitian kita cocok untuk penggunaan tipe pengolahan data statistik yang mana. Setelah mengetahui kedua jenis pengujian, mari kita simak keuntungan dan kerugiannya. Keuntungan penggunaan pengolahan data statistik parametrik adalah tidak perlu dilakukan pengujian terhadap parameter populasi karena sudah dianggap memenuhi syarat. Kemudian, data observasi dianggap saling bebas dan diambil dari populasi yang memiliki distribusi normal dengan varian yang homogen. Asumsi-asumsi yang rumit tersebut membuat pengujian menggunakan metode parametrik dapat diandalkan akurasinya. Sedangkan, kerugian statistik parametrik adalah populasi harus memiliki varian yang sama. Tentu hal ini merupakan hal yang sulit karena kenyataannya semua varian dari populasi tidak diketahui. Variabel variabel yang diteliti terbatas hanya untuk jenis data dengan skala minimal adalah interval dan rasio. Distribusi populasi harus diketahui berdistribusi normal. Jika belum diketahui tentu harus dicari terlebih dahulu menggunakan uji normalitas.


Penggunaan statistik non-parametrik juga memuat keuntungan dan kerugiannya, sahabat data. Keuntungannya adalah mudah dilakukan karena tidak membutuhkan asumsi normalitas. Secara umum metode perhitungan yang digunakan tidak menggunakan perhitungan perhitungan matematik yang rumit. Pengujian hipotesis dilakukan secara langsung pada pengamatan nyata karena data umumnya bersifat kualitatif sehingga terkadang tidak dibutuhkan jenjang atau urutan. Dapat juga digunakan untuk kelompok populasi berdistribusi normal sebagai uji pembanding statistik parametrik. Kerugian statistik non-parametrik adalah hasil uji metode statistik non parametrik tidak dapat digunakan untuk mengestimasi karakter populasi. Karena prosesnya sederhana dan cenderung menggunakan sampel kecil dan tidak berdistribusi normal. Selain itu penggunaan metode statistik non parametrik hanya membandingkan dua kelompok tertentu. Tidak melibatkan parameter populasi dalam uji hipotesis. Skala yang digunakan bersifat lebih lemah dan asumsi pada metode statistik parametrik tidak dipenuhi.


 

4. Yuk, BELAJAR DATA SCIENCE GRATIS DI DQLAB SELAMA 1 BULAN                                         


Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Buka academy.dqlab.id dan pilih menu redeem voucher 

  3. Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi. 

  4. Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.

Penulis: Reyvan Maulid Pradistya

Editor : Annissa Widya Davita


Postingan Terkait

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login