Asumsi Dasar Dalam Statistik Parametrik
Berdasarkan definisinya, Statistik parametrik adalah ilmu statistik yang memperhatikan jenis sebaran atau distribusi suatu data. Artinya dalam distribusi data statistik mempertimbangkan apakah data yang kita miliki dapat menyebar secara normal atau tidak. Data yang kita miliki nantinya akan masuk dalam proses analisis dan pengolahan data. Dalam perlakuan analisis data menggunakan statistik parametrik perlu memenuhi asumsi normalitas. Pada umumnya ketika asumsi ini tidak lulus maka harus beralih metode tidak bisa dipaksakan hanya menggunakan satu metode. Pilihannya adalah mengganti metode dari statistik parametrik menjadi statistik nonparametrik. Kalau tidak ingin mengganti, bisa menggunakan transformasi atau modifikasi data agar bisa sesuai dengan asumsi yang ditentukan. Dengan demikian kamu tidak perlu repot untuk beralih menggunakan metode lain. Berdasar ada-tidaknya asumsi yang mendasari suatu uji statistik, terdapat dua jenis statistik inferensial, yaitu statistik parametrik dan statistik non-parametrik. Statistik non-parametrik atau statistik bebas sebaran (distribution free) sekalipun mudah untuk dimengerti dan relatif sederhana perhitungannya, namun ia memiliki test-power yang rendah.
Hal ini terjadi karena statistik non-parametrik selain tidak menggunakan asumsi-asumsi yang mendasari, juga hanya dirancang untuk data nominal dan ordinal, yang diketahui tingkat kecermatannya lebih rendah dibandingkan data interval dan rasio. Harap dicatat bahwa apabila alat pengumpul data dalam penelitian dapat memperoleh data yang gejalanya interval atau rasio, jangan mengubah atau mengkonversikan data tersebut menjadi data nominal atau ordinal, karena hal itu akan menurunkan kecermatan kesimpulannya. Namun sebagai konsekuensinya peneliti harus menggunakan analisis data melalui statistik parametrik, yang didasari oleh asumsi-asumsi tertentu. Sehingga persoalan yang dapat muncul kemudian adalah, bagaimana kalau asumsi-asumsi tersebut tidak dapat dipatuhi atau dilanggar? Mari kita cari tahu lebih dalam soal asumsi-asumsi dalam uji statistik parametrik. Pada artikel DQLab kali ini, kita akan membahas mengenai asumsi-asumsi dalam statistik parametrik. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data, peneliti maupun data enthusiast. Jangan lewatkan artikel berikut ini, pastikan simak baik-baik, stay tune and keep scrolling on this article guys!
1. Asumsi Dasar Uji Statistik Parametrik
Minium dan Clarke (1982) menyebutkan asumsi-asumsi yang mendasari pemakaian analisis varians adalah:
(1) Masing-masing populasi darimana sampel-sampel diambil berdistribusi normal, dan
(2) Varians dari kelompok-kelompok sampel yang dibandingkan adalah sama atau homogen.
Asumsi penggunaan teknik analisis varians menurut Hadi (1994) adalah:
(1) Pengambilan sampel dari populasinya dilakukan secara random
(2) Distribusi skor variabel dependennya adalah normal
(3) Varians antara kelompok-kelompok sampel yang akan diperbandingkan adalah homogen.
Dari pendapat-pendapat di atas asumsi normalitas dan varians yang homogen selalu ada, sedangkan asumsi yang lain, yaitu random sampling dan data variabelnya paling tidak interval, tidak selalu ada, yang menurut Kerlinger dan Pedhazur (1973) hal tersebut lebih merupakan persoalan teknis. Asumsi random sampling menyangkut dengan cara bagaimana sampel-sampel itu diambil, sedangkan asumsi pencapaian paling tidak data interval pada variabel dependennya dapat dijumpai dalam definisi operasional. Asumsi normalitas dapat diuji dengan goodness of fit, sedangkan asumsi homogenitas varians dapat diuji dengan menggunakan data sampel dengan melakukan multiple t test. Namun agar pengujiannya tidak berulang-ulang maka yang umum dipakai adalah dengan œBartlett"s Test for Homogeneity Variance
Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik
2. Asumsi Dasar Regresi Berganda
Analisis regresi memuat beberapa asumsi-asumsi seperti pertama sampel diambil secara random dari populasinya. Kedua variabel tergantung dan variabel independennya bersifat continous (rasio, interval ataupun ordinal). Selain itu, varians skor variabel dependennya adalah sama atau homogen pada masing-masing skor variabel independen. Dari asumsi-asumsi yang dikemukakan di atas terdapat satu asumsi yang sama, yaitu normalitas pada variabel dependennya. Sedangkan hubungan yang linear antara variabel-variabel independen dan variabel dependen tidak merupakan asumsi menurut Kerlinger dan Pedhazur.
Penulis tidak tahu secara pasti kenapa demikian, namun kemungkinan karena Kerlinger dan Pedhazur memandang variabel-variabel independen dalam analisis regresi (ganda), yang sebenarnya bersifat continuous dikategorisasikan dalam kumpulan skor beberapa variabel independen; sehingga asumsi-asumsi yang dikemukakan tidak berbeda dengan asumsi-asumsi yang mendasari analisis varians. Bahkan Kerlinger dan Pedhazur (1973) secara tegas mengatakan bahwa tidak ada asumsi apapun untuk menghitung koefisien korelasi, kecuali asumsi bahwa distribusi satu atau lebih variabel independennya sama dengan variabel dependennya. Dan ini dilakukan apabila penelitian terhadap sampel akan digeneralisasikan pada populasinya
3. Konsekuensi Jika Melanggar Asumsi Statistik Parametrik
Apakah asumsi-asumsi yang mendasari suatu uji statistik parametrik harus dipenuhi sebelum peneliti menggunakan uji statistik yang dimaksud? Konsekuensi apa saja yang dihadapi peneliti apabila satu atau lebih asumsi tidak dipenuhi atau dilanggar? Hinkle, dkk., (1979) mengatakan bahwa asumsi-asumsi tidak perlu diuji kecuali apabila ada kecurigaan bahwa satu atau lebih asumsi tidak terpenuhi. Kalau peneliti meyakini data variabel penelitiannya tidak memenuhi asumsi yang mendasari uji statistik yang akan digunakan, tapi ia tidak peduli, maka apa konsekuensinya? Umumnya pelanggaran terhadap asumsi-asumsi yang mendasari suatu uji statistik, mengakibatkan statemen-statemen probabilitasnya menjadi tidak tepat (Hinkle, dkk., 1979). Katakanlah misalnya hasil uji F diperoleh p=0,05; maka probabilitas kesalahan tipe I secara aktual bisa lebih atau bisa kurang dari 5%, tergantung pada bagaimana asumsi-asumsi itu dilanggar.
Kleinbaum dan Kupper (1978) mengatakan bahwa didalam uji t dan uji F sekalipun varians antara kelompok sampelnya tidak homogen, asal besarnya sampel-sampel tersebut sama, maka uji F tetap sensitif. Senada dengan pendapat tersebut dikemukakan oleh Minium (1970) bahwa heterogenitas varians antara kelompok-kelompok sampel tidak berpengaruh pada hasil uji F apabila jumlah subyek masing-masing kelompok sampel adalah besar dan sama. Selanjutnya Minium dan Clarke (1982) mengatakan semakin meningkat besarnya sampel maka sampling distribution of mean mendekati normal bahkan untuk populasi yang tidak normal sekalipun. Akibatnya nilai t yang diperoleh akan menjadi hampir akurat sekalipun populasinya tidak normal apabila besarnya sampel di atas 30 atau 40.
4. Prosedur Robust Statistics
Pengaruh pelanggaran terhadap asumsi-asumsi suatu uji statistik akan berbeda-beda sesuai dengan asumsi mana yang dilanggar. Jika hasil suatu prosedur statistik hanya berpengaruh kecil sekalipun ia melakukan pengabaian atau pelanggaran terhadap asumsi yang mendasarinya, maka prosedur itu disebut robust terhadap asumsi tersebut (Hinkle, dkk., 1979). Huber (dalam Wardati, 1998) mengatakan robustness (ketegaran) memiliki arti ketidakpekaan/ketidaksensitifan terhadap penyimpangan-penyimpangan kecil dari asumsi. Robust statistics berkenaan dengan pengembangan prosedur statistik yang tidak mudah terganggu oleh penyimpangan kecil pada asumsi yang mendasarinya, misalnya outlier. Hinkle, dkk. (1979) mengatakan bahwa teknik statistik analisis varians bersifat robust terhadap tidak terpenuhinya asumsi atau pelanggaran asumsi, kecuali pada kasus besarnya sampel dan varians yang tidak sama. Anderson (dikutip Kerlinger dan Pedhazur, 1973) menyebutkan bahwa uji t dan uji F secara meyakinkan telah membuktikan diri sebagai statistik yang strong dan robust. Oleh sebab itu pengabaian terhadap asumsi-asumsi yang mendasari kedua uji statistik tersebut tidak akan berpengaruh banyak terhadap kesimpulan penelitian
Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika
5. Belajar Statistika Sampai Mahir Bersama DQLab!
Agar skill statistik kamu semakin terasah, tidak salah lagi jika kamu bisa upgrade skillmu bersama DQLab! Kamu bisa loh untuk coba bikin akun gratisnya kesini di DQLab.id dan lakukan signup untuk dapatkan info-info terbaru serta belajar data science. Banyak benefit yang bisa kamu dapatkan jika kamu bergabung untuk belajar bersama DQLab! Nikmati pengalaman belajar data science yang menarik dan cobain berlangganan bersama DQLab yang seru dan menyenangkan dengan live code editor. Cobain juga free module Introduction to Data Science with R dan Introduction to Data Science with Python untuk menguji kemampuan data science kamu gratis! Jika ingin berlangganan kalian bisa mendapatkan benefit yang beragam salah satunya mencoba modul platinum dan career track.
Dapatkan keuntungan-keuntungan yang didapatkan salah satunya tidak perlu install software tambahan. Karena kalian belajar secara langsung terhubung dengan live code editor dari device yang kalian gunakan. Kalian juga bisa mencoba studi kasus penerapan real case industry. Jika kamu kesulitan dalam proses pembelajaran di DQLab, kamu bisa loh gabung ke discord kita untuk menanyakan hal-hal yang kurang jelas dan bingung bagaimana cara penyelesaiannya. Kamu juga diberikan kesempatan mendapatkan job connector dari perusahaan ternama di ranah industri data. Uniknya kamu bisa langsung apply dari akun kamu loh. So, tunggu apalagi, buruan SIGNUP Sekarang ya!
Penulis: Reyvan Maulid