Kenalan dengan Statistika Inferensial, Yuk!
Statistika menjadi salah satu ilmu yang banyak diminati akhir-akhir ini. Segala sesuatu yang berhubungan dengan data seakan memiliki magnet tersendiri untuk menarik minat orang yang bergelut di bidang data untuk mempelajarinya. Banyak orang yang telah menyadari betapa pentingnya data untuk membuat keputusan di berbagai bidang, mulai dari perbankan, ritel, olahraga, hingga industri kreatif. Pembuatan keputusan yang dilandaskan dengan data dapat membuat keputusan yang diambil bersifat objektif dan tidak hanya berdasarkan perasaan saja.
Perkembangan ilmu Data Science juga ternyata didasari oleh beberapa ilmu yang telah ada sebelumnya, salah satunya adalah statistika. Sehingga untuk bisa menguasai ilmu Data Science, kita juga harus memahami ilmu statistika. Tidak perlu mahir, cukup menguasai beberapa hal-hal basic yang sifatnya fundamental. Secara garis besar, statistika dibagi lagi menjadi dua kelompok besar, yaitu statistika deskriptif dan statistika inferensial. Nah, di artikel ini kita akan membahas mengenai statistika inferensial, mulai dari pengertiannya hingga bagian-bagian dari statistika inferensial ini. Penasaran kan? Yuk, simak artikelnya!
1. Statistika
Berbicara tentang data, statistika tentu memiliki hubungan yang sangat erat dengan data. Pada dasarnya, ilmu ini akan membahas tentang cara memproses data dari awal proses pengumpulan data hingga tahapan akhir dimana hasil analisis akan diinterpretasikan. Awalnya ilmu ini merupakan bagian dari matematika, namun seiring perkembangan dunia pendidikan dan banyaknya peminat akan ilmu ini, statistika mulai berdiri sendiri. Statistika juga berhubungan erat dengan probability atau peluang, terutama di statistika inferensial.
Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika
2. Statistika Inferensial
Statistika inferensial merupakan salah satu bagian dari statistika. Umumnya, pada statistika inferensial akan menggunakan data sampel, bukan populasi, sehingga tidak mengherankan jika statistika inferensial akan banyak menggunakan pengujian hipotesis untuk bisa mengestimasi nilai untuk populasi. Pemilihan sampel yang digunakan juga tentu tidak diambil secara sembarangan, melainkan ada perhitungan tertentu menggunakan teknik sampling yang ada. Pokok utama dari statistika inferensial adalah pengujian hipotesis dan estimasi parameter (karakteristik populasi). Statistika inferensial kemudian terbagi lagi menjadi dua bagian, yaitu statistika parametrik dan non parametrik.
3. Statistika Parametrik
Statistika parametrik merupakan salah satu bagian dari statistika inferensial, dimana ada beberapa syarat yang harus dipenuhi sehingga data sampel yang digunakan akan diuji terlebih dahulu apakah memenuhi asumsi yang ada atau tidak. Beberapa asumsi yang harus dipenuhi untuk bisa dikatakan data tersebut sebagai statistika parametrik adalah jumlah data yang lumayan besar (biasanya lebih dari 30), berdistribusi normal, variansi yang relatif sama sehingga tidak boleh ada data yang outlier nya cukup ekstrim, serta asumsi independensi. Beberapa contoh metode yang bisa digunakan untuk statistika parametrik adalah:
Korelatif : Regresi Linear, Pearson
Komparatif : ANOVA
4. Statistika Non Parametrik
Statistika non parametrik merupakan kebalikan dari statistika parametrik. Biasanya, jika dari hasil pengujian statistika parametrik yang telah dilakukan, data sampel tidak bisa memenuhi asumsi-asumsi yang ada, maka akan dikategorikan sebagai statistika non parametrik. Di statistika parametrik ini, data dalam distribusi apapun bisa digunakan. Selain itu, sampel yang ada juga tidak perlu dilakukan pengujian asumsi lagi. Biasanya data yang digunakan pada statistika non parametrik ini berukuran kecil (kurang dari 30 sampel data). Beberapa contoh metode yang bisa digunakan untuk statistika non parametrik adalah:
Korelatif : Spearman Kendall, Kai
Komparatif : Man-Whitney, Kruskal-Wallis
Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika
5. Belajar Analisis Data di DQLab, Yuk!
Untuk mempelajari proses analisis data lebih lanjut, kamu bisa mulai belajar di DQLab, loh. Nah, DQLab sendiri merupakan lembaga kursus khusus untuk bidang Data Science yang dilakukan secara online. Ada banyak modul yang ditulis dalam bahasa yang ringan dan menarik dengan menggunakan bahasa pemrograman yang umum digunakan oleh praktisi data, seperti R, Python, dan SQL. Selain modul premium, kamu juga bisa menikmati free modul, loh. Yuk, tunggu apalagi, buruan daftar di DQLab dan nikmati semua modul yang ada!
Penulis : Gifa Delyani Nursyafitri