Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Mengenal Pengertian Statistika dan Unsur Penting Di Dalamnya

Belajar Data Science di Rumah 20-April-2022
https://dqlab.id/files/dqlab/cache/105e1f964283034e829e2ef6ed84b83c_x_Thumbnail800.jpg

Pengertian statistika adalah ilmu mengumpulkan, menganalisis, menampilkan, dan menafsirkan data. Statistika digunakan di berbagai bidang industri, mulai dari pemerintahan hingga pendidikan. Pemerintah membutuhkan statistika untuk melakukan sensus data mengenai suatu studi, misalnya aktivitas ekonomi yang ada di masyarakat. Saat ini kebutuhan data untuk berbagai bidang sangat tinggi. Data ini dikelompokkan menjadi beberapa variabel yang dibutuhkan untuk diolah agar menghasilkan insight yang berharga bagi suatu industri. Dengan adanya statistika, industri akan lebih mudah untuk mengukur sesuatu dengan tepat sehingga pekerjaan yang akan dilaksanakan akan lebih efektif.


Data adalah bahan bakar agar statistika dapat diaplikasikan di berbagai bidang. Data dapat dikatakan sebagai fakta yang dikumpulkan, dianalisis, dan disimpulkan untuk presentasi dan interpretasi. Data bisa diklasifikasikan sebagai data kualitatif dan data kuantitatif. Kuantitatif data merupakan data yang mengukur berapa banyak suatu item atau objek sedangkan data kualitatif menyediakan label, nama, kategori untuk suatu objek. Selain data, ada unsur penting dalam statistika yang tidak akan terlepas ketika kita bersinggungan dengan statistika. Penasaran apa saja unsur tersebut? Yuk simak artikel ini sampai akhir!


1. Peluang

Peluang adalah subjek yang berhubungan dengan ketidakpastian. Secara umum, peluang dapat dianggap sebagai ukuran numerik dari kemungkinan bahwa suatu peristiwa tertentu akan terjadi. Nilai probabilitas ditetapkan pada skala nol hingga satu, dimana nilai yang mendekati nol menunjukkan bahwa suatu peristiwa tidak mungkin terjadi dan nilai yang mendekati satu menunjukkan bahwa suatu peristiwa mungkin terjadi. Namun, bagaimana jika nilainya ada di tengah-tengah alias 0,5? Well peristiwa yang memiliki peluang 0,5 memiliki kemungkinan yang sama untuk terjadi dan tidak terjadi.

statistik


Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik


2. Outlier

Terkadang, kumpulan data pada suatu variabel mengandung beberapa nilai yang sangat kecil dan sangat besar dibandingkan dengan data-data lainnya. Nilai ekstrim ini dikenal sebagai outlier atau pencilan yang sering masuk dalam dataset. Ahli statistika biasanya mengidentifikasi outlier dan meninjau tiap angkanya hingga kemudian memutuskan apakah data ekstrim tersebut akan diikutsertakan dalam analisis atau tidak. Outlier ini akan sangat mempengaruhi hasil analisis sehingga harus dilakukan treatment khusus untuk menanganinya. Ada beberapa case yang mengharuskan kita menghapus outlier, namun ada juga case yang masih bisa ditoleransi.

statistik


3. Tabular 

Tabel tabular yang paling umum digunakan untuk satu variabel adalah distribusi frekuensi. Tabel distribusi frekuensi menunjukkan jumlah nilai data di masing-masing kelas yang tidak overlapping. Tabel tabular lainnya disebut dengan distribusi frekuensi relatif yang menunjukkan fraksi atau persentase dari nilai data di tiap kelas. Jika variabel yang digunakan lebih dari satu, maka tabel ini dikenal dengan tabel tabulasi silang yang merupakan analog dua variabel dari distribusi frekuensi.

statistik


4. Statistik Deskriptif

Statistik deskriptif adakah ringkasan data tabular, grafik, dan numerik yang bertujuan untuk mempermudah penyajian dan interpretasi data. Jika kita hanya menggunakan satu variabel (variabel tunggal) maka kita bisa menggunakan statistik deskriptif univariat sedangkan statistik deskriptif multivariat digunakan untuk memahami hubungan antara dua atau lebih variabel. Statistik deskriptif merupakan metode statistika paling sederhana yang bisa digunakan untuk menjawab pertanyaan dasar seperti berapa banyak, seberapa sering, dan lain sebagainya.


Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika


5. Belajar Mengaplikasikan Statistika dengan R dan Python

Statistika dapat diaplikasikan di berbagai tools termasuk bahasa pemrograman R dan Python. Ingin belajar bagaimana caranya? Yuk belajar dengan modul dari DQLab! Modul DQLab dilengkapi dengan live code editor sehingga bisa praktik langsung menggunakan data yang mencerminkan data real di dunia industri di modul DQLab tanpa install software tambahan. 


Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses modul gratis "Introduce to Data Science" dengan R dan Python sebagai langkah awal mengenal R dan Python serta nikmati ebook gratis 24 jam dari DQLab. Selamat belajar!


Penulis: Galuh Nurvinda K

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login