Pengolahan Data Statistik : Kenali Jenis Data yang Ada dalam Statistika
Pengolahan data Statistik adalah hal yang sangat erat kaitannya dengan ilmu Data Science. Sebagaimana yang kita ketahui bahwa Data Science merupakan ilmu gabungan yang terdiri dari Statistika/Matematika, Pemrograman, dan juga Bisnis. Sehingga memahami dan menguasai pengolahan data statistik menjadi hal yang sangat penting dalam proses belajar Data Science.
Beberapa orang mungkin masih ada yang belum bisa membedakan antara statistika dan matematika. Sekilas memang terlihat mirip karena keduanya sama-sama berhubungan dengan angka. Namun ternyata, statistika merupakan bagian kecil dari matematika. Statistika merupakan ilmu yang digunakan untuk mempelajari cara mengumpulkan data, menyajikan data, menganalisis data serta menginterpretasikan data, serta menarik kesimpulan dari data tersebut.
Sebelum masuk ke pembahasan mengenai metode pengolahan data statistik, ada baiknya kita memahami terlebih dahulu jenis-jenis data yang ada. Dalam artikel ini kita akan membahas mengenai jenis data berdasarkan sumbernya, berdasarkan jenisnya, serta skala pengukuran yang ada. Hal-hal yang paling dasar dari statistika namun sangat berpengaruh besar dalam proses pemahaman data. Sudah penasaran kan? Yuk, simak artikelnya!
1. Jenis Data Berdasarkan Sumbernya
Data berdasarkan sumbernya terbagi menjadi 2, yaitu data primer dan data sekunder. Data primer merupakan data yang didapatkan atau dikumpulkan secara langsung, misalnya dengan melakukan observasi, wawancara, survey, atau melakukan penelitian secara langsung di lapangan atau di laboratorium. Contohnya saja, penyebaran kuisioner untuk mengetahui sentiment masyarakat, dll.
Sedangkan data sekunder merupakan data yang diambil atau didapatkan dari pihak lain. Data sekunder ini biasanya bisa diambil di website penyedia data seperti BPS, BMKG, LIPI, dll. Namun seiring perkembangan teknologi yang semakin pesat, kini ulasan-ulasan yang ada di website seperti Traveloka, Tripadvisor juga sudah bisa diambil dengan menggunakan web-crawling.
Baca juga : Ini yang Akan Kamu Pelajari di Kelas Data Science DQLab!
2. Data Berdasarkan Jenisnya
Data ketika dibedakan berdasarkan jenisnya juga terbagi menjadi 2, yaitu data numerik atau dikenal dengan data kuantitatif dan data kategorik atau biasa juga disebut sebagai data kualitatif. Dari namanya, kedua data ini sudah dapat ditebak berisi data yang seperti apa. Data numerik merupakan data yang berisi angka, bisa berupa angka pengukuran, angka urutan, dan lain sebagainya. Misalnya saja: berat badan, pendapatan per kapita, jarak tempuh, dll. Sedangkan data kategorik merupakan data yang berisi kategori-kategori. Umumnya data kategori dapat berupa klasifikasi. Misalnya saja kategori ukuran sebuah wilayah, besar, sedang, dan kecil.
3. Skala Pengukuran
Skala pengukuran yang dikenal dalam statistika ada 4, yaitu Nominal, Ordinal, Interval, dan Rasio. Skala yang memiliki karakteristik paling kompleks merupakan kumpulan dari karakteristik skala pengukuran sebelumnya. Skala karakteristik yang paling sederhana adalah Nominal, dimana skala ini hanya bertujuan untuk membedakan hal yang satu dan yang lainnya, bukan untuk menunjukkan urutan, misalnya provinsi yang ada di Indonesia. Sedangkan skala ordinal bertujuan untuk membedakan namun juga sekaligus menunjukkan tingkatan. Misalkan SD, SMP, SMA, Perguruan Tinggi.
Untuk skala interval, merupakan skala yang juga digunakan untuk membedakan dan juga mengurutkan. Selain itu, dalam skala ini juga terdapat interval atau jarak antara data yang satu dan yang lainnya, biasanya digunakan untuk pengukuran, seperti suhu. Namun dalam skala ini tidak ada nilai 0 mutlak, yang artinya nilai 0 dalam skala ini memiliki arti. Misalnya suhu 0 derajat, menunjukkan bahwa keadaan daerah tersebut sedang dingin. Sementara untuk skala rasio, sebenarnya sangat mirip dengan skala interval, perbedaannya adalah dalam skala rasio ada 0 mutlak. Misalkan ketika pendapatan Rp.0, maka dapat dikatakan bahwa tidak ada pendapatan.
Baca juga : Mengenal Profesi Data Scientist
4. Mulai Terapkan Ilmunya dengan Belajar Data Science bersama DQLab!
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi masa kini! Sign up sekarang untuk #MulaiBelajarData di DQLab!
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
1. Buat Akun Gratis dengan Signup di DQLab.id/signup
2. Akses module Introduction to Data Science
3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
4. Subscribe DQLab.id untuk Akses Semua Module Premium!
Penulis : Gifa Delyani Nursyafitri
Editor : Annissawd