Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

4 Jenis Data Statistik dalam Teknik Pengambilan Sampel untuk Penelitian

Belajar Data Science di Rumah 10-November-2021
https://dqlab.id/files/dqlab/cache/74bdfae51f6e1cfe40eec22bee1f918a_x_Thumbnail800.jpg

Pengklasifikasian data adalah proses untuk memisahkan data yang heterogen ke dalam kelompok yang homogen sehingga sifat-sifat data yang menonjol mudah dilihat. Untuk itu, pengklasifikasian data sangat diperlukan karena dalam dunia bisnis tidak melulu tentang laba dan rugi tetapi, setip data tersebut harus tersimpan dengan baik. 


Dengan adanya data yang teratur maka Anda tidak perlu sulit dalam mencari data yang dibutuhkan, karena data sudah berada di tempat yang seharusnya, dan disusun secara teratur. Untuk memahami jenis data pada statistik, kamu perlu memahami mulai dari latar belakang pembagian jenis data, pengolahan data hingga pengumpulan data baik itu data primer atau data sekunder.


Dengan bergabung dalam modul terbaru DQLab yaitu œStatistik Dasar untuk Data Science dengan Python & Scikit - Jenis Data Statistik sahabat DQ sudah bisa langsung menikmati dan mempelajari kompetensi antara lain: 

  • Mampu memahami latar belakang pembagian jenis data, Mampu memahami dan mengidentifikasi data menurut sifat, yaitu kualitatif, kuantitatif, diskrit, dan kontinu, 

  • Mampu memahami dan mengidentifikasi data menurut sumber, yaitu internal dan eksternal, 

  • Mampu memahami dan mengidentifikasi data menurut rentang waktu, yaitu time series dan cross section

  • Mampu memahami dan mengidentifikasi data menurut proses pengolahan, yaitu berkelompok dan tidak berkelompok, serta mampu memahami dan mengidentifikasi data menurut pihak pengumpul data, yaitu primer dan sekunder. 


Untuk lebih lengkapnya, yuk simak artikel dibawah ini hingga selesai ya!


1. Sifat data

Pengklasifikasian data berdasarkan sifatnya dibedakan menjadi dua yaitu, Data Kualitatif merupakan data yang mendeskripsikan atribut atau sifat yang dimiliki oleh suatu objek dan direpresentasikan dalam bentuk non angka. Bentuk non angka yang dimaksud dapat berupa kata-kata yang mengandung makna. Contoh data kualitatif ini diantaranya yaitu hasil survei, catatan/dokumen, gambar, suara, dan vidio.


Data Kuantitatif merupakan data yang direpresentasikan ke dalam angka melalui pencacahan atau pengukuran atribut suatu objek. Contoh data kuantitatif ini diantaranya hasil pengukuran tinggi badan, banyak orang di setiap kelurahan di sebuah kecamatan, dll.


Selain itu juga ada data diskrit dan data kontinu, dimana  Data Diskrit merupakan data kuantitatif yang dapat dihitung (dicacah) karena memiliki nilai data yang berbeda dan dapat dipisahkan satu sama lainnya. Contoh data diskrit:

  • jumlah mahasiswa yang memperoleh nilai A, B, C, D, atau E pada suatu mata kuliah.

  • jumlah orang yang sedang mengantri dalam membeli tiket shuttle bus.

  • jumlah penjualan setiap produk pada suatu toko di hari Kamis.


Data Kontinu merupakan data yang diperoleh dari pengukuran bukan dari proses pencacahan. Nilainya dapat dinyatakan ke dalam bilangan ril.

Contoh data kontinu:

  • Berat badan mahasiswa perguruan tinggi di kota A

  • Tinggi badan mahasiswa perguruan tinggi di kota B

  • Temperatur harian ruangan pada alat ukur suhu ruangan

  • Nilai kurs dolar


2. Rentang Waktu Data

Data runtun waktu (time series) merupakan data yang terurut berdasarkan waktu. Urutan waktu dari data dapat memiliki skala waktu menit, jam, hari, bulan, tahun, atau abad. Umumnya data runtun waktu ini jika divisualisasikan dengan urutan waktu pada sumbu horizontal sedangkan nilainya dinyatakan pada sumbu vertikal.

Apa sajakah contoh data runtun waktu ini? Berikut diantaranya

  • temperatur rata-rata kota Jakarta setiap harinya yang direkam oleh BMKG (misal mulai dari tahun 2000 s/d sekarang).

  • kasus COVID 19 (aktif, sembuh, dan meninggal) di Indonesia tiap harinya dimulai dari kasus pertama hingga hari ini.

  • nilai harga saham yang direkam tiap harinya di Bursa Efek Jakarta

  • nilai tukar kurs dolar Amerika Serikat (USD) terhadap Rupiah (IDR) setiap harinya sejak awal tahun 2020, seperti yang divisualisasikan berikut ini.

statistik

Sementara untuk data cross section merupakan data yang diperoleh melalui data runtun waktu untuk nilai waktu tertentu. 


Sebagai contoh pada data kurs nilai tukar USD “ IDR, kita dapat mengetahui besarnya nilai kurs jual dan kurs beli di dalam rentang waktu data. Rentang waktu ini dimulai dari awal data (2 Januari 2020) hingga akhir data (18 Nopember 2021). Data cross section dapat diperoleh dengan memotong data runtun waktu pada nilai waktu tertentu. Misalkan kita akan memotong data runtun waktu pada 2 September 2020 akan diperoleh data cross section berupa kurs jual sebesar Rp. 14878.02, dan kurs beli sebesar Rp. 14729.98.


statistik


Baca juga : Belajar Statistika : Kenali Lebih Jauh Penerapannya dalam Data Science


3. Sumber Data

Data internal merupakan data bersumber dari dalam lingkup aktivitas organisasi atau institusi berupa keuangan, personil, perawatan, pelayanan, dan produksi. Data internal dicirikan dengan kepemilikan data pada institusi atau organisasi itu sendiri. 


Sebagai contoh, data internal dapat berupa: 

  • data demografi karyawan suatu perusahaan, 

  • data demografi anggota organisasi, 

  • data keuangan institusi, 

  • data rekam medis pasien suatu rumah sakit, 

  • data produksi kendaraan roda empat, 

  • data perawatan kendaraan di suatu bengkel otomotif.


Data eksternal merupakan data berasal dari luar lingkup aktivitas organisasi atau institusi berupa data kondisi pasar, data pesaing bisnis, atau data dari pihak ketiga. Data ini diperoleh melalui riset, survei, dan penyedia pihak ketiga baik bersifat data berbayar, data terbuka, atau data publik.

Contoh-contoh data eksternal:

  • data survei pelanggan, 

  • data riset pasar,

  • data perkembangan perusahaan saingan di lantai bursa, 

  • data kondisi demografi penduduk yang disediakan oleh pemerintah.


Baca juga : Empat Jenis Data Statistik Hasil Pengukuran


4. Pihak Pengumpul Data

Data Primer dan Data Sekunder

Data primer merupakan data yang diambil secara langsung dari objek yang diteliti/diamati oleh peneliti baik berupa survei, pencatatan, pengukuran, atau eksperimen.

Contoh:

  • data survei kepuasan pelanggan yang berbelanja di toko kita

  • data catatan penjualan oleh kasir

  • data eksperimen di laboratorium


Data sekunder merupakan data yang tidak dapat diambil secara langsung dari objek yang diteliti/diamati oleh peneliti sehingga memerlukan pihak ketiga sebagai penyedia datanya.

Contohnya berupa data-data yang disajikan oleh pihak ketiga yang bersifat berbayar (tertutup) atau terbuka.


5. Proses Pengolahan Data

Data Tidak Berkelompok merupakan data hasil penelitian atau pengamatan terhadap objek yang diteliti/diamati baik berupa survei, pencatatan, pengukuran, atau eksperimen.

Data Berkelompok diperoleh dari pengolahan data tidak berkelompok yang berupa pengelompokkan data-data tersebut ke dalam selang atau interval nilai tertentu.

Kita akan lihat contohnya untuk data pengukuran berat badan 120 orang berikut ini


71.2, 66.8, 66.9, 65.9, 69.7, 63.4, 71.5, 66.5, 68.6, 67.5, 70.9, 63.9, 67.4, 67.2, 70.3, 65.8, 67.7, 66.2, 68.1, 69.2, 65.8, 70.3, 69.8, 69.0, 69.8, 66.6, 67.8, 66.1, 67.5, 69.1, 66.6, 67.2, 66.6, 66.3, 66.7, 68.0, 65.8, 68.5, 71.3, 69.5, 67.6, 66.2, 66.5, 71.4, 68.1, 66.7, 68.4, 72.2, 68.2, 69.2, 68.6, 67.3, 65.7, 67.3, 67.6, 69.2, 69.7, 69.9, 68.6, 69.8, 66.5, 70.5, 69.0, 67.4, 69.0, 67.8, 70.3, 71.0, 72.4, 65.2, 65.1, 67.0, 68.3, 69.8, 68.6, 64.0, 67.4, 69.7, 68.5, 69.5, 67.6, 67.6, 68.4, 68.8, 68.4, 68.2, 66.7, 68.8, 68.2, 70.3, 70.4, 68.4, 67.2, 66.7, 68.8, 68.2, 67.3, 68.1, 66.8, 69.4, 67.1, 70.4, 68.8, 69.2, 65.8, 68.3, 69.5, 66.1, 67.5, 68.1, 65.3, 68.6, 69.7, 66.3, 68.7, 65.4, 67.9, 64.8, 70.2, 68.8.


Data berat badan yang ditunjukkan ini merupakan data tidak berkelompok karena diperoleh dari pengukuran langsung berat badan untuk 120 orang. Agar dapat dijadikan data berkelompok maka ke-120 data ini harus dibuatkan intervalnya. Untuk membuat interval kita akan menentukan nilai minimum dan maksimum data yang masing-masingnya adalah 63.4 kg dan 72.4 kg. Dalam hal ini kita dapat membuat interval untuk setiap kenaikan 1 kg. Jika ada setiap data berat badan dalam setiap interval tersebut maka akan kita tally dan akhirnya dijumlahkan (dihitung frekuensinya).


Simak Jenis Data Statistika Melalui Video Dibawah Ini Yuk!



Gimana sahabat DQ sudah paham bukan apa saja jenis-jenis data yang dapat kita gunakan berdasarkan klasifikasinya. Melihat hal tersebut, pengumpulan data itu sangat penting diulakukan guna menghasilkan suatu keputusan atau tujuan yang sesuai dengan goals kita. Buruan sign up dan nikmati modul terbaru DQLab tentang œStatistik Dasar untuk Data Science dengan Python & Scikit - Jenis Data Statistik dan perkaya bekal mu terkait jenis data statistik 


Dengan materi-materi yang ditawarkan lengkap dan sesuai dengan kebutuhan industri, disusun oleh mentor-mentor yang kompeten di bidangnya. Tunggu apalagi? Yuk, signup sekarang dan mulai belajar Module Premium di DQLab!


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login