Macam Jenis Dataset Data Science yang Digunakan pada Industri
Sahabat DQ pemula dan ingin memperdalam kompetensi data science? Bisa! Era Digital saat ini sangat terbuka untuk siapa saja bisa menjadi calon talent data. Tidak memandang background pendidikan, Sahabat DQ yang berasal dari non IT pun dapat mempelajari data science dan memiliki peluang yang sama untuk berkarir di industri data.
Untuk mempersiapkan kompetensi tersebut, tentunya Sahabat DQ juga perlu tahu bagaimana keseharian seorang praktisi data dan dataset apa saja yang dipergunakan untuk bisa menunjang proses pengolahan data.
1. Numerical Dataset
Kumpulan data yang berisikan angka-angka, dimana Numerical Dataset kerap kali dikenal dengan data kuantitatif. Data ini bersifat numerik dimana dataset ini dapat membantu menghasilkan insight untuk kebutuhan bisnis. Data yang dianalisis dapat berupa data statistik, data hasil survei, data perusahaan, dan lain-lain.
Contohnya saat kamu sedang mengumpulkan data-data usia dari pasien, tentunya data yang kamu gunakan adalah Numerical Dataset dimana data yang kamu peroleh hanya berupa angka umur pasien.
Baca juga: Teknik Analisis Data yang Pemula Wajib Coba
2. Correlation Dataset
Dataset yang memiliki korelasi atau kesinambungan. Data tersebut saling terhubung satu dengan yang lainnya. Salah satu contohnya adalah, pengumpulan data toko kopi dan toko susu, jika penjualan kopi meningkat akan berkesinambungan dengan toko penjual susu karena saat ini sedang marak es kopi susu yang cukup trend pada masa kini.
3. Categorical Dataset
Dataset ini merupakan data yang menggabungkan banyak data kedalam beberapa kategori atau pengelompokkan. Contoh sederhananya adalah gender dimana data yang dimiliki dapat dikategorikan apakah data perempuan maupun data laki-laki.
4. Bivariate Dataset
Bivariate dataset ini merupakan data dengan dua variabel. Jadi kedua jenis data ini hanya menggambarkan dua variabel saja.
Bingung dengan penjelasannya? Berikut contohnya, jika kamu ingin menghitung bonus gaji karyawan kamu bisa mengukur dengan dua variabel ini :
Target yang dicapai oleh karyawan tersebut
Jumlah keuntungan yang diraih perbulannya
Karena kedua data tersebut saling berhubungan, maka data tersebut dapat dikatakan Bivariate Dataset.
Baca juga: Langkah-Langkah Menggunakan Teknik Analisis Data Kualitatif
5. Multivariate Dataset
Jika sebelumnya kita membahas Bivariate dimana ada dua variabel, untuk Multivariate ini lebih dari dua variabel yang digunakan. Salah satu contoh sederhana adalah data Mahasiswa di Universitas, tentunya kamu perlu beberapa data diantaranya nama, umur, alamat dan lulusan dari sekolah apa.
Karena data yang tersedia sebanyak 4 variabel maka kamu menggunakan beberapa tipe multivariate dataset.
Bagaimana, mudah bukan membedakan macam-macam dataset yang saat ini sering digunakan di Industri. Yuk, pelajari lebih dalam bersama DQLab untuk gali potensi kamu dalam mengolah data.
Caranya mudah, kamu bisa langsung isi form di bawah ini untuk mulai belajar di DQLab tanpa perlu instalasi software tambahan!
Tunggu apa lagi? Yuk, sign up sekarang!