Tutorial Analysis ToolPak untuk Teknik Analisis Data Deskriptif
Dalam ilmu Data Analytics, terdapat berbagai jenis teknik analisis data. Misalnya, analisis deskriptif, analisis regresi, analisis faktor, dan lain sebagainya. Metode atau teknik ini biasa digunakan oleh Data Analyst untuk memperoleh insight dari kumpulan data, memproyeksi suatu kondisi di masa mendatang, serta memberikan rekomendasi dan solusi dari hasil analisis yang ia lakukan.
Mengingat tugas seorang Data Analyst yang cukup banyak dan menggunakan data yang berbeda-beda, maka seorang calon Data Analyst disarankan untuk memahami berbagai jenis teknik analisis data yang biasa digunakan di dunia industri. Oleh karena itu, salah satu syarat mempelajari Data Science atau Data Analytics adalah dengan menguasai ilmu statistik.
Di era industri 4.0 seperti saat ini, Data Science merupakan salah satu ilmu yang banyak dimanfaatkan dalam berbagai sektor. Banyaknya produksi data setiap harinya, mendorong perusahaan untuk mencari praktisi data yang bisa mengolah jutaan data tersebut menjadi insight yang bermanfaat bagi performa perusahaan. Tak heran jika saat ini mulai banyak yang tertarik dan serius menekuni ilmu ini
Di bawah ini, DQLab akan mengajak sahabat data untuk mengenal salah satu jenis teknik analisis data yang harus sobat pelajari sebelum mulai dalam mempelajari ilmu Data Science. Penasaran teknik apa yang akan dipelajari? Simak penjelasan berikut ya!
1. Pengertian dan Manfaat Analisis Deskriptif
(source: builtin.com)
Analisis deskriptif merupakan langkah awal untuk melakukan analisis statistik. Analisis deskriptif membantu kita untuk mengidentifikasi distribusi data, membantu mendeteksi adanya outlier atau pencilan, membantu kita mengidentifikasi adanya dugaan asosiasi pada variabel, serta membantu kita untuk menyiapkan data agar bisa dilakukan analisis lebih lanjut.
Analisis deskriptif dari data set yang besar bisa dibuat dengan mudah dengan mem-breakdown-nya menjadi dua kategori, yaitu deskriptif statistik untuk setiap individual dan analisis deskriptif untuk kombinasi variabel.
Baca juga : 4 Langkah Cara Mudah Implementasi Teknik Analisis Data
2. Alasan Menggunakan Excel untuk Melakukan Analisis Data
Analisis deskriptif menggunakan Excel sebenarnya tergolong hal yang mudah untuk dilakukan. Karena kita hanya tinggal menggunakan satu fungsi untuk mendapatkan nilai-nilai statistik yang dibutuhkan. Berikut beberapa alasan mengapa mengolah data menggunakan Excel lebih mudah untuk dilakukan:
User-friendly, tampilan interface Excel yang sangat ramah menjadi alasan utama mengapa software ini memiliki banyak pengguna. User yang menggunakan Excel tidak perlu memiliki ilmu yang mendalam untuk bisa menggunakannya.
Tidak perlu pengkodingan, kebanyakan aplikasi pengolah data mengharuskan penggunanya untuk melakukan pengkodingan dalam menjalankan perintah. Berbeda dengan Excel, kita tidak perlu melakukan coding apapun dan hanya perlu paham rumus-rumus dasar yang ada di Excel.
Mudah ditafsirkan, output yang dihasilkan di Excel disajikan dengan sederhana sehingga pengguna bisa memahami dan menginterpretasikan hasil dengan mudah.
3. Analisis Deskriptif Menggunakan Analysis ToolPak
Persiapkan data yang akan dianalisis
Pilih Tab Menu Data pada Excel, kemudian pilih Data Analysis
Kemudian pada kolom Analysis Tools, pilih Descriptive Statistics. Kemudian input data yang akan dianalisis. Jika label ikut terinput, maka centang bagian œLabels in first row. Kemudian tentukan dimana output akan diletakkan. Untuk menampilkan hasil analisis, pada kolom œOutput options centang Summary statistics.
Berikut hasil analisis statistik deskriptif menggunakan ToolPak Excel
4. Hasil Analisis Deskriptif dalam Excel
Dari hasil analisis statistik deskriptif di atas, kita dapat menghitung nilai mean, standar error, median, modus, standar deviasi, varian sampel, kurtosis, skewness, range, nilai minimum dan maksimum, jumlah data, dan banyaknya data.
Mean: 7558,33 ¡ª Rata-rata, ada 7.558 orang miskin di 12 area tersebut.
Standard error: 444,40 ¡ª Nilai ini menunjukkan bahwa sampel yang dipilih memiliki sebaran yang cukup tinggi dibandingkan rata-rata partisipasi.
Median: 7600 ¡ª Menunjukkan nilai tengah dari sampel yang digunakan.
Mode: #N/A ¡ª Artinya tidak ada jumlah penduduk miskin yang muncul paling banyak.
Standard deviation: 1539,45 ¡ª Menunjukkan nilai sampel yang kita gunakan cukup jauh dari rata-rata.
Sample variance: 2369924,24 ¡ª Menunjukkan sampel yang kita gunakan tersebar cukup jauh dari rata-rata.
Kurtosis: -0,7398
Skewness: -0,0966
Range: 5000 ¡ª Menunjukkan perbedaan antara jumlah penduduk miskin tertinggi dengan jumlah terendah pada 12 wilayah.
Minimum: 5000 ¡ª Menunjukkan jumlah penduduk miskin terendah adalah 5000 orang yaitu pada area L.
Maximum: 10000 ¡ª Menunjukkan jumlah penduduk miskin tertinggi adalah 10000 orang yaitu pada area J.
Total: 90700 ¡ª Nilai yang menunjukkan total jumlah penduduk miskin dari 12 wilayah tersebut sebanyak 90700.
Count: 12 ¡ª Ada sebanyak 12 data yang dihitung.
Baca juga : Langkah-Langkah Menggunakan Teknik Analisis Data Kualitatif
5. Kenali Dasar Teknik Analisis Data bersama DQLab!
Teknik analisis data merupakan langkah penting dalam kegiatan penelitian, terdapat beberapa teknik analisis data yang dapat digunakan sesuai dengan jenis data. Untuk mengenali dasar-dasar teknik analisis data kita bisa sama-sama belajar di DQLab. DQLab menyediakan materi berupa modul dan bisa langsung dipelajari secara live code, mulai dari belajar dasar-dasarnya sampai dengan mengerjakan mini project. Cara bergabungnya cukup mudah loh, yaitu langsung saja sign up di DQLab.id dan nikmati modul gratis DQLab.
Penulis: Salsabila MR
Editor: Annisa Widya Davita