Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Tutorial Simple Excel untuk Data Cleansing, Cocok bagi Pemula

Belajar Data Science di Rumah 19-April-2022
https://dqlab.id/files/dqlab/cache/90c5b5805fa3894f0c0c02ee4e2c51b1_x_Thumbnail800.jpg

Setiap orang pasti familiar dengan aplikasi Microsoft Excel, tapi tidak sedikit yang belum memahami penggunaan Excel untuk mengolah data secara maksimal. Salah satu contohnya dalam melakukan Data Cleansing. 

Dalam dunia Data Science, Data Cleaning atau Data Cleansing menjadi langkah awal yang perlu dilakukan sebelum lanjut ke proses selanjutnya. Ibarat rumah, sistem terutama yang memiliki data yang besar, dapat mempunyai data yang rusak. Jika dibiarkan, data yang rusak tersebut akan mempengaruhi kinerja dari sistem tersebut. Oleh karena itu, data tersebut harus dibersihkan secara konstan.

Pada dasarnya Data Cleansing juga dikenal dengan Data Scrubbing adalah proses menyiapkan data dengan cara menghapus atau memodifikasi data yang salah, tidak relevan, tidak akurat, duplikat, maupun yang tidak terformat. Setelah melewati tahap ini, barulah data siap untuk diolah. 

Jika jumlah data yang kita gunakan sedikit, proses Data Cleansing bisa dilakukan secara manual. Namun, apabila data yang kita gunakan berukuran besar, akan sangat sulit dan membutuhkan waktu yang lama untuk membersihkan data. Untungnya, Excel memiliki banyak fitur yang bisa kita manfaatkan untuk membersihkan data.

Pada artikel kali ini kita akan membahas seperti apa tahapan proses Data Cleansing menggunakan Microsoft Excel, jadi simak hingga akhir ya!


1. Mengubah Kapitalisasi Menggunakan Fungsi Lower/Upper/Proper

Dataset yang baru dikumpulkan terdiri dari huruf kapital dan non kapital yang terkadang tidak beraturan. Sedangkan beberapa metode analisis data bersifat case sensitive yang artinya huruf kapital sangat berpengaruh pada hasil analisis. Oleh karena itu, kita perlu mengubah huruf kapital sebelum menganalisis dataset tersebut. 

Microsoft Excel tidak menyediakan menu atau tool Change Case seperti di Microsoft Word untuk merubah huruf besar menjadi kecil maupun sebaliknya merubah huruf kecil ke besar. Namun,


Excel memiliki formula untuk mengubah text menjadi UPPER, LOWER, dan PROPER yang bisa kita manfaatkan untuk mengubah format test.


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


2. Menggabungkan Beberapa Data dalam Satu Sel

Terkadang pada beberapa penelitian, kita perlu menggabungkan beberapa data pada sel yang berbeda menjadi satu sel yang sama. Excel memiliki beberapa cara untuk menggabungkan beberapa sel menjadi satu. Beberapa cara tersebut adalah seperti berikut:

  • Menggunakan fitur Fill Justify

Cara ini berguna untuk menggabungkan teks yang jumlahnya sedikit dan kumpulan sel berada dalam satu kolom yang sama. Ada kemungkinan gabungan teks berada dalam beberapa baris sel. Untuk menggabungkannya ke dalam satu sel, bisa dengan memperlebar ukuran kolom.

  • Pilih kumpulan sel yang akan digabungkan isinya. Misal: sel A9:A15.

  • Pada tab Home, grup Editing, klik Fill dan pilih Justify.


  • Menggunakan simbol Ampersand (&)

Cara ini berguna untuk menggabungkan beberapa sel yang isinya selalu berubah. Namun cara ini kurang efisien jika digunakan untuk menggabungkan banyak sel pada sebuah kolom atau baris. Karen acara ini perlu memasukkan nilai secara manual satu persatu.


  • Menggunakan fungsi CONCATENATE

Selain kedua cara diatas, untuk menggabungkan kata atau teks di Excel juga bisa menggunakan fungsi CONCATENATE. Pada dasarnya fungsi ini juga digunakan untuk menggabungkan teks atau isi beberapa sel di Excel.

Namun jika argumen yang diberikan berupa rentang sel, maka concatenate hanya akan menghasilkan nilai sel yang sebaris atau sekolom dengan sel dimana rumus tersebut dimasukkan saja.

Maka caranya untuk menggabungkan banyak sel pada satu baris atau kolom yang sama adalah seperti berikut:

  • Misalkan sel yang akan digabung ada di A9:A15.

  • Selanjutnya kita akan menaruhnya di sel B17. Klik sel B17 dan ketik =CONCATENATE(A9:A15 & “ “). Catatan: jangan menekan ENTER dulu.

  • Highlight atau pilih bagian (A9:A15 & “ “) pada formula dan tekan tombol F9.

  • Hapus tanda kurung kurawal { } yang berada di formula. Kemudian tekan Enter.


3. Menghapus Data yang Double

Dalam proses pengumpulan data, tidak jarang kita menghadapi adanya data ganda atau duplikat. Untuk menangani masalah ini, Excel memiliki banyak cara. Salah satunya adalah dengan memberikan highlight pada sel yang nilainya sama lalu menghapus atau me-remove data duplikat yang sudah terhighlight.

Cara Menemukan Data Ganda di Excel:

C:Userssalsabila mrAppDataLocalMicrosoftWindowsINetCacheContent.WordBook1 - Excel 2022-04-18 23-58-57.gif

  • Tandai kolom atau baris data, bisa satu kolom atau seluruh kolom.

  • Selanjutnya, klik menu Home ? Conditional Formatting ? Highlights Cells Rules ? Duplicates Values.

  • Cara menemukan data ganda pada Excel sudah selesai, data ganda akan ditandai dengan warna merah atau warna lainnya tergantung kebutuhan. 

Cara Menghapus Data Ganda di Excel:

Ketika menggunakan fitur Remove Duplicates, data ganda akan dihapus secara permanen. Sebelum menghapus duplikat, disarankan untuk menyalin data asli ke lembar kerja lain sehingga tidak kehilangan informasi secara tidak sengaja.

  • Pilih rentang sel yang mempunyai nilai duplikat yang ingin dihapus. 

  • Klik Data ? Remove Duplicates

  • Akan muncul popup, beri tanda centang pada “My data has header” dan seluruh kolom.

  • Klik OK.


4. Memisahkan Data pada Tiap Kolom

Dalam proses data cleansing, ada yang tahap yang dikenal dengan proses tokenizing. Proses ini merupakan proses memisahkan kata pada setiap kalimat dengan delimited atau pembatas tertentu. Excel memiliki fitur yang bisa kita manfaatkan untuk melakukan proses tokenizing dengan cara select sel berisi teks yang akan dipisahkan, lalu pilih menu data kemudian pilih text to column. Setelah itu akan muncul jendela setting sehingga kita bisa memilih pemisahan kalimat berdasarkan delimited apa. Untuk cara yang lebih lengkap bisa dilihat tutorial berikut.


Baca juga : Kenali Rumus IF pada 3 Kondisi dengan Excel


5. Pelajari Lebih Banyak Rumus Excel untuk Terjun ke Dunia Kerja Bersama DQLab

Excel memiliki ratusan fungsi dan para Data Scientist pada umumnya menggunakan fungsi-fungsi ini untuk melakukan analisis data. Untuk menjadi Data Scientist, kamu perlu belajar menggunakan Excel dan paham bagaimana cara mengoperasikannya. Sama seperti mempelajari rumus matematika, pastinya dalam matematika kita akan mempelajari tentang penjumlahan, pengurangan perkalian dan pembagian.


Jika kamu penasaran dengan rumus-rumus dasar Excel dan penerapan rumus lainnya, kamu bisa bergabung dengan DQLab dengan membuat akun gratis di DQLab.id. Nikmati pengalaman belajar Excel bersama DQLab yang seru dan menyenangkan dengan mencoba quiz basic Excel yang pastinya FREE untuk menguji kemampuan Excel kamu. 


Yuk, persiapkan dirimu untuk berkarir sebagai praktisi data yang kompeten!


Penulis: Salsabila MR

Editor: Annissa Widya Davita


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login