Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Rumus Excel Praktis Mencocokkan dan Duplikasi pada Dua Data

Belajar Data Science di Rumah 06-Oktober-2021
https://dqlab.id/files/dqlab/cache/3bb65477d309bfa08ac33ec605995382_x_Thumbnail800.jpg

Dalam menyusun sebuah laporan dalam bentuk tabel, seringkali kita menemukan adanya data yang double atau ganda. Masalah ini kelihatannya sepele ya sahabat data. Tapi kalau terjadi terus menerus secara berulang menyebabkan terjadinya missing value pada data. Seakan-akan nilai data kalian tidak ada nilai yang memiliki arti atau tidak berarti. Kondisi ini dalam dunia data disebut dengan redundansi data atau duplikasi data.

Duplikasi adalah perulangan, perangkapan atau keadaan rangkap. Data duplikasi (duplicate data) dan data rangkap (redundant data) merupakan kondisi dimana satu atribut memiliki dua atau lebih nilai yang sama, hanya saja pada data rangkap apabila nilai tersebut dihapus tidak akan ada informasi yang hilang dengan kata lain data rangkap merupakan data duplikasi yang tidak perlu terjadi. Bagi kalian yang biasanya bekerja dengan Excel sebaiknya hindari adanya duplikasi data atau data yang rangkap ini.

Meminimalisir data rangkap dapat mencegah terjadinya data yang misinterpretasi dan salah tafsir. Hal ini juga mempengaruhi keputusan yang nantinya sahabat data ambil. Secara sederhananya, duplikasi ini adalah sebuah data yang mirip dan sengaja disamakan dengan data aslinya. 


Dalam kehidupan sehari-hari kita selalu dipertemukan dengan berbagai macam data. Baik itu dalam bentuk data mentahan, data yang sudah diolah, maupun dokumen-dokumen cetak sebagai bahan laporan yang akan dilaporkan pada tim terkait. Semua itu bisa kita selesaikan dengan Excel loh sahabat data.

Apalagi permasalahan soal duplikasi data dan juga mencocokkan kedua jenis data. Pastinya pekerjaannya akan menjadi lebih mudah tanpa ribet harus cari satu-satu. Sebagai salah satu tools yang sedang digandrungi oleh penggiat data, tentunya Excel menawarkan berbagai rumus untuk mengatasi duplikasi data. Kalian semua bisa mencoba untuk mengkombinasikan beberapa rumus seperti IFNA, IFERROR, INDEX, MATCH, LOOKUP dan banyak fungsi lainnya.

Dengan kata lain membandingkan 2 kelompok data pada microsoft excel. Hal ini bertujuan untuk mencocokan data atau mendapatkan akurasi data yang kita olah. Pada tutorial kali ini kita akan mencoba untuk menyoroti apakah data yang kita uji memiliki kesamaan atau terdeteksi indikasi duplikasi data. Tenang sahabat data kita akan belajar dan praktekkan sama-sama. Mari kita cari tahu lebih dalam tentang cara mencari data yang terindikasi duplikasi.


Pada artikel DQLab kali ini, kita akan membahas mengenai cara mencari data yang terindikasi sama dengan mencocokkan datanya bersama-sama. Dengan harapan bisa menjadi tambahan insight dan rekomendasi bagi kalian calon praktisi data untuk belajar seputar Excel. Jangan lewatkan artikel berikut ini, pastikan simak baik-baik, stay tune and keep scrolling on this article guys!


1. Membandingkan Dua Data dengan Rumus ISNA

Disini kita ambil contoh dari penyajian data pemandu wisata. Tugas kita adalah mencari kira-kira data mana yang menunjukkan unik atau tidak terindikasi duplikasi atau justru terindikasi adanya duplikasi. Untuk menemukan data ganda(sama) atau sebaliknya untuk mengetahui data unik pada data kelompok 2 pemandu wisata dibandingkan dengan data pemandu wisata pada kelompok 1 maka masukkan rumus excel berikut. Disini saya contohkan pada "sel F13" atau pada kolom bantu lain yang kamu inginkan.

Berikut terlampir rumus excel untuk membandingkan dua data pemandu wisata:

=IF(ISNA(MATCH(E13;$C$13:$C$21;0));"Unik";"Duplikat")

excel

Selanjutnya copy rumus excel tersebut ke sel-sel di bawahnya menggunakan auto fill atau secara manual. Setelah itu sahabat data langsung copy paste maka pada masing-masing sel kolom F14 sampai F21 dengan rumus yang sama seperti ini

=IF(ISNA(MATCH(E14;$C$13:$C$21;0));"Unik";"Duplikat")

=IF(ISNA(MATCH(E15;$C$13:$C$21;0));"Unik";"Duplikat")

Hasilnya empat dari sembilan data yang tersedia terindikasi duplikat. Sisanya ditandai dengan unik. Arti dari data unik disini tidak mengandung unsur duplikasi sehingga bisa untuk dilanjutkan.


Baca juga : Rumus Excel yang Paling Sering Digunakan dalam Dunia Kerja


2. Membandingkan Dua Data dengan Rumus ISERROR

Selain menggunakan fungsi ISNA kalian bisa juga memanfaatkan fungsi ISERROR excel seperti rumus excel di bawah ini:

=IF(ISERROR(MATCH(E13;$C$13:$C$21;0));"Unik";"Duplikat")

excel

Fungsi ISNA atau ISERROR pada kedua rumus ini bertujuan untuk mengetahui apakah pencarian data dengan fungsi MATCH menghasilkan nilai kesalahan/error atau tidak. Jika data tidak ditemukan, maka fungsi Match akan menghasilkan sebuah nilai error #NA, hasil inilah yang kita manfaatkan untuk mendapatkan data mana yang unik dan yang tidak. Ternyata hasilnya pun juga memiliki indikasi yang serupa bahwa dengan menggunakan fungsi ISERROR ini menghasilkan empat data yang diindikasi terjadi duplikat. Berarti dapat disimpulkan kalau sudah benar dalam penggunaan formulanya.


Bila kita lihat dengan jeli di Data kelompok satu pemandu wisata nomor kedua ada Laura. Tetapi nama LAURA ini disebut lagi di kelompok kedua nomor tiga, sehingga excel menandai laura terdapat duplikat. Sedangkan pada data kelompok satu nomor lima ada nama JANUAR tetapi di kelompok kedua di nomor yang sama ada muncul nama FITRIA. Maka excel menandainya dengan data unik karena memiliki data yang berbeda di nomor yang sama tapi di grup yang berbeda.


3. Mencocokkan Dua Kolom dengan ISERROR dan MATCH 

Dalam contoh kita sajikan data kota tujuan wisata di dua tahun yang berbeda. Anggap saja setiap tahunnya, tim mengusulkan daerah-daerah manakah yang menjadi tujuan wisata baik para pelancong dalam dan luar negeri. Tim menyusun rencana daerah dalam kurun dua tahun sekaligus yaitu 2020 dan 2021. apakah ada kandidat kota tujuan wisata yang sama di tahun sebelumnya. Mari kita cari tahu. Nah, selain menggunakan rumus excel seperti di atas, untuk mendapatkan list data kota tujuan wisata 2021 yang tidak terdapat pada kelompok kota tujuan wisata 2020, kita bisa juga menggunakan rumus excel berikut:

=IF(ISERROR(MATCH(C2;$A$2:$A$11;0));C2;"")

excel

Jika diterjemahkan dalam bahasa manusia rumus ini berbunyi: "Jika pencocokan nilai sel C2 dengan range A2:A11 menghasilkan error maka tulis nilai C2, jika tidak error (data ada) maka tulis nilai kosong (""). Selanjutnya anda tinggal melakukan filter data atau copy paste as value hasilnya ke kolom lain, lalu tinggal memanfaatkan fitur remove duplikat pada excel untuk mendapatkan list data kelompok 2021 yang tidak terdapat pada kelompok 2020 tersebut. Hasilnya yang tidak ada di kota tujuan wisata tahun 2020 dalam artian disini usulan kota tujuan wisata terbaru adalah Candi Borobudur, Danau Tiga Warna, Desa Wisata Pujon Kidul, Kebun Buah Mangunan, Museum Fatahillah dan Dieng.


4. Mencocokkan Dua Kolom dengan Merubah Posisi True or False

Kalau tadi kita mencari data yang tidak ada di kelompok tetangga, sekarang kita coba mencari apakah ada kandidat kota tujuan yang sama di tahun sebelumnya? Caranya mudah, kalian bisa melakukan dengan membalik nilai true dan false rumus IF di atas:

=IF(ISERROR(MATCH(C2;$A$2:$A$11;0));"";C2)

excel

Dalam kasus ini ada tiga kandidat kota tujuan yang terpilih kembali di tahun 2021 yaitu Nihi Sumba, Pulau Derawan dan Raja Ampat. Ketiga kota tujuan ini diindikasikan oleh excel karena datanya ada di kota tujuan wisata 2020. sedangkan yang kosong ini tandanya keseluruhannya tidak ada di kelompok tujuan wisata tahun 2020 atau dengan kata lain adalah wisata usulan baru.


Baca juga : Kenali Rumus IF pada 3 Kondisi dengan Excel


5. Bekali Kemampuan Excelmu untuk Persiapkan Diri Hadapi Digitalisasi Teknologi

Excel sebagai pengolah angka menyediakan berbagai rumus atau formula yang memudahkan kita dalam melakukan pengolahan data. Setiap formula memiliki karakteristik sendiri-sendiri dan kapan formula tersebut digunakan pada saat tertentu. Melihat fungsi Excel yang bermanfaat dalam pengolahan data pastinya akan mempermudah efisiensi kerja kita untuk melakukan analisis dan penyajian data secara numerik. Salah satu penerapannya adalah data science yang terdiri dari bidang ilmu matematika, statistik, dan komputer.

Dengan mempelajari Data Science, kamu akan terlatih dan terbiasa untuk menghasilkan informasi dari olahan data mentah dan insight yang valuable. Jika kamu penasaran dengan data science dan ingin belajar data science dan excel secara langsung, caranya mudah banget. Kamu bisa loh untuk coba bikin akun gratisnya kesini di DQLab.id atau bisa klik button di bawah ini yap.

Kamu juga bisa loh cobain Modul Platinum Excel untuk mengasah kemampuan excel kamu biar lebih oke lagi dan bisa diakses tanpa batas. Nikmati pengalaman belajar data science yang menarik dan cobain berlangganan bersama DQLab yang seru dan menyenangkan dengan live code editor.

Cobain juga free module Introduction to Data Science with R dan Introduction to Data Science with Python untuk menguji kemampuan data science kamu. Kalian juga bisa mencoba studi kasus penerapan real case industry. Ayo persiapkan dirimu untuk berkarir sebagai praktisi data yang kompeten!



Penulis: Reyvan Maulid

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login