Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Implementasi Data Empathy dalam Profesi Data Scientist

Belajar Data Science di Rumah 22-April-2022
https://dqlab.id/files/dqlab/cache/ddbfdf38070bb4da30b78add449f3f91_x_Thumbnail800.jpg

Profesi data scientist merupakan salah satu profesi yang sedang naik daun di bidang data. Data scientist bertanggung jawab untuk mengolah dan menganalisis data sebagai bahan pertimbangan untuk pengambilan keputusan. Berdasarkan lansiran dari KD Nuggets bahwa data scientist didapuk menjadi salah satu profesi ranah data yang paling berpotensi dan berpeluang mendapatkan gaji tinggi pada tahun 2022. Sedangkan laporan dari Seagate UK menyatakan bahwa pada tahun 2025 nantinya jumlah data di dunia akan mencapai 175 triliun gigabyte atau setara dengan 175 zettabyte. Pastinya dengan fenomena ini maka dunia akan membutuhkan talenta data yang ingin berprofesi sebagai data scientist. 


Ketika data sudah ada di tangan seorang data scientist maka segala kemungkinan bisa saja terjadi. Duplikasi data, missing value, adanya data yang bersifat not available, data tidak seragam dan banyak risiko yang terjadi. Kemudian, kalau sudah tahu seperti itu maka seorang data scientist setidaknya perlu memiliki skill yaitu empathy. Apalagi dalam dunia data, memiliki sikap empati pada data sangat penting karena keputusan yang diambil itu harus sesuai dengan tujuan yang ingin dicapai dan tidak keluar dari koridor bisnis yang seharusnya. 


Memiliki kemampuan data empathy mengindikasikan bahwa sebagai seorang data scientist punya tingkat kepekaan untuk menganalisis isu-isu yang berkaitan dengan business. Selain itu, keputusan yang keluar juga berdasarkan data yang akurat tanpa mengada-ada dan dibuat-buat. 


Ketika skill data empathy ini bisa kamu kuasai dengan baik maka akan menjadi lebih mudah untuk mengerjakan tugas-tugasnya. Kalau kamu punya dasar dan pijakan yang kuat maka kamu akan jauh lebih piawai dalam menjadi seorang data scientist. 


1. Definisi Data Empathy

Istilah empati mengacu pada tindakan memahami, menyadari, peka terhadap suatu hal, dan mengalami sendiri perasaan, pikiran, dan pengalaman orang lain baik di masa lalu atau sekarang tanpa perasaan, pikiran, dan pengalaman yang sepenuhnya dikomunikasikan secara eksplisit secara objektif. Koneksi logis antara empati dan profesi data scientist adalah pengguna akhir atau pemangku kepentingan. 

data scientist

Memahami kebutuhan dan keinginan mereka melalui empati akan memandu analisis data yang nantinya akan kamu lakukan. Penggunaan data empathy akan memungkinkan anda membuat produk data yang lebih baik dan bermanfaat. Namun, empati data berfokus pada pemahaman data. Ini mempertimbangkan subjektivitas yang diperkenalkan oleh manusia ke dalam proses pengumpulan data dan mengidentifikasi bias.


Baca juga : Mengenal Profesi Data Scientist


2. Proses Data Empathy

Empati data berarti seorang data scientist perlu memahami alur cerita yang tersingkap dari kumpulan data yang telah dianalisis. Data empathy memulainya dengan pertanyaan mengapa sih data itu dikumpulkan? Untuk apa data itu dikumpulkan? Bias mana yang dapat diidentifikasi berdasarkan tujuan dan proses pengumpulan data? Pertanyaan-pertanyaan ini sebagian dapat dijawab oleh metadata yaitu informasi terstruktur dan deskriptif yang terkait dengan data. 

data scientist

Tetapi seperti yang ditunjukkan oleh Brönnimann dan Wintzer, empati data berjalan lebih jauh. Hal ini menggambarkan proses reflektif, interpretatif, dan kualitatif.

  • Reflektif: Kita harus memikirkan keyakinan bawah sadar tentang dunia yang dapat mempengaruhi proses pengumpulan data. Hal ini terkait dengan narasi œbias dalam Artificial Intelligence. Contoh umum adalah kumpulan data pengklasifikasi gambar (face recognition) yang sebagian besar berisi wajah putih. Dataset ini tidak mewakili keragaman populasi. Model apa pun yang dibuat menggunakan data ini akan berkinerja buruk.

  • Interpretatif: Kita perlu mempertimbangkan konteks di sekitar data. Siapa yang mengambil data, mengapa, kapan, dan bagaimana? Misalnya kita ambil contoh data yang berkaitan dengan gejala suatu penyakit. Gejala yang dilaporkan dapat berbeda berdasarkan setidaknya tiga skenario yang berbeda. (1) Anda menyebutkan semua gejala yang dapat anda pikirkan tanpa pertanyaan utama dari dokter anda (potensi bias ingatan). (2) Seorang dokter menanyakan apakah anda kehilangan penciuman atau sakit tenggorokan (potensi bias konfirmasi). (3) Seorang dokter memeriksa Anda dan melaporkan gejala-gejalanya tanpa mengajukan pertanyaan apa pun kepada Anda (potensi bias pengamatan). Memahami nuansa ini dan mengungkap bias ini dalam kumpulan data sangat penting untuk analisis lebih lanjut dan penurunan wawasan.

  • Kualitatif: Kita harus mengatasi norma dan nilai sosial yang dapat mempengaruhi kualitas data dan proses pengumpulan. Khususnya data yang dilaporkan sendiri dapat dipengaruhi oleh norma-norma sosial. Bias keinginan sosial menggambarkan bahwa individu menjawab pertanyaan dengan cara mematuhi norma dan harapan masyarakat.


3. Pentingnya Data Empathy untuk Profesi Data Scientist

Ada beberapa alasan mengapa empati data itu penting bagi profesi data scientist

  • Pertama, bias dalam data tetap ada jika data empathy tidak diterapkan dalam melakukan pengolahan data. Hal ini akan menyebabkan model bias dan hasil yang tidak berguna. Mungkin tidak masalah selama kompetisi Kaggle di mana tujuan utama Anda adalah mencapai akurasi tinggi. Tetapi proyek dunia nyata memiliki implikasi dunia nyata. Jika Anda menggunakan data dan model yang bias untuk keputusan perekrutan, konsekuensinya akan mengerikan.

data scientist

  • Kedua, tujuan dan konteks kumpulan data dapat memandu proses analisis data Anda. Bias yang ditemukan akan menentukan fokus langkah eksplorasi dan persiapan data Anda. Selanjutnya akan memengaruhi keputusan Anda dalam pemilihan fitur dan rekayasa. Bahkan mungkin tepat untuk memilih model machine learning tertentu daripada yang lain untuk memiliki kontrol lebih besar atas bias.

  • Ketiga, memahami konteks seputar data dapat mengarah pada proses pengumpulan data baru dan proyek data science yang dikerjakan oleh data scientist. Setelah Anda mengidentifikasi masalah seputar proses pengumpulan data, pikirkan tentang bagaimana Anda dapat membuat kumpulan data yang lebih baik. Bagaimana Anda bisa menjelaskan bias yang melekat? Katakanlah Anda menemukan bias gender dalam data perekrutan historis dari perusahaan Anda. Apakah ada bias atau konteks serupa di sekitar data lain yang digunakan perusahaan Anda? Bagaimana Anda bisa meningkatkan data? Gunakan kesempatan ini untuk menemukan dan menjelaskan bias ini dan bagaimana mengatasinya di proyek Anda berikutnya.


4. Data Empathy Perlu Tidak Sih?

Empati data adalah proses memahami konteks, nilai, dan maksud di sekitar data. Menggunakan empati data dalam proses ilmu data memungkinkan Anda mengidentifikasi bias. Ini membantu memandu proses analisis data Anda dan mengarahkan Anda ke pertanyaan baru yang dapat Anda jawab di proyek berikutnya. Meskipun kami suka percaya bahwa data secara objektif benar atau salah, atau benar atau salah, kenyataannya lebih bernuansa. 

data scientist

Subjektivitas manusia diperkenalkan selama langkah pengumpulan data, eksplorasi data, dan interpretasi data. Tugas Anda sebagai data scientist adalah mengakui hal ini dan memperhitungkannya dalam analisis Anda. Hanya dengan begitu model dan hasil Anda akan berarti. Dan hanya dengan begitu Anda akan menjadi ilmuwan data yang lebih baik.


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


5. Aplikasikan Data Empathy Untuk Berkarir Menjadi Seorang Data Scientist

Data Empathy merupakan salah satu skill khusus yang perlu dimiliki oleh seorang Data Scientist. Data scientist perlu untuk berempati dengan hal-hal yang berkaitan dengan pekerjaannya. Tidak hanya soal proses ataupun tahapan dalam melakukan pengumpulan data dan pengolahan sampai analisis data. 


Namun banyak aspek yang berpengaruh penting terhadap keputusan yang nantinya akan diambil. Oleh karena itu, seorang data scientist perlu melibatkan empatinya untuk mengerjakan projek data-data dan perlu memilah-milah mana aspek yang sekiranya perlu dipertimbangkan dalam pengerjaan dan penarikan kesimpulan.


Tunggu apa lagi? Yuk, mulai belajar sekarang dengan signup di DQLab.id atau isi form dibawah ini ya!


Penulis: Reyvan Maulid

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login