Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Pemula Data Wajib Tahu, 5 Tugas Sehari-hari Data Scientist

Belajar Data Science di Rumah 17-Agustus-2022
https://dqlab.id/files/dqlab/cache/13d8b288befcf2c5ad32ebe2a3939705_x_Thumbnail800.jpg

Data scientist sehari-harinya menggunakan data sebagai makanan sehari-hari. Salah ambil data sedikit saja, data scientist bisa salah kaprah dalam mengambil keputusan. Jadi, sebisa mungkin bagi seorang data scientist untuk meminimalisir ruang kesalahan (room for error) apabila ada kesalahan dalam pengambilan data. Dengan data yang dimiliki oleh bisnis ataupun organisasi maka data scientist dapat menghasilkan rekomendasi yang tepat dan akurat. Bentuk datanya juga bermacam-macam. Bisa dari tim terkait ataupun sistem informasi yang telah disediakan oleh perusahaan.


Secara umum, data scientist diibaratkan sebagai seorang peneliti untuk bisa mengumpulkan dan menganalisis banyaknya data yang masih acak-acakan melalui teknologi dan bantuan algoritma tertentu. Pastinya tugas sehari-hari data scientist tidak akan jauh-jauh dari yang namanya data. Makanya, buat kalian nih jangan salah sangka ya. Kinerja data scientist patut kita apresiasi karena dengan keberadaan mereka yang bisa menghasilkan rekomendasi kebijakan berlandaskan data. Apalagi dalam bisnis, banyak sekali permasalahan yang bisa ditelusuri. 


1. Membuat Pertanyaan untuk Membingkai Masalah Bisnis

Menjadi seorang data scientist menuntut kita untuk lebih peka dan terbuka terhadap berbagai permasalahan yang ada dalam bisnis. Cepat ataupun lambat, perubahan akan selalu ada. Salah satu tugas yang sehari-harinya dilakukan oleh data scientist adalah membuat pertanyaan berdasarkan masalah yang terjadi di dalam sebuah bisnis. 


Caranya gimana? Kamu ambil suatu fenomena yang terjadi tentang masalah apa sih yang akhir-akhir ini sedang dirasakan. Kalau sudah menemukan masalahnya, silakan ajukan pertanyaan sebanyak-banyaknya untuk mencoba mencari solusinya apa sih dari masalah tersebut. Gampangnya, kayak kita membuat pertanyaan yang ada di rumusan masalah pada penelitian.

Data Scientist

Kita ambil contoh seperti ini. Perusahaan NM sedang melakukan percobaan strategi digital marketing yang mulai diterapkan pada kuartal pertama tahun 2021. Manajer meminta data scientist untuk melakukan uji coba data terhadap strategi baru dengan menggunakan data penjualan pada kuartal terakhir tahun 2020, data sebaran platform digital dan marketplace, kuantitas penjualan, dan lain-lain. Dari sini, seorang data scientist mulai menemukan banyak pertanyaan dan kejanggalan antara lain:

  • Siapa target pasar yang ingin disasar dalam strategi digital marketing ini?

  • Berapakah target penjualan yang ingin dicapai apabila perusahaan ingin menerapkan strategi digital marketing dalam waktu dekat?

  • Ada berapakah channel yang ingin dioptimalkan untuk melakukan kegiatan pemasaran digital?

  • Apa yang membedakan strategi pemasaran yang lama dengan yang baru?

  • Apa saja strategi yang perlu dilakukan untuk bisa mengaplikasikan strategi digital marketing?

  • Pertanyaan-pertanyaan ini biasanya dijadikan sebagai dasar pertimbangan untuk melakukan uji coba apakah kiranya berhasil atau tidak dalam menerapkan strategi baru yaitu digital marketing.


Baca juga : Mengenal Profesi Data Scientist


2. Mengumpulkan Data untuk Relevan untuk Masalah Bisnis

Dari pertanyaan yang sudah kita susun atas berbagai kemungkinan yang terjadi, langkah selanjutnya adalah data scientist perlu mengumpulkan data yang relevan terkait strategi baru tadi. Diatas mimin sudah berikan sedikit Clue bahwa data yang perlu diambil adalah data penjualan pada kuartal terakhir tahun 2020, data sebaran platform digital dan marketplace, kuantitas penjualan, dan lain-lain. 

Data Scientist

Data-data tersebut sangat mewakili keadaan dari munculnya strategi baru di perusahaan NM. Ingat, data yang kamu kumpulkan adalah data mentah. Karakteristiknya mudah kita tebak bahwa data mentah masih mengandung kesalahan dan error. Jadi, sebelum kamu melakukan analisis data, bersihkan dulu datanya dari missing value.


3. Menumpas Error Pada Data

Error menggambarkan perbedaan antara nilai yang diperoleh dari proses pengumpulan data dan nilai “benar” untuk populasi. Semakin besar kesalahan maka semakin kurang representatif data dari populasi. Survei menunjukkan bahwa lebih dari 70 persen tugas sehari-hari data scientist dihabiskan untuk membersihkan data. 


Walaupun proses pengumpulan data sudah dilakukan sebelumnya, tetapi data belum sepenuhnya bisa digunakan karena benar-benar masih mentah. Data scientist perlu memastikan bahwa data yang dikumpulkan bersih dan bebas dari kesalahan apapun. Mulai dari kesalahan pengukuran, kesalahan dalam jumlah, kesalahan satuan dalam pengukuran dan lain-lain.

Data Scientist

Tugas yang satu ini benar-benar tidak bisa dianggap remeh. Sebab, butuh kesabaran dan fokus yang tinggi. Data scientist dapat menggunakan software untuk mempermudah proses cleaning data. Seperti Python, R, SQL yang bisa mensupport data agar siap dianalisis. 


Setelah dilakukan pembersihan data, cek lagi apakah ada data yang hilang setelah proses cleaning data? Apakah nilainya sudah valid semuanya? Kalau ada kumpulan data, bagaimana cara menggabungkannya? Setiap dugaan ini perlu dipastikan kembali. Jika semuanya dirasa sudah tidak ada yang dipermasalahkan maka bisa dilanjutkan dalam tahap analisis data untuk mendapatkan hasil.


4. Analisis Mendalam Terhadap Data

Lanjut, tugas seorang data scientist adalah melakukan analisis mendalam dari data yang sudah dikumpulkan dan dicek melalui proses cleaning data. Nantinya dari data tersebut akan dibuat suatu model untuk menjawab pertanyaan tadi. Kita tarik contoh yang tadi aja ya. Misalnya perusahaan ingin menerapkan strategi digital marketing maka dari data yang telah dikumpulkan langsung dibuat analisis untuk menjawab pertanyaan apa saja strategi yang perlu dilakukan untuk bisa mengaplikasikan strategi digital marketing? 

Ada beberapa hal yang dilakukan dalam proses analisis data oleh data scientist

  • Melakukan analisis data dengan penerapan berbagai algoritma 

  • Membangun model data untuk menjawab pertanyaan

  • Validasi model terhadap data yang dikumpulkan

  • Penggunaan berbagai tools dalam melakukan visualisasi data untuk penyajian data

  • Melakukan berbagai algoritma dan analisis statistik yang diperlukan

  • Membandingkan antara hasil dengan teknik dan sumber lainnya


Dari data-data yang telah dikumpulkan maka data scientist bisa segera membuat keputusan yang mana apakah bisa diterapkan strategi digital marketing atau tidak. Misalnya target pasar yang dipilih berdasarkan hasil analisis adalah ibu rumah tangga, kemudian target penjualan untuk strategi digital marketing juga berbeda dengan strategi pemasaran secara langsung.


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


5. Melaporkan Hasil Analisis Kepada Pihak Terkait

Setelah analisis berhasil dilakukan, terakhir data scientist melaporkan hasil analisisnya kepada pihak terkait. Sayangnya tidak banyak orang yang tahu bahwa skill komunikasi benar-benar penting dalam dunia data scientist. Sebab, ketika seorang data scientist sulit untuk melaporkan hasilnya, bagaimana bisa pihak-pihak terkait itu bisa paham dengan hasil kamu. 

Data Scientist

Dalam mengkomunikasikan hasil temuannya, seorang data scientist perlu memperhatikan beberapa hal sebagai berikut:

  • Data scientist bisa melaporkan hasilnya menggunakan bagan atau grafik sebagai bahan untuk presentasi.

  • Gunakan teknik storytelling karena kembali lagi bahwa tidak semua paham sama apa yang kamu sajikan melalui presentasi

  • Jawab pertanyaan sesuai dengan rencana atau tujuan dari pihak tersebut

  • Sampaikan rekomendasi maupun saran kepada pihak terkait untuk kedepannya dari hasil analisis data yang telah dilakukan oleh data scientist


Jadi bisa dibayangkan ya, apabila tugas data scientist bisa menjadi sebuah perpanjangan tangan kepada pemangku kepentingan untuk bisa merumuskan kebijakan yang tepat bagi sebuah bisnis. Nah, apakah kamu pengen juga seperti mereka sahabat DQ? Untuk menjawab kebutuhan kamu, sekarang ini DQLab punya tiga bahasa pemrograman yang bisa kamu kuasai. Ada R, Python dan SQL. Belajarnya juga seru karena pakai live code editor biar langsung sekalian praktik. Terus cobain modul gratis dari kita yaitu “Introduction to Data Science with R” dan “Introduction to Data Science with Python”. 


Nikmati kompetensinya sekarang untuk belajar data science dengan cara signup pada form dibawah ini ya!


Penulis: Reyvan Maulid


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login