Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Step by Step Tugas Data Scientist dengan Framework OSEMN

Belajar Data Science di Rumah 18-April-2022
https://dqlab.id/files/dqlab/cache/ce1af54e3fce46845ab5838bef70fab5_x_Thumbnail800.jpg

Seorang data scientist tidak hanya handal dalam melakukan analisis dan interpretasi data. Data scientist juga disarankan untuk memiliki keahlian pendukung seperti bahasa pemrograman (coding) dan pemodelan matematika atau mathematical modelling. Data scientist ketika mendeliver sebuah tugas baik yang dikerjakan sendiri atau untuk kebutuhan tim memiliki workflow atau cara kerja yang dapat membantu mereka melakukan analisis data dalam jumlah besar. 


Salah satu framework atau kerangka kerja yang dapat membantu data scientist untuk mengerjakan tugasnya adalah framework OSEMN. OSEMN merupakan tahapan-tahapan atau urutan aktivitas yang jelas dan menjadi hal yang penting dalam sebuah proses data science. 


Framework OSEMN memuat berbagai step-by-step alias langkah-langkah yang dikerjakan oleh data scientist. Mulai dari pengumpulan data, preparasi data sampai interpretasi data. Framework ini dapat bermanfaat untuk pemecahan masalah dalam bidang analisis data science. Tahapan OSEMN bisa dibilang pengerjaannya sangat runtut sehingga jika salah satu tahap miss atau hilang maka penarikan kesimpulan tidak bisa dilakukan.

data scientist


Jika, kebetulan kamu pemula yang ingin berkarir menjadi seorang data scientist, pastinya penasaran lebih lanjut dong dengan tahapan dari framework OSEMN ini? Pada artikel ini kita akan bahas khusus terkait step-by-step tugas seorang data scientist dengan framework OSEMN. Yuk simak terus artikel ini untuk mempersiapkan dirimu berkarir menjadi Data Scientist! Keep scrolling on this article guys!


1. Obtain 

Pada step pertama ini, Data Scientist melakukan tugasnya yaitu Obtain. Obtain disini menandakan bahwa data scientist mulai mengumpulkan setiap data yang relevan dengan tujuan atau target. Disini Data Scientist dituntut untuk peka dan ketika mengumpulkan data pastinya membutuhkan asking the right question dari business understanding untuk memperkuat tujuan pengumpulan dan hasil analisis. 

data scientist

Pada proses obtain ini kita perlu tahu terlebih dahulu data apa yang diperlukan. Pastikan sumbernya relevan dan persiapan data yang matang agar memenuhi hasil yang diinginkan. Sumber data bisa didapatkan oleh Data Scientist dari file. Bisa dari Kaggle untuk unduh data, data dalam format CSV. Data scientist juga bisa menggunakan scraping data dengan bantuan extension dari Google Chrome dan crawling data dari Web API seperti Facebook atau Twitter.


Baca juga : Mengenal Profesi Data Scientist


2. Scrub

Pada step kedua, data yang telah dikumpulkan akan masuk kedalam tahap pembersihan atau cleaning data. Data scientist akan melakukan investigasi keseluruhan data. Mulai dari format data, keseragaman data, jenis data, atribut data bahkan anomali data pada dataset yang telah kita kumpulkan. Tahap-tahap yang dilakukan oleh Data Scientist pada proses Scrub meliputi handling missing data, correcting invalid values, removing duplicates, structuring the data dan feature engineering. 

data scientist

Ketika scrubbing data tidak berhasil maka hasilnya pun tidak berguna untuk dilakukan ataupun lanjut ke tahap selanjutnya. Ketika Data Scientist menemukan ketidaksesuaian atau kerusakan pada data maka jalan satu-satunya melakukan cross-checking dari sumber data yang telah dikumpulkan.


3. Explore

Lanjut pada tahap eksplorasi atau explore. Disini Data Scientist bertugas untuk mengeksplorasi pola dari data yang sudah diberikan pada tahap kedua yaitu scrubbing data. Data Scientist perlu memandang hasil eksplorasi pola dari sudut pandang domain knowledge ataupun ilmu bisnis. Hal ini dilakukan agar Data Scientist bisa merumuskan saran atau solusi yang akurat dan relevan berdasarkan pola yang telah dieksplorasi. 

data scientist

Biasanya data scientist melakukan pemeriksaan data terlebih dahulu sebelum dikerjakan. Ketika data scientist menemukan tipe data yang berbeda maka treatment yang dilakukan juga berbeda. Lalu, Data Scientist biasanya juga menggunakan metode correlation untuk melakukan pengujian extract features dan mengetes adanya significant variables pada data.


4. Model

Tahap selanjutnya adalah Model atau Modelling. Disinilah data scientist melakukan proses data modelling atau pemodelan data pada hasil eksplorasi pola yang telah dilakukan pada tahap sebelumnya yaitu Explore. Dalam prosesnya, data yang digunakan hanyalah data yang relevan dengan prediksi hasil akhir. Tahap model juga merupakan sebuah tahap yang sangat menarik dan dianggap sebagai where the magic happens alias keajaiban pun bisa terjadi. 

data scientist

Namun perlu diingat bahwa tahapan modelling data jangan dianggap enteng dan jangan terburu-buru untuk mengerjakannya. Karena jika sudah pada tahap ini adalah hal yang krusial. Data scientist bisa menggunakan regression dan prediction untuk forecasting, classification untuk identifikasi dan clustering untuk klasifikasi atau pengelompokkan pada data yang telah diamati.


5. Interpret

Tahap terakhir sekaligus tahap yang paling krusial. Tahap terakhir dalam tugas data scientist adalah Interpret. Pada tahap ini, data scientist diminta untuk menginterpretasikan model yang sudah dibuat. Disini data scientist mempresentasikan temuan kepada stakeholders sehingga model data dan insight yang kita temukan dapat dipertanggungjawabkan. 

data scientist

Di awal kita sudah menyusun pertanyaan-pertanyaan yang ingin kita tanyakan saat melakukan pengumpulan data pada tahap obtain. Pada tahap interpretasi, data scientist memerlukan actionable insight sebagai kunci. Selain itu kita juga memerlukan strong business domain knowledge untuk menyajikan penemuan yang akan menjawab business questions dan menerjemahkannya menjadi actionable steps. Perlu juga skill untuk tell a clear and actionable story kepada audience tanpa technical background.


Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar


6. Ingin Ahli di Bidang Data? Mulai Belajar Data Science Bareng DQLab Yuk!

Siapapun bisa ahli di bidang data! Dengan belajar data science di DQLab Sahabat DQ tidak perlu install software tambahan lagi. Sahabat DQ bisa langsung belajar dari sekarang karena dataset yang telah disediakan sudah sudah terintegrasi dengan live code editor. 


Jika kamu penasaran dengan data science dan ingin belajar data science secara langsung, caranya mudah banget. Sahabat DQ bisa loh untuk coba bikin akun gratisnya pada DQLab.id. Sahabat DQ bisa coba module gratis œIntroduction to Data Science dan cicipi module R & Python yang tersedia yuk. 


Signup sekarang di DQLab.id atau isi form dibawah ini yaa!


Penulis: Reyvan Maulid



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login