Roadmap Terupdate Profesi Data Scientist di tahun 2022
Data Scientist sama halnya dengan profesi lain, dimana harus dipelajari step by step terutama bagi kamu yang tidak berasal dari background pendidikan yang berhubungan dengan Data Science. Pembelajaran dengan memperkuat hal-hal yang bersifat fundamental akan membuat hal yang lebih rumit bisa diselesaikan dengan mudah. Itulah mengapa, sebagai seorang pemula di suatu bidang, kita ada baiknya memulai dari hal yang sederhana dan fundamental terlebih dahulu, agar ketika bertemu materi yang lebih rumit bisa diselesaikan dengan menggunakan pemahaman fundamental.
Roadmap Data Science sendiri bisa disebut sebagai bagian dari kurikulum ketika kita belajar ilmu Data Science. Umumnya, roadmap akan berisi skill-skill yang lebih spesifik untuk mencapai sebuah tujuan, dalam hal ini tujuan kita adalah untuk menjadi seorang Data Scientist. Skills yang disebutkan dalam roadmaps adalah skill multi-level yang lebih rinci yang perlu kita asah secara terus menerus.
Terus, roadmap untuk menjadi seorang Data Scientist itu gimana sih? Tenang aja, dalam artikel ini, kita akan membahas hal tersebut. Yuk, simak artikelnya!
1. Statistika
Statistika merupakan salah satu hal yang cukup krusial dan memegang peranan penting dalam ilmu Data Science. Berikut adalah hal-hal yang harus kamu kuasai dari Statistika untuk menjadi Data Scientist yang hebat:
Introduction to Statistics, lebih berisi sekilas tentang perkenalan statistika, seperti pembagian menjadi analisis deskriptif dan analisis inferensial, skala data yang ada, ukuran pemusatan data, ukuran penyebaran data, dan lainnya.
Sampling, membicarakan teknik pengambilan sampling, sampling distribution, dll.
Parameter Estimation
Pengujian Hipotesis
ANOVA
Stochastic Process
Rancangan Percobaan
Regresi Linear Sederhana & Multiple Regression
Korelasi
Statistik Non Parametrik, seperti Uji Tanda, Uji Wilcoxon, Uji Kruskal-Wallis, dll
Dasar dari Grafik dan Chart
Baca juga : Mengenal Profesi Data Scientist
2. Programming
Selain Statistika, kamu juga harus menguasai Programming juga loh. Bahasa pemrograman yang umum digunakan oleh Data Scientist adalah bahasa R, Python, dan juga SQL. Namun di beberapa perusahaan ada juga yang menambah dengan bahasa-bahasa lainnya.
Python:
Python Basics, seperti List, Set, Tuples, Dictionary, Function, dll
NumPy
Pandas
Matplotlib & Seaborn, dll
R:
R Basics, seperti Vector, List, Data Frame, Matrix, Array, Function, dll
Package dplyr
Package ggplot2
Package Tidyr
R Shiny
DataBase:
SQL
MongoDB
Other:
Data Structure
Time Complexity
Web Scraping
3. Machine Learning
Source: Universitas STEKOM
Machine Learning juga menjadi hal yang harus dikuasai oleh seorang Data Scientist, karena dapat mempermudah pekerjaan yang ada, dimana mesin diminta untuk membuat keputusan secara otomatis dengan cara mengikuti pola pikir manusia. Paling tidak, seorang Data scientist harus menguasai basic dari algoritma Supervised Learning dan Unsupervised Learning.
Introduction:
Cara Model dan Algoritma Bekerja
Basic Data Exploration
Model Machine Learning Pertama
Model Validation
Underfitting & Overfitting
Algoritma Supervised Learning & Unsupervised Learning, seperti Random Forest, K-Means Clustering, Regression, dll
scikit-learn
Intermediate:
Handling Missing Values
Handling Categorical Variables
Pipelines
Cross-Validation
XGBoost
Data Leakage
4. Data Visualisasi
Source : Kyubit.com
Selain hal yang telah dijelaskan di atas, Data Visualisasi juga sangat penting untuk dikuasai oleh Data Scientist. Jika kamu bisa menguasai pembuatan visualisasi dengan memanfaatkan bahasa pemrograman yang ada, itu sudah cukup bagus. Namun ternyata ada loh beberapa tools visualisasi data yang bisa lebih mudah untuk dikuasai. Tidak ada salahnya jika kamu mulai mempelajari nya juga.
Excel VBA
BI (Business Intelligence):
Tableau
Power BI
Qlik View
Qlik Sense
Baca juga : Yuk Kenal Role Data Scientist, Profesi Menarik Dengan Gaji Besar
Gimana nih, setelah mengetahui road map untuk menjadi Data Scientist? Menariknya nih, kamu ternyata bisa mempelajari tentang statistika, bahasa pemrograman, machine learning, serta data visualisasi dari modul premium yang ada di DQLab loh. Dengan sekali berlangganan, kamu akan bisa menikmati modul-modul yang berkaitan dengan hal tersebut loh. Hemat banget kan?
Namun kamu adalah seorang pemula yang belum pernah belajar Data Science, kamu bisa memulai dengan mencoba free modul yang disediakan oleh DQLab. Saat ini, free modul bisa kamu nikmati untuk bahasa R yang berjudul œIntroduction to Data Science using R dan juga Python dengan judul modul œIntroduction to Data Science using Python.
Yuk, tunggu apa lagi? Giliranmu sekarang menjadi Data Scientist!
Penulis : Gifa Delyani Nursyafitri