Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Yuk, Bangun Portfolio Data Science dengan 4 Algoritma Populer

Belajar Data Science di Rumah 31-Januari-2022
https://dqlab.id/files/dqlab/cache/31ca31661ccd97fcdd67cac76ac803f9_x_Thumbnail800.jpg

Sebelum eksistensi internet muncul, bahkan tools dan teknologi belum secanggih sekarang algoritma data science sudah ada sejak lama. Algoritma sendiri adalah serangkaian instruksi yang digunakan agar komputer dapat memecahkan masalah berdasarkan inputan tertentu dalam waktu yang terbatas. Algoritma digunakan di semua permasalahan yang membutuhkan komputers untuk memecahkan permasalahan tersebut termasuk dalam bidang data science. Dengan menggunakan algoritma data science kamu dapat memecahkan pola-pola dibalik suatu data. Terdapat 3 jenis algoritma dalam data science antara lain supervised learning, unsupervised learning, dan reinforcement learning.


Dimana algoritma supervised learning merupakan jenis algoritma yang tidak bisa belajar sendiri tetapi harus diberi contoh terlebih dahulu dengan cara memberi label pada dataset yang kita punya. Memberi label disini artinya adalah dataset kita telah diberikan nilai kebenarannya yang akan dijadikan sebagai nilai target atau nilai acuan. Sementara Unsupervised Learning mengacu pada kesimpulan pola yang mendasari sekumpulan data tak berlabel atau tanpa referensi apa pun ke hasil atau prediksi berlabel, meskipun tanpa label kita memiliki data-data aktual yang dapat digunakan untuk mengobservasi data tersebut berdasarkan kriteria yang sejenis untuk mendapatkan suatu kesimpulan. Reinforcement Learning berfokus pada proses pembelajaran yang diatur, dimana algoritma Machine Learning ini dilengkapi dengan serangkaian tindakan, parameter, dan nilai akhir. Untuk lebih lanjut, artikel ini akan membahas 4 contoh algoritma data science berdasarkan ketiga jenisnya tadi, yang bisa kamu terapkan pada portfolio data kamu Yuk, simak penjelasannya !


1. Support Vector Machine (SVM)

Algoritma SVM termasuk kedalam jenis algoritma supervised learning karena untuk dapat melihat pola suatu data harus diberikan di training terlebih dahulu. Sebenarnya SVM termasuk ke dalam model klasifikasi dan regresi, tetapi lebih banyak digunakan dalam kasus-kasus klasifikasi. Karena dengan model SVM kita dapat melakukan plotting pada setiap item data sebagai titik dalam ruang n-dimensi (dimana n adalah jumlah fitur yang kita miliki) dengan nilai di setiap fitur tersebut menjadi nilai koordinat tertentu. Kemudian, kita akan melakukan klasifikasi dengan menemukan hyperplane yang membedakan kedua kelas dengan sangat baik serta dari sisi feasibility SVM tergolong mudah diimplementasikan. Tetapi SVM memang cenderung tidak cocok digunakan untuk jumlah sampel berskala besar, serta SVM baru bisa dikembangkan untuk pengklasifikasian dua class atau lebih saja sedangkan untuk kasus multiclass problem masih dalam tahap penelitian.


data science


Baca juga : Belajar Data Science Secara Otodidak? Berikut langkah-langkahnya!


2. K-Means Clustering

Algoritma K-Means Clustering termasuk dalam jenis algoritma unsupervised learning karena untuk dapat memprediksi dan menarik kesimpulan kita tidak perlu melabeli satu persatu data, tapi kita akan mengumpulkan data-data yang memiliki kemiripan berdasarkan clusternya. Secara umum K-Means Clustering menentukan jumlah dari cluster pembagian, mengalokasikan data secara acak ke cluster yang telah ada,  menghitung rata-rata pada setiap cluster dari data yang ada tergabung di dalamnya, kemudian mengalokasikan kembali semua data yang berada di cluster terdekat, dan mengulang proses mengulang kembali proses menghitung rata-rata pada setiap cluster dari data yang tergabung di dalamnya. K-means clustering mudah ketika diimplementasikan sehingga waktu yang dibutuhkan untuk melakukan pembelajaran relatif lebih cepat, dan menggunakan prinsip yang dapat dijelaskan dalam non-statistik. Meskipun begitu, K-means perlu menginisialisasikan titik k secara random sehingga kemungkinan mendapat nilai penginisialisasi kurang baik maka pengelompokan yang didapatkan menjadi tidak optimal. Penggunaan k random , tidak menjamin untuk menemukan kumpulan cluster yang optimal juga.


data science


3. Q-Learning

Jenis Algoritma Q-learning termasuk dalam jenis algoritma reinforcement learning yang cocok digunakan dalam kasus-kasus pembuatan aplikasi robot. Sesuai dengan namanya Q-learning menggunakan tabel Q untuk mencocokan kondisi diskrit dan aksi saja. Q-learning merupakan terobosan paling penting dalam reinforcement learning. Tidak seperti TD-learning yang memperbarui value function berdasarkan state selanjutnya, Q-learning memperbarui value function berdasarkan nilai action-value function terbesar di state selanjutnya. Tetapi, untuk aplikasi robot dengan arsitektur kontrol waktu nyata yang ukuran kondisi dan data sensornya bersifat kontinu, hal ini justru menjadi tidak praktis. 


4. Decision Trees

Algoritma Decision Tree merupakan salah satu algoritma Supervised Learning paling populer yang digunakan saat ini. Tidak seperti algoritma Supervised Learning lainnya, algoritma Decision Tree dapat digunakan untuk memecahkan masalah regresi dan klasifikasi juga. Tujuan algoritma Decision Tree untuk membuat model pelatihan yang dapat digunakan untuk memprediksi kelas atau nilai variabel target dengan mempelajari aturan keputusan sederhana yang disimpulkan dari data training (data pelatihan). Dengan Decision Tree untuk memprediksi label kelas untuk catatan kita mulai dari root node, kemudian node tersebut bercabang untuk menyatakan pilihan-pilihan yang ada.  Algoritma Decision Tree memiliki tiga elemen yaitu, root node yang merupakan goals dari pengambilan keputusan, branches yang merupakan berbagai pilihan tindakan, serta leaf node kemungkinan dari masing-masing tindakan. Adapun jenis Decision Tree berdasarkan variabel target yang dimiliki dibagi atas dua jenis antara lain: Categorical Variable, dan Continuous Variable. 


data science


Baca juga : Mulai Belajar Data Science GRATIS bersama DQLab selama 1 Bulan Sekarang!


5. Intip Modul DQLab Tentang Algoritma Machine Learning Disini, Yuk!

Kamu tidak memiliki background pendidikan STEM? Tapi, ingin berkarir sebagai praktisi data. Sudah mencoba belajar otodidak, tapi malah overdosis informasi? Ingin mengikuti kursus tapi tidak punya waktu untuk pergi ke tempat kursus. Gabung dengan DQLab adalah solusi. Disini kamu akan belajar skill data science salah satu algoritma-algoritma yang akan digunakan untuk mendevelop dan menambahkan portfolio data science. Dengan bermodalkan koneksi internet kamu bisa belajar secara fleksibel dan dapat diakses dimanapun dan kapanpun.

Materinya pun disusun oleh mentor-mentor yang kompeten di bidangnya dari perusahaan unicorn dan startup. Jadi, jangan khawatir, kamu bisa mulai kursus data science online bersama DQLab! Sign up sekarang di DQLab.id atau klik button dibawah ini untuk nikmati pengalaman belajar yang seru dan menyenangkan. Yuk, buruan sign up sekarang dan cobain materi introduction data science, Gratis!


data science



Penulis: Rian Tineges

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login