Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Jenis Model Linear Algoritma Supervised Learning

Belajar Data Science 12-Januari-2021
https://dqlab.id/files/dqlab/cache/90f3a34d7de9045827e014889f112a34_x_Thumbnail800.jpg

Selain penggunaan algoritma unsupervised learning, seorang data scientist juga perlu memahami penggunaan algoritma supervised learning. Algoritma supervised learning merupakan algoritma machine learning dengan mencantumkan label di setiap dataset sebagai supervisornya. Algoritma supervised learning diibaratkan sebagai adanya supervisor layaknya wali kelas yang mengontrol siswanya. Algoritma ini telah memberikan isyarat bahwa terdapat label dari data yang akan kita olah. Algoritma supervised learning ini dapat berupa classification dan regression. Algoritma supervised learning banyak digunakan dimana pola ini sudah ada seperangkat dataset yang telah dilengkapi label. Hal ini biasanya dilakukan oleh Data Scientist untuk melakukan pengujian data dari pilihan algoritma machine learning yang tersedia, salah satunya algoritma supervised learning.


Seorang Data Scientist tentunya mengemban tugas dan tanggung jawab untuk melakukan data mining. Data scientist dituntut dapat membangun model untuk memperkaya wawasan atas pengolahan data yang telah dilakukan. Dibutuhkan waktu dan keterampilan teknis dari tim ilmuwan data agar mampu menerapkan algoritma machine learning secara tepat sesuai tujuan yang ingin dicapai dan ketersediaan kebutuhan data. Secara umum dalam istilah algoritma, terdapat dua jenis data yaitu data training dan data testing. Data training nantinya akan digunakan untuk melatih algoritma dalam mencari model yang sesuai, sedangkan data testing akan dipakai untuk menguji dan mengetahui performa model yang didapatkan pada tahapan testing. Salah satu penggunaan algoritma supervised learning adalah regression. Penggunaan scikit-learn adalah pilihan tepat karena salah satu library python yang digunakan untuk melakukan prediksi model melalui machine learning. Terdapat berbagai jenis regresi linier yang dilakukan mulai dari regresi logistic, support vector machine, naive bayes dan masih banyak macam lainnya. Pada artikel kali ini, DQLab akan mengulas beberapa jenis regresi linear model yang menggunakan algoritma supervised learning khususnya dengan scikit-learn spesial untuk kalian. Baca selengkapnya dan pastikan kalian simak artikelnya berikut ini!



1. Gaussian Processes 

Gaussian Processes (GP) adalah penggunaan algoritma supervised learning yang dirancang untuk memecahkan masalah klasifikasi regresi dan probabilistik. Terdapat keuntungan dan kerugian ketika sahabat data menerapkan metode ini. Dimulai dari keuntungannya, melakukan prediksi menggunakan Gaussian Processes dapat menginterpolasi pengamatan (setidaknya untuk kernel biasa). Prediksinya bersifat probabilitas (Gaussian) sehingga seseorang dapat menghitung confidence interval dan memutuskan berdasarkan pada seseorang harus mereparasi prediksi di beberapa wilayah yang diminati. Gaussian Processes juga dinilai serbaguna atau versatile. Hal ini karena dengan kernel berbeda dapat ditentukan. Kernel umum memang disediakan, tetapi juga memungkinkan untuk menentukan kernel khusus. Namun kerugiannya ialah mereka menggunakan seluruh sampel untuk melakukan prediksi.


Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan


2. Least-Angle Regression

Least-angle regression atau LARS adalah algoritma yang digunakan dalam regresi untuk data berdimensi tinggi (yaitu, data dengan atribut dalam jumlah besar). Algoritma ini dikembangkan oleh Bradley Efron, Trevor Hastie, Iain Johnstone dan Robert Tibshirani. LARS mirip dengan forward stepwise regression. Karena digunakan dengan data yang memiliki banyak atribut, LARS menemukan atribut yang paling berkorelasi tinggi dengan nilai target. Ada lebih dari satu atribut yang memiliki korelasi yang sama. Dalam skenario ini, LARS menghitung rata-rata atribut dan melanjutkan ke arah yang memiliki sudut yang sama dengan atribut. Inilah mengapa algoritma ini disebut Least Angle Regression. Pada dasarnya, LARS membuat lompatan ke arah yang dihitung paling optimal tanpa overfitting model.


Syarat yang dipenuhi regresi jenis ini adalah normalisasi semua nilai agar memiliki mean nol dan varian satuan. Kemudian, cara kerja regresi LARS adalah temukan variabel yang paling berkorelasi dengan residual. Pindahkan garis regresi ke arah ini hingga kita mencapai variabel lain yang memiliki korelasi yang sama atau lebih tinggi. Dimana, residual adalah selisih antara nilai observasi dan nilai prediksi. Variabel yang dimaksud disini menyiratkan sebuah atribut. 


Baca juga: Belajar Data Science: Pahami Penggunaan Machine Learning pada Python


3. Stochastic Gradient Descent - SGD

Stochastic Gradient Descent adalah pendekatan sederhana dan efisien dalam melakukan klasifikasi linier dengan pembelajaran diskriminatif. Metode SGD merupakan algoritma optimasi iteratif untuk mencari titik fungsi minimum yang dapat diturunkan. Algoritmanya dimulai dengan cara melakukan penebakan di awal proses. Kesalahan penebakan-penebakan kemudian diperbaiki seiring adanya perulangan tebakan yang menggunakan aturan gradien (turunan) dari fungsi yang hendak diminimalkan. SGD memiliki sifat yang lebih label dan lebih cepat ketika dilakukan pelatihan klasifikasi serta tidak terbatas pada waktu dalam pelaksanaanya berdasarkan ukuran dataset latih. Metode SGD memiliki kemampuan belajar yang lebih cepat.


4. Pengen Mengenal Lebih Dalam Tentang Machine Learning? Yuk Mulai Belajar Data Science Sekarang!

Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

1.Buat Akun Gratis dengan Signup di DQLab.id/signup

2.Akses module Introduction to Data Science

3.Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

4.Subscribe DQLab.id untuk Akses Semua Module Premium!


Penulis: Reyvan Maulid Pradistya

Editor : Annissawd


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login