Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Jangan Salah Pilih Machine Learning Untuk Riset Data

Belajar Data Science 16-Januari-2021
https://dqlab.id/files/dqlab/cache/86900f3b23faea8b1b6c89d6ba4c92e8_x_Thumbnail800.jpg

Machine learning merupakan mesin yang dikembangkan dengan sendirinya tanpa mendapatkan arahan dari penggunanya. Terdapat berbagai macam tipe machine learning yang bisa dipilih bagi praktisi data dalam melakukan pengolahan data maupun prediksi model. Tipe machine learning tersebut antara lain supervised learning, unsupervised learning dan reinforcement learning. Pemilihan tipe machine learning juga tidak bisa sembarangan dan asal ya sahabat data. Hal ini dikarenakan setiap dari tipe machine learning memiliki karakteristik yang berbeda-beda tergantung dari case yang akan dianalisis. Misalnya perusahaan ingin melakukan riset segmentasi pasar dengan mempertimbangkan data usia, gender, pekerjaan, frekuensi dan kualitas pembelian dalam kurun periode terakhir. Dengan case berikut, jawabannya sahabat data bisa menggunakan algoritma Unsupervised Learning.


Selain mengenal tipe machine learning, sebagai seorang data scientist juga mampu mengenali aplikasi dari penggunaan tipe machine learning. Misalnya saja,  K-Means Clustering bertujuan untuk mengklasifikasikan atau mengelompokkan ragam variabel yang akan diteliti. Penggunaan K-Means Clustering ini termasuk dalam golongan tipe machine learning yaitu algoritma unsupervised learning. Sepanjang perjalanannya maupun proyek yang akan dikerjakan, data scientist perlu mendalami dan memahami apa kasusnya, permasalahan dan tujuan serta masalah tersebut akan diselesaikan menggunakan metode algoritma machine learning yang mana. Jangan sampai ketika sudah memilih tipe machine learning sebelumnya, malah akan berdampak pada hasil dan kesimpulan yang kurang aplikatif. Hal ini berimbas pada rekomendasi yang kurang relevan ketika diajukan kepada tim operasional bisnis. Maka dari itu, pada artikel kali ini DQLab akan mengulas apa saja kriteria dalam pemilihan tipe machine learning yang tepat. Dengan memilih machine learning yang sesuai dan tepat, maka hasilnya juga tepat. Sahabat data juga perlu menyimak hal apa saja yang perlu dipertimbangkan dalam pilihan tipe machine learning. Melalui artikel ini, sahabat data dapat menemukan jawabannya. Jadi, Baca selengkapnya dan pastikan kalian simak artikelnya berikut ini!




1.Pelajari Case yang akan dikerjakan dan Kenali Karakteristiknya

Pertama, sahabat data perlu mempelajari case yang akan dianalisis. Kalian bisa guideline atau latar belakang proyek sebelum memilih algoritma machine learning. Misalkan, perusahaan AB memiliki data usia, gender, pekerjaan, tempat tinggal, frekuensi pembelian, dan kuantitas pembelian dari produk N selama dua tahun terakhir. Data ini bisa digunakan oleh perusahaan AB untuk melakukan segmentasi pasar berdasarkan data-data tadi. Dengan algoritma Unsupervised Learning, kita tidak perlu men-declare atau menetapkan "label" atau "output yang benar". Kita tidak perlu melabeli pembeli dengan usia, gender, dan kriteria tertentu ke dalam kelompok tertentu. Kita tidak perlu menentukan jumlah kelas/kelompok dan kriteria tiap kelompok. Di sini algoritma machine learning akan melihat dan mempelajari pola-pola dari karakteristik tiap data yang ada dan melakukan pengelompokan pembeli secara mandiri. 


Kemudian, sahabat data DQLab juga bisa melihat karakteristiknya berdasarkan output atau data. Misalkan jika outputnya berupa angka, maka bisa menggunakan regression. Jika berupa kelas-kelas, maka bisa menggunakan classification. Ketika ingin mendeteksi data apakah terjadi kecenderungan atau melihat apakah ada anomali data, maka pilihan yang tepat adalah deteksi anomali data. Tentunya sebagai seorang data scientist, kualitas data sangat penting demi keberlanjutan bisnis yang sustain. Sehingga, pada akhirnya keputusan yang dipilih dapat menjadi rekomendasi untuk memaksimalkan tujuan bisnis.


Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan


2. Pilih Algoritma Machine Learning Sesuai Tujuan

Setelah mengetahui karakteristik kasus dan permasalahannya, sekarang kita perlu mengetahui algoritma apa sih yang akan kita gunakan. Dalam menentukan pilihan algoritma apa saja yang ingin dipilih, ada beberapa pertanyaan yang perlu ditanyakan seperti apakah model tersebut memenuhi tujuan bisnis? Seberapa akurat modelnya? Seberapa mudah untuk dapat dijelaskan model tersebut? Sejauh mana algoritma machine learning ini dapat scalable untuk penggunaannya. Kriteria penting yang mempengaruhi pemilihan algoritma adalah kerumitan model. Hal ini bergantung pada lebih banyak fitur untuk dipelajari dan diprediksi (misalnya menggunakan dua fitur vs sepuluh fitur untuk memprediksi target) Selain itu, rekayasa fitur yang lebih kompleks (misalnya menggunakan istilah polinomial, interaksi, atau komponen utama) dan overhead komputasi (misalnya satu pohon keputusan vs. hutan acak yang terdiri dari 100 pohon). 


Baca juga: Belajar Data Science: Pahami Penggunaan Machine Learning pada Python


3. Terapkan Aplikasi Algoritma Machine Learning Sebagai Pemecahan Masalah

Terdapat beberapa jenis aplikasi algoritma machine learning yang bisa digunakan. Contohnya regresi logistik. Algoritma ini biasa digunakan untuk menghitung nilai probabilitas, sehingga output yang dihasilkan berada antara nilai 0 hingga 1. Contoh penggunaannya adalah proses pengajuan kredit di bank. Biasanya pihak bank akan mengajukan sejumlah pertanyaan/kuesioner untuk menilai kelayakan calon penerima kredit. Dari beberapa pertanyaan itulah nantinya pihak bank akan memperhitungkan probabilitas calon penerima kredit akan mengembalikan pinjaman atau tidak. Misalnya lagi adalah Pohon keputusan atau Decision Tree. Dimana, penggunaan decision tree ini dapat dengan mudah menangani interaksi data berbentuk non-parametrik, jadi tidak perlu khawatir tentang adanya outliers atau apakah datanya dapat dipisahkan secara linier. Contoh penggunaan decision tree adalah mengidentifikasi dan menganalisis customer churn (persentase pelanggan yang berhenti menggunakan produk dan layanan bisnis)


Tapi kembali lagi, bahwa algoritma yang dipakai tentunya disesuaikan dengan tujuan pemakaiannya. Bisa jadi suatu masalah dapat diselesaikan tidak hanya dengan satu algoritma saja. Semua algoritma memiliki kelemahan dan kelebihannya masing-masing. Oleh karena itu, kita dapat memilah-milah atau mengkombinasikan beberapa algoritma dalam menyelesaikan masalah untuk memperoleh hasil yang maksimal.


4. Pengen Mengenal Lebih Dalam Tentang Machine Learning? Yuk Mulai Belajar Data Science Sekarang!

Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri data yang sebenarnya! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

1.Buat Akun Gratis dengan Signup di DQLab.id/signup

2.Akses module Introduction to Data Science

3.Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

4.Subscribe DQLab.id untuk Akses Semua Module Premium!


Penulis: Reyvan Maulid Pradistya

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login