Intip Algoritma Apriori dalam Unsupervised Learning
Machine Learning dapat dibagi menjadi tiga kelompok utama, yaitu Supervised Learning, Unsupervised Learning, dan Reinforcement Learning. Setiap kelompok ini memiliki ciri-cirinya masing-masing dan akan menjadi sangat powerfull jika digunakan untuk mengolah data yang sesuai. Ketika tipe Machine Learning ini tetap membutuhkan proses training untuk melatih model dan testing untuk menguji akurasi model yang dibuat.
Unsupervised Learning merupakan algoritma Machine Learning yang dapat digunakan jika data inputnya tidak memiliki label. Data tanpa label inilah yang nantinya akan dilatih pada tahapan training data, sehingga outputnya akan berupa kelas kelas data.
Dengan menggunakan Unsupervised Learning, model mempelajari pola tersembunyi dari kumpulan data dengan sendirinya tanpa pengawasan apa pun. Model Unsupervised Learning umumnya akan digunakan untuk melakukan tiga tugas utama, yaitu untuk Clustering, Associate Rules, dan Dimensionality Reduction.
Dalam artikel ini kita akan fokus untuk membahas penggunaan algoritma Apriori yang merupakan salah satu algoritma yang umum digunakan pada Association Rules. Penasaran? Yuk, simak artikelnya!
1. Association Rule Learning
Association Rule Learning merupakan salah satu teknik analisis data yang termasuk ke dalam bagian Unsupervised Learning. Dalam teknik ini, kita dapat melihat hubungan antara variabel-variabel yang tersedia dari sekumpulan data yang berukuran besar. Tujuan utama dari algoritma pembelajaran ini adalah untuk menemukan ketergantungan satu item data pada item data yang lain dan memetakan variabel-variabel tersebut sehingga dapat menghasilkan keuntungan yang maksimal. Algoritma ini kerap kali diterapkan dalam Market Basket Analysis, Web Usage Mining, produksi berkelanjutan, dll. Beberapa algoritma yang populer dari Association rule learning adalah Apriori Algorithm, Eclat, FP-growth algorithm.
Baca juga : Yuk Kenali Macam-Macam Algoritma Machine Learning!
2.Algoritma Apriori
Algoritma Apriori menggunakan frequent itemsets untuk menghasilkan aturan asosiasi (association rules), dan dirancang untuk bekerja pada database yang berisi data transaksi. Dengan bantuan association rules ini, kita bisa melihat apakah objek memiliki hubungan kuat atau lemah. ini menentukan seberapa kuat atau seberapa lemah dua objek terhubung. Algoritma ini menggunakan pencarian breadth-first dan Hash Tree untuk menghitung asosiasi itemset secara efisien. Ini adalah proses berulang untuk menemukan frequent itemset dari dataset besar.
Algoritma ini mulai dikenalkan oleh R. Agrawal dan Srikant pada tahun 1994. Algoritma ini banyak digunakan untuk menemukan produk-produk yang dapat dibeli bersama dan untuk melakukan market basket analysis. Algoritma ini juga dapat digunakan di bidang perawatan kesehatan untuk menemukan reaksi obat untuk pasien.
3. Apa itu Frequent Itemset?
Frequent itemset merupakan item yang nilai supportnya lebih besar dari nilai ambang batas atau support minimum yang telah ditentukan. Sehingga ketika A & B merupakan frequent itemset jika digunakan secara bersama-sama, maka secara individual A dan B juga harus merupakan frequent itemset. Misalkan ada dua transaksi, yaitu transaksi A dan B, dimana transaksi A= {1, 2, 3, 4, 5} dan transaksi B= {2,3,6,8,9}. Maka kita bisa mengatakan bahwa 2 dan 3 merupakan frequent itemset.
4.Tahapan Menggunakan Algoritma Apriori
Untuk menggunakan algoritma apriori, kita membutuhkan beberapa tahapan yang harus dilakukan, yaitu:
Tentukan itemset support dalam database transaksional, dan pilih nilai support dan confidence yang paling kecil.
Ambil semua support dalam transaksi dengan nilai support lebih tinggi dari nilai support yang telah dipilih sebelumnya.
Cari semua rules yang mungkin terjadi dari subset yang digunakan dimana pilih yang memiliki nilai confidence lebih tinggi dari ambang batas atau minimum confidence.
Urutkan rules dengan menggunakan urutan lift dari yang terbesar ke yang terkecil.
Baca juga : Kenali Algoritma Klasifikasi Machine Learning Terpopuler di Tahun 2021
Market Basket Analysis kerap kali digunakan untuk menentukan karakteristik customer dan juga bisa digunakan untuk menentukan barang yang bisa laku secara bersamaan. Pemanfaatan Machine Learning dalam kehidupan sehari-hari bukanlah hal yang bisa kita pungkiri. Adanya Machine Learning tidak hanya memberikan manfaat bagi para pemilik bisnis, namun juga bisa meringankan pekerjaan kita sebagai masyarakat biasa.
Agar tidak tertinggal dan bisa mengikuti perkembangan zaman, kita juga harus terus mengupgrade diri. Salah satunya adalah dengan mempelajari Machine Learning. Tenang, kamu tidak perlu pusing-pusing lagi mencari tempat belajar karena DQLab juga menyediakan modul yang membahas tentang Machine Learning, yaitu modul “Machine Learning with Python for Beginning”.
Yuk, tunggu apa lagi? Sign up, dan belajar Machine Learning sekarang juga!
Penulis : Gifa Delyani Nursyafitri