Kenali Data Science Algoritma Apriori pada Machine Learning
Sebelum eksistensi internet seperti saat ini, tools serta teknologi belum secanggih sekarang algoritma data science sudah ada sejak lama. Agar komputer dapat memecahkan masalah, kita perlu membuat rumusan langkah-langkah penyelesaian tersebut dalam suatu rangkaian instruksi agar dapat memperoleh output yang diinginkan dari suatu inputan dalam waktu yang terbatas.
Nah, sekumpulan instruksi-instruksi tersebut inilah yang dinamakan algoritma. Salah satu algoritma yang bisa kamu gunakan dan terapkan khususnya untuk menemukan aturan asosiasi antara suatu kombinasi itemset.
Algoritma apriori dapat kamu gunakan untuk mengatasi munculnya frequent item/itemset dalam pencarian nilai support dan nilai confidence pada database yang cukup besar, sehingga dapat menghasilkan asosiasi rule mining tanpa melakukan candidate generation.
Sehingga waktu penyelesaian pada proses frequent item/itemset pada algoritma apriori lebih efisien. Yuk, mengenal lebih dalam tentang algoritma apriori sebagai metode machine learning yang digunakan dalam ilmu data science. Simak terus artikel ini sampai selesai ya!
1. Algoritma Apriori
Algoritma Apriori adalah salah satu algoritma pada data mining untuk mencari frequent item/itemset pada transaksional database. Algoritma apriori pertama kali diperkenalkan oleh R.Agarwal dan R Srikant untuk mencari frequent tertinggi dari suatu database.
Algoritma apriori banyak digunakan pada data transaksi atau biasa disebut market basket, misalnya sebuah swalayan memiliki market basket, dengan adanya algoritma apriori, pemilik swalayan dapat mengetahui pola pembelian seorang konsumen.
Atau algoritma apriori juga bisa digunakan oleh restoran cepat saji dalam menentukan paket menu makanan atau minuman yang ada di restoran mereka berdasakan pola beli konsumen.
Baca juga: Algoritma Apriori dalam Data Science, Pemula Data Catat!
2. Cara Kerja Algoritma Apriori
tentukan minimum support
Iterasi 1 : hitung item-item dari support(transaksi yang memuat seluruh item) dengan men-scan database untuk 1-itemset, setelah 1-itemset didapatkan, dari 1-itemset apakah diatas minimum support, apabila telah memenuhi minimum support, 1-itemset tersebut akan menjadi pola frequent tinggi,
Iterasi 2 : untuk mendapatkan 2-itemset, harus dilakukan kombinasi dari k-itemset sebelumnya, kemudian scan database lagi untuk hitung item-item yang memuat support. itemset yang memenuhi minimum support akan dipilih sebagai pola frequent tinggi dari kandidat
Tetapkan nilai k-itemset dari support yang telah memenuhi minimum support dari k-itemset
lakukan proses untuk iterasi selanjutnya hingga tidak ada lagi k-itemset yang memenuhi minimum support.
3. Kelebihan Algoritma Apriori
Adapun kelebihan dari algoritma Apriori adalah sebagai berikut:
Sederhana dan mudah dipahami di antara algoritma asosiasi
Aturan yang dihasilkan intuitif dan mudah dikomunikasikan ke pengguna awam
Tidak memerlukan data berlabel karena merupakan algoritma unsupervised
Algoritmanya lengkap, sehingga dapat menemukan semua aturan dengan support dan confidence yang ditentukan
Baca juga: Memahami Keunggulan dan Manfaat Data Science dalam Dunia Bisnis
4. Kekurangan Algoritma Apriori
Kelemahan dari algoritma apriori di antaranya:
Membutuhkan banyak perhitungan jika itemset sangat besar dan nilai support minimal dipertahankan seminimal mungkin.
Perlu melakukan pemindaian penuh seluruh database. Hal ini membuat proses pada algoritma Apriori berjalan sangat lama dan lambat serta menghabiskan banyak sumber daya.
Karena perlu melakukan pemindaian penuh, kompleksitas waktu dan ruang dari algoritma apriori adalah O(2D), yang berarti sangat tinggi. Simbol D mewakili lebar horizontal yang ada dalam database
Sahabat DQ ingin berkarir di bidang data science tapi, tidak memiliki background pendidikan yang linier dengan itu? Sudah mencoba belajar otodidak tapi malahan overdosis materi? Mengingat skill data science terbilang cukup banyak yang wajib dikuasai salah satunya adalah memahami algoritma data science nya hingga tahap penerapannya pada dataset.
Yuk, coba free module Introduction to Data Science with R dan python dari DQLab sekarang
Caranya gimana? Mudah banget kok cukup signup sekarang ke DQLab.id lalu pilih menu learn.
Setelah itu kamu sudah bisa menikmati pembelajaran yang praktis dan aplikatif dan jago algoritma data science bersama DQLab! Tunggu apa lagi? Yuk, signup sekarang dan mulai belajar Module Premium di DQLab!