Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Algoritma Apriori dalam Data Science, Pemula Data Catat!

Belajar Data Science di Rumah 16-Agustus-2022
https://dqlab.id/files/dqlab/cache/9b11b406c990d4e1d5b44e1410fe275f_x_Thumbnail800.jpg

Jauh sebelum internet booming, tools serta teknologi belum secanggih sekarang algoritma data science sudah ada sejak lama. Agar komputer dapat memecahkan masalah, kita perlu membuat rumusan langkah-langkah penyelesaian tersebut dalam suatu rangkaian instruksi agar dapat memperoleh output yang diinginkan dari suatu inputan dalam waktu yang terbatas. 


Nah, sekumpulan instruksi-instruksi tersebut inilah yang dinamakan algoritma. Algoritma data science juga demikian, terdiri dari instruksi-instruksi yang dapat digunakan untuk memecahkan pola-pola dibalik suatu data. Terdapat 3 jenis algoritma dalam data science antara lain supervised learning, unsupervised learning, dan reinforcement learning.


Artikel ini akan fokus untuk membahas salah satu algoritma yang berpengaruh khususnya dalam industri ritel yaitu algoritma apriori atau assosiation rules. Penasaran kan? Untuk lebih lanjut, simak penjelasan dibawah ini terkait penerapan algoritma apriori di bidang ritel, lengkap dengan contoh studi kasus dan penyelesaiannya, lho!


1. Mengenal Algoritma Apriori

Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Salah satu tahap analisis asosiasi yang menarik banyak peneliti untuk menghasilkan banyak algoritma yang efiseien adalah analisis pola frequensi tinggi. Penting tidaknya suatu asosiasi dapat diketahui dengan dua tolak ukur yaitu, support dan confidence. Untuk mendapatkan nilai support kamu dapat menggunakan persamaan berikut:

data science


Setelah itu kamu menentukan rule dengan mencari confidence dari frequent itemset tersebut menggunakan persamaan berikut:

data science

Support atau nilai penunjang adalah persentase kombinasi item tersebut dalam database, sedangkan confidence atau nilai kepastian adalah kuatnya hubungan antar item dalam anturan asosiasi. algoritma apriori dapat membantu untuk transaksi penjualan bisnis terutama bidang ritel.


Baca juga: Memahami Keunggulan dan Manfaat Data Science dalam Dunia Bisnis


2. Mini Project 

Suatu supermarket memiliki sejumlah transaksi seperti yang ada di tabel berikut. Buatlah association rule dari data tersebut dengan cara menghubungkan nilai support dan confidence. Gunakan metode/algoritma apriori dengan nilai minimum support=0.3 dan confindence=0.8

data science

Berdasarkan soal diatas penyelesaiannya menggunakan metodologi dasar dari algoritma apriori yang terdiri dari 2 tahapan yaitu:

  • Analisis pola frekuensi tinggi

  • Pembentukkan aturan asosiatif

Selengkapnya mari perhatikan langkah-langkah penyelesaian dibawah ini


3. Analisis Pola Frekuensi Tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam suatu database. Nilai support sebuah item diperoleh dengan rumus:

data science

Sedangkan nilai support untuk dua item diperoleh dari rumus berikut:

data science


  • Ubah dta transaksi ke dalam bentuk tabular

data science


data science


Sebagai contoh, T1(Transaksi 1) nilai roti,selai dan mentega bernilai 1 artinya dalam transaksi 1 terdapat roti, selai dan mentega sedangkan susu dan coklat tidak ada di transaksi tersebut maka nilainya 0.


Baca juga: 3 Contoh Penerapan Data Science yang Sangat Berguna di Dunia Perindustrian


4. Tentukan nilai k-item set yang memenuhi nilai support yang telah diberikan pada soal

Menghitung iterasi 1 dengan nilai support yang sudah ditentukan pada soal tadi yaitu 0,3. Dengan menerapkan rumus yang sudah dijelaskan di poin sebelumnya.

data science

Dikarekan hasil nilai support belum ada yang bernilai 0,3 maka iterasi dilanjut untuk 2-itemset, 3- itemset sebagai berikut:

data science


data science



Sahabat DQ ingin berkarir di bidang data science tapi, tidak memiliki background pendidikan yang linier dengan itu? Sudah mencoba belajar otodidak tapi malahan overdosis materi? Mengingat skill data science terbilang cukup banyak yang wajib dikuasai salah satunya adalah memahami algoritma data science nya hingga tahap penerapannya pada dataset. 


Yuk, coba free module Introduction to Data Science with R dan python dari DQLab sekarang 

Caranya gimana? Mudah banget kok cukup signup sekarang ke DQLab.id lalu pilih menu learn.


Setelah itu kamu sudah bisa menikmati pembelajaran yang praktis dan aplikatif dan jago algoritma data science bersama DQLab! Tunggu apa lagi? Yuk, signup sekarang dan mulai belajar Module Premium di DQLab!


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login