Intip Jenis Teknik Analisis Data yang Sedang Trend, Decision Tree!
Pernahkah kamu merasa kesulitan dalam mengambil keputusan dalam waktu yang singkat? Terlebih lagi jika itu dalam soal pekerjaan, kamu dituntut untuk membuat keputusan yang tepat namun dihadapkan dengan banyak pilihan. Jika kamu pernah mengalaminya, Decision Tree menjadi salah satu jenis teknik analisis data yang direkomendasikan untuk kamu. Dengan metode ini, dapat membantumu dalam mempertimbangkan berbagai pilihan tersebut sekaligus dengan risiko yang akan dihadapi.
Analisis data merupakan salah satu teknik terpopuler yang saat ini seringkali digunakan dalam dunia data dan teknologi. Tujuan utama dari teknik analisis data adalah untuk menentukan atau mendapatkan kesimpulan secara keseluruhan yang berasal dari data-data yang telah dikumpulkan. Selain itu, teknik analisis data juga dapat digunakan untuk mendeskripsikan dan menyajikan kumpulan data yang telah diolah agar lebih mudah dipahami orang awam.
Dalam Data Science, Decision Tree menjadi salah satu teknik analisis data yang dikenal cukup ampuh dalam membantumu membuat keputusan efektif dan tetap memperhatikan kemungkinan hasil serta risikonya. Disebut sebagai œTree karena struktur ini menyerupai sebuah pohon lengkap dengan akar, batang, dan percabangannya.
Tertarik untuk menggunakannya? Kebetulan nih! Karena di artikel ini, DQlab akan mengajak sobat data untuk mempelajari mengenai Decision Tree, mengeksplorasi penggunaan Decision Tree dan bagaimana cara membuatnya.
Happy reading!
1. Apa Itu Decision Tree?
Decision Tree merupakan sebuah metode klasifikasi yang menggunakan seperangkat aturan untuk membuat keputusan dengan struktur seperti pohon, dimana setiap node merepresentasikan atribut dan cabangnya merepresentasikan nilai dari atribut, serta daunnya digunakan untuk merepresentasikan kelas.
Konsepnya adalah dengan cara menyajikan algoritma dengan pernyataan bersyarat, yang meliputi cabang untuk mewakili langkah-langkah pengambilan keputusan yang dapat mengarah pada hasil yang menguntungkan.
Mengutip dari Venngage, ada tiga elemen dalam satu Decision Tree, yaitu:
Root node (akar): tujuan akhir atau keputusan besar yang ingin diambil.
Branches (ranting): berbagai pilihan tindakan.
Leaf node (daun): kemungkinan hasil atas setiap tindakan. Biasanya, ada dua jenis leaf node, yakni yang berbentuk persegi dan lingkaran.
Lead node persegi menyatakan keputusan yang diambil.
Sementara itu, leaf node lingkaran menyatakan hasil yang tidak pasti.
Baca juga : Jenis Teknik Analisis Data yang Sering Digunakan Praktisi Data
2. Jenis Pohon Keputusan
Ada 2 jenis pohon keputusan didasarkan pada jenis variabel target yang kita miliki. Pohon keputusan tersebut adalah:
Pohon Keputusan Variabel Kategoris: Pohon keputusan yang memiliki variabel target kategoris maka disebut pohon keputusan variabel kategoris. Misalnya, kategorinya bisa ya atau tidak. Kategori berarti bahwa setiap tahap proses keputusan jatuh ke dalam salah satu kategori, dan tidak ada di antaranya.
Pohon Keputusan Variabel Kontinu: Pohon keputusan variabel kontinu adalah pohon keputusan dengan variabel target kontinu. Misalnya, pendapatan individu yang pendapatannya tidak diketahui dapat diprediksi berdasarkan informasi yang tersedia seperti pekerjaan, usia, dan variabel kontinu lainnya.
Contoh kasus: Misalkan kita memiliki masalah untuk memprediksi apakah pelanggan akan membayar premi perpanjangannya dengan perusahaan asuransi (YA/TIDAK), ini berarti masuk kepada variabel kategori. Di sini kita tahu bahwa pendapatan pelanggan adalah variabel yang signifikan tetapi perusahaan asuransi tidak memiliki rincian pendapatan untuk semua pelanggan. Sekarang, seperti yang kita ketahui bahwa ini adalah variabel penting, maka kita dapat membangun pohon keputusan untuk memprediksi pendapatan pelanggan berdasarkan pekerjaan, produk, dan berbagai variabel lainnya. Dalam hal ini, kami memprediksi nilai untuk variabel kontinu.
3. Cara Membuat Decision Tree
Mulai dengan membuat pertanyaan atau ide.
Bagian awal dari Decision Tree adalah keputusan apa yang ingin kamu ambil. Jika diibaratkan pohon, ini adalah akarnya. Gambarlah sebuah kotak kecil dan letakkan di bagian paling atas atau kiri. Kemudian, buat garis dari setiap kotak untuk menggambarkan kemungkinan dari setiap solusi dan berikan label yang sesuai agar mudah dikenali.
Misalnya, kita ingin menentukan apakah harus memperpanjang asuransi, gambarkan persegi panjang di bagian atas halaman dan tulis, œPerpanjang asuransi? di dalamnya. Kemudian, buat cabang di bawah kotak dengan memberi label œYa atau œTidak.
Tambahkan simpul keputusan ke cabang
Setelah membuat beberapa garis, pertimbangkan hasilnya. Kita bisa menambahkan simpul keputusan atau node dengan mengikuti ketentuan berikut:
- Apabila keputusannya masih tidak pasti, buatlah lingkaran kecil di ujung garis.
- Jika kamu perlu membuat keputusan lain, gambar persegi di ujung garis.
- Dan jika kamu telah menyelesaikan solusi di akhir garis tersebut, biarkan ujung garis kosong.
Tetapkan nilai
Terus lanjutkan tiap keputusan hingga mencapai sebuah titik akhir. Titik akhir keputusan berarti tidak ada lagi pilihan yang harus diambil atau peluang yang harus diperhitungkan lagi. Jika semua garis telah menemukan solusi, berarti kamu tinggal menetapkan nilai untuk setiap hasilnya. Nilai yang dimaksud bisa berupa nilai abstrak maupun angka tertentu.
Terakhir, tambahkan segitiga untuk menandakan titik akhir. Artinya Decision Tree yang dibuat telah selesai, kini kamu bisa menganalisis setiap risiko dan kemungkinan solusi yang ada.
4. Keunggulan dari Decision Tree
Agar semakin lebih mengenali algoritma Decision Tree kamu juga harus mengetahui kelebihan menggunakan metode klasifikasi ini, diantaranya:
Mudah dibaca dan ditafsirkan tanpa perlu pengetahuan statistik
Mudah disiapkan tanpa harus menghitung dengan perhitungan yang rumit
Sangat berguna untuk memecahkan masalah terkait keputusan
Membantu untuk memikirkan semua kemungkinan hasil untuk suatu masalah
Proses Data Cleaning cenderung lebih sedikit, kasus nilai yang hilang dan outlier kurang signifikan pada data Decision Tree.
Baca juga : Kupas Tuntas Teknik Analisis Data Kualitatif, Analisis Deskriptif
Apabila kalian tidak terlalu memahami teknik analisis data atau bahkan tidak mengetahuinya sama sekali, kalian bisa dengan mudah belajar bersama DQLab. Di DQLab, kalian bisa mendapatkan materi data yang lengkap dan pembahasan yang mudah dimengerti dari pengajar kalian. Selain itu, di DQLab kalian juga bisa belajar secara langsung menggunakan live code editor dengan mengerjakan mini project.
Cara untuk belajar bersama DQLab mudah sekali, cukup sign up di DQLab.id, lalu kalian dapat langsung mengerjakan module "Introduction Data Science with Python and R" secara gratis. Yuk, mulai sesi belajar teknik analisis data kalian bersama DQLab!
Penulis: Salsabila MR
Editor: Annisa Widya Davita