Data Science in Finance: Credit Risk Analysis
Module Description
Credit risk adalah risiko yang harus ditanggung oleh sebuah bank atau lembaga pembiayaan lain ketika memberikan pinjaman ke seorang individu atau lembaga lain. Risiko ini berupa tidak bisa dibayarkannya pokok dan bunga pinjaman, sehingga mengakibatkan kerugian berikut:
- Gangguan aliran kas (cash flow) sehingga modal kerja terganggu.
- Meningkatkan biaya operasional untuk mengejar pembayaran tersebut (collection).
Untuk memperkecil risiko kredit ini, biasanya dilakukan proses penilaian risiko sebelum diberikan pinjaman yang disebut dengan credit scoring dan credit rating terhadap pihak peminjam.
Manfaat dari credit scoring ini adalah memperkecil risiko yang bisa terjadi pada lembaga peminjam, dimana berdasarkan hasil penilaian ini akan menjadi penentu apakah aplikasi pengajuan pinjaman diterima atau ditolak oleh lembaga finansial.
Untuk menghitung credit risk ini biasanya lembaga pembiayaan menggunakan suatu perhitungan standard yang telah ditentukan. Namun, yang semakin menjadi tren adalah perhitungan dengan menggunakan metode machine learning berdasarkan data historis pinjaman. Course ini akan mempelajari penerapan metode machine learning di R dengan menggunakan algoritma decision tree bernama C5.0.
Learning Outcomes
Dengan menyelesaikan course ini, Anda akan mampu menyusun dan menggunakan untuk credit scoring menggunakan R dengan detail pengetahuan dan keterampilan yang dikuasai sebagai berikut:
- Memahami permasalahan dan solusi credit scoring di lembaga pembiayaan, dan bagaimana bisa dimodelkan dengan decision tree.
- Mengerti apa itu decision tree dan algoritma C5.0.
- Memahami dan mampu mempersiapkan data untuk class variable dan input variable.
- Memahami dan mampu mempersiapkan data untuk training dan testing dataset.
- Menghasilkan model credit risk menggunakan algoritma C5.0.
- Mengevaluasi akurasi model yang dihasilkan.
- Mampu mengoperasionalkan model tersebut sehari-hari untuk memprediksi credit risk dari data pengajuan baru.
Chapters
1. Credit Risk dan Model Prediksi
Pengenalan terhadap mengenai credit risk dan credit rating prediction dan apa manfaatnya untuk industri finansial pemberi pinjaman seperti bank, multi finance, asuransi, dan lain-lain.
- Pendahuluan
- Credit Score
- Mana definisi credit score yang benar?
- Risk Rating
- Contoh Tabel Risk Rating
- Rekam jejak historis apa yang digunakan?
- Analisa dan Model Pengambilan Keputusan
- Apa yang dilakukan oleh analyst?
- Kesimpulan
2. Desicion Tree
Penjelasan mengenai konsep decision tree, dan implementasi machine learning menggunakan fungsi rpart di R.
- Decision Tree
- Komponen Decision Tree
- Mana komponen yang disebut dengan Root?
- Mana komponen yang disebut dengan Split?
- Mana komponen yang disebut dengan Leaf?
- Contoh Pemodelan Decision Tree dengan Machine Learning
- Package R apa yang kita gunakan untuk decision tree?
- Kesimpulan
3. Algoritma C5.0
Penjelasan ringkas algoritma C5.0, persiapan data dan penggunaan algoritma untuk menghasilkan model credit risk.
- Apa itu algoritma C5.0?
- Class and Input Variables
- Berapa banyak class variable?
- Data Preparation untuk Class Variable
- Data Preparation untuk Input Variables
- Training Set dan Testing Set
- Mempersiapkan Training dan Testing Set
- Apa fungsi dari perintah set.seed?
- Apa fungsi dari perintah sample?
- Menghasilkan Model dengan Fungsi C5.0
- Dataset apa yang diperlukan untuk menghasilkan model C5.0?
- Apa syarat class variable untuk fungsi C5.0?
- Menghasilkan Plot dari Model C5.0
- Kesimpulan
4. Memahami Output dari Fungsi C5.0
Bab ini akan berfokus pada tahap memahami hasil dari C5.0.
- Summary Model C5.0
- Label dari Class
- Jumlah Data dan Variable yang Digunakan
- Tampilan Teks dari Model Decision Tree
- Berapa banyak Leaf Nodes?
- Arti dari statistik di Leaf Node
- Persentase Kesalahan Model
- Confusion Matrix
- Menganalisa Confusion Matrix (1)
- Menganalisa Confusion Matrix (2)
- Merubah Label Class Variable
- Variable-variable Penentu
- Diagram Decision Tree C5.0
- Elemen dari Plot Decision Tree C5.0
- Mana kesimpulan yang benar dari plot?
- Apa arti dari n = 259?
- Kesimpulan
5. Evaluasi Model
Setelah model dihasilkan, kita perlu fokus mengevaluasi kelayakan model untuk digunakan.
- Pendahuluan
- Menggunakan Fungsi Predict
- Input apa yang diperlukan oleh fungsi predict?
- Menggabungkan Hasil Prediksi
- Apa tujuan penggabungan hasil prediksi?
- Membuat Table Confusion Matrix
- Jumlah Data dengan Prediksi Benar
- Jumlah Data dengan Prediksi Salah
- Arti operator !=
- Kesimpulan
6. Menggunakan Model untuk Prediksi
Bab ini berisi cara bagaimana kita menggunakan model ini untuk melakukan prediksi risk rating dari data pengajuan pinjaman baru.
- Pendahuluan
- Mempersiapkan Data Pengajuan Baru
- Melakukan Prediksi terhadap Data Pengajuan Baru
- Merubah Durasi Pinjaman
- Kesimpulan
7. Penutup
Bab penutup yang berisi summary atas apa yang dilakukan.
- Kesimpulan
- Whats next?
7 Chapters
65 Sub-babs
Premium