Data Science in Finance Course
Module Description
Pelajari metode pengolahan data dan hasilkan prediksi menggunakan teknik machine learning untuk menghasilkan model yang dapat di implementasikan pada sektor keuangan.
- Materi mudah dipahami karena disampaikan dalam Bahasa Indonesia, tanpa instalasi software tambahan, menggunakan fitur Live Code Editor.
- Modul yang ada di DQLab.id dipersiapkan oleh praktisi data di industri sehingga mencerminkan studi kasus yang sering dihadapi dalam dunia kerja.
Learning Outcomes
Dengan mempelajari Data Science in Finance Course, peserta mampu untuk:
- Mengolah dataset complex dengan R dan SQL
- Memahami dan menerapkan teknik Predictive Modelling untuk menghasilkan data model dengan studi kasus yang sering ditemukan pada sektor Finansial
- Menguji tingkat akurasi dari data model yang dibangun, dan memilih metode dan data model yang tepat dengan tingkat akurasi yang tinggi
- Menampilkan visualisasi data dengan grafik yang tepat sesuai kebutuhan
- Menghasilkan insight yang dapat membantu proses pengambilan keputusan
- Melatih critical thinking dan problem solving apabila dihadapkan dengan suatu masalah
Chapters
Fundamental R for Data Science
Pelajari langkah dasar untuk memulai R - bahasa yang sangat populer di data science - mulai dari operasi matematika sampai visualisasi data.
- Mengerti hal-hal dasar di R seperti menggunakan dan menampilkan angka, teks, dan perhitungan matematika dasar
- Mampu menggunakan variable untuk menyimpan nilai
- Mengerti penggunaan komentar (comment) untuk menghasilkan human readable code
- Mengerti sifat R yang case sensitive - huruf besar dan huruf kecil merupakan hal yang berbeda
- Mengerti penggunaan tipe data logika TRUE/FALSE
- Memahami contoh error
- Memahami apadan bagaimana menggunakan package
- Mengerti bagaimana membaca file Excel
- Mampu menghasilkan grafik bar chart dan pie chart dengan data yang dibaca dari file Excel
Statistics using R for Data Science
Pelajari dasar-dasar ilmu statistik untuk memulai perjalanan data science dengan menggunakan R.
- Fungsi statistik
- Perbedaan statistik dan parameter
- Perbedaan data kuantitatif dan kualitatif
- Membaca dataset dalam format CSV
- Mengubah kolom menjadi factor
- Estimasi Karakteristik (modus, median, mean)
- Skala pengukuran data
- Ukuran sebaran data (range, varian, simpangan baku)
- Perbedaan Statistik Deskriptif dan Statistik Inferensia
- Hubungan antar variabel
Data Science in Finance: Credit Risk Analysis
Pelajari penggunaan algoritma decision tree untuk pembuatan dan operasional model prediksi resiko kredit (credit risk) di R.
- Memahami permasalahan dan solusi credit scoring di lembaga pembiayaan, dan bagaimana bisa dimodelkan dengan decision tree
- Mengerti apa itu decision tree dan algoritma C5.0
- Memahami dan mampu mempersiapkan data untuk class variable dan input variable
- Memahami dan mampu mempersiapkan data untuk training dan testing dataset
- Menghasilkan model credit risk menggunakan algoritma C5.0
- Mengevaluasi akurasi model yang dihasilkan
- Mampu mengoperasionalkan model tersebut sehari-hari untuk memprediksi credit risk dari data pengajuan baru
Data Science in Finance: Dimension Reduction
Pelajari metode Principal Component Analysis untuk mereduksi dimensi (feature extraction) dalam data berdimensi tinggi. Dalam modul ini Principal Component Analysis (PCA) diterapkan untuk data credit rating.
- Melakukan standarisasi data numerik untuk dianalisa dengan PCA
- Menghitung matrik korelasi antar variabel numerik
- Menghitung Principal Component dengan fungsi prcomp()
- Menentukan banyaknya principal component dengan menggunakan screeplot dan kriterion Kaiser.
- Membuat visualisasi Principal Component dengan biplot. 6. Menghitung skor data setelah aplikasi PCA.
Premium