Kursus Teknik Belajar Data Science: Contoh Dataset Kursus Data Science
Untuk membangun suatu model saat mengikuti kursus Data Science, salah satu hal utama yang dibutuhkan adalah dataset. Sebelum kamu memulai dengan algoritma apapun, kamu harus memiliki pemahaman yang cukup mengenai data. Dataset ini pada dasarnya digunakan untuk tujuan penelitian maupun saat mengikuti kursus Data Science. Dan sebagian besar kumpulan datanya bersifat homogen. Data digunakan bisa untuk data latih dan untuk mengevaluasi model yang dihasilkan nantinya.
Jika kamu adalah pemula dalam kursus Data Science, tenang saja karena setiap orang memiliki kesempatan yang sama untuk mempelajarinya. Karena pada dasarnya ilmu Data Science tidak hanya terbatas di background pendidikan tertentu, mengingat pada era digital transformation saat ini, ilmu ini dapat digunakan di semua lini bisnis. Pada artikel ini, kamu akan menemukan 3 contoh teratas dataset yang dapat kamu gunakan sebagai latihan untuk memperdalam keahlianmu dalam mengolah data. Dengan banyak berlatih kamu dapat mengerjakan project yang ada di DQLab dan juga membangun portofolio sebanyak mungkin! Yuk, kita lihat bersama!
1. Iris Dataset
Dataset Iris merupakan dataset multivariate yang diperkenalkan oleh ahli statistika dan biologi inggris, Ronald Fisher, pada tahun 1936. Dataset bunga Iris ini sangat terkenal di dunia Machine Learning yang digunakan untuk klasifikasi. Dataset ini terdiri dari 3 spesies Iris yaitu Iris Setosa, Iris Virginica, dan Iris Versicolor dan tiap spesiesnya memiliki 50 sampel. Dalam data Iris terdapat 4 atribut yang dapat mempengaruhi klasifikasi yaitu, sepal length, sepal width, petal length, dan petal width dalam centimeter yang berbeda-beda.
Baca juga : Awali Kursus Data Science Gratis Di Era Pandemi Bersama DQLab
2. Twitter Sentiment Analysis Dataset
Sentiment Analysis merupakan salah satu aplikasi populer dalam Natural Language Processing (NLP) dan untuk membangun model analisis sentiment, dataset ini akan sangat membantu. Dataset inu pada dasarnya berupa pemrosesan teks pada data dengan bantuan Machine Learning dalam membangun model. Pada dasarnya dataset ini terdiri dari tiga kolom utama yaitu, ItemID, Sentimen, dan SentimenText. Dan terdiri dari tiga jenis data yaitu netral, positif, dan negatif.
3. Youtube Dataset
Dataset video Youtube didasarkan pada informasi video-video yang ada di Youtube. Dataset ini membantu dalam membuat model klasifikasi video menggunakan algoritma Machine Learning. Kumpulan data ini akan membantu meningkatkan kualitas dari anotasi dan pelabelan yang dihasilkan dari database. Dataset ini memiliki kumpulan data berlabel dengan skala yang besar dan berkualitas tinggi. Dalam kumpulan data tersebut, video akan diambil sampelnya secara seragam. Dataset ini tersedia dalam format CSV (Comma-separated value)
Baca juga : Kursus Data Science Jakarta: Tips Cermat Belajar Data Science bersama DQLab!
4. Yuk, Latih dan Asah Kemampuan Analisis Datamu bersama DQLab Sekarang!
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industri! Sign up sekarang untuk #MulaiBelajarData di DQLab!
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
1. Buat Akun Gratis dengan Signup di DQLab.id/signup
2. Akses module Introduction to Data Science
3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
4. Subscribe DQLab.id untuk Akses Semua Module Premium!
Penulis : Salsabila Miftah Rezkia
Editor : Annissa Widya Davita