Big Data : Tipe, Karakteristik, dan Manfaat di Era Digital!
Sebelum kita membahas big data, ada baiknya jika kita mulai dengan data. Data itu apa sih? Well, data adalah jumlah, karakter atau simbol yang dioperasikan menggunakan komputer, dapat disimpan dan dikirim dalam bentuk sinyal listrik dan dapat direkam pada media perekam magnetik, optik, maupun mekanik. Lalu sekarang apa itu big data? Big data merupakan istilah yang digunakan untuk menunjukkan kumpulan-kumpulan data yang besar dan kompleks sehingga sangat sulit untuk diproses menggunakan software aplikasi data konvensional. Jadi, pada dasarnya, sistem konvensional tidak dapat memproses data dalam jumlah besar secara bersamaan.
Big data dapat ditemukan di berbagai sumber contohnya adalah data yang ada di bursa efek. Bursa Efek Indonesia menghasilkan sekitar satu terabyte data perdagangan baru setiap harinya. SUmber lain yang paling banyak ditemukan big data adalah media sosial. Statistik menunjukkan bahwa lebih dari 500 terabyte data baru diolah ke dalam database media sosial Facebook setiap harinya. Sebagian besar data ini dihasilkan dari unggahan foto, video, pertukaran direct message, komentar, dan lain sebagainya. Salah satu sumber big data yang jarang terekspos adalah sumber big data dari transportasi udara. Faktanya, mesin jet tungga dapat menghasilkan lebih dari 10 terabyte dalam waktu penerbangan 30 menit. Dengan ribuan penerbangan per hari, bisa dibayangkan berapa petabyte data yang dihasilkan setiap harinya. Selain bisa berasal dari berbagai sumber, big data juga memiliki beberapa jenis, karakter, dan manfaat yang berbeda-beda. Mau tahu apa saja? Yuk simak artikel ini sampai selesai!
1. Tipe Big Data
Tipe big data dibagi menjadi tiga, yaitu structured, unstructured, dan semi structured data. Structured data atau dalam bahasa indonesia disebut dengan data terstruktur merupakan semua data yang dapat disimpan, diakses, dan diolah dalam bentuk dan format tetap. Semakin berkembangnya teknologi, saat ini sudah banyak teknik yang dikembangkan untuk mengolah data terstruktur. Salah satu contoh data terstruktur adalah data yang tersimpan dalam database relasional seperti data karyawan, penjualan, produksi, transaksi, dan lain sebagainya.
Unstructured data atau lebih dikenal dengan data tidak terstruktur adalah semua data yang bentuk atau strukturnya tidak diketahui. Data tidak terstruktur sedikit berbeda dengan data terstruktur karena dalam proses pengolahannya memiliki banyak tantangan. Contoh data tidak terstruktur adalah data yang berasal dari google search seperti kombinasi teks, gambar, video, dan lain sebagainya. Saat ini, teknologi untuk mengolah data tidak terstruktur sudah mulai banyak dikembangkan. Sedangkan kombinasi dari data terstruktur dan tidak terstruktur disebut dengan data semi terstruktur. Contoh data semi terstruktur adalah data yang direpresentasikan dalam file XML.
Baca juga : Pahami Proses Integrasi Data untuk Hasilkan Proses Pengolahan Data yang Valid
2. Karakteristik Big Data
Bagaimana cara menganalisis bahwa suatu data termasuk ke dalam kategori big data? Big data memiliki beberapa karakteristik yang biasa disebut dengan "fifth V of big data". Lima V tersebut adalah volume, variety, velocity, value, dan veracity. Karakteristik volume mengacu pada data yang sangat besar. Volume ini dapat meningkat secara eksponensial. Pada tahun 2016, data yang diproduksi hanya 8ZB sedangkan pada tahun 2020 data naik hingga 40 ZB. Luar biasa bukan?
Karakteristik variety muncul karena pertumbuhan volume data yang pesat ini berasal dari sumber yang berbeda dalam berbagai format. Jenis-jenis data tersebut sudah kita bahas di poin sebelumnya. Kecepatan akumulasi data juga berperan dalam menentukan apakah suatu data termasuk ke dalam kategori big data atau data normal. Hal ini menyebabkan adanya karakteristik velocity pada big data. Karakteristik big data yang keempat adalah value. Karakteristik ini berhubungan dengan mekanisme untuk mengeluarkan nilai atau informasi yang benar dari sebuah kumpulan data. proses pertama untuk mendapatkan value dari sebuah data adalah proses data mining yang akan mengubah raw data menjadi data yang berguna. Kemudian data dianalisis sesuai dengan tujuan penelitian. Karakteristik big data yang terakhir adalah veracity. Pada proses data mining, memungkinkan adanya pembuangan data dalam jumlah besar. Oleh karena itu perlu adanya veracity atau kebenaran agar tidak terjadi ketidakpastian atau inkonsistensi dalam data. Veracity artinya kualitas data dapat dipercaya.
3. Manfaat dan Pentingnya Big Data
Big data dapat dimanfaatkan di berbagai sektor. Di sektor perbankan, big data dapat digunakan untuk memeriksa persyaratan nasabah, memberikan pelayanan sesuai spesifikasi, dan mengurangi resiko tanpa melanggar protokol. Contohnya adalah Bursa Efek New York yang menghasilkan sekitar satu terabyte data perdagangan setiap hari. Berapa terabyte yang akan dihasilkan dalam satu tahun. Oleh karena itu, sektor perbankan sangat memerlukan big data. Big data juga digunakan oleh instansi pemerintah untuk mengelola utilitas, menangani kemacetan lalu lintas, dan mengurangi kejahatan. Di sektor pendidikan, big data digunakan untuk memastikan pertumbuhan siswa, mengidentifikasi siswa yang bermasalah, dan dapat digunakan untuk mengembangkan sistem evaluasi kegiatan belajar mengajar. Di dunia kesehatan big data digunakan untuk membantu dokter dalam diagnosis pasien. Dokter memerlukan rekam medis pasien yang jumlahnya cukup banyak sehingga tidak dapat disimpan dalam database tradisional. Besarnya data pasien dengan berbagai format menyebabkan sektor kesehatan memerlukan big data.
Big data merupakan bagian dari data science. Data science merupakan ilmu yang banyak digunakan di era modern seperti saat ini. Berkembangnya big data mengakibatkan berkembangnya teknik untuk mengelola data tersebut dan sebagian besar teknik tersebut berada di dalam data science. Data science dapat diterapkan pada sektor apapun. Saat ini, mulai banyak perusahaan yang mengadopsi data science untuk membantu proses pengambilan keputusan. Tak heran jika saat ini lapangan pekerjaan sebagai data scientist terbuka lebar. Tak hanya menjadi "most wanted job", data scientist juga termasuk profesi dengan salary tinggi. Hal ini menyebabkan banyak orang mulai tertarik dan serius menekuni bidang data science. Kabar baiknya, data science dapat dipelajari oleh siapapun dengan background pendidikan apapun.
Baca juga : Belajar Data Science: Simak 3 Manfaat Penerapan Big Data di Berbagai Industri
4. Yuk, Mulai Belajar Data Science bersama DQLab secara GRATIS!
Tidak memiliki background IT? Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi! Sign up sekarang untuk #MulaiBelajarData di DQLab!
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Subscribe DQLab.id untuk Akses Semua Module Premium!
Penulis: Galuh Nurvinda Kurniawati
Editor: Annissa Widya Davita