3 Metode Numpy Array Python Sebagai Dasar Proses Manipulasi Data
Salah satu kemampuan yang sangat penting untuk dimiliki oleh Data Analyst, Data Engineer dan Data Scientist adalah kemampuan untuk memanipulasi data. Data Analyst butuh kemampuan memanipulasi data untuk menganalisis data dan mendapatkan informasi-informasi penting dari data tersebut.
Data Engineer sangat memerlukan kemampuan manipulasi data untuk membersihkan data kotor menjadi data bersih untuk kemudian digunakan oleh Data Analyst dan Data Scientist. Adapun Data Scientist juga membutuhkan kemampuan manipulasi data untuk mempersiapkan data sebelum dibuat suatu model Machine Learning. Seluruh kemampuan manipulasi data yang dilakukan di Python hanya akan dilakukan dengan benar apabila kita memahami dengan baik konsep Array pada Python.
Array adalah kumpulan elemen / nilai yang dapat memiliki satu atau lebih dimensi. Array satu dimensi disebut Vektor sementara memiliki dua dimensi disebut Matriks. NumPy Array juga disebut Array ndarray atau N-dimensional Array dan mereka menyimpan elemen dengan tipe dan ukuran yang sama. Ia dikenal karena kinerjanya yang tinggi dan menyediakan penyimpanan dan operasi data yang efisien seiring bertambahnya ukuran array.
Pada artikel ini, DQLab akan berbagi pengetahuan mengenai bagaimana menggunakan Numpy untuk memanipulasi Array pada Python. Secara spesifik, pada artikel ini akan dijelaskan 3 metode yang dapat sahabat data sekalian terapkan menggunakan Numpy pada array. Dengan memahami 3 metode numpy array tersebut, sahabat data akan memiliki dasar yang lebih baik dalam melakukan Data Manipulation kedepannya. Penasaran apa saja ke-3 metode tersebut? Yuk simak penjelasan berikut.
1. Melakukan Indexing Pada Suatu Array
Dalam array satu dimensi, Sahabat Data dapat mengakses nilai ke-i (menghitung dari nol) dengan menentukan indeks yang diinginkan dalam tanda kurung siku, seperti halnya pada List Python. Kita akan mulai dengan menentukan tiga Array acak: array satu dimensi, dua dimensi, dan tiga dimensi. Kali ini kita akan belajar bagaimana melakukan indexing dan slicing dari Array 1 dan 2 dimensi. Sebelum itu, kita akan menggunakan generator nomor acak NumPy, yang akan kita seed dengan nilai yang ditetapkan untuk memastikan bahwa array acak yang sama dihasilkan setiap kali kode ini dijalankan. Berikut adalah kode nya:
Array1 adalah contoh array 1 dimensi dan array2 adalah contoh array 2 dimensi. Kamu dapat melihat seperti aoa bentuk array pada contoh di atas. Terdapat 2 results yang terbagi oleh garis putus-putus. Hasil yang di atas adalah contoh array 1 dimensi dan yang di bawah adalah contoh array 2 dimensi. Bagaimana melakukan indexing dari array ini? Perhatikan contoh berikut :
Contoh di samping adalah contoh bagaimana melakukan indexing pada Array 1 dimensi. Hakikatnya indexing adalah proses mengambil elemen atau nilai yang terkandung di dalam suatu array dengan melihat indeks dari elemen tersebut. Pada Array 1 dimensi, cara yang dilakukan sangat mudah, bahkan sama dengan melakukan indexing dari suatu List Python. Kamu hanya perlu menuliskan nama array diikuti oleh kurung kotak dan diisi dengan index yang diinginkan. Lalu, bagaimana melakukan proses indexing pada Array 2 dimensi? Perhatikan cara berikut :
Pada contoh di atas dapat dilihat terdapat sedikit perbedaan dalam melakukan indexing pada array 2 dimensi. Di sini, kamu harus memberikan 2 nilai dalam kurung kotak yag menunjukkan lokasi/posisi dari nilai yang ingin kamu ambil. Nilai di dalam kurung kotak mewakili row dan kolom. Jadi apabila kamu menuliskan array2[1,2] seperti contoh di atas maka kamu memertintahkan program untuk mengambil value row indeks ke 1 dan kolom indeks ke 2. Adapun contoh titik dua yag terdapat dalam gambar di atas merupakan penerapan dari slicing yang akan dijelaskan pada poin berikutnya.
Baca Juga : Belajar Python : 3 Fungsi Pandas Python yang Jarang Diketahui
2. Melakukan Slicing Pada Suatu Array
Sama seperti kita dapat menggunakan tanda kurung siku untuk mengakses elemen array, kita juga dapat menggunakannya untuk mengakses subarray dengan notasi slice, yang ditandai dengan karakter titik dua (:). Sintaks pemotongan NumPy mengikuti yang ada pada List Python standar; untuk mengakses sebuah Array "x", gunakan ini:
x [Start: Stop: Step]
Jika salah satu di antaranya tidak ditentukan, nilai defaultnya Start = 0, Stop = ukuran dimensi, Step = 1. Kita akan melihat cara mengakses subarray dalam satu dimensi dan dalam beberapa dimensi.
Seperti yang dapat sahabat data lihat pada contoh di atas, terdapat beberapa contoh kegunaan dari slicing. Pada dasarnya slicing sama seperti indexing, yang membedakan adalah slicing mengambil lebih dari 1 value, sedangkan indexing hanya mengambil satu saja. Lalu, bagaimana melakukan slicing pada Array 2 dimensi? Perhatikan contoh berikut!
Sama seperti slicing pada array 1 dimensi, di sini kita juga harus memberikan 2 nilai yang akan ditangkap oleh program. Kedua nilai tersebut juga melambangkan posisi suatu nilai yang ingin kita tarik dari Array.
3. Mengubah Bentuk (Reshaping) Suatu Array
Jenis operasi lain yang berguna adalah mengubah bentuk array. Cara paling fleksibel untuk melakukannya adalah dengan metode reshape(). Misalnya, jika Anda ingin memasukkan angka 1 hingga 9 dalam kisi 3 × 3, Anda dapat melakukan hal berikut:
Dengan menggunakan metode reshape(), kita dapat dengan mudah mengubah bentuk suatu array sesuai keinginan kita. Kita hanya perlu menentukan bentuk dengan mendefinisikan angka dalam kurung seperti yang dicontohkan di atas. Perlu diingat bahwa agar metode ini berfungsi, ukuran array awal harus sesuai dengan ukuran array yang dibentuk ulang. Cara mengubah bentuk Array yang umum lainnya adalah konversi array satu dimensi menjadi matriks baris atau kolom dua dimensi. Anda dapat melakukan ini dengan metode pembentukan kembali, atau lebih mudah dengan menggunakan kata kunci sumbu baru dalam operasi slice. Perhatikan contoh berikut :
Pada gambar di samping dapat dilihat beberapa contoh dalam melakukan proses reshaping dengan membandingkan 2 cara yaitu .reshape() dan np.newaxis.
Baca Juga : Belajar Python : Tingkatkan Kemampuan Data Manipulation Kamu Dengan 3 Metode Pandas Berikut!
4. Belajar Python dan Kenali Numpy Array Sekarang
Kenali 3 metode numpy array pyhton bersama DQLab! Sign up sekarang di DQLab.id untuk nikmati module gratis introduction to data science with Python. Yuk, mulai belajar data science secara praktis dan aplikatif bersama DQLab sekarang!