Berkenalan dengan Pandas

Melalui kelas ini, kamu diajak untuk:

  • Mengetahui dasar-dasar pengoperasian Pandas.
  • Memahami cara Pandas bekerja.

Sejarah

Pada 2008, Weston McKinney dihadapkan pada kebutuhan untuk membuat sistem yang lebih fleksibel untuk analisis finansial di kantornya, AQR Capital Management. Dari situ, McKinney menciptakan library Pandas.

Foto: Weston McKinney

Usai keluar pada 2012, McKinney terus mengasuh Pandas menjadi library open-source. Saat ini Pandas sudah mencapai versi 1.2.4 dan menjadi salah satu library dengan kontributor terbanyak di ekosistem Python.

Kegunaan

Pandas adalah library yang terkenal andal dalam analisis data. Mulai dari import data dalam berbagai format, membersihkan data mentah, hingga melakukan analisis, menjadi skema yang terintegrasi dalam Pandas tanpa perlu lagi membangun dari awal.

Sekilas, Pandas merupakan penyempurnaan dari Microsoft Excell. Struktur dasar Pandas bernama Dataframe berupa kolom dan tabel berisi kumpulan data. Pembedanya, Pandas menyediakan operasi lebih kaya untuk kepentingan analisis data, bahkan mampu mengintegrasikan dalam sistem terotomasi.

Ketuk kartu-kartu di bawah untuk melihat fungsi Pandas.

Import Document

Unduh file CSV, JSON, SQL, hingga Google Sheet.

Manipulasi Data

Penggabungan, pengubahan (reshaping), dan pemindaian.

Membersihkan Data

Merapikan data mentah ke dalam format yang dibutuhkan.

Wrangling

Mengubah data mentah lebih rapi dan siap pakai.

Memasang dan Menggunakan Library Pandas

Pengelola Pandas mempersilakan siapapun untuk menggunakannya tanpa syarat.

Aksesnya cukup dengan menginstall perintah khusus di terminal seperti berikut.


pip install pandas

Setelah itu, sematkan Pandas di bagian awal file Python dengan cara berikut.

import pandas as pd
from pandas import read_csv

df = pd.read_csv("/Users/user/Documents/Code Learning/Python/train.csv")

Rangkuman

  • Pandas berguna untuk memasukkan file kemudian mengolahnya.
  • Penggabungan data dengan Pandas terdiri penggabungan dan pemindaian.
  • Data wrangling lewat Pandas bertujuan agar data kotor menjadi siap pakai.

Kuis

Di mana kita harus mencantumkan library saat menulis kode?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan