Analisis Sederhana lewat Pandas
Melalui kelas ini, kamu diajak untuk:
- Mengetahui metode analisis Pandas
- Memahami struktur kode untuk analisis.
Statistik dalam Pandas
Popularitas Pandas meroket berkat keahliannya dalam mendeskripsikan data. Lebih jauh, Pandas juga didesain untuk melakukan analisis-analisis data sederhana. Melalui Pandas, kita dapat melakukan analisis statistik deskriptif, seperti jumlah, mean, median, standar deviasi, min/max, dan sebagainya.
Fungsi Agregasi
Mari kita buka data penumpang kapal Titanic di bawah ini.
DataFrame di atas memiliki banyak data numerik yang sejatinya dapat diolah. Kita dapat menggunakan function atau fungsi .agg() untuk mengaplikasikan analisis statistik deskriptif. Lihat value apa saja yang dapat diaplikasikan melalui fungsi agg() di bawah ini.
Misal kita ingin mengetahui mean dari seluruh data numerik.
Atau mean dari satu kolom saja.
Mengenal GroupBy
Sekarang, kita diajak untuk mengenal fungsi groupby. Seperti namanya, groupby adalah fungsi untuk mengelompokkan data lebih dari satu kolom berdasarkan satu kolom tertentu.
Di materi sebelumnya, kita telah mengenal iloc (mengakses kolom dengan kata kunci numerik) dan loc (mengakses kolom dengan kata kunci string). Kita akan menggunakan loc untuk mengetahui ilustrasi sederhana groupby dan agg.
Dari susunan kode di atas, kita memerintah Python untuk:
- Mengakses kolom “Sex” dan “Survived”.
- Dengan fungsi loc, kita spesifik mengatur kolom “Survived” agar hanya menampilkan data yang bernilai 1 (artinya selamat).
- Mengelompokkan data berdasarkan kolom “Sex” dengan fungsi groupby.
- Menjalankan fungsi agregasi “count” yang artinya jumlah.
Mari simak contoh lainnya. Kali ini, kita akan menggunakan nilai agregat yang lain, yaitu mean atau rata-rata.
Pro Tips
- Fungsi agg() digunakan untuk mengaplikasikan analisis statistik deskriptif sederhana.
- Fungsi groupby() digunakan untuk mengelompokkan analisis statistik deskriptif lebih dari satu kolom berdasarkan satu kolom tertentu.
Kuis
Apa sintaksis yang tepat digunakan untuk mengaplikasikan standar deviasi?