Visualisasi dengan Matplotlib

Melalui kelas ini, kamu diajak untuk:

  • Memahami integrasi Pandas dengan Matplotlib.
  • Cara menggunakan function visualisasi data dengan Matplotlib.
  • Jenis-jenis visualisasi di Matplotlib.

Visualisasi

Penggunaan Pandas memungkinkan penampilan visualisasi data untuk membantu proses analisis. Namun, Pandas tidak bekerja sendiri dalam menyediakan analisis karena meminjam fitur library Matplotlib.

Misalnya ketika hendak menggunakan visualisasi histogram di Pandas. Bisa gunakan cara berikut:


import pandas as pd

data = pd.readcsv('statistik-covid.csv')
data['age'].hist()

Maka Pandas akan menampilkan data dari file 'statistik-covid' dalam bentuk histogram

Untuk visualisasi yang lebih kompleks, Pandas perlu ditemani library tambahan bernama Matplotlib. Untuk memulainya, integrasikan library Matplotlib dengan Pandas dengan contoh kode di bawah.


import pandas as pd
import matplotlib as mp
import matplotlib.pyplot as plt

Dengan menggunakan Matplotlib, nantinya proses visualisasi data akan menggunakan kode tambagan mp atau plt.

Merapikan Visualisasi Data

Terkadang, bagan yang muncul dalam visualisasi masih belum jelas. Pandas menyediakan fitur untuk merapikan di dalam kode perintah.

Misalnya untuk memperbesar jarak sehingga data tidak menumpuk. Pandas menyediakan perintah bins. Tempatkan kode bins dengan cara berikut:


import seaborn as sns
sns.set()

Pengimporan seaborn bertujuan untuk menanamkan fungsi tambahan terkati visualisasi data. Kode sns.set() mutlak diperlukan untuk menuntaskan integrasi dengan Pandas.

Salah satu keunggulan Seaborn dibanding visualisasi data bawaan Pandas adalah jarak antar batang. Contoh tampilannya bisa dilihat di gambat di bawah.

Detail Visualisasi Matplotlib

Sebelum memulai, pastikan sudah familiar dengan konsep dasar visualisasi data yakni sumbu x dan sumbu y. Untuk sumbu x adalah yang horizontal atau garis yang meninggi, dan sumbu y yang vertikal atau yang menyamping. Hapalkan bentuknya seperti berikut:

Pemahaman ini penting karena nantinya Matplotlib membutuhkan perintah rinci variabel apa saja yang masuk dalam masing-masing sumbu.

Selanjutnya, Matplotlib memiliki fungsi khusus dalam penggunaan jenis visualisasi. Misalnya saat akan menggunakan Scatter Plot, maka bentuk kodenya seperti yang tertulis di bawah:


data = pd.readcsv['statistik-covid.csv']
data1 = data.tail(1)
data2 = data.head(3)
data3 = data.head(2)

data.scatter(data1,data2,color='red')
data.scatter(data1,data3,color='blue')

data.xlabel('data1')
data.ylabel('data2')

Maka, Matplotlib akan menempatkan data1 sebagai x dan data2 sebagai y dengan visualisasi korelasi melalui scatter.

Variasi Plot

Strategi apakah yang harus dilakukan dalam proses awal perancangan iklan stories?

Geser ke kanan untuk melihat jenis plot di Pandas+Matplotlib:

Scatter Plot

Persebaran dari masing-masing kelompok dan mencari hubungannya.

plt.scatterplot()

Ordered Bar Chat

Menampilkan kuantitas data secara berurut agar memberi konteks.

Kode: plt.subplots

Box Plot

Menampilkan volume di masing-masing kelompok data.

Kode: sns.boxplot

Joy Plot

Distribusi relasi data dari kelompok besar.

Kode: joypy.joyplot

Rangkuman

  • Visualisasi data dengan Pandas harus ditemani Numpy, Matplotlib, dan Seaborn.
  • Seaborn berguna untuk merapikan visualisasi.
  • Matplotlib dapat memberi fleksibilitas visualisasi.

Kuis

Bagaimana memunculkan hasil visualisasi Matplotlib?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan