Fungsi Plot: Histogram dan Bar Chart

Melalui kelas ini, kamu diajak untuk:

  • Mengenal histogram dan bar chart untuk visualisasi data.
  • Mengetahui susunan kode dan parameter untuk mengatur histogram dan bar chart.

Bar

Seaborn menyediakan banyak bentuk grafik. Setiap bentuk grafik memiliki karakteristik sesuai dengan jenis data yang ingin dianalisis. Pada materi ini, kita diajak untuk mengenal histogram, grafik bar, dan grafik garis atau line chart, karakteristiknya, serta susunan kode masing-masing jenis grafik.

Bar

Bar chart atau grafik batang digunakan untuk melihat frekuensi dari data-data kategori. Bar chart dalam Seaborn menggunakan fungsi barplot().

Muat kembali dataset Titanic. Misal kita ingin melihat frekuensi orang yang selamat berdasarkan kategori laki-laki dewasa, perempuan dewasa, dan anak-anak. Lihat contoh susunan kode di bawah ini.

df = sns.load_dataset("titanic")
sns.barplot(data=df, x = "who", y = "survived", ci=None)

Tampilannya:

Kita dapat membuat bar chart yang lebih kompleks. Kita tak hanya ingin melihat data orang selamat berdasarkan kategori siapa, tapi juga kategori kelas. Lihat susunan kode ini.

df = sns.load_dataset("titanic")
sns.barplot(data=df, x = "who", y = "survived", ci=None)

Tampilannya:

Historgram

Visualisasi histogram juga berbentuk batang. Namun, histogram adalah jenis grafik yang menjelaskan frekuensi berdasarkan dua data numerik. Contohnya, data populasi berdasarkan umur dan jumlah proporsi laki-laki dan perempuan.

Fungsi histogram dalam Seaborn menggunakan histplot(), displot(), atau distplot(), meski distplot() sudah jarang sekali digunakan. Lihat contohnya menggunakan dataset tips di bawah ini.

sns.histplot(df.tip)

Tampilannya:

Mari simak demonstrasi yang lebih kompleks. Kali ini, kita akan menggunakan data penumpang kapal Titanic kembali. Kita ingin menggunakan histogram untuk melihat jumlah orang dengan umur tertentu, tetapi ada perbedaan warna berdasarkan gender. Lihat susunan kode di bawah ini.

df = sns.load_dataset("titanic")
# x adalah data, hue adalah pembeda warna berdasarkan data kategori, bins adalah jarak 
sns.histplot(data=df, x="age", hue="sex", bins=10)

Tampilannya:

Pro Tips

  • Histogram umum digunakan untuk melihat frekuensi dari data-data numerik yang bersifat kontinu.
  • Bar chart umum digunakan untuk melihat frekuensi dari data-data kategori.

Kuis

Apa fungsi yang bukan termasuk cara membuat histogram?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan