Memuat Dataset dan Mengatur Style

Melalui kelas ini, kamu diajak untuk:

  • Mengetahui cara memuat dataset dengan Seaborn.
  • Mengidentifikasi langkah-langkah membuat visualisasi sederhana dan pengaturan style yang tersedia.

Tentang Visualisasi Data

Langkah paling awal dalam memulai dengan Seaborn adalah memuat dataset. Dataset inilah yang nantinya akan kita olah menjadi data visual yang menarik dan mudah dianalisis. Di materi ini, kita akan mengulas langkah-langkah memuat dataset dan membuat visualisasi sederhana.

Memuat Dataset

Mula-mula, kita perlu mengimpor beberapa library pendukung visualisasi data, seperti Seaborn, Matplotlib, Numpy, dan Pandas. Kita juga dapat mengimpor library lain seperti scipy dan statsmodel jika kita ingin mengolah data-data statistik lebih jauh.

import pandas
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

Setelah impor berhasil, saatnya beranjak ke langkah paling awal, yaitu memuat dataset dengan fungsi load_dataset(“nama_dataset”). Di materi ini, kita akan memuat salah satu contoh yang disediakan oleh library Seaborn.

df = sns.load_dataset("tips")
df.head()

df.head() digunakan untuk membantu kita melihat 5 indeks paling atas dari dataset. Tampilannya seperti ini.

Membuat Grafik dan Mengatur Style

Setelah data dimuat, saatnya buat visualisasi sederhana. Misal kita ingin membaca data tip dan total tagihan secara bersamaan dengan visualisasi scatter (persebaran). Lihat susunan kode di bawah ini:

plt.scatter(df.total_bill,df.tip)
sns.set()
plt.show()

Tampilannya:

Menghilangkan Axis

Visualisasi sebelumnya tampak bagus. Namun, pada praktiknya, visualisasi data amat jarang menggunakan axis atas dan axis kanan. Seaborn memiliki fungsi despine() untuk menghilangkan kedua axis tersebut.

plt.scatter(df.total_bill,df.tip)
sns.set_style("white")
sns.despine()
plt.show()

Tampilannya:

Mengatur Tema

Kita juga dapat mengatur tema dari grafik kita dengan fungsi set_style(). set_style() memiliki beberapa parameter yang dapat dimasukkan, yaitu:

  • “white”
  • “dark”
  • “whitegrid”
  • “darkgrid”
  • “ticks”

Kali ini, kita akan menggunakan “darkgrid” dengan susunan kode di bawah ini.

plt.scatter(df.total_bill,df.tip)
sns.set_style("darkgrid")
plt.show()

Tampilannya:

Membuat Replot

Kita dapat memasang parameter-parameter tertentu dengan membuat plot ulang. Plot ulang ini dilakukan dengan fungsi replot(). Lihat apa saja yang dapat kita lakukan dengan replot di bawah ini.

Memasang Variabel

Lewat fungsi replot(), kita dapat menentukan variabel x dan y dalam grafik. Lihat susunan kode ini.

sns.relplot(data=df, x="total_bill", y="tip")

Tampilannya:

Parameter Warna

Kita juga dapat memasukkan parameter pembeda berdasarkan warna. Misal dari data tip dan total tagihan, kita ingin mengetahui persebaran berdasarkan parameter lain, seperti waktu. Kita dapat menggunakan warna lewat parameter hue=””.

sns.relplot(data=df, x="total_bill", y="tip", hue="time")

Tampilannya:

Menambah Kolom

Jika kita masih membutuhkan parameter lain, tenang saja, Seaborn akan membantu kita. Kita dapat menambah parameter kolom lewat parameter col=”” (menambah parameter data) dan col_wrap=”” (untuk mengatur tata letak berdasarkan kolom).

Misal kita ingin menambah parameter hari ke dalam visualisasi data kita. Lihat susunan kode ini:

sns.relplot(data=df, x="total_bill", y="tip", hue="time", col="day", col_wrap=2)

Tampilannya:

Pro Tips

  • Dataset dimuat dengan bantuan library Seaborn lewat fungsi load_dataset() dan Pandas lewat fungsi head().
  • Seaborn memiliki beberapa pengaturan style sederhana pada grafik, seperti tema dan axis.
  • Kita juga dapat menambah berbagai parameter seperti variabel, warna, dan kolom dengan fungsi replot().

Kuis

Apa fungsi dari despine() dalam library Seaborn?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan