Scatterplot: Visualisasi untuk Regresi
Kelas ini berisikan materi tentang:
- Penggunaan scatterplot.
- Cara membaca scatterplot.
Apa itu Scatterplot
Scatterplot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Komponennya terdiri dari garis memanjang (x) sebagai variabel bebas, garis melebar untuk variabel dependen, kemudian titik yang merepresentasikan nilai x dan y.
Titik dalam scatterplot berada di koefisien antara x dan y. Tempatkan seluruh data dalam format serupa yang nantinya akan membentuk titik dalam jumlah banyak. Titik-titik ini akan membentuk sebuah pola.
Pola
Bentuk pola akan menyamping ke atas, ke bawah, atau menyebar, bergantung pada korelasi matematisnya. Masing-masing bentuk memiliki konsekuensi analisis yang berbeda. Berikut deskripsinya.
Garis Tengah
Garis yang berada di tengah persebaran titik bukan tak ada gunanya. Garis tersebut merupakan line of best fit, sebuah garis hasil penghitungan nilai estimasi. Letaknya berada di tengah-tengah titik nilai data dan bentuknya serupa dengan kecenderungan korelasinya.
Namun, pembuatan garisnya bukan cuma asal di tengah. Line of best fit memiliki penghitungan sehingga penempatannya bisa presisi atau menghitung slope. Gunakan rumus y = a + bx seperti berikut
Jangan pusing dulu dengan rumus yang ada. Mencari a dan b harus didahului dengan menghitung masing-masing jumlah x dan y, lalu dibagi dengan jumlah data. Caranya bisa ikuti contoh penghitungan berikut.
Rangkuman
- Scatterplot adalah visualisasi persebaran titik-titik data yang setiap titiknya berada di koefisien variabel x dan y.
- Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.
Kuis
Apa pola korelasi yang menjelaskan peningkatan variabel x seiring dengan menurunnya variabel y?