Korelasi: Chi-Square dan Korelasi Koefisien

Melalui kelas ini, kamu diajak untuk:

  • Mengenal karakteristik uji chi-square dan korelasi koefisien untuk mengukur korelasi.
  • Mengidentifikasi fungsi dan parameter dalam susunan kode uji chi-square dan korelasi koefisien.

Korelasi Antar-Variabel

Selain mencari perbedaan, tipe aplikasi statistika inferensial lainnya adalah mengukur korelasi antar variabel. Dalam praktiknya, ada dua jenis analisis korelasi, analisis dua variabel kategori dan dua variabel numerik.

Namun perlu digarisbawahi bahwa korelasi adalah soal signifikan atau tidaknya hubungan antar variabel. Korelasi tidak menjelaskan pengaruh satu variabel terhadap variabel lainnya. Untuk mencari pengaruh, kita biasanya menggunakan model lain seperti regresi.

Chi-Square: Dua Variabel Kategori

Pertama-tama, kita diajak mengenal chi-square. Chi-square adalah jenis tes untuk mencari korelasi antara dua variabel kategori. Misal kita ingin mengukur korelasi antara gender dan perilaku merokok.

Lihat dataset ini.

df <- read.csv("chi_square.csv")
df

      Gender Merokok
1  Laki-laki      Ya
2  Perempuan      Ya
3  Perempuan    Tidak
4  Laki-laki       Ya
5  Perempuan       Ya
6  Perempuan    Tidak
7  Perempuan    Tidak
8  Laki-laki    Tidak
9  Laki-laki       Ya
10 Perempuan       Ya
11 Laki-laki       Ya
12 Laki-laki       Ya
13 Laki-laki    Tidak
....

Untuk menggunakan chi-square kita perlu mengubah format dataset menjadi tabel terlebih dahulu.

df_table <- table(df$Gender, df$Merokok)
df_table

           
            Tidak Ya
  Perempuan    16  8
  Laki-laki     8 18

Sekarang, tugas kita adalah menulis fungsi chisq.test(nama_tabel).

chi_square <- chisq.test(df_table)
chi_square

    Pearson's Chi-squared test with Yates' continuity correction

data:  df_table
X-squared = 5.0852, df = 1, p-value = 0.02413

Berdasarkan hasil di atas, dapat dilihat bahwa p-value < 0.05. Maka, kita berhasil menolak hipotesis nol. Dengan kata lain, ada korelasi antara gender dan perilaku merokok.

Korelasi Koefisien: Dua Variabel Numerik

Jika chi-square digunakan untuk menganalisis korelasi dua variabel kategori, korelasi koefisien menganalisis dua variabel numerik. Sebagai contoh kasus, kita memiliki dataset berat badan dan kecepatan lari. Kita ingin mengetahui apakah ada hubungan antara berat badan dan kecepatan lari sekumpulan atlet.

df <- read.csv("korelasi_koefisien.csv")
df

   Berat.Badan Kecepatan.Lari
1           65           12.9
2           60           11.8
3           62           13.6
4           58           12.1
5           61           12.2
6           55           10.7
7           67           13.7
8           57           11.9
9           58           11.5
10          60           12.2
11          55           11.3
12          64           12.5
13          66           13.1
14          59           11.9
15          63           13.1

Fungsi untuk menerapkan tes korelasi koefisien adalah dengan menggunakan cor.test(x,y). Isi parameter dengan nama indeks yang untuk merepresentasikan variabel x dan y.

Lihat susunan kode di bawah ini.

korelasi <- cor.test(df$Berat.Badan, df$Kecepatan.Lari)
korelasi

    Pearson's product-moment correlation

data:  df$Berat.Badan and df$Kecepatan.Lari
t = 6.7552, df = 13, p-value = 0.00001352
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.6749729 0.9604287
sample estimates:
      cor 
0.8822023 

Dari hasil di atas, dapat dilihat bahwa angka korelasi 0.89 atau sekitar 80%, sementara p-value nyaris menyentuh angka 0. Dengan kata lain, ada korelasi yang cukup signifikan antara berat badan dan kecepatan lari atlet.

Pro Tips

  • Chi-square digunakan untuk melihat korelasi antara dua variabel kategori.
  • Korelasi koefisien digunakan untuk melihat korelasi antara dua variabel numerik.

Kuis

Apa langkah yang ditempuh setelah memuat dataset saat kita ingin menerapkan uji chi-square?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan