Korelasi: Chi-Square dan Korelasi Koefisien
Melalui kelas ini, kamu diajak untuk:
- Mengenal karakteristik uji chi-square dan korelasi koefisien untuk mengukur korelasi.
- Mengidentifikasi fungsi dan parameter dalam susunan kode uji chi-square dan korelasi koefisien.
Korelasi Antar-Variabel
Selain mencari perbedaan, tipe aplikasi statistika inferensial lainnya adalah mengukur korelasi antar variabel. Dalam praktiknya, ada dua jenis analisis korelasi, analisis dua variabel kategori dan dua variabel numerik.
Namun perlu digarisbawahi bahwa korelasi adalah soal signifikan atau tidaknya hubungan antar variabel. Korelasi tidak menjelaskan pengaruh satu variabel terhadap variabel lainnya. Untuk mencari pengaruh, kita biasanya menggunakan model lain seperti regresi.
Chi-Square: Dua Variabel Kategori
Pertama-tama, kita diajak mengenal chi-square. Chi-square adalah jenis tes untuk mencari korelasi antara dua variabel kategori. Misal kita ingin mengukur korelasi antara gender dan perilaku merokok.
Lihat dataset ini.
Untuk menggunakan chi-square kita perlu mengubah format dataset menjadi tabel terlebih dahulu.
Sekarang, tugas kita adalah menulis fungsi chisq.test(nama_tabel).
Berdasarkan hasil di atas, dapat dilihat bahwa p-value < 0.05. Maka, kita berhasil menolak hipotesis nol. Dengan kata lain, ada korelasi antara gender dan perilaku merokok.
Korelasi Koefisien: Dua Variabel Numerik
Jika chi-square digunakan untuk menganalisis korelasi dua variabel kategori, korelasi koefisien menganalisis dua variabel numerik. Sebagai contoh kasus, kita memiliki dataset berat badan dan kecepatan lari. Kita ingin mengetahui apakah ada hubungan antara berat badan dan kecepatan lari sekumpulan atlet.
Fungsi untuk menerapkan tes korelasi koefisien adalah dengan menggunakan cor.test(x,y). Isi parameter dengan nama indeks yang untuk merepresentasikan variabel x dan y.
Lihat susunan kode di bawah ini.
Dari hasil di atas, dapat dilihat bahwa angka korelasi 0.89 atau sekitar 80%, sementara p-value nyaris menyentuh angka 0. Dengan kata lain, ada korelasi yang cukup signifikan antara berat badan dan kecepatan lari atlet.
Pro Tips
- Chi-square digunakan untuk melihat korelasi antara dua variabel kategori.
- Korelasi koefisien digunakan untuk melihat korelasi antara dua variabel numerik.
Kuis
Apa langkah yang ditempuh setelah memuat dataset saat kita ingin menerapkan uji chi-square?