Perbedaan: T-Test dan ANOVA
Melalui kelas ini, kamu diajak untuk:
- Mengenal karakteristik t-test dan ANOVA untuk mengukur signifikansi perbedaan.
- Mengidentifikasi fungsi dan parameter dalam susunan kode t-test dan ANOVA.
Statistika Inferensial
Ringkasan data sampel tak selalu mampu menjelaskan populasi. Lebih jauh dari sekadar deskripsi, kita membutuhkan statistika inferensial untuk analisis yang lebih dalam. Statistika inferensial adalah tipe statistika yang mengolah data sampel agar bisa membuat keputusan dan menarik kesimpulan atas populasi.
Aplikasi statistika inferensial butuh hipotesis. Hipotesis sendiri adalah dugaan/asumsi yang butuh dibuktikan kebenarannya. Setiap hipotesis didasarkan pada pembacaan dan ringkasan data. Kemudian, tugas kita adalah memilih teknik analisis statistik yang tepat, lalu menerapkan teknik tersebut.
Hipotesis Nol dan Alternatif
Sebelum lanjut pada pengujian menggunakan R, kita perlu memahami hipotesis. Ada dua jenis hipotesis, yaitu hipotesis nol dan alternatif.
Ketuk untuk mengetahui keduanya.
Hipotesis nol
Hipotesis yang saat ini diterima atau hipotesis yang menyatakan bahwa tidak ada korelasi, pengaruh, dan perbedaan antar variabel.
Hipotesis alternatif
Hipotesis yang ingin kita uji untuk menantang hipotesis nol. Dengan kata lain, hipotesis menyatakan bahwa ada korelasi, pengaruh, dan perbedaan antar variabel.
T-Test
T-test adalah jenis tes yang digunakan untuk mengukur signifikansi perbedaan antara satu variabel kategori (dua level) dan satu variabel numerik. T-test adalah tingkat lanjutan dari mean. Jika mean digunakan untuk mencari rata-rata dari sampel, t-test menakar apakah perbedaan dari kelompok signifikan jika ditarik ke populasi.
Dalam R, t-test menggunakan fungsi t.test(). Parameter dalam fungsi t.test() sederhana diisi oleh data sampel yang ingin diuji dan mean populasi dalam hipotesis nol (mu). Jika hipotesis nol adalah “tidak ada perbedaan” maka isi parameter mean populasi dengan 0.
Misal kita ingin menguji signifikansi perbedaan nilai ujian dari siswa yang mengikuti bimbel dan tidak. Hipotesis kita adalah ada perbedaan signifikan antara nilai dua kelompok tersebut.
Mari terapkan t-test di bawah ini.
Dapat dilihat bahwa p-value dari pengujian kita nyaris menyentuh angka 0. Dengan kata lain, probabilitas kebenaran hipotesis nol (bahwa tidak ada perbedaan) amat dekat dengan angka 0. Sehingga, hipotesis nol berhasil ditolak atau ada perbedaan signifikan antara data A dan B.
Ambang batas p-value yang umum digunakan adalah 0.05. Dengan demikian, jika p-value < 0.05, kita dapat dengan percaya diri menolak hipotesis nol.
Tes ANOVA Satu Arah
ANOVA adalah jenis tes untuk mengukur perbedaan antara satu variabel kategori (lebih dari dua level) dan satu variabel numerik. Misal signifikansi minat baca isu politik berdasarkan generasinya (Gen Z, Milenial, dan Baby Boomer). Ada tiga level dalam kategori generasi. Dalam kasus ini, kita menggunakan ANOVA satu arah.
Dalam R, ANOVA satu arah menggunakan fungsi aov(). Ada dua parameter utama dalam fungsi aov(), yaitu formula dan data.
- Formula adalah rumus untuk spesifikasi model (variabel_numerik~variabel_kategori)
- Data adalah dataset yang dirujuk
Lihat susunan kode ini.
Dari hasil di atas, perhatikan Pr(>F). Istilah ini adalah p-value yang diasosiasikan dengan F value atau uji ANOVA itu sendiri. Angka p-value adalah 0.193 yang berarti lebih dari ambang batas 0.05. Dengan kata lain, kita gagal menolak hipotesis nol atau tidak ada perbedaan signifikan antara tingkat minat tiga kategori generasi.
Tes ANOVA Dua Arah
Tes ANOVA dua arah adalah pengujian dua variabel kategori dan satu variabel numerik. Misal kita mengambil data BPS mengenai Angka Partisipasi Murni (APM) masyarakat Indonesia tahun 2020 berdasarkan dua kategori, yaitu gender dan tempat tinggal. Kasus ini menggunakan ANOVA dua arah alih-alih satu arah.
Sama seperti ANOVA satu arah, tes dua arah juga menggunakan aov(formula, data). Bedanya, di bagian formula, kita menambahkan satu variabel kategori tambahan.
Lihat susunan kode ini.
Dua faktor yang dianalisis menghasilkan dua angka p-value pula. Ada kemungkinan p-value untuk satu faktor signifikan (< 0.05) atau sebaliknya. Ada juga kasus dengan p-value signifikan di dua faktor, atau tidak sama sekali.
Dalam kasus ini, dapat dilihat bahwa kedua p-value > 0.05. Dengan kata lain, kita gagal menolak hipotesis nol bahwa ada perbedaan berdasarkan faktor A, faktor B atau keduanya.
Sederhananya, tidak ada perbedaan signifikan APM berdasarkan gender maupun tempat tinggal.
Pro Tips
- Jika ingin mengukur signifikansi perbedaan antara satu variabel kategori (dua level) dan satu variabel numerik, kita menggunakan t-test.
- Signifikansi perbedaan antara satu variabel kategori (lebih dari dua level) dan satu variabel numerik diukur dengan tes ANOVA satu arah.
- Tes ANOVA dua arah digunakan untuk mengukur signifikansi perbedaan lebih dari satu variabel kategori (dua level atau lebih) dan satu variabel numerik.
Kuis
Apa parameter formula yang tepat digunakan dalam tes ANOVA satu arah?