Perbedaan: T-Test dan ANOVA

Melalui kelas ini, kamu diajak untuk:

  • Mengenal karakteristik t-test dan ANOVA untuk mengukur signifikansi perbedaan.
  • Mengidentifikasi fungsi dan parameter dalam susunan kode t-test dan ANOVA.

Statistika Inferensial

Ringkasan data sampel tak selalu mampu menjelaskan populasi. Lebih jauh dari sekadar deskripsi, kita membutuhkan statistika inferensial untuk analisis yang lebih dalam. Statistika inferensial adalah tipe statistika yang mengolah data sampel agar bisa membuat keputusan dan menarik kesimpulan atas populasi.

Aplikasi statistika inferensial butuh hipotesis. Hipotesis sendiri adalah dugaan/asumsi yang butuh dibuktikan kebenarannya. Setiap hipotesis didasarkan pada pembacaan dan ringkasan data. Kemudian, tugas kita adalah memilih teknik analisis statistik yang tepat, lalu menerapkan teknik tersebut.

Hipotesis Nol dan Alternatif

Sebelum lanjut pada pengujian menggunakan R, kita perlu memahami hipotesis. Ada dua jenis hipotesis, yaitu hipotesis nol dan alternatif.

Ketuk untuk mengetahui keduanya.

Hipotesis nol

Hipotesis yang saat ini diterima atau hipotesis yang menyatakan bahwa tidak ada korelasi, pengaruh, dan perbedaan antar variabel.

Hipotesis alternatif

Hipotesis yang ingin kita uji untuk menantang hipotesis nol. Dengan kata lain, hipotesis menyatakan bahwa ada korelasi, pengaruh, dan perbedaan antar variabel.

T-Test

T-test adalah jenis tes yang digunakan untuk mengukur signifikansi perbedaan antara satu variabel kategori (dua level) dan satu variabel numerik. T-test adalah tingkat lanjutan dari mean. Jika mean digunakan untuk mencari rata-rata dari sampel, t-test menakar apakah perbedaan dari kelompok signifikan jika ditarik ke populasi.

Dalam R, t-test menggunakan fungsi t.test(). Parameter dalam fungsi t.test() sederhana diisi oleh data sampel yang ingin diuji dan mean populasi dalam hipotesis nol (mu). Jika hipotesis nol adalah “tidak ada perbedaan” maka isi parameter mean populasi dengan 0.

Misal kita ingin menguji signifikansi perbedaan nilai ujian dari siswa yang mengikuti bimbel dan tidak. Hipotesis kita adalah ada perbedaan signifikan antara nilai dua kelompok tersebut.

Mari terapkan t-test di bawah ini.

# nilai siswa yang ikut bimbel
a <- c(88, 85, 89, 92, 94, 90, 85, 82, 80, 91, 90, 84, 83, 88, 92)
# nilai siswa yang tidak ikut
b <- c(70, 72, 75, 75, 77, 80, 74, 75, 82, 73, 75, 75, 78, 78, 77)
# pengoperasian t-test, mu adalah mean populasi dalam hipotesis nol
t.test(a, b,mu=0)



    Welch Two Sample t-test

data:  a and b
t = 8.8579, df = 25.726, p-value = 0.000000002726
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  9.060322 14.539678
sample estimates:
mean of x mean of y 
 87.53333  75.73333

Dapat dilihat bahwa p-value dari pengujian kita nyaris menyentuh angka 0. Dengan kata lain, probabilitas kebenaran hipotesis nol (bahwa tidak ada perbedaan) amat dekat dengan angka 0. Sehingga, hipotesis nol berhasil ditolak atau ada perbedaan signifikan antara data A dan B.

Ambang batas p-value yang umum digunakan adalah 0.05. Dengan demikian, jika p-value < 0.05, kita dapat dengan percaya diri menolak hipotesis nol.

Tes ANOVA Satu Arah

ANOVA adalah jenis tes untuk mengukur perbedaan antara satu variabel kategori (lebih dari dua level) dan satu variabel numerik. Misal signifikansi minat baca isu politik berdasarkan generasinya (Gen Z, Milenial, dan Baby Boomer). Ada tiga level dalam kategori generasi. Dalam kasus ini, kita menggunakan ANOVA satu arah.

Dalam R, ANOVA satu arah menggunakan fungsi aov(). Ada dua parameter utama dalam fungsi aov(), yaitu formula dan data.

  • Formula adalah rumus untuk spesifikasi model (variabel_numerik~variabel_kategori)
  • Data adalah dataset yang dirujuk

Lihat susunan kode ini.

# load dataset csv
df <- read.csv("anova_satu_arah.csv")
# aplikasi aov()
anova1 <- aov(formula=Tingkat~Kategori, data=df)
# memperlihatkan ringkasan dari hasil
summary(anova1)


            Df Sum Sq Mean Sq F value Pr(>F)
Kategori     2   2.77  1.3860   1.697  0.193
Residuals   54  44.11  0.8168

Dari hasil di atas, perhatikan Pr(>F). Istilah ini adalah p-value yang diasosiasikan dengan F value atau uji ANOVA itu sendiri. Angka p-value adalah 0.193 yang berarti lebih dari ambang batas 0.05. Dengan kata lain, kita gagal menolak hipotesis nol atau tidak ada perbedaan signifikan antara tingkat minat tiga kategori generasi.

Tes ANOVA Dua Arah

Tes ANOVA dua arah adalah pengujian dua variabel kategori dan satu variabel numerik. Misal kita mengambil data BPS mengenai Angka Partisipasi Murni (APM) masyarakat Indonesia tahun 2020 berdasarkan dua kategori, yaitu gender dan tempat tinggal. Kasus ini menggunakan ANOVA dua arah alih-alih satu arah.

Sama seperti ANOVA satu arah, tes dua arah juga menggunakan aov(formula, data). Bedanya, di bagian formula, kita menambahkan satu variabel kategori tambahan.

Lihat susunan kode ini.

# load dataset
df <- read.csv("anova_dua_arah.csv")
# aplikasi tes ANOVA dua arah
anova2 <- aov(formula=APM~Tempat.Tinggal+Gender, data=df)
# hasil ringkasan analisis
summary(anova2)


               Df Sum Sq Mean Sq F value Pr(>F)
Tempat.Tinggal  1  55.43   55.43  17.593  0.149
Gender          1   3.67    3.67   1.164  0.476
Residuals       1   3.15    3.15

Dua faktor yang dianalisis menghasilkan dua angka p-value pula. Ada kemungkinan p-value untuk satu faktor signifikan (< 0.05) atau sebaliknya. Ada juga kasus dengan p-value signifikan di dua faktor, atau tidak sama sekali.

Dalam kasus ini, dapat dilihat bahwa kedua p-value > 0.05. Dengan kata lain, kita gagal menolak hipotesis nol bahwa ada perbedaan berdasarkan faktor A, faktor B atau keduanya.

Sederhananya, tidak ada perbedaan signifikan APM berdasarkan gender maupun tempat tinggal.

Pro Tips

  • Jika ingin mengukur signifikansi perbedaan antara satu variabel kategori (dua level) dan satu variabel numerik, kita menggunakan t-test.
  • Signifikansi perbedaan antara satu variabel kategori (lebih dari dua level) dan satu variabel numerik diukur dengan tes ANOVA satu arah.
  • Tes ANOVA dua arah digunakan untuk mengukur signifikansi perbedaan lebih dari satu variabel kategori (dua level atau lebih) dan satu variabel numerik.

Kuis

Apa parameter formula yang tepat digunakan dalam tes ANOVA satu arah?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan