R Kuadrat dan P-Value
Melalui kelas ini, kamu diajak untuk:
- Mengenal R² dan p-value dalam analisis regresi linier.
- Mencari hasil R² dan p-value menggunakan fungsi summary() di R.
Pengantar
Meski telah mendapatkan line of best fit serta visualisasinya, pekerjaan belum selesai. Kita masih perlu untuk melihat dua komponen utama dalam regresi, yaitu R² dan p-value.
Ketuk untuk mengetahui keduanya.
R²
Variabel pemberi efek atau variabel yang mempengaruhi variabel dependen, bisa juga disebut sebagai variabel eksplanatori.
P-value
Probabilitas kebenaran dari hipotesis nol atau probabilitas bahwa tidak ada korelasi antara variabel independen dan dependen. Ambang batas umum p-value adalah 0.05. Jika p-value < 0.05, maka hasil dikatakan signifikan secara statistik untuk menolak hipotesis nol.
Menganalisis R Kuadrat
Kita dapat memperoleh hasil R² dengan menggunakan fungsi summary() pada linear model yang telah kita aplikasikan. Lihat susunan kodenya di bawah ini.
# menerapkan linear model
regresi <- lm(formula = Kecepatan.Lari ~ Berat.Badan, data = data)
# memanggil hasil
summary(regresi)
[1]
Call:
lm(formula = Kecepatan.Lari ~ Berat.Badan, data = data)
Residuals:
Min 1Q Median 3Q Max
-0.60802 -0.27379 -0.07649 0.22486 0.88928
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.81161 0.77577 -2.335 0.0237 *
Berat.Badan 0.23423 0.01285 18.232 <0.0000000000000002 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.3624 on 49 degrees of freedom
Multiple R-squared: 0.8715, Adjusted R-squared: 0.8689
F-statistic: 332.4 on 1 and 49 DF, p-value: < 0.00000000000000022
Mari fokus pada Multiple R-squared. 0.8715 adalah R² dari analisis regresi yang kita lakukan. Jika diterjemahkan, sekitar 87,15% varians dari variabel independen menjelaskan variabel dependen.
Apakah angka ini signifikan? 87% adalah angka yang cukup tinggi untuk analisis regresi. Namun, biasanya, beda area studi memiliki kisaran R² yang berbeda pula.
Geser untuk mengetahui lebih lanjut.
Melihat P-Value
Kita akhirnya sampai pada p-value. Seperti yang telah disinggung, p-value adalah probabilitas kebenaran hipotesis nol. Dalam konteks ini, kita membutuhkan p-value < 0.05 (ambang batas umum) untuk menerima hasil analisis regresi sebagai hasil yang signifikan secara statistik.
Mari tengok kembali panggilan summary() regresi dalam R.
Call:
lm(formula = Kecepatan.Lari ~ Berat.Badan, data = data)
Residuals:
Min 1Q Median 3Q Max
-0.60802 -0.27379 -0.07649 0.22486 0.88928
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.81161 0.77577 -2.335 0.0237 *
Berat.Badan 0.23423 0.01285 18.232 <0.0000000000000002 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.3624 on 49 degrees of freedom
Multiple R-squared: 0.8715, Adjusted R-squared: 0.8689
F-statistic: 332.4 on 1 and 49 DF, p-value: < 0.00000000000000022
Di bagian bawah, dideklarasikan bahwa p-value hampir mendekati 0. Dengan kata lain, kemungkinan hipotesis nol benar hanya 0.00000000000000022 atau nyaris 0. Jika diterjemahkan lebih lanjut, hasil analisis regresi linier ini dapat dikatakan signifikan secara statistik untuk menolak hipotesis nol.
Rangkuman
- R² adalah tingkat korelasi dan pengaruh variabel independen terhadap variabel dependen. Semakin dekat R² dengan angka 1, semakin tinggi tingkat pengaruhnya.
- P-value adalah probabilitas kebenaran hipotesis nol. Semakin kecil angka p-value, semakin kecil kemungkinan hipotesis nol benar dan hipotesis alternatif salah.
Kuis
Apa hasil yang menjelaskan tingkat signifikansi statistik?