Dataset
Melalui kelas ini, kamu diajak untuk:
- Mengetahui cara memuat dataset di R.
- Mengidentifikasi langkah-langkah mengakses variabel dan nilai dalam dataset.
Pengantar
Kelebihan R bagi komunitas programmer adalah sistem analisis statistiknya. R umum digunakan para peneliti untuk membersihkan, menganalisis, dan membuat visualisasi data. Kelas ini didesain untuk memahami dasar-dasar penggunaan R untuk statistika, dari konsep, kegunaan, hingga susunan kodenya.
Memuat Dataset
Mula-mula, tugas kita adalah memuat dataset yang akan dianalisis. Di materi ini, kita akan mencoba menganalisis dataset sederhana berisi berat badan (kg) atlet dan kecepatan lari (detik). Mari gunakan fungsi read.csv() seperti di bawah ini.
Untuk memuat data di R, kita dapat menggunakan function read_csv(“file.csv”). Di materi ini, kita akan menggunakan data yang disediakan R, yaitu data mengenai mobil dengan kata kunci mtcars.
# untuk load data, kita dapat menggunakan Data <- read.csv("nama_file.csv")
# kali ini, kita akan memakai mtcars
Data <- mtcars
Mengakses Variabel dan Nilai
Kita juga dapat mengakses variabel dan nilai. Misal, kita ingin mengetahui dimensi dari data, kita dapat menggunakan dim(). Dimensi data adalah jumlah baris dan kolom.
dim(Data)
[1] 32 11
Mengetahui nama-nama variabel (kolom) dengan names().
names(Data)
[1] "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear" "carb"
Mengetahui nilai-nilai pada baris di kolom pertama dengan rownames()
rownames(Data)
[1] "Mazda RX4" "Mazda RX4 Wag" "Datsun 710"
[4] "Hornet 4 Drive" "Hornet Sportabout" "Valiant"
[7] "Duster 360" "Merc 240D" "Merc 230"
[10] "Merc 280" "Merc 280C" "Merc 450SE"
[13] "Merc 450SL" "Merc 450SLC" "Cadillac Fleetwood"
[16] "Lincoln Continental" "Chrysler Imperial" "Fiat 128"
[19] "Honda Civic" "Toyota Corolla" "Toyota Corona"
[22] "Dodge Challenger" "AMC Javelin" "Camaro Z28"
[25] "Pontiac Firebird" "Fiat X1-9" "Porsche 914-2"
[28] "Lotus Europa" "Ford Pantera L" "Ferrari Dino"
[31] "Maserati Bora" "Volvo 142E"
Mengetahui nilai dari variabel tertentu menggunakan tanda $. Misal kita ingin mengetahui value dari berat mobil atau kolom wt.
Data$wt
[1] 2.620 2.875 2.320 3.215 3.440 3.460 3.570 3.190 3.150 3.440 3.440 4.070 3.730
[14] 3.780 5.250 5.424 5.345 2.200 1.615 1.835 2.465 3.520 3.435 3.840 3.845 1.935
[27] 2.140 1.513 3.170 2.770 3.570 2.780
Ringkasan Dataset
Selain mengakses variabel atau nilai-nilai tertentu, kita juga dapat mencari tahu ringkasan data. Ringkasan data terdiri dari min, Q1, median, mean, Q3, hingga max. Fungsi yang diberikan adalah summary().
summary(Data)
R akan menampilkan hasil seperti ini.
Kita juga dapat mengetahui ringkasan dari satu variabel, misal berat mobil.
summary(Data$wt)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.513 2.581 3.325 3.217 3.610 5.424
Pro Tips
- Kita dapat memuat dataset dengan load_csv().
- Untuk mengakses nilai dari variabel tertentu, kita menggunakan tanda $.
- Gunakan summary() untuk melihat ringkasan data.
Kuis
Apa kegunaan dari rownames()?