Dataset

Melalui kelas ini, kamu diajak untuk:

  • Mengetahui cara memuat dataset di R.
  • Mengidentifikasi langkah-langkah mengakses variabel dan nilai dalam dataset.

Pengantar

Kelebihan R bagi komunitas programmer adalah sistem analisis statistiknya. R umum digunakan para peneliti untuk membersihkan, menganalisis, dan membuat visualisasi data. Kelas ini didesain untuk memahami dasar-dasar penggunaan R untuk statistika, dari konsep, kegunaan, hingga susunan kodenya.

Memuat Dataset

Mula-mula, tugas kita adalah memuat dataset yang akan dianalisis. Di materi ini, kita akan mencoba menganalisis dataset sederhana berisi berat badan (kg) atlet dan kecepatan lari (detik). Mari gunakan fungsi read.csv() seperti di bawah ini.

Untuk memuat data di R, kita dapat menggunakan function read_csv(“file.csv”). Di materi ini, kita akan menggunakan data yang disediakan R, yaitu data mengenai mobil dengan kata kunci mtcars.

# untuk load data, kita dapat menggunakan Data <- read.csv("nama_file.csv")


# kali ini, kita akan memakai mtcars
Data <- mtcars

Mengakses Variabel dan Nilai

Kita juga dapat mengakses variabel dan nilai. Misal, kita ingin mengetahui dimensi dari data, kita dapat menggunakan dim(). Dimensi data adalah jumlah baris dan kolom.

dim(Data)

[1] 32 11

Mengetahui nama-nama variabel (kolom) dengan names().

names(Data)

[1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear" "carb"

Mengetahui nilai-nilai pada baris di kolom pertama dengan rownames()

rownames(Data)
 
[1] "Mazda RX4"           "Mazda RX4 Wag"       "Datsun 710"         
 [4] "Hornet 4 Drive"      "Hornet Sportabout"   "Valiant"            
 [7] "Duster 360"          "Merc 240D"           "Merc 230"           
[10] "Merc 280"            "Merc 280C"           "Merc 450SE"         
[13] "Merc 450SL"          "Merc 450SLC"         "Cadillac Fleetwood" 
[16] "Lincoln Continental" "Chrysler Imperial"   "Fiat 128"           
[19] "Honda Civic"         "Toyota Corolla"      "Toyota Corona"      
[22] "Dodge Challenger"    "AMC Javelin"         "Camaro Z28"         
[25] "Pontiac Firebird"    "Fiat X1-9"           "Porsche 914-2"      
[28] "Lotus Europa"        "Ford Pantera L"      "Ferrari Dino"       
[31] "Maserati Bora"       "Volvo 142E"     

Mengetahui nilai dari variabel tertentu menggunakan tanda $. Misal kita ingin mengetahui value dari berat mobil atau kolom wt.

Data$wt
 
[1] 2.620 2.875 2.320 3.215 3.440 3.460 3.570 3.190 3.150 3.440 3.440 4.070 3.730
[14] 3.780 5.250 5.424 5.345 2.200 1.615 1.835 2.465 3.520 3.435 3.840 3.845 1.935
[27] 2.140 1.513 3.170 2.770 3.570 2.780

Ringkasan Dataset

Selain mengakses variabel atau nilai-nilai tertentu, kita juga dapat mencari tahu ringkasan data. Ringkasan data terdiri dari min, Q1, median, mean, Q3, hingga max. Fungsi yang diberikan adalah summary().

summary(Data)

R akan menampilkan hasil seperti ini.

Kita juga dapat mengetahui ringkasan dari satu variabel, misal berat mobil.

summary(Data$wt)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.513   2.581   3.325   3.217   3.610   5.424 

Pro Tips

  • Kita dapat memuat dataset dengan load_csv().
  • Untuk mengakses nilai dari variabel tertentu, kita menggunakan tanda $.
  • Gunakan summary() untuk melihat ringkasan data.

Kuis

Apa kegunaan dari rownames()?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan