Dataset
Melalui kelas ini, kamu diajak untuk:
- Mengetahui cara memuat dataset di R.
- Mengidentifikasi langkah-langkah mengakses variabel dan nilai dalam dataset.
Pengantar
Kelebihan R bagi komunitas programmer adalah sistem analisis statistiknya. R umum digunakan para peneliti untuk membersihkan, menganalisis, dan membuat visualisasi data. Kelas ini didesain untuk memahami dasar-dasar penggunaan R untuk statistika, dari konsep, kegunaan, hingga susunan kodenya.
Memuat Dataset
Mula-mula, tugas kita adalah memuat dataset yang akan dianalisis. Di materi ini, kita akan mencoba menganalisis dataset sederhana berisi berat badan (kg) atlet dan kecepatan lari (detik). Mari gunakan fungsi read.csv() seperti di bawah ini.
Untuk memuat data di R, kita dapat menggunakan function read_csv(“file.csv”). Di materi ini, kita akan menggunakan data yang disediakan R, yaitu data mengenai mobil dengan kata kunci mtcars.
Mengakses Variabel dan Nilai
Kita juga dapat mengakses variabel dan nilai. Misal, kita ingin mengetahui dimensi dari data, kita dapat menggunakan dim(). Dimensi data adalah jumlah baris dan kolom.
Mengetahui nama-nama variabel (kolom) dengan names().
Mengetahui nilai-nilai pada baris di kolom pertama dengan rownames()
Mengetahui nilai dari variabel tertentu menggunakan tanda $. Misal kita ingin mengetahui value dari berat mobil atau kolom wt.
Ringkasan Dataset
Selain mengakses variabel atau nilai-nilai tertentu, kita juga dapat mencari tahu ringkasan data. Ringkasan data terdiri dari min, Q1, median, mean, Q3, hingga max. Fungsi yang diberikan adalah summary().
R akan menampilkan hasil seperti ini.
Kita juga dapat mengetahui ringkasan dari satu variabel, misal berat mobil.
Pro Tips
- Kita dapat memuat dataset dengan load_csv().
- Untuk mengakses nilai dari variabel tertentu, kita menggunakan tanda $.
- Gunakan summary() untuk melihat ringkasan data.
Kuis
Apa kegunaan dari rownames()?