Mengumpulkan Data

Melalui kelas ini, kamu diajak untuk:

  • Memahami tipe data apa saja dalam semesta pemrograman R.
  • Mengetahui pengolahan dari masing-masing tipe data.

Proses Mengolah Data

Ketika memproses sebuah data dengan bantuan bahasa pemrograman, jangan sekalipun menganggap sebuah program langsung mahir. Komputer dan bahasa pemrogramannya mengikuti cara manusai bekerja, ia harus diberi tahu secara runut sampai benar-benar paham. Maka kita perlu memberi tahu apa yang kita punya, apa yang ingin dilakukan, dan apa yang diharapkan.

Ketiga hal itu dalam teknisnya akan menjadi poin berikut:

1. Mengidentifikasi Struktur Data

Kita perlu memahami tipe data yang tengah diolah, karena tipe yang berbeda punya konsekuensi penghitungan berbeda.

2. Assign to Values

Memperjelas nilai dan aspek dari kumpulan data yang harus diolah.

3. Mengolah Data

Data yang ada perlu dirapikan ke dalam format yang siap dianalisis, kemudian membentuk susunan kode untuk melakukan analisa.

Variable

Data membutuhkan tempat bernaung. Variable berguna sebagai identifier atau pengidentifikasi sebuah kelompok data. Nantinya proses penghitungan adalah proses menghubungkan antar-variabel karena adanya kemungkinan data yang berubah atau termutakhirkan.

x <- count(1,2,3,4)

Nama variabel bisa bebas semau kita. Aturannya terletak pada tanda baca. Berikut yang harus dipahami:

  • Dapat menggunakan kombinasi kata, angka, atau garis bawah.
  • Dimulai dengan sebuah kata.
  • Tidak boleh menggunakan kata yang berkaitan dengan fungsi R.

Objects

R bekerja dalam bentuk script dengan nama file “file.R”. File akan berisi barisan kode yang akan dipakai untuk merancang program. Ketika menyusun sistem, nantinya seorang developer akan menggunakan file berbeda untuk setiap fitur, namun tetap saling terhubung.

Numerik

Memasukkan data berupa angka ke dalam suatu variabel. Angka yang masuk bisa bilangan bulat atau persen.

x <- 10
print (x)
Integer

Memasukkan data berupa angka ke dalam suatu variabel. Angka yang masuk bisa bilangan bulat atau persen.

x <- 10
print (x)
Strings

Kata dan tanda baca bisa menjadi sebuah data. Mas

x <- "Maman"
print (x)
Logical

Data tidak melulu angka atau kata, namun bisa dipasang sebuah logika seperti TRUE dan FALSE

x <- TRUE
print (x)

String

Ada ragam cara mengutak-atik tipe data string dalam R. Kenali contoh-contoh umumnya di bawah ini.

Baris Majemuk

Kita dapat menulis string lebih dari satu baris dengan menekan tombol SHIFT+ENTER.
Contoh:

kalimat <- kalimat <- "Maman ingin belajar R,
Mimin ingin belajar Python,
Momon tidak ingin belajar."

[1] "Maman ingin belajar R,\nMimin ingin belajar Python,\nMomon tidak ingin belajar."

Dapat dilihat bahwa R menampilkan tanda \n di setiap baris. Tanda tersebut adalah tanda line break. Untuk menghilangkannya, kita dapat menggunakan perintah cat().

cat(kalimat)

[1] Maman ingin belajar R,
Mimin ingin belajar Python,
Momon tidak ingin belajar.

Kutipan dalam String

Saat kita mendeklarasikan variabel dengan tanda petik (“”), R akan otomatis menerjemahkan variabel tersebut sebagai tipe data string. Lalu apa yang akan terjadi ketika kita menggunakan tanda petik di dalam deklarasi string?

Lihat kasus di bawah ini.

kalimat <- "Tim berjulukan "Setan Merah" ini takluk di hadapan Liverpool."

[1] Error: unexpected symbol in "kalimat <- "Tim berjulukan "Setan"

Untuk menghindari error, kita perlu menggunakan tanda \”, lalu gunakan fungsi cat() untuk menghilangkan tandanya saat hasil dimunculkan.

Simak perbaikannya:

kalimat <- "Tim berjulukan \"Setan Merah\" ini takluk di hadapan Liverpool."
cat(kalimat)

[1] Tim berjulukan "Setan Merah" ini takluk di hadapan Liverpool.

Menggabungkan String

Misal kita memiliki lebih dari satu variabel berisi data string. Kita dapat menggabungnya dengan function paste().

Lihat contohnya di bawah ini.

kata1 <- "Maman sedang belajar R."
kata2 <- "Ia ingin handal mengolah data."
kata1 + kata2
paste(kata1, kata2)

[1] "Maman sedang belajar R. Ia ingin handal mengolah data."

Angka

Kita telah mengetahui bahwa tipe data angka terdiri dari numerik, integer, dan kompleks. Kita dapat mengubah masing-masing jenis data angka menjadi jenis lainnya. Kita hanya perlu menggunakan fungsi-fungsi di bawah ini:

  • as.numeric(), untuk menjadikan jenis angka numerik.
  • as.integer(), untuk menjadikan jenis angka integer.
  • as.complex(), untuk menjadikan jenis angka kompleks.

Pro Tips

  • Variabel adalah wadah berisi nilai data, dideklarasikan dengan nama_variabel <- [data].
  • R memiliki tiga tipe data, string (karakter), angka, dan logika (boolean).

Kuis

Apa fungsi untuk menghilangkan tanda \n atau line break pada variabel string?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan