Mengunduh Library Selenium

Melalui kelas ini, kamu diajak untuk:

  • Mengaktifkan Selenium dalam lingkungan Python.
  • Mengenal elemen kode dalam Selenium.

Menginstall Modul-modul Pendukung

Untuk melakukan scraping data Instagram, pastikan setiap modul pendukung telah terinstall. Modul-modul ini meliputi Pandas, Time, dan Selenium.

Install Pandas


# melalui terminal
pip install pandas
# melalui jupyterlab atau jupyter notebook
!pip install pandas

Install Time


# melalui terminal
pip install time
# melalui jupyterlab atau jupyter notebook
!pip install time

Install Selenium


# melalui terminal
pip install selenium
# melalui jupyterlab atau jupyter notebook
!pip install selenium

Fitur dalam Modul yang Perlu Diimpor

Seperti yang telah kita pahami di kelas Basic Python, setiap modul memiliki fitur penunjang modulnya sendiri. Dari ketiga modul di atas, kita perlu mengidentifikasi fitur-fitur apa saja yang dibutuhkan untuk memastikan segala fungsi dalam susunan kode Python dapat bekerja.

Untuk melakukan scraping data Instagram, fitur-fitur dalam modul yang akan digunakan ada di dalam modul Selenium. Fitur-fitur ini meliputi:

  • webdriver
  • Keys
  • expected_conditions
  • By exceptions WebDriverWait

Fungsi dari Setiap Fitur

Setiap fitur memiliki fungsi tersendiri. Ketuk untuk mengetahui setiap fungsi dari fitur yang telah dipaparkan.

pandas

pandas akan digunakan untuk mengumpulkan data yang akan diambil dan disimpan dalam jenis file .csv

time

time akan digunakan untuk menunda waktu eksekusi dari webdriver dengan mengisi parameter angka yang ditentukan.

webdriver

webdriver berfungsi sebagai penunjang otomasi browser yang akan kita gunakan.

Keys

Keys berfungsi layaknya keyboard komputer yang akan digunakan untuk mengisi kolom-kolom seperti username dan password.

expected_conditions

expected_conditions berfungsi untuk membuat webdriver menunggu hingga kondisi yang ditentukan bekerja sebelum melanjutkan eksekusi kode selanjutnya.

By

By adalah mekanisme untuk menemukan elemen spesifik pada halaman.

exceptions

exceptions akan digunakan untuk mengatasi berbagai jenis exceptions (hambatan) yang mungkin muncul dalam proses eksekusi.

WebDriverWait

WebDriverWait digunakan untuk membuat webdriver menunggu beberapa waktu dan pada elemen spesifik yang ditentukan.

Mengimpor Modul-modul Pendukung

Setelah mengidentifikasi modul-modul pendukung beserta fungsinya, saatnya mengimpor masing-masing modul.

Tulis kode ini pada file Python untuk mengimpor modul.


import pandas as pd
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common import exceptions 
from selenium.webdriver.support.wait import WebDriverWait

Selayang Pandang

  • Import library selenium di terminal.
  • Selenium membutuhkan webdriver untuk menjalankan pemindaian di web browser.

Kuis

Di mana kita harus mencantumkan library saat menulis kode?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan