Mengintegrasikan Dokumen

Melalui kelas ini, kamu diajak untuk:

  • Mengetahui dokumen apa saja yang bisa diakses Pandas.
  • Mengunduh dokumen offline di Microsoft Excell.
  • Mengintegrasikan dataset online.

Jenis Dokumen

Format penyimpanan data saat ini terbagi dalam dua jenis yakni offline dan online. Peranti offline seperti Microsoft Excell masih digemari. Data di ranah maya mulai dari Google Docs hingga API yang menyediakan dalam bentuk JSON

Pandas punya kemampuan mengintegrasikan semuanya. Tapi sebelum terlalu jauh, kenali dahulu jenis data yang ada.

Ketuk kartu-kartu di bawah untuk melihat data apa saja yang bisa diolah Pandas.

Microsoft Excell

Menautkan file mentah di dalam komputer atau laptop dengan ukuran ringan.

Google Docs

Microsoft Excell digital yang dapat diintegrasikan.

SQL

Database SQL yang dikelola internal maupun eksternal untuk mempermudah pengintegrasian.

JSON

Database API menyediakan format JSON dengan keunggulan live update otomatis.

Memasang File di Microsoft Excell

Setiap file Excell di komputer dapat terhubung dengan Pandas. Caranya dengan menentukan nama file di dalam folder, lalu copy pathname ke dalam file kode seperti berikut:


pip install pandas

Setelah itu, sematkan Pandas di bagian awal file Python dengan cara berikut.

import pandas as pd
from pandas import read_csv

df = pd.read_csv("/Users/user/Documents/Code Learning/Python/train.csv")

Google Sheet

Untuk mengintegrasikan Google Sheet, diperlukan otentifikasi dari Google serta library tambahan bernama gspread. Otentifikasi ini dapat diakses dalam laman Google.

Aksesnya cukup dengan menginstall perintah khusus di terminal seperti berikut.


import pandas as pd
import gspread
from oauth2client.service_account import ServiceAccountCredentials

Setelah itu, sematkan Pandas di bagian awal file Python dengan cara berikut. Misalnya kode di bawah ini adalah operasi untuk menarik data di file Google Sheet bernama Data Python

gc = gspread.service_account("client_secret.json")
data_open = gc.open("Data Python").sheet1
data_all = data_open.get_all_records()
data_epl = pd.DataFrame(data_all)

Microsoft Excel

Setiap file Excel di komputer dapat terhubung dengan Pandas. Caranya dengan menentukan nama

Aksesnya cukup dengan menginstall perintah khusus di terminal seperti berikut.


pip install pandas

Setelah itu, sematkan Pandas di bagian awal file Python dengan cara berikut.

import pandas as pd
from pandas import read_csv

df = pd.read_csv("/Users/user/Documents/Code Learning/Python/train.csv")

JSON

Untuk meminta file JSON, perlu akses khusus dari penyedia data publik. Setelah mendapat file JSON, integrasikan dengan Google Sheet, lalu masukkan kode berikut:


gc = gspread.service_account("data.json")
sheet_open = gc.open("COVID Indonesia").sheet1
sheet = sheet_open.get_all_records()
sheet_df = pd.DataFrame (sheet)

Rangkuman

  • Penggunaan Google Sheet membutuhkan otentikasi terlebih dahulu.
  • JSON dan SQL membutuhkan fungsi tersendiri.

Kuis

Apa nama library untuk mengintegrasikan Google Sheet?

Selamat, Anda telah menyelesaikan pelajaran ini
Klik untuk menyelesaikan