Dalang adalah perpustakaan Node yang dikembangkan oleh tim Google Chrome yang menyediakan API tingkat tinggi untuk mengontrol versi Chrome atau Chromium tanpa kepala. Dalang mampu melakukan berbagai tugas, termasuk navigasi halaman, pengikisan konten, tangkapan layar, pembuatan PDF, dan banyak lagi.
Fitur utama
Kontrol Browser Tanpa Kepala: Melakukan tugas tanpa membuka antarmuka browser.
Lintas platform: mendukung Windows, Linux dan macOS.
API Kaya: Menyediakan API kaya untuk menyimulasikan perilaku pengguna.
Menggunakan Dalang untuk pengikisan data
Proses dasar
Luncurkan browser: Gunakan Dalang untuk meluncurkan browser tanpa kepala.
Buka halaman: Buat contoh halaman baru dan navigasikan ke URL target.
Tunggu hingga halaman dimuat: Pastikan halaman dimuat sepenuhnya.
Ambil konten: Gunakan API yang disediakan oleh Dalang untuk mendapatkan konten halaman.
Logging: Rekam konten yang diambil atau informasi terkait ke file log.
Tutup browser: Tutup browser setelah tugas selesai.
Proses implementasi
Misalkan kita perlu meng-crawl data tabel pada halaman web. Berikut langkah-langkah untuk mencapainya: