Friday, September 8, 2017

Tutorial python untuk web scrapping (olah data dari web)

Dalam tutorial kali ini  saya akan memberikan petunjuk bagaimana menggunakan bahasa pemrograman python dalam melakukan web-scrapping (mengambil isi dari sebuah web-sites). Jadi kita mengambil informasi, semisal data-data pengumuman yang disematkan di web, tanpa perlu melakukan browsing manual web tersebut.

Untuk itu, pastikan di komputer Anda sudah terinstall interpreter python yang bisa diunduh di situs resminya. Jika sudah, maka di komputernya akan terlihat tempat instalasi python:























Kemudian kita dapat menggunakan modul pip untuk menginstall modul tambahan yang diperlukan. Letak pip ini terdapat pada sub folder script.


Jadi tinggal jalankan file pip.exe dari command line untuk menginstall module tambahan yang diperlukan dalam web-scrapping, yakni modul beautifullsoup. Jadi tinggal tekan SHIFT di keyboard dan pencet klik kanan mouse untuk membuka command pada folder script dan ketikkan pip install beautifulsoup4 dan tekan ENTER. 

Jika sudah, selanjutnya Anda bisa menggunakan module ini untuk melakukan web scrapping. Caranya tulis perintah di bawah ini di editor dan simpan di folder yang Anda sukai. Beri nama, misalnya dengan nama extractweb.py

Kemudian jalankan interpreter python diikuti nama file script tadi sebagai argumen dari command line di folder tempat file berada. Di mana gunakan full path untuk lokasi interpreter python, dan relatif path untuk lokasi file script tadi (karena current directory dari command line nya di tempat kita menyimpan script python nya). Lantas tekan ENTER.
























Dan script nya langsung kita bisa jalankan dan menghasilkan output.



No comments: