Cara menghindari pemeriksaan Bot saat web crawling
(piprogramming.org)Berdasarkan Selenium, tetapi dapat diterapkan juga di tempat lain
-
Hapus flag
navigator.webdriver -
Hapus string tertentu dari ChromeDriver / GeckoDriver
-
Ubah resolusi, User-Agent, dan lain-lain
-
Gunakan alur URL yang nyata. Hindari mengunjungi tautan yang tidak terlihat
-
Gunakan proxy untuk mengubah IP
-
Gunakan nilai jeda acak
-
Jangan gunakan browser headless (dapat diperiksa dengan mengecek Notification Permission)
2 komentar
Untuk poin 1, pada Puppeteer ada tempat yang tetap mendeteksi sebagai bot jika hanya mengatur true/false
Jadi sebaiknya hapus propertinya sepenuhnya seperti di bawah ini
Itu poin yang bagus :) Saya sudah mengganti kodenya