- Mengembangkan bot crawling untuk mengumpulkan informasi produk Coupang dengan ChatGPT
- Kolom yang akan dikumpulkan adalah nama produk, harga normal, harga jual, rating bintang, jumlah ulasan, informasi diskon kartu, informasi poin reward, dan informasi pengiriman
- Cara mengurangi ukuran HTML untuk menghindari batas jumlah token serta hal-hal yang perlu dipertimbangkan saat menulis prompt
- Melewati produk iklan
- Penanganan pengecualian saat struktur DOM berbeda
- Memeriksa kolom wajib (nama produk, harga)
- ChatGPT adalah alat yang sangat berguna, tetapi tetap memerlukan sedikit debugging dan perbaikan (pada akhirnya, para ahli akan mendapat manfaat yang lebih besar)
- Untuk mengumpulkan data dalam jumlah besar, perlu mempertimbangkan penghindaran pemblokiran
5 komentar
Sepertinya tulisan di sini sendiri juga semuanya ditulis oleh GPT.
Sepertinya bisa diringkas seperti itu..
Saya sedang membuat crawler dengan ChatGPT dan sangat terbantu dalam parsing serta ekstraksi XPath.
Ini memang artikel tentang membuat crawling dengan GPT, tetapi pada akhirnya hanya menjadi iklan untuk HashScraper.
Bukankah semua blog teknologi memang seperti itu.. hehe