- Ingin memahami pasar kerja dan tren saat ini melalui thread "Ask HN: Who Is Hiring" di Hacker News
- Menggunakan Selenium untuk menelusuri Google setiap bulan dengan kueri "ask hn who is hiring {month} {year}" guna mengumpulkan ID thread
- Menggunakan HN-API untuk mengumpulkan ID komentar tingkat atas dan menyimpannya ke database sqlite3
- Mengklasifikasikan komentar menggunakan GPT-4o
- Menggunakan metode
llm.batch(array) dari LangChain untuk pemrosesan paralel sehingga data dapat diproses dengan cepat
Hasil
Berapa banyak pekerjaan yang mengizinkan kerja jarak jauh?
- Selama pandemi, hanya sekitar seperlima pekerjaan yang tidak mendukung kerja jarak jauh
- Proporsi dukungan kerja jarak jauh tidak menurun sebesar yang diperkirakan
Berapa banyak pekerjaan yang mensponsori visa?
- Proporsi pekerjaan dengan sponsor visa relatif stabil selama dua tahun terakhir
- Mencari pekerjaan dengan sponsor visa tetap sulit
Bagaimana distribusi tingkat pengalaman berubah?
- Dalam 6–12 bulan ke depan, penting untuk memiliki pengalaman lebih dari 8 tahun
Berapa jumlah pekerjaan per negara bagian di AS?
- Pekerjaan yang tersedia di Bay Area dan NYC jauh lebih banyak dibanding wilayah lain
Database apa yang digunakan?
- PostgreSQL digunakan jauh lebih dominan dibanding database lain
Framework JavaScript apa yang paling banyak diminati?
- Permintaan untuk React sangat tinggi
- Membuat bubble chart interaktif dengan
three.js tanpa menggunakan skala logaritmik
Bagaimana distribusi gaji?
- Tidak ada rincian spesifik yang diberikan mengenai distribusi gaji
Hal yang dipelajari
- Field model harus dijelaskan seakurat mungkin
- Saat melakukan klasifikasi, kelas-kelas harus disebutkan secara eksplisit dalam deskripsi
- Saat mengekstrak himpunan, pemisah harus disebutkan secara eksplisit dalam deskripsi
Pekerjaan selanjutnya
- Berdasarkan pekerjaan awal ini, tampaknya bisa dibuat mini SaaS yang mengklasifikasikan kebutuhan pengguna dan mencocokkannya per bulan jika mereka menjelaskan pekerjaan yang mereka cari di thread "Ask HN: Who is hiring?"
Opini GN⁺
- Tulisan ini menunjukkan dengan baik cara menganalisis pasar kerja menggunakan data science dan teknologi pemrosesan bahasa alami
- Pemrosesan paralel menggunakan GPT-4o dan LangChain berguna untuk memproses data skala besar dengan cepat
- Fakta bahwa pekerjaan dengan sponsor visa tetap sulit ditemukan mencerminkan realitas saat ini dan akan berguna bagi orang yang mencari informasi terkait
- Tingginya permintaan untuk React dan PostgreSQL menjadi referensi yang baik bagi orang yang ingin mempelajari teknologi tersebut
- Ide mini SaaS ini bisa sangat membantu banyak pencari kerja jika benar-benar diwujudkan
1 komentar
Opini Hacker News
Analisis yang menggunakan GPT-4o menarik
node.jsdannodejs, sertareact-nativedanreact nativetidak digabungkanDisayangkan kode sumber proyek ini tidak bisa ditemukan di GitHub
Terima kasih sudah menginvestasikan waktu dan uang ke proyek ini
Kombinasi yang sangat bagus antara LLM dan analisis tradisional
Menumpuk batang pada grafik bukan pendekatan yang baik
Perlu memakai skala log agar grafiknya tidak terlihat aneh
Akan menarik jika analisis yang sama dilakukan dengan Claude 3 Haiku
Akan menarik jika dibandingkan dengan sampel acak dari Indeed atau LinkedIn
Pada grafik framework JS, ada bubble "React Native" dan "React-Native" secara bersamaan
Ingin melihat analisis serupa untuk "Who Wants to be Hired"