2 poin oleh GN⁺ 2023-10-05 | 1 komentar | Bagikan ke WhatsApp
  • Artikel tentang mengekstraksi rekomendasi buku dari thread Hacker News (HN) menggunakan ChatGPT API
  • Penulis menganalisis hampir 200 cerita HN yang judulnya mengandung kata "book" dan tidak menaut ke halaman lain
  • Penulis menggunakan GPT API untuk mengklasifikasikan data dan menghasilkan informasi dalam format JSON
  • Data diambil dari Hacker News API, dan penulis memanggil Chat Completions API untuk mengekstrak judul buku, penulis, dan URL dari teks
  • 50 rekomendasi buku teratas dicantumkan, dengan "Structure and Interpretation of Computer Programs" karya Abelson dan Sussman sebagai yang paling banyak direkomendasikan
  • API kadang tidak mengembalikan JSON yang valid, terutama saat ditemukan bahwa ChatGPT merespons komentar seperti "thanks" atau mengajukan pertanyaan
  • Penulis merancang prompt agar membuang respons tanpa judul, karena ChatGPT kadang memasukkan penyebutan penulis tanpa judul buku tertentu
  • Pemrosesan 57k komentar menggunakan GPT 3.5 Turbo API menelan biaya sekitar $40
  • Penulis menemukan bahwa bahkan saat temperature diatur ke 0, hasil GPT berbeda di setiap pemanggilan dan menunjukkan variabilitas yang lebih besar dibanding model GPT-3 sebelumnya
  • Penulis menemukan bahwa GPT dapat mengidentifikasi tautan dalam teks, tetapi tag HTML perlu dihapus agar tidak memilih teks tautan yang terpotong alih-alih URL
  • Penulis membagikan contoh keluaran JSON dari ChatGPT dan prompt yang digunakan untuk tugas tersebut
  • Data mentah yang dihasilkan oleh GPT dibagikan untuk analisis lebih lanjut setelah diurutkan berdasarkan judul
  • Sebagai latihan belajar, penulis menambahkan tautan afiliasi Amazon ke URL Amazon di tabel

1 komentar

 
GN⁺ 2023-10-05
Opini Hacker News
  • Artikel tentang ekstraksi informasi rekomendasi buku dari Hacker News menggunakan API ChatGPT
  • Sejumlah pengguna menyoroti bahwa ChatGPT melewatkan beberapa informasi rekomendasi buku
  • Pengguna mencari informasi rekomendasi buku di Hacker News dengan kata kunci "books", dan memuji kualitas rekomendasi yang ditemukan di platform tersebut
  • Pengguna menyebut sumber rekomendasi buku lain seperti Hacker Recommended Books dan Hacker News Books
  • Beberapa pengguna mengungkapkan keterkejutan karena sejumlah buku seperti 'Code' karya Charles Petzold dan buku-buku karya Knuth tidak masuk dalam daftar 50 teratas
  • Ada kekhawatiran tentang kualitas informasi rekomendasi buku yang dihasilkan AI, dan beberapa pengguna menyarankan bahwa ini bisa digunakan untuk membuat tautan afiliasi Amazon
  • Beberapa pengguna mempertanyakan masuknya buku seperti 'How to Win Friends and Influence People' dan 'Atlas Shrugged' dalam daftar
  • Seorang pengguna menunjukkan bahwa 'Meditations' karya Marcus Aurelius mungkin tertukar dengan 'Meditations on First Philosophy' karya Descartes, sehingga kemungkinan ada kesalahan dalam daftar
  • Beberapa pengguna menemukan nilai pada rekomendasi buku yang kurang populer yang mereka temukan di komentar postingan Hacker News
  • Ada pertanyaan tentang perlunya menggunakan ChatGPT, dan beberapa pengguna berpendapat bahwa Algolia dan analisis data saja sudah cukup