2 poin oleh GN⁺ 2023-10-17 | 1 komentar | Bagikan ke WhatsApp
  • MemGPT adalah sistem baru yang mengelola hierarki memori model bahasa besar (LLM), menyediakan konteks yang diperluas di dalam jendela konteks LLM yang terbatas.
  • Sistem ini memungkinkan percakapan tanpa henti dengan mengetahui kapan harus menyimpan dan mengambil informasi penting dari basis data vektor.
  • MemGPT dapat digunakan untuk membuat chatbot dengan memori yang dapat mengedit dirinya sendiri.
  • Sistem MemGPT dapat diuji dengan mengirim pesan ke bot MemGPT di saluran #memgpt di Discord.
  • Untuk menjalankan MemGPT secara lokal, pengguna harus menginstal dependensi, menambahkan kunci OpenAI API ke environment, lalu menjalankan main.py.
  • Pengguna dapat membuat pengguna awal atau persona baru untuk MemGPT dengan membuat file .txt baru di /memgpt/humans/examples atau /memgpt/personas/examples.
  • MemGPT mendukung berbagai perintah CLI seperti /exit, /save, /load, /dump, /memory, /pop, /heartbeat, dan /memorywarning.
  • Secara default, MemGPT menggunakan gpt-4, sehingga diperlukan kunci API yang memiliki akses ke API gpt-4.
  • Untuk masalah atau permintaan fitur, pengguna dianjurkan untuk membuka issue di GitHub.
  • Dataset yang digunakan dalam makalah MemGPT dapat diunduh dari HuggingFace.

1 komentar

 
GN⁺ 2023-10-17
Komentar Hacker News
  • Para penulis MemGPT bersedia menjawab pertanyaan tentang implementasinya
  • MemGPT memiliki bot Discord yang menampilkan penyuntingan memori secara real-time
  • Kode MemGPT bersifat open source dan tersedia di GitHub
  • Seorang komentator mengusulkan proses memparalelkan beberapa permintaan ke agen lain pada tahap prapemrosesan dan pascapemrosesan
  • Komentator lain mengusulkan penggunaan sampling berbasis tata bahasa agar pemanggilan fungsi dilakukan dengan benar secara sintaksis
  • Beberapa komentator menyatakan antusiasme terhadap proyek ini, dan melihatnya sebagai fitur dasar untuk chatbot masa depan
  • Para penulis merilis chatbot persisten di Discord yang dibangun di atas MemGPT
  • Beberapa komentator menganggap context window adalah batasan terbesar pada LLM
  • Ada diskusi tentang pemilihan judul oleh para penulis
  • Seorang komentator mengkritik pendekatan tersebut, dengan menyatakan bahwa itu bergantung pada asumsi bahwa konteks yang ada terdiri dari konteks yang dapat diringkas dengan entropi rendah, dan bahwa semua kueri hanya bergantung pada sebagian dari riwayat. Mereka percaya ini tidak selalu benar, terutama dalam konteks pembuatan kode.