g1 - Membuat rantai penalaran mirip o1 menggunakan Llama-3.1 70B di Groq
(github.com/bklieger-groq)- g1 adalah prototipe awal yang menggunakan strategi prompt untuk meningkatkan kemampuan penalaran LLM
- Ini memungkinkan LLM menyelesaikan masalah logika dan memecahkan persoalan yang sulit ditangani model-model sebelumnya
- g1 dirilis sebagai open source untuk menginspirasi komunitas open source mengembangkan strategi baru
Cara kerja
- g1 menggunakan Llama3.1-70b untuk menghasilkan Chain of Thought yang dinamis.
- Pada setiap langkah, LLM dapat melanjutkan ke langkah penalaran berikutnya atau memberikan jawaban akhir.
- System prompt mencakup tip untuk LLM.
- Misalnya, ada instruksi seperti "sertakan eksplorasi jawaban alternatif" dan "gunakan setidaknya 3 metode untuk mendapatkan jawaban".
- Metode-metode ini meningkatkan kemampuan penalaran LLM.
Contoh
- g1 dapat menyelesaikan masalah logika sederhana dengan akurasi 60-80%.
- Contoh: untuk pertanyaan "berapa banyak huruf R dalam strawberry?", g1 menunjukkan akurasi 70%.
Mulai cepat
-
Cara menggunakan UI Streamlit:
python3 -m venv venv source venv/bin/activate pip3 install -r requirements.txt export GROQ_API_KEY=gsk... streamlit run app.py -
Cara menggunakan UI Gradio:
cd gradio pip3 install -r requirements.txt python3 app.py
Strategi prompt
-
Contoh prompt:
{ "title": "Identifying Key Information", "content": "To begin solving this problem, we need to carefully examine the given information and identify the crucial elements that will guide our solution process. This involves...", "next_action": "continue" } -
Komposisi prompt:
- Menetapkan peran sebagai asisten AI ahli
- Menyediakan judul dan isi untuk setiap langkah
- Merespons dalam format JSON
- Menggunakan setidaknya 3 langkah penalaran
- Menyadari keterbatasan LLM dan menyertakan eksplorasi jawaban alternatif
- Saat meninjau ulang, benar-benar menggunakan pendekatan yang berbeda
Fork utama
- Mult1: membuat rantai penalaran mirip o1 menggunakan beberapa penyedia AI (GitHub Repository)
Credits
- Aplikasi ini dikembangkan oleh Benjamin Klieger
Ringkasan GN⁺
- g1 adalah prototipe awal yang menggunakan strategi prompt untuk meningkatkan kemampuan penalaran LLM.
- Dirilis sebagai open source untuk menginspirasi komunitas open source mengembangkan strategi baru.
- g1 menunjukkan akurasi lebih tinggi daripada model sebelumnya dalam menyelesaikan masalah logika sederhana.
- Artikel ini berguna untuk mengeksplorasi berbagai cara meningkatkan kemampuan penalaran LLM.
- Proyek lain dengan fungsi serupa adalah o1 dari OpenAI.
1 komentar
Komentar Hacker News