Panduan Pengembang untuk Aplikasi LLM Tingkat Produksi (Tulisan Terjemahan)

ninebow · 2023-11-24T13:10:09+09:00

Artikel ini diterjemahkan dengan izin dari tulisan yang ditulis oleh Tal Peretz, pengembang produk AI di Zapier. Teks aslinya dapat dilihat di sini, dan poin-poin utamanya adalah sebagai berikut. Prompt engineering - tahap awal Peran evaluasi: Bintang Utara (patokan navigasi) Mendekati evaluasi AI secara sistematis / Systematic Approach to AI Evaluations Memanfaatkan dataset untuk pengujian mendalam / Dataset Utilization for In-depth Testing Menyempurnakan evaluasi dengan penilaian AI / Refining Evaluations with AI Assessments Metrik untuk evaluasi / Metrics to evaluate Evaluasi manusia sebagai standar emas / Human Evaluation as the Gold Standard RAG: informasi mendalam yang sesuai konteks saat dibutuhkan Teknik yang bisa dicoba / Techniques to Experiment With Fine-tuning: seni spesialisasi Kekurangan data pelatihan: persoalan keseimbangan kuantitas dan kualitas / Insufficient Training Data: The Quantity-Quality Equilibrium Data pelatihan yang tidak seimbang: dilema bias / Unbalanced Training Sets: The Bias Dilemma Penggunaan ulang data publik: sinyal baru adalah keharusan / Reusing Public Data: The New Signal Imperative Prompt engineering yang kurang baik: keharusan akan instruksi yang jelas / Poor Prompt Engineering: The Clarity Commandment Tidak mengevaluasi secara bertahap: kelalaian yang berkelanjutan / Not Evaluating Incrementally: The Continuous Oversight Saat semuanya dibutuhkan Penutup

(discuss.pytorch.kr)

32 poin oleh ninebow 2023-11-24 | 3 komentar | Bagikan ke WhatsApp

Artikel ini diterjemahkan dengan izin dari tulisan yang ditulis oleh Tal Peretz, pengembang produk AI di Zapier.
Teks aslinya dapat dilihat di sini, dan poin-poin utamanya adalah sebagai berikut.

Prompt engineering - tahap awal
Peran evaluasi: Bintang Utara (patokan navigasi)
- Mendekati evaluasi AI secara sistematis / Systematic Approach to AI Evaluations
- Memanfaatkan dataset untuk pengujian mendalam / Dataset Utilization for In-depth Testing
- Menyempurnakan evaluasi dengan penilaian AI / Refining Evaluations with AI Assessments
- Metrik untuk evaluasi / Metrics to evaluate
- Evaluasi manusia sebagai standar emas / Human Evaluation as the Gold Standard
RAG: informasi mendalam yang sesuai konteks saat dibutuhkan
- Teknik yang bisa dicoba / Techniques to Experiment With
Fine-tuning: seni spesialisasi
- Kekurangan data pelatihan: persoalan keseimbangan kuantitas dan kualitas / Insufficient Training Data: The Quantity-Quality Equilibrium
- Data pelatihan yang tidak seimbang: dilema bias / Unbalanced Training Sets: The Bias Dilemma
- Penggunaan ulang data publik: sinyal baru adalah keharusan / Reusing Public Data: The New Signal Imperative
- Prompt engineering yang kurang baik: keharusan akan instruksi yang jelas / Poor Prompt Engineering: The Clarity Commandment
- Tidak mengevaluasi secara bertahap: kelalaian yang berkelanjutan / Not Evaluating Incrementally: The Continuous Oversight
Saat semuanya dibutuhkan
Penutup

3 komentar

cosine20 2023-11-27

Terima kasih sudah berbagi.

apkas 2023-11-24

Sepertinya isinya hampir sama dengan A Survey of Techniques for Maximizing LLM Performance yang dipublikasikan oleh OpenAI, ya?

ninebow 2023-11-25

Saya belum sempat menonton video OpenAI DevDay, jadi baru sekarang saya tahu ada sesi yang Anda sebutkan. :)
Terima kasih sudah memberi tahu!

(+ Saya bagikan juga tautan YouTube yang saya temukan untuk yang lain!)
https://www.youtube.com/watch?v=ahnGLM-RC1Y

Panduan Pengembang untuk Aplikasi LLM Tingkat Produksi (Tulisan Terjemahan)

Bacaan terkait

3 komentar