- LLM-Kit dari Grab adalah framework yang dirancang untuk mempercepat penyiapan aplikasi Generative AI tingkat produksi
- Dalam pengembangan aplikasi AI yang menangani data sensitif, keamanan dan keselamatan data sangat penting, dan LLM-Kit membantu mengatasi isu seperti skalabilitas, integrasi, pemantauan, dan standardisasi
- Melalui hal ini, pengembangan aplikasi LLM yang efisien dan efektif dalam jangka panjang menjadi dimungkinkan, serta membantu onboarding ratusan aplikasi GenAI di Grab
Fitur LLM-Kit
- Menyediakan struktur yang telah dikonfigurasi sebelumnya (server API, manajemen konfigurasi, agen LLM contoh, pengujian, dan lain-lain)
- Terintegrasi dengan Poetry, Gunicorn, FastAPI, LangChain, LangSmith, Hashicorp Vault, Amazon EKS, Gitlab CI, dan lain-lain
- Fitur observability yang memungkinkan pemantauan real-time melalui integrasi Datadog dan LangSmith
- Manajemen konfigurasi dan secret dengan memanfaatkan
configparser Python dan Vault
- Helper autentikasi OpenID Connect (OIDC)
- Dokumentasi API menggunakan Swagger dan Redoc
- Integrasi dengan Redis dan Vector DB
- Pipeline deployment untuk lingkungan staging dan production
- Integrasi dengan framework evaluasi yang kuat dari LangSmith
- Cookbook: menyediakan sumber daya bagi developer dengan mengumpulkan contoh yang sering digunakan di Grab
- Mencakup berbagai kasus seperti agen memori persisten, agen LLM Slackbot, penganalisis gambar, hingga chatbot full-stack dengan antarmuka pengguna
Nilai LLM-Kit
- Meningkatkan kecepatan pengembangan aplikasi LLM dengan tech stack yang telah dikonfigurasi dan diintegrasikan sebelumnya
- Memungkinkan pemantauan real-time serta deteksi/penyelesaian isu melalui integrasi LangSmith dan Datadog
- Meningkatkan keamanan dengan autentikasi OIDC dan manajemen secret Vault
- Meningkatkan efisiensi penyimpanan/pencarian data dengan Vector DB
- Menyediakan framework berpola paved road yang mendorong best practice dan standardisasi
- Memungkinkan tim menghemat sekitar 1,5 minggu waktu pengembangan sebelum mulai mengerjakan fitur pertama
Desain arsitektur dan implementasi teknis
- Menyediakan skalabilitas, fleksibilitas, dan kemudahan penggunaan melalui arsitektur modular
Otomatisasi
- Ketika engineer mengirim detail terkait seperti nama aplikasi, pembuatan proyek GitLab akan dipicu
- Code scaffold yang dirancang khusus untuk aplikasi LLM akan dibuat
- File GitLab CI untuk CI/CD akan dibuat di dalam repositori yang sama
- Infrastruktur staging seperti ECR dan EKS akan dibuat
- Folder Terraform untuk provisioning infrastruktur akan dibuat dan berlanjut ke deployment infrastruktur production
- Di akhir pipeline, token GPT akan didorong ke jalur Vault yang aman dan notifikasi penyelesaian akan dikirim ke engineer
Struktur kode scaffold
- Agents: berisi kode untuk menginisialisasi agen berbasis framework agen LangChain
- Auth: modul autentikasi dan otorisasi untuk menjalankan beberapa API internal Grab
- Core: mencakup ekstraksi konfigurasi (seperti token GPT) dan dekripsi secret untuk menjalankan aplikasi LLM
- Models: mendefinisikan struktur untuk API LLM inti di Grab
- Routes: mendefinisikan endpoint REST API untuk aplikasi LLM (termasuk pemeriksaan status, autentikasi, otorisasi, agen sederhana, dan lain-lain)
- Storage: mencakup konektivitas dengan PGVector, Vector DB terkelola milik Grab, serta skema DB
- Tools: fungsi yang digunakan sebagai alat untuk agen LLM
- Tracing: terintegrasi dengan alat tracing dan monitoring untuk memantau berbagai metrik aplikasi production
- Utils: folder dasar untuk fungsi utilitas
Provisioning infrastruktur dan deployment
- Terintegrasi pipeline komprehensif yang secara otomatis membuat scaffold kode yang diperlukan untuk provisioning infrastruktur, deployment, dan proses build dalam codebase yang sama
- Memprovision infrastruktur yang dibutuhkan secara mulus menggunakan Terraform
- Pipeline deployment didefinisikan dalam file
.gitlab-ci.yml untuk memastikan deployment otomatis
- Proses build ditentukan dalam
Dockerfile untuk memungkinkan build yang konsisten
- Dengan scaffolding otomatis, developer dapat fokus menulis business logic alih-alih kompleksitas infrastruktur dasar dan deployment
Scaffolding RAG
- Dengan menggunakan LLM-Kit, proses penyiapan Vector DB (PGVector) dan penambahan allowlist layanan menjadi lebih sederhana
- Setelah pengiriman formulir, kredensial serta akses ke jalur host DB akan tersedia
- Secret akan otomatis ditambahkan ke jalur Vault
- Engineer hanya perlu memasukkan jalur host DB ke dalam file konfigurasi aplikasi LLM-Kit yang telah di-scaffold
Kesimpulan
- LLM-Kit adalah alat penting yang mendukung inovasi dan pertumbuhan AI serta ML di Grab
- Dengan menyelesaikan tantangan yang dihadapi tim dan menyediakan framework pengembangan aplikasi LLM yang komprehensif, skalabel, dan fleksibel, LLM-Kit memimpin pengembangan aplikasi AI generasi berikutnya di Grab
Pertumbuhan dan rencana ke depan
- Berencana menyediakan SDK yang stabil dan mudah digunakan sekaligus sangat meningkatkan konkurensi dan skalabilitas web server
- Akan menyediakan LLM SDK yang dapat digunakan ulang dan dikombinasikan, termasuk framework evaluasi dan guardrail
- Pembaruan versi dan pengembangan CLI untuk alat developer
- Mengembangkan fitur penyediaan agen berbasis polling
- Melalui perkembangan ini, Grab ingin memberikan pengalaman pengembangan yang lebih mulus dan efisien bagi para engineer
Belum ada komentar.