Grab mempercepat pengembangan aplikasi LLM dengan LLM-Kit

xguru · 2024-12-03T10:02:01+09:00

LLM-Kit dari Grab adalah framework yang dirancang untuk mempercepat penyiapan aplikasi Generative AI tingkat produksi Dalam pengembangan aplikasi AI yang menangani data sensitif, keamanan dan keselamatan data sangat penting, dan LLM-Kit membantu mengatasi isu seperti skalabilitas, integrasi, pemantauan, dan standardisasi Melalui hal ini, pengembangan aplikasi LLM yang efisien dan efektif dalam jangka panjang menjadi dimungkinkan, serta membantu onboarding ratusan aplikasi GenAI di Grab Fitur LLM-Kit Menyediakan struktur yang telah dikonfigurasi sebelumnya (server API, manajemen konfigurasi, agen LLM contoh, pengujian, dan lain-lain) Terintegrasi dengan Poetry, Gunicorn, FastAPI, LangChain, LangSmith, Hashicorp Vault, Amazon EKS, Gitlab CI, dan lain-lain Fitur observability yang memungkinkan pemantauan real-time melalui integrasi Datadog dan LangSmith Manajemen konfigurasi dan secret dengan memanfaatkan configparser Python dan Vault Helper autentikasi OpenID Connect (OIDC) Dokumentasi API menggunakan Swagger dan Redoc Integrasi dengan Redis dan Vector DB Pipeline deployment untuk lingkungan staging dan production Integrasi dengan framework evaluasi yang kuat dari LangSmith Cookbook: menyediakan sumber daya bagi developer dengan mengumpulkan contoh yang sering digunakan di Grab Mencakup berbagai kasus seperti agen memori persisten, agen LLM Slackbot, penganalisis gambar, hingga chatbot full-stack dengan antarmuka pengguna Nilai LLM-Kit Meningkatkan kecepatan pengembangan aplikasi LLM dengan tech stack yang telah dikonfigurasi dan diintegrasikan sebelumnya Memungkinkan pemantauan real-time serta deteksi/penyelesaian isu melalui integrasi LangSmith dan Datadog Meningkatkan keamanan dengan autentikasi OIDC dan manajemen secret Vault Meningkatkan efisiensi penyimpanan/pencarian data dengan Vector DB Menyediakan framework berpola paved road yang mendorong best practice dan standardisasi Memungkinkan tim menghemat sekitar 1,5 minggu waktu pengembangan sebelum mulai mengerjakan fitur pertama Desain arsitektur dan implementasi teknis Menyediakan skalabilitas, fleksibilitas, dan kemudahan penggunaan melalui arsitektur modular Otomatisasi Ketika engineer mengirim detail terkait seperti nama aplikasi, pembuatan proyek GitLab akan dipicu Code scaffold yang dirancang khusus untuk aplikasi LLM akan dibuat File GitLab CI untuk CI/CD akan dibuat di dalam repositori yang sama Infrastruktur staging seperti ECR dan EKS akan dibuat Folder Terraform untuk provisioning infrastruktur akan dibuat dan berlanjut ke deployment infrastruktur production Di akhir pipeline, token GPT akan didorong ke jalur Vault yang aman dan notifikasi penyelesaian akan dikirim ke engineer Struktur kode scaffold Agents: berisi kode untuk menginisialisasi agen berbasis framework agen LangChain Auth: modul autentikasi dan otorisasi untuk menjalankan beberapa API internal Grab Core: mencakup ekstraksi konfigurasi (seperti token GPT) dan dekripsi secret untuk menjalankan aplikasi LLM Models: mendefinisikan struktur untuk API LLM inti di Grab Routes: mendefinisikan endpoint REST API untuk aplikasi LLM (termasuk pemeriksaan status, autentikasi, otorisasi, agen sederhana, dan lain-lain) Storage: mencakup konektivitas dengan PGVector, Vector DB terkelola milik Grab, serta skema DB Tools: fungsi yang digunakan sebagai alat untuk agen LLM Tracing: terintegrasi dengan alat tracing dan monitoring untuk memantau berbagai metrik aplikasi production Utils: folder dasar untuk fungsi utilitas Provisioning infrastruktur dan deployment Terintegrasi pipeline komprehensif yang secara otomatis membuat scaffold kode yang diperlukan untuk provisioning infrastruktur, deployment, dan proses build dalam codebase yang sama Memprovision infrastruktur yang dibutuhkan secara mulus menggunakan Terraform Pipeline deployment didefinisikan dalam file .gitlab-ci.yml untuk memastikan deployment otomatis Proses build ditentukan dalam Dockerfile untuk memungkinkan build yang konsisten Dengan scaffolding otomatis, developer dapat fokus menulis business logic alih-alih kompleksitas infrastruktur dasar dan deployment Scaffolding RAG Dengan menggunakan LLM-Kit, proses penyiapan Vector DB (PGVector) dan penambahan allowlist layanan menjadi lebih sederhana Setelah pengiriman formulir, kredensial serta akses ke jalur host DB akan tersedia Secret akan otomatis ditambahkan ke jalur Vault Engineer hanya perlu memasukkan jalur host DB ke dalam file konfigurasi aplikasi LLM-Kit yang telah di-scaffold Kesimpulan LLM-Kit adalah alat penting yang mendukung inovasi dan pertumbuhan AI serta ML di Grab Dengan menyelesaikan tantangan yang dihadapi tim dan menyediakan framework pengembangan aplikasi LLM yang komprehensif, skalabel, dan fleksibel, LLM-Kit memimpin pengembangan aplikasi AI generasi berikutnya di Grab Pertumbuhan dan rencana ke depan Berencana menyediakan SDK yang stabil dan mudah digunakan sekaligus sangat meningkatkan konkurensi dan skalabilitas web server Akan menyediakan LLM SDK yang dapat digunakan ulang dan dikombinasikan, termasuk framework evaluasi dan guardrail Pembaruan versi dan pengembangan CLI untuk alat developer Mengembangkan fitur penyediaan agen berbasis polling Melalui perkembangan ini, Grab ingin memberikan pengalaman pengembangan yang lebih mulus dan efisien bagi para engineer

(engineering.grab.com)

7 poin oleh xguru 2024-12-03 | Belum ada komentar. | Bagikan ke WhatsApp

LLM-Kit dari Grab adalah framework yang dirancang untuk mempercepat penyiapan aplikasi Generative AI tingkat produksi
Dalam pengembangan aplikasi AI yang menangani data sensitif, keamanan dan keselamatan data sangat penting, dan LLM-Kit membantu mengatasi isu seperti skalabilitas, integrasi, pemantauan, dan standardisasi
Melalui hal ini, pengembangan aplikasi LLM yang efisien dan efektif dalam jangka panjang menjadi dimungkinkan, serta membantu onboarding ratusan aplikasi GenAI di Grab

Fitur LLM-Kit

Menyediakan struktur yang telah dikonfigurasi sebelumnya (server API, manajemen konfigurasi, agen LLM contoh, pengujian, dan lain-lain)
Terintegrasi dengan Poetry, Gunicorn, FastAPI, LangChain, LangSmith, Hashicorp Vault, Amazon EKS, Gitlab CI, dan lain-lain
Fitur observability yang memungkinkan pemantauan real-time melalui integrasi Datadog dan LangSmith
Manajemen konfigurasi dan secret dengan memanfaatkan configparser Python dan Vault
Helper autentikasi OpenID Connect (OIDC)
Dokumentasi API menggunakan Swagger dan Redoc
Integrasi dengan Redis dan Vector DB
Pipeline deployment untuk lingkungan staging dan production
Integrasi dengan framework evaluasi yang kuat dari LangSmith
Cookbook: menyediakan sumber daya bagi developer dengan mengumpulkan contoh yang sering digunakan di Grab
- Mencakup berbagai kasus seperti agen memori persisten, agen LLM Slackbot, penganalisis gambar, hingga chatbot full-stack dengan antarmuka pengguna

Nilai LLM-Kit

Meningkatkan kecepatan pengembangan aplikasi LLM dengan tech stack yang telah dikonfigurasi dan diintegrasikan sebelumnya
Memungkinkan pemantauan real-time serta deteksi/penyelesaian isu melalui integrasi LangSmith dan Datadog
Meningkatkan keamanan dengan autentikasi OIDC dan manajemen secret Vault
Meningkatkan efisiensi penyimpanan/pencarian data dengan Vector DB
Menyediakan framework berpola paved road yang mendorong best practice dan standardisasi
Memungkinkan tim menghemat sekitar 1,5 minggu waktu pengembangan sebelum mulai mengerjakan fitur pertama

Desain arsitektur dan implementasi teknis

Menyediakan skalabilitas, fleksibilitas, dan kemudahan penggunaan melalui arsitektur modular

Otomatisasi

Ketika engineer mengirim detail terkait seperti nama aplikasi, pembuatan proyek GitLab akan dipicu
Code scaffold yang dirancang khusus untuk aplikasi LLM akan dibuat
File GitLab CI untuk CI/CD akan dibuat di dalam repositori yang sama
Infrastruktur staging seperti ECR dan EKS akan dibuat
Folder Terraform untuk provisioning infrastruktur akan dibuat dan berlanjut ke deployment infrastruktur production
Di akhir pipeline, token GPT akan didorong ke jalur Vault yang aman dan notifikasi penyelesaian akan dikirim ke engineer

Struktur kode scaffold

Agents: berisi kode untuk menginisialisasi agen berbasis framework agen LangChain
Auth: modul autentikasi dan otorisasi untuk menjalankan beberapa API internal Grab
Core: mencakup ekstraksi konfigurasi (seperti token GPT) dan dekripsi secret untuk menjalankan aplikasi LLM
Models: mendefinisikan struktur untuk API LLM inti di Grab
Routes: mendefinisikan endpoint REST API untuk aplikasi LLM (termasuk pemeriksaan status, autentikasi, otorisasi, agen sederhana, dan lain-lain)
Storage: mencakup konektivitas dengan PGVector, Vector DB terkelola milik Grab, serta skema DB
Tools: fungsi yang digunakan sebagai alat untuk agen LLM
Tracing: terintegrasi dengan alat tracing dan monitoring untuk memantau berbagai metrik aplikasi production
Utils: folder dasar untuk fungsi utilitas

Provisioning infrastruktur dan deployment

Terintegrasi pipeline komprehensif yang secara otomatis membuat scaffold kode yang diperlukan untuk provisioning infrastruktur, deployment, dan proses build dalam codebase yang sama
Memprovision infrastruktur yang dibutuhkan secara mulus menggunakan Terraform
Pipeline deployment didefinisikan dalam file .gitlab-ci.yml untuk memastikan deployment otomatis
Proses build ditentukan dalam Dockerfile untuk memungkinkan build yang konsisten
Dengan scaffolding otomatis, developer dapat fokus menulis business logic alih-alih kompleksitas infrastruktur dasar dan deployment

Scaffolding RAG

Dengan menggunakan LLM-Kit, proses penyiapan Vector DB (PGVector) dan penambahan allowlist layanan menjadi lebih sederhana
Setelah pengiriman formulir, kredensial serta akses ke jalur host DB akan tersedia
Secret akan otomatis ditambahkan ke jalur Vault
Engineer hanya perlu memasukkan jalur host DB ke dalam file konfigurasi aplikasi LLM-Kit yang telah di-scaffold

Kesimpulan

LLM-Kit adalah alat penting yang mendukung inovasi dan pertumbuhan AI serta ML di Grab
Dengan menyelesaikan tantangan yang dihadapi tim dan menyediakan framework pengembangan aplikasi LLM yang komprehensif, skalabel, dan fleksibel, LLM-Kit memimpin pengembangan aplikasi AI generasi berikutnya di Grab

Pertumbuhan dan rencana ke depan

Berencana menyediakan SDK yang stabil dan mudah digunakan sekaligus sangat meningkatkan konkurensi dan skalabilitas web server
Akan menyediakan LLM SDK yang dapat digunakan ulang dan dikombinasikan, termasuk framework evaluasi dan guardrail
Pembaruan versi dan pengembangan CLI untuk alat developer
Mengembangkan fitur penyediaan agen berbasis polling
Melalui perkembangan ini, Grab ingin memberikan pengalaman pengembangan yang lebih mulus dan efisien bagi para engineer