- Pada akhir 2022, saat memperluas infrastruktur Readwise, mereka ingin menambahkan fitur rekomendasi artikel dan pencarian semantik yang menggunakan vector embedding
- Biaya database relasional saat itu $5k per bulan, tetapi biaya pencarian vektor melebihi $20k per bulan, sehingga implementasi fitur dibatalkan karena biayanya terlalu tinggi
- Mesin pencari yang ada mahal dan sulit dioperasikan: dengan perkembangan object storage, NVMe SSD, AI, dan teknologi vektor, dibutuhkan mesin pencari baru
- Database vektor yang ada menggunakan penyimpanan in-memory sehingga biayanya tinggi
- Biaya dapat ditekan secara signifikan dengan memanfaatkan object storage (S3, GCS) dan caching SSD
- Contoh: penyimpanan in-memory $2+/GB, object storage $0.02/GB
Desain turbopuffer
- Mengembangkan mesin pencari yang sesuai untuk masa kini
- Mencapai efisiensi biaya dan performa sekaligus dengan memanfaatkan object storage dan caching cerdas
- Dapat menangani puluhan miliar vektor dan jutaan tenant
- Mesin pencari berbasis object storage
- Mesin pencari yang ada menggunakan arsitektur disk replika dari database relasional
- Mesin pencari membutuhkan throughput tulis yang tinggi dan toleransi latensi tulis yang longgar
- Menjaga performa sambil menekan biaya melalui object storage serta caching SSD/memori
- Implementasi database native object storage
- Membangun database yang menjadikan object storage sebagai fondasi utama
- Menyediakan keandalan tinggi dan skalabilitas tanpa batas
- Menjaga ketersediaan tinggi melalui multi-tenancy dan sharding
- Contoh pelanggan
- Cursor: editor kode AI, mengelola puluhan miliar vektor sambil menurunkan biaya 10x
- Suno: fitur radio
- Dot: fitur memori
- Shapes: fitur memori
Ringkasan GN⁺
- turbopuffer sangat meningkatkan efisiensi biaya dan performa mesin pencari dengan memanfaatkan object storage dan caching cerdas
- Bertujuan mengatasi tingginya biaya dan sulitnya operasional pada mesin pencari yang ada
- Merancang mesin pencari baru yang sesuai dengan perkembangan AI dan teknologi vektor
- Membuktikan penghematan biaya dan peningkatan performa melalui contoh pelanggan awal seperti Cursor
- Proyek lain dengan fungsi serupa antara lain ElasticSearch dan Vector DBs
1 komentar
Komentar Hacker News
Pernah bekerja dengan Simon, dan dia sangat memahami bidangnya
Berharap Turbopuffer dapat bekerja seperti dataframe Polars sehingga ranking bisa diekspresikan di API pencarian
Juga sangat menyukai desain situs web Fixie.ai
Di Hetzner, biaya RAM adalah $200/TB/bulan, 18 kali lebih murah dibanding tempat lain
pg_vector sudah ada sejak sebelum 2022, dan tidak memerlukan penyimpanan in-memory
Bertanya-tanya apakah memungkinkan membangun pendekatan menggunakan Lucene dengan node cache SSD di depan object storage
Terdengar seperti versi source-available tertutup dari Quickwit
Bertanya-tanya apakah ada solusi umum untuk menyimpan database besar yang hanya-baca di S3 dan melakukan query langsung
Latensi baca ClickHouse di bawah 100ms, latensi tulis di bawah 1 detik
Tidak terlalu paham tentang database vektor, tetapi mengira ini terutama digunakan untuk RAG dan pekerjaan terkait AI lainnya
Menganggap pendekatan object-storage-first sangat cocok secara alami dengan cloud