- Cabang open source berbasis MySQL yang dikembangkan oleh Alibaba Group, dengan mesin database yang mengintegrasikan fungsi OLTP dan OLAP
- Menanamkan mesin kolumnar DuckDB untuk memberikan kinerja hingga 200x lebih cepat pada kueri analitik
- Mendukung pencarian vektor berbasis HNSW dan menangani embedding AI·ML hingga 16.383 dimensi
- 100% kompatibel dengan alat·driver MySQL yang ada, sehingga bisa langsung digunakan tanpa pembelajaran tambahan
- Teknologi yang telah tervalidasi di lingkungan produksi skala besar Alibaba Cloud, dan menonjol sebagai database terpadu untuk workload AI·analitik
Ikhtisar AliSQL
- AliSQL adalah cabang MySQL kelas enterprise yang dikembangkan oleh Alibaba Group, mengintegrasikan mesin OLAP DuckDB dan fitur pencarian vektor native
- Sistem yang telah terverifikasi melalui pengoperasian jutaan database di lingkungan produksi Alibaba
- Menggabungkan stabilitas OLTP InnoDB dari MySQL dengan kinerja analitik berkecepatan tinggi dari DuckDB
- Semua fitur dapat diakses melalui antarmuka MySQL yang sudah ada
Kinerja dan fitur utama
- DuckDB Storage Engine adalah mesin OLAP kolumnar yang mendukung kompresi otomatis dan dioptimalkan untuk workload analitik
- Memberikan kecepatan pemrosesan kueri analitik hingga 200x lebih cepat dibanding InnoDB
- Vector Index (VIDX) mendukung penyimpanan vektor dan approximate nearest neighbor search (ANN) berbasis algoritma HNSW
- Mendukung perhitungan jarak COSINE dan EUCLIDEAN, serta dapat memproses vektor hingga 16.383 dimensi
- Tetap mempertahankan kompatibilitas MySQL 100%, sehingga SQL, driver, dan alat yang ada bisa digunakan apa adanya
Roadmap pengembangan ke depan
- Hingga kuartal 4 tahun 2025, penyelesaian mesin DuckDB, Vector Index, dan rilis open source
- Fitur yang direncanakan setelah 2026
- Optimasi DDL: instant DDL, pembuatan B+tree paralel, non-blocking lock
- Optimasi RTO: pemulihan crash cepat, RTO minimum
- Replication Boost: parallel Binlog Flush, Binlog in Redo, optimasi transaksi berukuran besar
Contoh penggunaan
- Pembuatan dan kueri tabel analitik DuckDB
- Setelah membuat tabel dengan mesin DuckDB, kueri agregasi penjualan bulanan diproses 200x lebih cepat dibanding InnoDB
- Pencarian vektor untuk aplikasi AI
- Setelah membuat tabel yang mencakup kolom vektor 768 dimensi, lakukan pencarian kemiripan berbasis jarak cosine melalui indeks HNSW
Open source dan komunitas
- Rilis open source pada Desember 2025, dikembangkan, dikelola, dan dipelihara terutama oleh tim Alibaba Cloud Database
- Didistribusikan dengan lisensi GPL-2.0, sama seperti skema lisensi MySQL
- Laporan bug dan usulan fitur dapat diajukan melalui GitHub Issues
- Tersedia sebagai layanan komersial di Alibaba Cloud RDS dalam bentuk instance analitik berbasis DuckDB
1 komentar
Opini Hacker News
Pendekatan yang menggunakan DuckDB sebagai storage engine cukup menarik
Kueri analitik bisa diarahkan ke engine berbasis kolom sambil tetap mempertahankan koneksi, tooling, dan struktur replikasi MySQL yang sudah ada
Secara operasional ini jauh lebih sederhana daripada membangun DB analitik terpisah dan membuat pipeline sinkronisasi
Namun, poin kuncinya adalah bagaimana menjaga konsistensi data antara InnoDB dan DuckDB
Detailnya dirangkum dalam dokumentasi AliSQL DuckDB
Berbagai optimasi dilakukan pada pengiriman batch binlog, operasi tulis, dan lainnya
Saat log_bin dimatikan, transaksi DuckDB di-commit sebelum pencatatan GTID, lalu diterapkan ulang saat pemulihan gangguan dengan cara idempotent
Saat log_bin dinyalakan, Binlog dipakai secara langsung, dan posisi Binlog yang valid dicatat di DuckDB agar bisa rollback sampai posisi tersebut jika terjadi kegagalan
Hasilnya, jika gtid_executed pada replica cocok dengan primary, maka data DuckDB juga konsisten
Evolusi database SQL dalam 10 tahun ke depan dipandang akan melalui tiga tahap
Hanya akses ke data lama yang akan sedikit lebih lambat, sementara sisanya memberi pengalaman kueri yang sepenuhnya terintegrasi
Penasaran apa perbedaannya dibandingkan pg_duckdb
Berkat mekanisme ekstensi Postgres, pg_duckdb terlihat cukup rapi
Penasaran apakah sistem ini, seperti SAP HANA, memasok data workload transaksional ke DuckDB secara real-time
Jika ya, pekerjaan rumit untuk menyinkronkan data warehouse lewat Kafka atau Debezium akan sangat berkurang
Ingin juga mendengar pendapat apavlo
Rasanya era HTAP benar-benar sudah datang
Menarik melihat database hibrida seperti ini makin banyak diadopsi
Terutama peningkatan pemrosesan transaksi yang dijelaskan dalam dokumentasi AliSQL DuckDB sangat mengesankan
Keren bahwa sinkronisasi antara tabel dasar dan tabel analitik dijamin cepat dan per transaksi
Jaminan konsistensinya tidak jauh berbeda dari sistem seperti Materialize
Sebenarnya upaya seperti ini sudah ada sejak lama, dan sudah banyak kasus menambahkan storage engine OLAP ke MySQL/Postgres
Menambahkan engine kolumnar embedded ke DB tradisional memberi keuntungan besar dalam produktivitas dan kesederhanaan operasional
Saat ini saya memakai kombinasi PG + Tiger Data, tetapi di sisi MySQL belum ada alternatif seperti ini
Percobaan kali ini tampaknya bisa mengisi kekosongan tersebut
Belakangan juga ditambahkan vector storage type, jadi menarik membandingkan performanya dengan implementasi Alibaba
Postgres sering disebut, tetapi MariaDB juga cukup serbaguna
Memang butuh dua koneksi, tetapi bekerja cukup baik
Saya hanya butuh count cepat seperti di ClickHouse, tetapi harus melalui seluruh proses sinkronisasi terasa merepotkan
TimeSeries dioptimalkan untuk use case tertentu, jadi agak sulit untuk penggunaan umum
Mendukung data berbasis row dan column, tetapi hanya kompatibel dengan MySQL dan basis kodenya berbeda
Jadi ini bukan ekstensi MySQL yang sepenuhnya nyata
Penasaran seberapa mudah fitur ini diterapkan jika digabungkan dengan MySQL Operator
Sekilas ini terlihat seperti versi FDW milik PSQL yang diintegrasikan lebih erat dengan DuckDB dan Vector Storage
Nuansanya juga mirip Vespa, jadi menarik kenapa mereka memilih ekstensi MySQL alih-alih pendekatan FDW
Riwayat commit-nya aneh
Hanya ada 2 commit pada 2022 dan beberapa commit pada 2024~2026, sementara commit pertama berbunyi “First commit, Support DuckDB Engine”
Versi internalnya mungkin rumit karena referensi Jira, informasi produk, komentar berbahasa Mandarin, dan sebagainya
Jadi sepertinya mereka membuat ulang riwayat git publik yang lebih rapi
Penasaran bagaimana jadinya jika TiDB memakai DuckDB alih-alih ClickHouse