- Editor kode AI berbasis VS Code yang dioptimalkan untuk pekerjaan data, terhubung langsung ke BigQuery/Snowflake/Postgres dan menyediakan pembuatan kode otomatis sesuai skema data serta pemeriksaan kualitas
- Sementara alat berbasis LLM yang ada melengkapi SQL secara otomatis tanpa memahami skema data, nao menggunakan tab AI berbasis RAG dan alat agen untuk menghasilkan kode SQL/Python/YAML yang akurat
- Pipeline SQL dapat ditulis, dijalankan, dan divisualisasikan dalam satu antarmuka
- Pipeline Python juga didukung di lingkungan yang sama, dan workflow dbt juga didukung
- Perbedaan data hasil sebelum dan sesudah perubahan kode serta masalah kualitas data dapat dilihat sekilas, sehingga memungkinkan deployment cepat tanpa pengujian atau membantu mencegah kesalahan
- Kegunaan utama
- Digunakan untuk membangun pipeline data (SQL, dbt, dll.)
- Deteksi data hilang/duplikat/outlier
- Perbandingan data pengembangan vs operasional
- Menjalankan dan merangkum pengujian yang telah didefinisikan sebelumnya
- Terintegrasi dengan dbt, alat BI, dan data warehouse, sehingga menyediakan lingkungan IDE yang cocok untuk data engineer, analis, dan data scientist
- Mendukung BigQuery, Snowflake, dan Postgres, serta akan segera mendukung Databricks, Iceberg, dan Redshift
- Juga akan terintegrasi dengan Looker, Power BI, Metabase, Tableau
- Saat ini hanya tersedia versi Mac, versi Windows/Linux juga direncanakan
- Perbedaan dibanding Cursor dan MCPs
- Cursor memerlukan beberapa panggilan MCP untuk mendapatkan konteks data, sedangkan Nao selalu dapat menggunakannya dari satu RAG tunggal
- MCPs hanya bekerja secara terbatas di dalam Cursor, dan adaptasi UI-nya juga kurang baik
- Nao hadir dalam paket siap pakai, sehingga tidak memerlukan konfigurasi, pemasangan ekstensi, autentikasi, atau pembangunan CI/CD, dan menjadi keunggulan karena bahkan pengguna nonspesialis dapat meningkatkan pengalaman pengembangannya
FAQ
- Siapa yang sebaiknya menggunakan nao?
- Penulis SQL, analis engineer dbt, data scientist, data engineer, dan semua anggota tim data
- Apa bedanya dengan Cursor?
- Ini adalah IDE yang dioptimalkan untuk konteks data dengan pembuatan kode berbasis pemahaman skema data, pemeriksaan kualitas data otomatis, dan prediksi dampak perubahan
- Bahasa apa yang didukung?
- Mendukung semua bahasa, tetapi terutama dioptimalkan untuk SQL
- Bagaimana ini membantu workflow dbt?
- Memahami model dbt, source, dokumentasi, pengujian, dan lineage tingkat kolom, lalu menyediakan autocomplete dan visualisasi
- Bagaimana dengan keamanan data?
- Data hanya diproses secara lokal, dan memerlukan persetujuan pengguna sebelum dikirim ke LLM
- Kode maupun skema tidak disimpan, hanya embedding yang digunakan
1 komentar
Komentar Hacker News
Banyak proyek data berbasis LLM memang menawarkan fleksibilitas dan bantuan, tetapi sulit direproduksi dan kurang interaktif; menurut saya Nao mengimplementasikan konsep ini dengan baik. Buckaroo yang saya buat adalah UI tabel data untuk Jupyter dan Pandas/Polars, sehingga Anda bisa langsung melihat data dengan tabel modern, histogram, dan statistik ringkasan. Kemarin saya merilis fitur auto-cleaning di Buckaroo, yang secara heuristik memilih cara pembersihan untuk data dan memberikan kode yang sudah final. Performanya sangat cepat, di bawah 500ms. Bisa mencoba beberapa strategi pembersihan dan memilih yang paling cocok. Untuk masalah sederhana, LLM bahkan tidak perlu dilibatkan. Ini open source dan sangat mudah diperluas
Saya juga sedang mengembangkan sesuatu yang sangat mirip. Memang belum sematang Buckaroo, tetapi menurut saya aplikasi tertanam di dalam notebook cukup berguna
Saya sangat suka tampilan untuk memvisualisasikan data profiling. Menurut saya itu bagian yang sangat penting untuk memahami data
Menurut saya ini ide yang sangat keren. Saya penasaran bagaimana model Tab dilatih, apakah berbasis Fill in the middle atau edit history. Seseorang juga membagikan tulisan blog tentang autocomplete tab Cursor yang mirip kemarin, dan menarik untuk dibaca
Setelah terus memakainya selama beberapa minggu, saya merasa ada peningkatan nyata pada workflow saya. Saya jadi lebih sering memilih ini daripada VSCode dan ekstensinya. Fitur chat, worksheet, dan pelacakan lineage kolom untuk exploratory data analysis benar-benar mengubah permainan dalam pengembangan dbt. Semua fitur ini terasa dirancang dengan sangat cermat agar cocok dengan cara saya bekerja. Claire dan Christophe juga sangat responsif terhadap masukan, serta cepat menambah dan memperbaiki fitur. Produknya sedang berkembang cepat ke arah yang benar
Ini terasa sangat menarik. Saya sudah menonton video YouTube-nya beberapa kali, dan sangat terkesan dengan bagaimana ia mempersingkat siklus umpan balik. Keren sekali
Saya penasaran apakah ini hanya bekerja saat memakai raw SQL. Proyek saya memakai Postgres + TypeScript dan menulis query dengan query builder seperti Kysely, jadi saya ingin tahu apakah ini bisa langsung saya gunakan
Saya penasaran seberapa banyak data/prompt saya yang dikirim ke model. Skema saya mungkin tidak masalah, tetapi data warehouse biasanya berisi data sensitif. Saya rasa ada paket enterprise, jadi saya ingin tahu sebelumnya apakah data/hasil di luar kode benar-benar dikirim ke server, atau hanya kodenya saja
Ada yang ingin rekomendasi tautan alat berbasis LLM untuk data engineering dan data science
Saya suka dengan fitur-fitur yang ada. Apakah ke depannya ada rencana menambahkan dukungan SQLite juga?
Saya penasaran bagaimana ini menangani join transitif di beberapa tabel yang tidak punya FK/PK. Selain itu, analisis penggunaan/penulisan ulang terhadap query tidak efisien yang sudah ada juga tampaknya bisa jadi fitur andalan