Kebocoran informasi sensitif: database DeepSeek terekspos, termasuk riwayat chat

(wiz.io)

1 poin oleh GN⁺ 2025-01-30 | Belum ada komentar. | Bagikan ke WhatsApp

Dalam proses pemeriksaan permukaan serangan eksternal DeepSeek, ditemukan database ClickHouse yang terbuka tanpa autentikasi, dan DeepSeek segera memblokir paparan tersebut setelah menerima laporan
Titik paparan berada pada port 8123 dan 9000 di oauth2callback.deepseek.com dan dev.deepseek.com; dari luar, dimungkinkan untuk mengendalikan seluruh database dan mengakses data internal
Tabel log_stream berisi lebih dari 1 juta log, termasuk riwayat chat sejak 6 Januari 2025, API Keys, detail backend, dan metadata operasional dalam teks polos
Melalui path /play pada antarmuka HTTP ClickHouse, query SQL arbitrer dapat dijalankan dari browser, tetapi Wiz Research membatasi ruang lingkup peninjauan pada tingkat enumerasi sesuai praktik riset etis
Dalam adopsi layanan AI yang cepat, risiko langsung tidak hanya muncul dari model itu sendiri, tetapi juga dari masalah keamanan infrastruktur dasar seperti paparan eksternal database secara tidak sengaja

Database ClickHouse DeepSeek terbuka tanpa autentikasi

Wiz Research mengidentifikasi database ClickHouse yang dapat diakses publik milik DeepSeek
Database tersebut dapat diakses tanpa autentikasi, dan kondisinya memungkinkan bukan hanya melihat data internal, tetapi juga mengendalikan sepenuhnya operasi database
Informasi yang terekspos mencakup riwayat chat, API Keys, detail backend, stream log, dan detail operasional
Wiz Research segera melaporkan masalah ini kepada DeepSeek, dan DeepSeek dengan cepat memblokir paparan tersebut

DeepSeek adalah startup AI asal Tiongkok yang baru-baru ini menarik perhatian besar melalui model penalaran DeepSeek-R1
- DeepSeek-R1 disebut mampu bersaing dari sisi performa dengan sistem AI terdepan seperti o1 milik OpenAI
- Efektivitas biaya dan efisiensi menjadi fitur utamanya
Wiz Research menelusuri domain publik untuk mengevaluasi permukaan serangan eksternal DeepSeek
Melalui eksplorasi subdomain pasif dan aktif, sekitar 30 subdomain yang terekspos ke internet berhasil diidentifikasi
- Sebagian besar awalnya tidak tampak sebagai paparan berisiko tinggi, seperti antarmuka chatbot, halaman status, dan dokumentasi API
Saat eksplorasi diperluas melampaui port HTTP standar 80/443, ditemukan bahwa port 8123 dan 9000 terbuka
- Host targetnya adalah oauth2callback.deepseek.com dan dev.deepseek.com

Port yang teridentifikasi mengarah ke database ClickHouse yang dapat diakses tanpa autentikasi
ClickHouse adalah sistem manajemen database kolumnar open-source yang dirancang untuk query analitik cepat pada dataset berskala besar
- Dikembangkan oleh Yandex
- Banyak digunakan untuk pemrosesan data real-time, penyimpanan log, dan analisis big data
Pada antarmuka HTTP ClickHouse, penggunaan path /play memungkinkan query SQL arbitrer dijalankan langsung dari browser
Query SHOW TABLES; mengembalikan daftar dataset yang dapat diakses, dan di antaranya tabel log_stream berisi log yang sangat sensitif

Tabel log_stream berisi lebih dari 1 juta entri log
Kolom utama dan informasi yang terekspos adalah sebagai berikut
- timestamp: log sejak 6 Januari 2025
- span_name: referensi ke berbagai endpoint API internal DeepSeek
- string.values: log teks polos yang mencakup riwayat chat, API Keys, detail backend, dan metadata operasional
- _service: menunjukkan layanan DeepSeek yang menghasilkan log
- _source: mengekspos asal permintaan log, termasuk riwayat chat, API Keys, struktur direktori, dan log metadata chatbot
Tingkat akses seperti ini dapat menimbulkan risiko besar bagi keamanan DeepSeek sendiri maupun pengguna akhir
Penyerang dapat mengambil log sensitif dan pesan chat teks polos yang sebenarnya, dan bergantung pada konfigurasi ClickHouse, berpotensi langsung membocorkan kata sandi teks polos server, file lokal, dan informasi proprietari melalui query seperti SELECT * FROM file('filename')
Wiz Research tidak menjalankan query intrusif di luar enumerasi demi mematuhi praktik riset etis

Risiko keamanan langsung pada aplikasi AI dapat muncul dari infrastruktur dan alat yang menopangnya, bukan dari model itu sendiri
Meski diskusi keamanan AI berfokus pada ancaman masa depan, risiko keamanan dasar seperti paparan eksternal database secara tidak sengaja tetap harus menjadi prioritas utama tim keamanan
Seiring organisasi dengan cepat mengadopsi alat dan layanan AI dari berbagai startup dan penyedia, semakin sering data sensitif dipercayakan kepada perusahaan-perusahaan tersebut
Laju adopsi yang cepat dapat membuat keamanan terabaikan, sehingga perlindungan data pelanggan harus menjadi prioritas
Tim keamanan harus bekerja erat dengan engineer AI untuk memperoleh visibilitas atas arsitektur, alat, dan model yang digunakan agar dapat mencegah paparan data
Perusahaan AI berkembang cepat menjadi penyedia infrastruktur inti tanpa framework keamanan yang biasanya menyertai adopsi luas, sehingga diperlukan praktik keamanan yang sesuai dengan risiko penanganan data sensitif