Belajar SQL untuk ilmuwan data melalui 100 kueri
(gvwilson.github.io)SQL for the Weary
- Target pembaca: Rachel, yang memiliki gelar master biologi sel, bekerja pada analisis sel di rumah sakit riset dan ingin menjadi ilmuwan data.
- Pengetahuan awal yang dibutuhkan: Perintah Unix dasar dan kemampuan menganalisis data tabular.
- Hasil pembelajaran: Menjelaskan perbedaan antara database dan administrator database, menulis SQL, mendefinisikan tabel dan memanipulasi data, menjelaskan jenis-jenis join, menggunakan window function untuk bekerja dengan baris yang berdekatan, memahami transaction dan trigger, memanipulasi data JSON dengan SQL, serta berinteraksi dengan database melalui Python.
Pengaturan
- Unduh rilis terbaru: Ekstrak file yang berisi contoh database SQLite, kueri SQL, skrip Python, dan lainnya ke direktori sementara.
Konsep latar belakang
- Database: Kumpulan data yang dapat ditelusuri dan diambil kembali.
- Sistem manajemen database (DBMS): Program yang mengelola jenis database tertentu.
- SQLite: Menyimpan database sebagai satu file, sedangkan PostgreSQL mendistribusikan informasi ke beberapa file untuk performa yang lebih tinggi.
- Sistem manajemen database relasional (RDBMS): Menyimpan data dalam tabel dan melakukan kueri menggunakan SQL.
- Database NoSQL: Ada juga database seperti MongoDB yang tidak menggunakan tabel.
Koneksi database
- Koneksi database: Bukan kueri yang sebenarnya, tetapi langkah yang diperlukan sebelum melakukan pekerjaan lain.
Perintah administrasi
- Perintah administrasi SQLite: Bukan bagian dari SQL standar, dan perintah khusus PostgreSQL diawali dengan
\. - Format output: Gunakan
.headers ondan.mode markdownagar hasil ditampilkan dengan mudah dibaca.
Manipulasi tabel
- Membuat tabel: Mendefinisikan tabel dan kolom dengan perintah
create table. - Menyisipkan data: Menambahkan data ke tabel dengan perintah
insert into. - Memperbarui baris: Mengubah data pada baris yang memenuhi kondisi tertentu dengan perintah
update. - Menghapus baris: Menghapus baris yang memenuhi kondisi tertentu dengan perintah
delete from.
Join
- Join: Operasi untuk menggabungkan informasi dari dua tabel.
- Inner join: Menggunakan
inner joinuntuk menggabungkan hanya baris yang cocok dari kedua tabel. - Left join: Menggunakan
left joinuntuk mempertahankan semua baris dari tabel kiri dan mengisi nilai yang hilang dari tabel kanan dengannull.
Fungsi agregasi
- Agregasi: Operasi untuk menggabungkan beberapa nilai menjadi satu.
- Fungsi agregasi umum: Mengagregasi data menggunakan
sum,max,min,avg, dan lainnya. - Pengelompokan: Menggunakan
group byuntuk mengelompokkan baris berdasarkan kombinasi unik dari kolom tertentu dan melakukan agregasi untuk setiap grup.
Pendapat GN⁺
- Artikel ini adalah materi untuk membantu pemahaman dasar tentang database dan SQL, dan berguna bagi insinyur perangkat lunak pemula maupun mereka yang tertarik pada data science.
- Dengan contoh nyata, artikel ini menjelaskan berbagai fitur SQL sehingga memberikan pengetahuan praktis tentang pengelolaan dan manipulasi database.
- Khususnya, join database, fungsi agregasi, dan manipulasi tabel sangat penting dalam pekerjaan terkait analisis data, dan artikel ini membantu memahami konsep-konsep tersebut dengan jelas.
1 komentar
Komentar Hacker News