Teman membantu teman agar tidak membuat grafik yang buruk
(github.com/cxli233)Contoh baik dan buruk dalam visualisasi data
- Sebuah esai berisi opini tentang visualisasi data, mencakup contoh dan penjelasan tentang visualisasi yang baik dan yang buruk
Jangan membuat bar chart untuk memisahkan rata-rata
- Grafik pemisahan rata-rata sering terlihat dalam publikasi ilmiah, tetapi bar chart tidak cocok untuk menunjukkan apakah dua kelompok dengan distribusi dan simpangan baku yang mirip sebenarnya sama atau tidak.
- Ditekankan bahwa ada beberapa hal yang harus diperiksa sebelum menggunakan bar chart.
Jangan membuat violin plot untuk ukuran sampel kecil
- Pada sampel kecil, distribusi dan kuartil dapat sangat berbeda, sehingga violin plot tidak bermakna.
- Melalui eksperimen, dikonfirmasi bahwa distribusi menjadi stabil ketika ukuran sampel mencapai 50 atau lebih.
Jangan gunakan skala warna divergen untuk data satu arah
- Menggunakan skala warna divergen untuk data satu arah adalah kesalahan besar dalam visualisasi data.
- Skala warna harus merepresentasikan nilai-nilai khusus yang bermakna.
Jangan tampilkan hasil eksperimen multifaktor dengan bar chart
- Untuk menyampaikan hasil eksperimen multifaktor secara efektif, diperlukan perancangan yang cermat terkait pengelompokan/pemisahan berdasarkan tiap faktor.
Jangan membuat heatmap tanpa menyusun ulang baris dan kolom
- Heatmap harus dibuat secara efektif dengan mempertimbangkan urutan baris dan kolom.
- Baris dan kolom dapat disusun ulang melalui clustering, tetapi itu bukan satu-satunya cara.
Jangan membuat heatmap tanpa memeriksa outlier
- Jika outlier tidak diperiksa dalam heatmap, hal itu dapat sangat memengaruhi interpretasi data.
Jangan lupa memeriksa rentang data pada setiap level faktor
- Dalam eksperimen multifaktor, rentang variabel respons dapat sangat berbeda tergantung pada level faktor.
Jangan membuat grafik jaringan tanpa mencoba berbagai layout
- Tampilan grafik jaringan adalah elemen penting yang menentukan efektivitasnya.
- Dengan mengubah layout, interpretasi grafik jaringan dapat dibuat lebih mudah.
Jangan mencampuradukkan visualisasi berbasis posisi dan visualisasi berbasis panjang
- Mencampuradukkan visualisasi berbasis posisi dan visualisasi berbasis panjang dapat menimbulkan salah paham.
- Tidak memulai bar chart dari 0 adalah kesalahan besar dalam visualisasi data.
Jangan membuat pie chart
- Pie chart dikritik karena manusia tidak terlalu mahir membaca sudut dan luas.
- Jika ingin menampilkan data sebagai panjang, lebih baik membongkar donut chart menjadi stacked bar chart.
Jangan membuat concentric donut chart
- Concentric donut chart dapat salah merepresentasikan data karena panjang busur cincin luar jauh lebih besar daripada cincin dalam.
- Alternatif yang sederhana dan efektif adalah membongkar donut chart menjadi stacked bar chart.
Jangan gunakan skala warna merah/hijau dan pelangi
- Dengan mempertimbangkan buta warna merah-hijau, sebaiknya gunakan skala warna yang ramah buta warna dan tetap mempertahankan informasi dengan baik dalam grayscale.
Jangan lupa menyusun ulang stacked bar chart
- Jika ada banyak sampel dan kelas, urutan stacked bar chart harus dioptimalkan agar visualisasinya efektif.
Opini GN⁺
Hal terpenting dari tulisan ini adalah meningkatkan kesadaran tentang kesalahan-kesalahan yang umum dilakukan saat membuat visualisasi data dan cara menghindarinya. Visualisasi data adalah alat yang kuat untuk menyampaikan informasi kompleks agar mudah dipahami, tetapi jika digunakan secara keliru dapat menimbulkan salah tafsir. Tulisan ini memberikan panduan yang menarik dan bermanfaat bagi siapa pun yang ingin menyampaikan data secara akurat dan jelas.
2 komentar
Judul artikelnya menarik. Kalau melihat artikel aslinya, ada grafik contoh yang ditampilkan bersama sehingga lebih mudah dipahami.
Opini Hacker News