3 poin oleh GN⁺ 2023-11-21 | 2 komentar | Bagikan ke WhatsApp

Contoh baik dan buruk dalam visualisasi data

  • Sebuah esai berisi opini tentang visualisasi data, mencakup contoh dan penjelasan tentang visualisasi yang baik dan yang buruk

Jangan membuat bar chart untuk memisahkan rata-rata

  • Grafik pemisahan rata-rata sering terlihat dalam publikasi ilmiah, tetapi bar chart tidak cocok untuk menunjukkan apakah dua kelompok dengan distribusi dan simpangan baku yang mirip sebenarnya sama atau tidak.
  • Ditekankan bahwa ada beberapa hal yang harus diperiksa sebelum menggunakan bar chart.

Jangan membuat violin plot untuk ukuran sampel kecil

  • Pada sampel kecil, distribusi dan kuartil dapat sangat berbeda, sehingga violin plot tidak bermakna.
  • Melalui eksperimen, dikonfirmasi bahwa distribusi menjadi stabil ketika ukuran sampel mencapai 50 atau lebih.

Jangan gunakan skala warna divergen untuk data satu arah

  • Menggunakan skala warna divergen untuk data satu arah adalah kesalahan besar dalam visualisasi data.
  • Skala warna harus merepresentasikan nilai-nilai khusus yang bermakna.

Jangan tampilkan hasil eksperimen multifaktor dengan bar chart

  • Untuk menyampaikan hasil eksperimen multifaktor secara efektif, diperlukan perancangan yang cermat terkait pengelompokan/pemisahan berdasarkan tiap faktor.

Jangan membuat heatmap tanpa menyusun ulang baris dan kolom

  • Heatmap harus dibuat secara efektif dengan mempertimbangkan urutan baris dan kolom.
  • Baris dan kolom dapat disusun ulang melalui clustering, tetapi itu bukan satu-satunya cara.

Jangan membuat heatmap tanpa memeriksa outlier

  • Jika outlier tidak diperiksa dalam heatmap, hal itu dapat sangat memengaruhi interpretasi data.

Jangan lupa memeriksa rentang data pada setiap level faktor

  • Dalam eksperimen multifaktor, rentang variabel respons dapat sangat berbeda tergantung pada level faktor.

Jangan membuat grafik jaringan tanpa mencoba berbagai layout

  • Tampilan grafik jaringan adalah elemen penting yang menentukan efektivitasnya.
  • Dengan mengubah layout, interpretasi grafik jaringan dapat dibuat lebih mudah.

Jangan mencampuradukkan visualisasi berbasis posisi dan visualisasi berbasis panjang

  • Mencampuradukkan visualisasi berbasis posisi dan visualisasi berbasis panjang dapat menimbulkan salah paham.
  • Tidak memulai bar chart dari 0 adalah kesalahan besar dalam visualisasi data.

Jangan membuat pie chart

  • Pie chart dikritik karena manusia tidak terlalu mahir membaca sudut dan luas.
  • Jika ingin menampilkan data sebagai panjang, lebih baik membongkar donut chart menjadi stacked bar chart.

Jangan membuat concentric donut chart

  • Concentric donut chart dapat salah merepresentasikan data karena panjang busur cincin luar jauh lebih besar daripada cincin dalam.
  • Alternatif yang sederhana dan efektif adalah membongkar donut chart menjadi stacked bar chart.

Jangan gunakan skala warna merah/hijau dan pelangi

  • Dengan mempertimbangkan buta warna merah-hijau, sebaiknya gunakan skala warna yang ramah buta warna dan tetap mempertahankan informasi dengan baik dalam grayscale.

Jangan lupa menyusun ulang stacked bar chart

  • Jika ada banyak sampel dan kelas, urutan stacked bar chart harus dioptimalkan agar visualisasinya efektif.

Opini GN⁺

Hal terpenting dari tulisan ini adalah meningkatkan kesadaran tentang kesalahan-kesalahan yang umum dilakukan saat membuat visualisasi data dan cara menghindarinya. Visualisasi data adalah alat yang kuat untuk menyampaikan informasi kompleks agar mudah dipahami, tetapi jika digunakan secara keliru dapat menimbulkan salah tafsir. Tulisan ini memberikan panduan yang menarik dan bermanfaat bagi siapa pun yang ingin menyampaikan data secara akurat dan jelas.

2 komentar

 
xguru 2023-11-21

Judul artikelnya menarik. Kalau melihat artikel aslinya, ada grafik contoh yang ditampilkan bersama sehingga lebih mudah dipahami.

 
GN⁺ 2023-11-21
Opini Hacker News
  • Ada pendapat bahwa beberapa grafik bisa dipilih secara sengaja untuk menyembunyikan kurangnya titik data atau distribusi yang meragukan.
  • Tidak menetapkan outlier sebagai nilai maksimum pada heatmap adalah masalah yang umum dalam visualisasi statistik video game, sehingga sering kali hampir tidak berguna untuk mendiagnosis masalah suhu yang sebenarnya.
  • Fakta bahwa sumbu grafik tidak dimulai dari 0 tidak selalu berarti menyesatkan, dan ada pendapat yang membagikan pengalaman frustrasi terhadap klaim semacam itu.
  • Ini dinilai sebagai ringkasan yang bagus tentang kesalahan yang umum terjadi dalam visualisasi data, dengan komentar bahwa orang tersebut ingin membagikannya kepada rekan kerja, serta rekomendasi materi berdasarkan penelitian tentang persepsi manusia.
  • Sebagai referensi tambahan tentang visualisasi data, direkomendasikan "The Visual Display of Quantitative Information" karya Edward Tufte yang diterbitkan pada 1983.
  • Ada pendapat yang menyarankan untuk merujuk ke "Graphic presentation" karya Willard C. Brinton yang diterbitkan pada 1939, dengan catatan bahwa banyak pelajaran dalam visualisasi data bukanlah hal baru.
  • Saran "teman tidak membiarkan teman memakai skala warna dua arah" yang menganjurkan agar tidak menggunakan skala warna dua arah untuk data satu arah.
  • Bersamaan dengan pandangan negatif terhadap violin plot, dibagikan tautan video yang menyatakan bahwa violin plot seharusnya tidak ada.
  • Pengenalan terhadap ceramah "How Humans See Data" yang menggabungkan berbagai ide berdasarkan penelitian tentang cara manusia melihat data.
  • Disebutkan juga sebuah panduan yang menjelaskan cara mengklasifikasikan jenis data dan memilih gaya grafik/bagan yang paling sesuai untuk tiap jenis, disertai penyesalan karena tidak mem-bookmark panduan tersebut.