Airbus A320 – Data inti kendali penerbangan berpotensi rusak akibat radiasi matahari yang kuat
(airbus.com)- Hasil analisis atas insiden terbaru pada pesawat keluarga A320 mengonfirmasi bahwa radiasi matahari yang kuat dapat merusak data inti yang diperlukan untuk kendali penerbangan
- Airbus karena itu mengidentifikasi bahwa banyak pesawat seri A320 yang saat ini beroperasi berpotensi terdampak
- Perusahaan telah menerbitkan Alert Operators Transmission (AOT) agar langkah pencegahan segera diterapkan dengan bekerja sama dengan otoritas penerbangan, dan hal ini akan dituangkan dalam Emergency Airworthiness Directive dari EASA
- Airbus mengakui bahwa tindakan ini dapat menyebabkan gangguan pada jadwal operasional penumpang dan pelanggan, dan saat ini bekerja erat dengan para operator untuk menanganinya
- Prioritas tertinggi dari seluruh tindakan ini adalah memastikan keselamatan penerbangan
Ikhtisar tindakan pencegahan untuk keluarga A320
- Analisis atas insiden terbaru terkait pesawat keluarga A320 mengungkap bahwa radiasi matahari yang kuat (intense solar radiation) dapat merusak data inti pada sistem kendali penerbangan
- Fenomena ini dapat memengaruhi integritas data yang diperlukan untuk fungsi kendali penerbangan (flight controls)
- Airbus menilai bahwa sejumlah besar pesawat seri A320 yang saat ini beroperasi dapat terdampak oleh masalah ini
Tindakan pencegahan dan kerja sama dengan otoritas
- Airbus menerbitkan Alert Operators Transmission (AOT) agar langkah pencegahan segera diterapkan dengan bekerja sama dengan otoritas penerbangan
- AOT memuat panduan untuk menerapkan langkah perlindungan perangkat lunak dan/atau perangkat keras guna memastikan operasi pesawat tetap aman
- Tindakan ini akan secara resmi dituangkan dalam Emergency Airworthiness Directive dari European Union Aviation Safety Agency (EASA)
Dampak operasional dan respons
- Airbus mengakui bahwa langkah ini dapat menimbulkan sebagian keterlambatan atau gangguan pada jadwal operasional penumpang dan pelanggan
- Perusahaan akan bekerja erat dengan para operator untuk mendukung pelaksanaan langkah tersebut, sambil tetap menjadikan keselamatan sebagai prioritas utama
- Airbus menyampaikan permohonan maaf atas ketidaknyamanan yang ditimbulkan
Materi terkait
- Tersedia dokumen PDF (126.02 KB) dengan isi yang sama seperti siaran pers
- Judul dokumen: Airbus update on A320 Family precautionary fleet action
- Tautan unduhan dipublikasikan di situs resmi
1 komentar
Komentar Hacker News
Saya benar-benar penasaran keluarga mikrokontroler mana yang menemukan masalah ini
Jika ini adalah safety processor yang memakai lockstep, ECC, dan sejenisnya, itu berarti terjadi bit flip pada tingkat yang tidak terdeteksi oleh ECC
Jika yang rusak adalah data, mungkin bukan sekadar restart sederhana, melainkan beberapa bit dalam satu word terbalik secara bersamaan
Jika lingkungannya tidak terlalu berbeda, mungkin saja margin tegangan dikurangi
Saya juga penasaran apakah ini NVM atau SRAM
Itu bukan MCU, melainkan sistem yang terdiri dari beberapa chip, dirancang pada tahun 90-an, dan baru pada tahun 2002 muncul versi hardware baru yang menambahkan EDAC
Dalam situasi seperti ini, bit flip memang sangat mungkin terjadi
Detailnya ada di laporan ATSB
Yang terutama bermasalah adalah flash xenon
Contoh terkait bisa dilihat di posting forum, diskusi tambahan, blog resmi, dan video YouTube
Satelit beroperasi pada ketinggian yang jauh lebih tinggi daripada A320, dan kebanyakan menggunakan Triple Modular Redundancy
Lihat penjelasan TMR dan konsep SEU
NASA menaikkan N menjadi 5 untuk penerbangan berawak
Ada juga metode seperti menonaktifkan cache sepenuhnya atau terus me-refresh ECC RAM
Ada pula langkah hardware untuk mencegah latch-up pada rangkaian digital
Kalau sudah lama di industri komputer, Anda akan melihat beberapa insiden bit flip seperti ini
ECC memang menyelamatkan sebagian besar kasus, tetapi kadang software juga dirancang untuk mendeteksi nilai aneh dan mengabaikannya
Dalam sistem real-time dan kritikal terhadap keselamatan, beberapa sistem juga memverifikasi kesalahan dengan mekanisme voting
Saya pernah menderita berbulan-bulan pada tahun 90-an gara-gara bit flip di cache line CPU
Di layanan yang menangani trafik besar, kami merangkum nilai berbentuk enum, lalu menemukan beberapa nilai yang mustahil
Setelah melihat string yang tercatat salah dengan selisih tepat satu bit, kami menduga itu mungkin akibat sinar kosmik
Padahal sebenarnya itu bug yang bisa direproduksi, dan baru setelah mencurigai kernel, driver, hingga klien, dia mengakui kesalahannya sendiri
Tetap saja dia jenius, dan untuk insiden A320 kali ini, mungkin justru dia benar
The Aviation Herald punya detail teknis yang lebih banyak
“Kerentanan ini dalam skenario terburuk dapat menyebabkan pergerakan elevator yang tidak diperintahkan hingga melampaui batas struktur pesawat”
Industri kedirgantaraan sudah lama menyiapkan langkah penanganan bit flip
Perbaikan Airbus/Thales kali ini dilakukan dengan memperkuat pemeriksaan kesalahan dan me-restart komponen yang bermasalah secara otomatis
Detail lebih lanjut ada di laporan BEA
Rasanya seperti nuansa gaya BoFH
“Datang kerja pagi-pagi pada hari Jumat, telepon berdering. Saya membalik lembar alasan, dan di sana solar flare menatap saya...”
tautan
Saya penasaran bagaimana kejadian ini didiagnosis
Saya tidak tahu apakah FDR (flight data recorder) mencatat sampai error level rendah, atau hanya menyimpan nilai input level tinggi
Jika ini bit flip akibat radiasi, bagaimana mereka bisa mengetahuinya?
Saya juga penasaran apakah mungkin ada catatan seperti kesalahan voting antar komputer penerbangan utama
Ada laporan analisis pascakejadian yang sangat bagus tentang kasus SEU (single-event upset) serupa
Ini memancing reaksi bercanda seperti, “terbang terlalu dekat ke matahari”
Saya ragu apakah kejadian seperti ini perlu sampai menghentikan operasi seluruh armada
Jika ini cuma satu kejadian dari puluhan ribu pesawat selama bertahun-tahun, rasanya memberi tenggang waktu sekitar dua bulan untuk memperbaikinya pun sudah cukup
Solusinya adalah downgrade atau menggantinya dengan hardware versi sebelumnya
Dari sudut pandang Airbus, kerugian langsung akibat penghentian operasi mungkin kecil, tetapi jika sampai terjadi kecelakaan, risiko reputasi dan gugatannya jauh lebih besar
Semacam, “kami bertindak proaktif, sementara pesaing baru bergerak setelah kecelakaan terjadi”
Menurut laporan media, tindakan kali ini adalah rollback software update
Saya penasaran apa tujuan update awalnya, dan seberapa sering software komputer penerbangan diperbarui