Fault injection and Lockstep evaluation on Zynq Ultrascale+ MPSoC
Τεχνητή εισαγωγή σφαλμάτων και αξιολόγηση λειτουργίας Lockstep στο Zynq UltraScale+ MPSoC

Master Thesis
Συγγραφέας
Alampasis, Nikolaos
Αλαμπάσης, Νικόλαος
Ημερομηνία
2025-12Επιβλέπων
Psarakis, MichaelΨαράκης, Μιχαήλ
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
FaultiInjection ; Lockstep ; Cortex-R5 ; MPSoC reliability ; PMU–RPU signaling ; Soft error mitigation ; ECC protectionΠερίληψη
Η παρούσα διατριβή διερευνά πειραματικά τη συμπεριφορά και τους μηχανισμούς χειρισμού σφαλμάτων στο AMD Zynq UltraScale+ MPSoC, με χρήση της πλατφόρμας Ultra96-V2. Η μελέτη εστιάζει σε συμβάντα soft errors και σε αρχιτεκτονικά χαρακτηριστικά που ενισχύουν την αξιοπιστία σε embedded συστήματα ασφάλειας, με ιδιαίτερη έμφαση στη μονάδα Arm Cortex-R5 (RPU) σε λειτουργία lockstep, στην προστασία μνήμης OCM μέσω ECC και στον ρόλο της Platform Management Unit (PMU).
Ακολουθείται πειραματική μεθοδολογία εισαγωγής ελεγχόμενων σφαλμάτων και ανάλυσης της διάδοσής τους μέσω καταγραφών firmware και σηματοδότησης PMU-RPU. Αναπτύχθηκε εφαρμογή FreeRTOS για ντετερμινιστική εκτέλεση και μηχανισμό heartbeat, ενώ το PMU firmware επεκτάθηκε ώστε να ανιχνεύει συμβάντα ECC και να ειδοποιεί την RPU μέσω IPIs, επιτρέποντας άκρο-σε-άκρο επικύρωση του μηχανισμού ειδοποίησης.
Εξετάζονται τρεις περιπτώσεις: διορθώσιμο ECC σφάλμα με διαφανή αντιμετώπιση, μη διορθώσιμο ECC σφάλμα με κλιμακωμένη αναφορά και ασυμφωνία lockstep που οδηγεί σε fail-safe επαναφορά της RPU. Τα αποτελέσματα αναδεικνύουν τη διάκριση μεταξύ ανακτήσιμων σφαλμάτων μνήμης και μη ανακτήσιμων ασυμφωνιών lockstep. Ως μελλοντική εργασία προτείνεται η επέκταση της μεθοδολογίας και η ενίσχυση των μηχανισμών ανάκτησης.

