Automata learning for complex event recognition and forecasting
Master Thesis
Συγγραφέας
Baou, Evangelia
Μπάου, Ευαγγελία
Ημερομηνία
2025-09Επιβλέπων
Katzouris, NikolaosΚατζούρης, Νικόλαος
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Automata learning ; Complex event recognition ; Complex event forecastingΠερίληψη
Η παρούσα διπλωματική εργασία επικεντρώνεται στη συγκριτική μελέτη δύο διαφορετικών προσεγγίσεων πρόβλεψης γεγονότων σε ροές δεδομένων, των DISC και Wayeb. Το DISC χρησιμοποιεί μεικτό ακέραιο γραμμικό προγραμματισμό (MILP) για να εκπαιδεύσει αυτόματα μοντέλα πρόβλεψης πρώιμων γεγονότων (early prediction). Τα αποτελέσματα της εκπαίδευσης από το DISC στη συνέχεια χρησιμοποιούνται ως είσοδος στο Wayeb, μια μέθοδο που βασίζεται σε πιθανωτικά αυτόματα και υποστηρίζει online πρόβλεψη σε συνεχείς ροές δεδομένων. Ηεργασία εξετάζει τη συμπεριφορά του συστήματος υπό διαφορετικές παραμετροποιήσεις, με έμφαση σε δύο κρίσιμες μεταβλητές του Wayeb: το threshold, το οποίο καθορίζει το κατώφλι εμπιστοσύνης για το αν μία πρόβλεψη θεωρείται θετική, και το order, που προσδιορίζει το εύρος ιστορικού (παρελθόντων γεγονότων) που λαμβάνει υπόψη το μοντέλο. Πειραματιζόμενοι με διαφορετικά ποσοστά δεδομένων εκπαίδευσης (trace percentage) και αξιολογώντας την απόδοση με βάση τον δείκτη F1 Score, αναλύσαμε τη συμπεριφορά του συστήματος σε δύο datasets (MIT και Alfred). Τα αποτελέσματα δείχνουν ότι η απόδοση του Wayeb εξαρτάται έντονα από τη σωστή παραμετροποίηση, με μεσαίες τιμές threshold (0.5–0.7) να αποδίδουν σταθερά καλά, και μεγαλύτερες τιμές order να προσφέρουν βελτίωση μόνο όταν διατίθεται επαρκής ποσότητα δεδομένων. Ιδιαίτερα στο Alfred dataset, παρατηρείται υψηλή απόδοση ακόμη και με μικρά ποσοστά εκπαίδευσης, σε αντίθεση με το MIT, όπου η αύξηση του ορδερ δεν συνοδεύεται από σημαντική αύξηση στην απόδοση. Η εργασία αναδεικνύει τη δυναμική του DISC ως εργαλείο αυτόματης εκπαίδευσης και την αποτελεσματικότητα του Wayeb για πρόβλεψη σε πραγματικό χρόνο, προσφέροντας έναν συνδυασμό που είναι τόσο ευέλικτος όσο και ισχυρός για προβλήματα πρόβλεψης γεγονότων σε ακολουθιακά δεδομένα.

