Interpretable machine learning for undeclared work prediction
Ερμηνεύσιμη μηχανική μάθηση για πρόβλεψη αδήλωτης εργασίας
Doctoral Thesis
Συγγραφέας
Alogogianni, Eleni
Αλογογιάννη, Ελένη
Ημερομηνία
2024-07Επιβλέπων
Virvou, MariaΒίρβου, Μαρία
Λέξεις κλειδιά
Data mining ; Machine learning ; Interpretable machine learning ; Predictive modeling ; Decision support ; Classification ; Associative classification ; Class imbalance ; Class overlap ; CRISP-DM methodology ; Interpretability ; Targeting ; Risk assessment ; Employment ; Undeclared work ; Labor law violations ; Labor inspectorate ; Social security ; Informal economy ; Tax evasion ; Public AuthorityΠερίληψη
Η αδήλωτη εργασία, μια θεμελιώδης πτυχή της άτυπης οικονομίας, αποτελεί ένα περίπλοκο κοινωνικοοικονομικό ζήτημα που υπονομεύει την ευημερία των εργαζομένων, των επιχειρήσεων και τη σταθερότητα του κράτους πρόνοιας. Οι Επιθεωρήσεις Εργασίας είναι επιφορτισμένες με την καταπολέμηση αυτής της παράνομης πρακτικής της απασχόλησης, ωστόσο συχνά αποδεικνύονται ανεπαρκείς, αντιμετωπίζοντας ελλείψεις σε ανθρώπινους πόρους και κατάλληλα εργαλεία.
Η παρούσα διδακτορική διατριβή επιδιώκει να ενισχύσει τις δυνατότητες των δημοσίων αρχών επιβολής του εργατικού δικαίου να αντιμετωπίσουν την αδήλωτη εργασία και άλλες παραβιάσεις του εργατικού δικαίου μέσω του σχεδιασμού και της ανάπτυξης ενός καινοτόμου συστήματος μηχανικής μάθησης. Αυτό το σύστημα δημιουργεί ερμηνεύσιμα μοντέλα πρόβλεψης για αυτές τις παραβιάσεις και προσφέρει τρία κύρια οφέλη. Πρώτον, μέσω της ακριβούς πρόβλεψης των επιχειρήσεων που ενδεχομένως απασχολούν αδήλωτους εργαζομένους, συμβάλλει σημαντικά στην αποδοτική κατανομή των πόρων της Αρχής, διευκολύνοντας τον αποτελεσματικό σχεδιασμό στοχευμένων επιτόπιων επιθεωρήσεων και άλλων αποτρεπτικών και προληπτικών μέτρων. Δεύτερον, μέσω της παροχής σαφών εξηγήσεων για αυτές τις προβλέψεις, βελτιώνει τις γνώσεις των επιθεωρητών εργασίας, τους εμπλέκει ενεργά στη διαδικασία σχεδιασμού επιθεωρήσεων και αυξάνει την εμπιστοσύνη και την αποδοχή τους στα αποτελέσματα και τις συστάσεις των μοντέλων. Τρίτον, μέσω του εντοπισμού και της εξαγωγής των κυρίαρχων προτύπων που σχετίζονται με κάθε παραβίαση, προσφέρει αξιόπιστες γνώσεις για τις επικρατούσες τάσεις στην αγορά εργασίας, υποστηρίζοντας έτσι την αποτελεσματική και στρατηγική λήψη αποφάσεων για παρεμβάσεις πολιτικής.
Η ερευνητική μελέτη και εφαρμογή μηχανικής μάθησης είναι ειδικά προσαρμοσμένες στις επιχειρηματικές ανάγκες και διαθέσιμα δεδομένα της Ελληνικής Επιθεώρησης Εργασίας, ωστόσο οι προτεινόμενες προσεγγίσεις και τεχνικές, οι οποίες αναλύονται διεξοδικά κατά τις έξι φάσεις της μεθοδολογίας CRISP-DM, μπορούν να εφαρμοστούν σε οποιαδήποτε αρχή επιβολής διατάξεων της εργατικής νομοθεσίας. Για τους σκοπούς της μελέτης και εφαρμογής, χρησιμοποιείται ένα σύνολο πραγματικών δεδομένων που ενσωματώνει δεδομένα επιθεωρήσεων, επιχειρήσεων και απασχόλησης και επιστρατεύονται τέσσερις αλγόριθμοι συσχετιστικής ταξινόμησης (Associative Classification), μιας προηγμένης μεθόδου μηχανικής μάθησης που είναι γνωστή για την υψηλή προγνωστική της ακρίβεια και βελτιωμένη ερμηνευτικότητα.
Κατά την εφαρμογή τριών επαναλήψεων του κύκλου ζωής μηχανικής μάθησης σύμφωνα με τη μεθοδολογία CRISP-DM, αναπτύσσονται συνολικά 96 μοντέλα πρόβλεψης αδήλωτης εργασίας και άλλων παραβιάσεων, χρησιμοποιώντας διάφορες τεχνικές μηχανικής δεδομένων για την αντιμετώπιση των ζητημάτων ανισορροπίας τάξεων και επικάλυψης τάξεων που συχνά ενυπάρχουν στα σύνολα δεδομένων επιθεώρησης εργασίας, με στόχο τη βελτίωση της προγνωστικής τους ισχύος και της ερμηνευτικότητας των αποτελεσμάτων τους. Η μελέτη αξιολογεί τα μοντέλα τόσο για την απόδοση πρόβλεψης όσο και για τη σαφήνεια των εξαγόμενων τοπικών και καθολικών εξηγήσεων. Επιπλέον, δίνεται έμφαση στην προσαρμοστικότητα των τεχνικών μηχανικής μάθησης στο λειτουργικό πλαίσιο ενός δημόσιου ιδρύματος, αναλύοντας προκλήσεις και προτείνοντας λύσεις για τη διευκόλυνση της ομαλής ενσωμάτωσης και αποδοχής τέτοιων καινοτόμων προσεγγίσεων στον δημόσιο τομέα.
Συνολικά, αυτή η έρευνα αντιπροσωπεύει ένα ολοκληρωμένο και λεπτομερές έργο μηχανικής μάθησης που έχει σχεδιαστεί για εφαρμογή στο επιχειρηματικό περιβάλλον ενός δημόσιου ιδρύματος υπεύθυνου για την αποτελεσματική καταπολέμηση της παράνομης πρακτικής της αδήλωτης εργασίας. Δίνει έμφαση σε προηγμένες τεχνικές και μεθόδους που επιτυγχάνουν ανώτερη απόδοση πρόβλεψης, βελτιωμένη ερμηνευτικότητα και απρόσκοπτη ενσωμάτωση στις υπάρχουσες επιχειρησιακές διαδικασίες. Ο απώτερος στόχος της παρούσας διδακτορικής διατριβής είναι να προωθήσει τον σχεδιασμό, την εφαρμογή και την ενσωμάτωση τέτοιων καινοτόμων προσεγγίσεων στις αρμόδιες δημόσιες αρχές, ενισχύοντας έτσι την ικανότητά τους να αντιμετωπίζουν τις παραβιάσεις της εργατικής νομοθεσίας πιο αποτελεσματικά και στρατηγικά.