Προβλεπτική ανάλυση κόστους διαμονής και μεταφοράς και ομαδοποίηση ταξιδιωτών με χρήση μηχανικής μάθησης σε περιορισμένο σύνολο δεδομένων

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Τουρισμός ; Μηχανική μάθηση ; Πρόβλεψη κόστους ; Ομαδοποίηση ; Random Forest ; CatBoost ; K-ModesΠερίληψη
Ο τουρισμός αποτελεί έναν από τους πλέον δυναμικούς τομείς της παγκόσμιας οικονομίας, με
καθοριστική επίδραση στην ανάπτυξη, την απασχόληση και τη διαμόρφωση στρατηγικών. Η αυξανόμενη
πολυπλοκότητα της ζήτησης καθιστά αναγκαία την αξιοποίηση σύγχρονων υπολογιστικών μεθόδων για
πρόβλεψη και κατανόηση κρίσιμων παραμέτρων. Σε αυτό το πλαίσιο, η Μηχανική Μάθηση προσφέρει
δυνατότητες πρόβλεψης κόστους, εντοπισμού προτύπων και υποστήριξης εξατομικευμένων υπηρεσιών.
Η παρούσα εργασία βασίζεται σε μικρό σύνολο δεδομένων (137 δείγματα) από το Kaggle “Traveler details
dataset”, που περιλαμβάνει πληροφορίες όπως ο προορισμός, η διάρκεια, η εθνικότητα ταξιδιωτών, ο
τύπος καταλύματος, το μέσο μεταφοράς και σχετικά κόστη. Η περιορισμένη διάσταση του δείγματος
αποτελεί πρόκληση, απαιτώντας προσεκτική επεξεργασία για την εξαγωγή αξιόπιστων συμπερασμάτων.
Η εργασία περιλαμβάνει την πρόβλεψη του κόστους διαμονής και μεταφοράς και την ομαδοποίηση
ταξιδιωτών με βάση δημογραφικά και ταξιδιωτικά χαρακτηριστικά. Για την πρόβλεψη κόστους
εφαρμόστηκαν οι αλγόριθμοι Random Forest Regressor και CatBoost Regressor, ενώ για την ομαδοποίηση
χρησιμοποιήθηκε η τεχνική K-Modes. Τα μοντέλα παλινδρόμησης απέδωσαν ικανοποιητική ακρίβεια
στην εκτίμηση κόστους διαμονής και μεταφοράς, ενώ η ομαδοποίηση ανέδειξε διακριτά προφίλ
ταξιδιωτών βάσει εθνικότητας, ηλικίας, τύπου καταλύματος και εποχικότητας ταξιδιού.
Τα ευρήματα δείχνουν ότι ακόμη και σε μικρά σύνολα δεδομένων η Μηχανική Μάθηση μπορεί να
προσφέρει χρήσιμες γνώσεις για τη συμπεριφορά των ταξιδιωτών. Η αξιοποίησή τους μπορεί να
συμβάλει στη διαμόρφωση στοχευμένων στρατηγικών μάρκετινγκ και δυναμικής τιμολόγησης,
ενισχύοντας την ικανότητα των τουριστικών επιχειρήσεων να κατανοούν τη ζήτηση και να βελτιώνουν
την εμπειρία των επισκεπτών. Τέλος, επισημαίνεται η ανάγκη για μεγαλύτερα και πιο αντιπροσωπευτικά
σύνολα δεδομένων, ώστε να ενισχυθεί περαιτέρω η αξιοπιστία και η πρακτική εφαρμογή των μοντέλων
στον τουριστικό κλάδο.

