Ανάλυση δεδομένων παραγγελιών και καταναλωτικής συμπεριφοράς σε ηλεκτρονική πλατφόρμα παραγγελιών φαγητού
Analysis of order data and consumer behavior on an online food ordering platform

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Ανάλυση δεδομένων ; Συμπεριφορά καταναλωτών ; Πρόβλεψη αποχώρησης πελατών ; Churn prediction ; Τμηματοποίηση πελατών ; Customer segmentation ; Μεθοδολογία RFM ; Μηχανική μάθηση ; Random forest ; Gradient boosting ; Ηλεκτρονικές πλατφόρμες παραγγελιών ; Customer analytics ; Data analytics ; Consumer behavior ; RFM analysis ; Machine learning ; Online food delivery platformsΠερίληψη
Η παρούσα διπλωματική εργασία εξετάζει τη συμπεριφορά πελατών σε πλατφόρμα ηλεκτρονικών
παραγγελιών φαγητού, αξιοποιώντας δεδομένα πραγματικών συναλλαγών, με στόχο τόσο την
περιγραφική ανάλυση καταναλωτικών μοτίβων όσο και την πρόβλεψη της αποχώρησης πελατών (churn).
Η μελέτη συνδυάζει τεχνικές ανάλυσης δεδομένων, τμηματοποίησης πελατών και προβλεπτικής
μοντελοποίησης, προκειμένου να αναδειχθούν επιχειρησιακά χρήσιμα συμπεράσματα για τη διαχείριση
πελατειακών σχέσεων και τη λήψη αποφάσεων βάσει δεδομένων.
Αρχικά, πραγματοποιείται εκτενής διερευνητική ανάλυση δεδομένων παραγγελιών, με έμφαση στη
συμπεριφορά χρηστών, τα χαρακτηριστικά καταστημάτων, τη γεωγραφική κατανομή της ζήτησης και
βασικούς δείκτες απόδοσης. Η ανάλυση βασίζεται σε σύνολο άνω του 1,4 εκατομμυρίου παραγγελιών και
καταδεικνύει έντονη συγκέντρωση της ζήτησης στα μεγάλα αστικά κέντρα, διαφοροποιήσεις μεταξύ
αλυσίδων και ανεξάρτητων καταστημάτων, καθώς και τη σημασία παραγόντων όπως οι αξιολογήσεις και
οι μέθοδοι πληρωμής.
Στη συνέχεια, εφαρμόζεται η μεθοδολογία RFM (Recency, Frequency, Monetary) για την τμηματοποίηση
των πελατών βάσει της αγοραστικής τους συμπεριφοράς. Μέσω αλγοριθμικής ομαδοποίησης
προκύπτουν τρία (3) διακριτά προφίλ πελατών, τα οποία παρουσιάζουν σημαντικές διαφοροποιήσεις τόσο
ως προς τη δραστηριότητα όσο και ως προς την πιθανότητα αποχώρησης. Η αποχώρηση ορίζεται
έμμεσα, μέσω της παρατεταμένης χρονικής αδράνειας, με χρήση ποσοστιαίου κατωφλίου της μεταβλητής
Recency, αποφεύγοντας φαινόμενα πληροφοριακής διαρροής (data leakage).
Στο τελικό στάδιο της ανάλυσης αναπτύσσονται και συγκρίνονται, υπό ενιαίο πλαίσιο αξιολόγησης,
προβλεπτικά μοντέλα αποχώρησης πελατών, και συγκεκριμένα μοντέλα λογιστικής παλινδρόμησης,
δέντρου απόφασης, Gradient Boosting και Random Forest. Τα μοντέλα αξιολογούνται με βάση μετρικές
διακριτικής ικανότητας (AUC, KS), ακρίβειας ταξινόμησης και επιχειρησιακής αποτελεσματικότητας (Lift
και cumulative gain). Τα αποτελέσματα δείχνουν ότι όλα τα μοντέλα επιτυγχάνουν υψηλή και σταθερή
απόδοση, με το Random Forest να παρουσιάζει οριακά ανώτερη επιχειρησιακή αποτελεσματικότητα στον
εντοπισμό πελατών υψηλού κινδύνου αποχώρησης, ενώ η λογιστική παλινδρόμηση διατηρεί το
πλεονέκτημα της ερμηνευσιμότητας.
Συνολικά, η εργασία καταδεικνύει ότι ο συνδυασμός RFM τμηματοποίησης και προβλεπτικής ανάλυσης
churn μπορεί να αποτελέσει ισχυρό εργαλείο υποστήριξης στρατηγικών αποφάσεων για ψηφιακές
πλατφόρμες, επιτρέποντας τον στοχευμένο εντοπισμό πελατών υψηλού κινδύνου και την
αποτελεσματικότερη εφαρμογή πολιτικών διατήρησης.

