dc.contributor.advisor | Κούτρας, Μάρκος | |
dc.contributor.author | Μυλωνίδης, Στέφανος | |
dc.date.accessioned | 2018-05-14T08:00:21Z | |
dc.date.available | 2018-05-14T08:00:21Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/11202 | |
dc.description.abstract | Το πεδίο της Διαχωριστικής Ανάλυσης παρουσιάζει ιδιαίτερο ενδιαφέρον, τόσο σε ερευνητικό επίπεδο, όσο και σε επίπεδο πρακτικής εφαρμογής στο χώρο των επιχειρήσεων, σε ένα ευρύ πεδίο δραστηριοτήτων. Στον Χρηματοπιστωτικό τομέα, τα τραπεζικά ιδρύματα ενδιαφέρονται για τον έγκαιρο εντοπισμό των πελατών με υψηλή πιστοληπτική διαβάθμιση, προκειμένου να αποφανθούν για την χορήγηση ή μη πίστωσης, στον τομέα της Ιατρικής Επιστήμης, προκειμένου να εντοπιστούν και προληπτικά αντιμετωπιστούν σοβαρές ασθένειες, με βάση τα επίπεδα τιμών συγκεκριμένων ιατρικών δεικτών και συναφών συμπτωμάτων, στον τομέα των Κοινωνικών Επιστημών και της Εγκληματολογίας, προκειμένου να εντοπιστούν κοινωνικές ομάδες συγκεκριμένου ενδιαφέροντος ή κινδύνου, με κριτήριο μία σειρά από χαρακτηριστικά (δημογραφικά, ιατρικά, οικονομικά κλπ.), καθώς και στον τομέα του Marketing, προκειμένου να αποφασιστεί το κατά πόσον ένα συγκεκριμένο τμήμα της Αγοράς, κρίνεται κατάλληλο για την τοποθέτηση και ανάπτυξη νέων προϊοντικών κατηγοριών ή υπηρεσιών. Βασικός σκοπός της διαχωριστικής διαδικασίας είναι να κατατάξει τις υπό μελέτη πειραματικές μονάδες, σε έναν από πολλούς γνωστούς πληθυσμούς, με βάση τις τιμές επιλεχθέντων παρατηρούμενων χαρακτηριστικών. Το παραπάνω καθίσταται εφικτό, μέσω της διαμόρφωσης κατάλληλου διαχωριστικού κανόνα, βάση του οποίου κατατάσσεται κάθε πειραματική μονάδα, σε έναν από τους διαθέσιμους πληθυσμούς.
Στην παρούσα διπλωματική εργασία, αναπτύσσεται λεπτομερώς το θεωρητικό πλαίσιο της μεθόδου Πολυωνυμικής Λογιστικής Παλινδρόμησης, καθώς και των Διαχωριστικών Αλγορίθμων ID3, C4_5 και CART. Ακολούθως, δίδονται συγκεκριμένα παραδείγματα εφαρμογής εκάστης μεθόδου, προκειμένου να καταστεί ευκολότερη η κατανόηση των σχετικών εννοιών θεμελίωσής τους. Καταληκτικά, πραγματοποιείται εκτενής εφαρμογή της μεθόδου Πολυωνυμικής Λογιστικής Παλινδρόμησης, καθώς και του διαχωριστικού αλγορίθμου C 4_5, σε πρωτογενές σύνολο δεδομένων, προκειμένου να διαχωριστούν οι φορολογούμενοι συγκεκριμένης χώρας, ως προς την οικογενειακή τους κατάσταση, πληροφορία η οποία είναι χρήσιμη στις φορολογικές αρχές, για την αποτελεσματικότερη φορολογική διαχείριση των μη μονίμων κατοίκων αλλοδαπής εθνικότητας. Η απόδοση και διαχωριστική ακρίβεια των δύο μεθόδων η οποία επιτεύχθηκε, κρίνεται απολύτως συγκρίσιμη σε σύνολα δεδομένων, τα οποία είναι πλήρη επί των χρησιμοποιούμενων χαρακτηριστικών, δηλαδή χωρίς την εμφάνιση ελλειπουσών τιμών, ενώ στην περίπτωση ενσωμάτωσης χαρακτηριστικών με υψηλό ποσοστό ελλειπουσών τιμών και μετέπειτα διαχείρισης αυτών, ο διαχωριστικός αλγόριθμος C 4_5, εμφανίστηκε ανθεκτικότερος, σημειώνοντας καλύτερη ακρίβεια διαχωρισμού, σε σχέση με εκείνον της Πολυωνυμικής Λογιστικής Παλινδρόμησης. | el |
dc.format.extent | 86 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Σύγκριση τεχνικών διαχωριστικής ανάλυσης | el |
dc.title.alternative | Comparison of discrimination techniques | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
dc.description.abstractEN | The field of Discriminant Analysis is of particular interest, both at the research scientific area, as well as, the direction of practical application in the field of business, in a wide range of activities. The main purpose of the discrimination process is to classify the experimental units under study, to one of many known populations, based on the values of specific observed characteristics. The above is made possible through the formation of an appropriate discrimination rule, based on which each experimental unit is classified, in one of the above mentioned available populations.
Along the specific diploma thesis, the theoretical framework of the Polynomial Logistic Regression method, as well as the ID3, C4_5 and CART Algorithms, is thoroughly presented. Next, specific examples are given of each method, in order to make it easier to understand their concepts of foundation. Finally, extensive use of the Polynomial Logistic Regression method and the C 4_5 algorithm is performed, in a primary set of data, so as to separate taxpayers of a given country, in terms of their marital status, which is particular useful to the tax authorities, for tax administration of non-residents of a foreign nationality. The efficiency and separation accuracy of the two methods achieved, is judged to be entirely comparable to data sets, which are complete on the characteristics under consideration, without the occurrence of missing values, whereas in the case of incorporation of features with a high percentage of missing values and subsequent management of them, the C 4_5 algorithm appeared to be more robust, showing better separation accuracy than that of the Polynomial Logistic Regression. | el |
dc.contributor.master | Εφαρμοσμένη Στατιστική | el |
dc.subject.keyword | Εποπτευόμενη μάθηση | el |
dc.subject.keyword | Διαχωριστική ανάλυση | el |
dc.subject.keyword | Discriminant methods | el |
dc.subject.keyword | Classification | el |
dc.subject.keyword | Supervised learning | el |
dc.date.defense | 2018-05-10 | |