Show simple item record

Σύγκριση τεχνικών διαχωριστικής ανάλυσης

dc.contributor.advisorΚούτρας, Μάρκος
dc.contributor.authorΜυλωνίδης, Στέφανος
dc.date.accessioned2018-05-14T08:00:21Z
dc.date.available2018-05-14T08:00:21Z
dc.date.issued2018
dc.identifier.urihttp://dione.lib.unipi.gr/xmlui/handle/unipi/11202
dc.description.abstractΤο πεδίο της Διαχωριστικής Ανάλυσης παρουσιάζει ιδιαίτερο ενδιαφέρον, τόσο σε ερευνητικό επίπεδο, όσο και σε επίπεδο πρακτικής εφαρμογής στο χώρο των επιχειρήσεων, σε ένα ευρύ πεδίο δραστηριοτήτων. Στον Χρηματοπιστωτικό τομέα, τα τραπεζικά ιδρύματα ενδιαφέρονται για τον έγκαιρο εντοπισμό των πελατών με υψηλή πιστοληπτική διαβάθμιση, προκειμένου να αποφανθούν για την χορήγηση ή μη πίστωσης, στον τομέα της Ιατρικής Επιστήμης, προκειμένου να εντοπιστούν και προληπτικά αντιμετωπιστούν σοβαρές ασθένειες, με βάση τα επίπεδα τιμών συγκεκριμένων ιατρικών δεικτών και συναφών συμπτωμάτων, στον τομέα των Κοινωνικών Επιστημών και της Εγκληματολογίας, προκειμένου να εντοπιστούν κοινωνικές ομάδες συγκεκριμένου ενδιαφέροντος ή κινδύνου, με κριτήριο μία σειρά από χαρακτηριστικά (δημογραφικά, ιατρικά, οικονομικά κλπ.), καθώς και στον τομέα του Marketing, προκειμένου να αποφασιστεί το κατά πόσον ένα συγκεκριμένο τμήμα της Αγοράς, κρίνεται κατάλληλο για την τοποθέτηση και ανάπτυξη νέων προϊοντικών κατηγοριών ή υπηρεσιών. Βασικός σκοπός της διαχωριστικής διαδικασίας είναι να κατατάξει τις υπό μελέτη πειραματικές μονάδες, σε έναν από πολλούς γνωστούς πληθυσμούς, με βάση τις τιμές επιλεχθέντων παρατηρούμενων χαρακτηριστικών. Το παραπάνω καθίσταται εφικτό, μέσω της διαμόρφωσης κατάλληλου διαχωριστικού κανόνα, βάση του οποίου κατατάσσεται κάθε πειραματική μονάδα, σε έναν από τους διαθέσιμους πληθυσμούς. Στην παρούσα διπλωματική εργασία, αναπτύσσεται λεπτομερώς το θεωρητικό πλαίσιο της μεθόδου Πολυωνυμικής Λογιστικής Παλινδρόμησης, καθώς και των Διαχωριστικών Αλγορίθμων ID3, C4_5 και CART. Ακολούθως, δίδονται συγκεκριμένα παραδείγματα εφαρμογής εκάστης μεθόδου, προκειμένου να καταστεί ευκολότερη η κατανόηση των σχετικών εννοιών θεμελίωσής τους. Καταληκτικά, πραγματοποιείται εκτενής εφαρμογή της μεθόδου Πολυωνυμικής Λογιστικής Παλινδρόμησης, καθώς και του διαχωριστικού αλγορίθμου C 4_5, σε πρωτογενές σύνολο δεδομένων, προκειμένου να διαχωριστούν οι φορολογούμενοι συγκεκριμένης χώρας, ως προς την οικογενειακή τους κατάσταση, πληροφορία η οποία είναι χρήσιμη στις φορολογικές αρχές, για την αποτελεσματικότερη φορολογική διαχείριση των μη μονίμων κατοίκων αλλοδαπής εθνικότητας. Η απόδοση και διαχωριστική ακρίβεια των δύο μεθόδων η οποία επιτεύχθηκε, κρίνεται απολύτως συγκρίσιμη σε σύνολα δεδομένων, τα οποία είναι πλήρη επί των χρησιμοποιούμενων χαρακτηριστικών, δηλαδή χωρίς την εμφάνιση ελλειπουσών τιμών, ενώ στην περίπτωση ενσωμάτωσης χαρακτηριστικών με υψηλό ποσοστό ελλειπουσών τιμών και μετέπειτα διαχείρισης αυτών, ο διαχωριστικός αλγόριθμος C 4_5, εμφανίστηκε ανθεκτικότερος, σημειώνοντας καλύτερη ακρίβεια διαχωρισμού, σε σχέση με εκείνον της Πολυωνυμικής Λογιστικής Παλινδρόμησης.el
dc.format.extent86el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Διεθνές*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.titleΣύγκριση τεχνικών διαχωριστικής ανάλυσηςel
dc.title.alternativeComparison of discrimination techniquesel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμηςel
dc.description.abstractENThe field of Discriminant Analysis is of particular interest, both at the research scientific area, as well as, the direction of practical application in the field of business, in a wide range of activities. The main purpose of the discrimination process is to classify the experimental units under study, to one of many known populations, based on the values of specific observed characteristics. The above is made possible through the formation of an appropriate discrimination rule, based on which each experimental unit is classified, in one of the above mentioned available populations. Along the specific diploma thesis, the theoretical framework of the Polynomial Logistic Regression method, as well as the ID3, C4_5 and CART Algorithms, is thoroughly presented. Next, specific examples are given of each method, in order to make it easier to understand their concepts of foundation. Finally, extensive use of the Polynomial Logistic Regression method and the C 4_5 algorithm is performed, in a primary set of data, so as to separate taxpayers of a given country, in terms of their marital status, which is particular useful to the tax authorities, for tax administration of non-residents of a foreign nationality. The efficiency and separation accuracy of the two methods achieved, is judged to be entirely comparable to data sets, which are complete on the characteristics under consideration, without the occurrence of missing values, whereas in the case of incorporation of features with a high percentage of missing values and subsequent management of them, the C 4_5 algorithm appeared to be more robust, showing better separation accuracy than that of the Polynomial Logistic Regression.el
dc.contributor.masterΕφαρμοσμένη Στατιστικήel
dc.subject.keywordΕποπτευόμενη μάθησηel
dc.subject.keywordΔιαχωριστική ανάλυσηel
dc.subject.keywordDiscriminant methodsel
dc.subject.keywordClassificationel
dc.subject.keywordSupervised learningel
dc.date.defense2018-05-10


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές
Except where otherwise noted, this item's license is described as
Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»