dc.contributor.advisor | Τζαβελάς, Γεώργιος | |
dc.contributor.author | Χαλκιά, Μαρία - Ελένη | |
dc.date.accessioned | 2023-08-24T07:52:53Z | |
dc.date.available | 2023-08-24T07:52:53Z | |
dc.date.issued | 2023-07 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/15649 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/3071 | |
dc.description.abstract | Η παρούσα διπλωματική εργασία επικεντρώνεται στην κατανομή Pareto, τις μεθόδους εκτίμησης
των παραμέτρων της, καθώς και στην αξιολόγηση των εκτιμητών αυτών. Ο κύριος σκοπός της
εργασίας είναι η ανάλυση και η εξέταση της κατανομής Pareto με βάση πραγματικά δεδομένα,
καθώς και η προσαρμογή της κατανομής σε αυτά τα δεδομένα.
Αρχικά, γίνεται μια εισαγωγή στην κατανομή και η σημασία της σε διάφορους τομείς.
Εξετάζεται το θεωρητικό υπόβαθρο της κατανομής, συμπεριλαμβανομένου του ιστορικού, της
μαθηματικής μορφής, των μέτρων θέσης, διασποράς και ροπής, καθώς και της λοξότητας και
κύρτωσης. Επίσης, αναλύονται οι βασικές ιδιότητες της κατανομής Pareto και παρουσιάζονται οι
συναρτήσεις επιβίωσης και μέσης υπολειπόμενης ζωής.
Στο τρίτο κεφάλαιο, αναλύονται μια σειρά μεθόδων εκτίμησης των παραμέτρων της
κατανομής Pareto. Αρχικά, παρουσιάζεται η παραμετροποίηση της κατανομής, που περιλαμβάνει
τη μορφή της κατανομής και τις παραμέτρους της. Με τη χρήση αυτών των μεθόδων εκτίμησης,
είναι δυνατόν να εκτιμηθούν οι παράμετροι και να προσαρμοστεί η κατανομή στα παρατηρούμενα
δεδομένα.
Στο τέταρτο κεφάλαιο περιγράφονται λεπτομερώς τα μέτρα καλής προσαρμογής που
χρησιμοποιούνται για την αξιολόγηση των εκτιμητών και παρουσιάζονται οι στατιστικές
συναρτήσεις που χρησιμοποιούνται για τον υπολογισμό τους. Αυτά τα μέτρα περιλαμβάνουν τον
δείκτη Kolmogorov-Smirnov (KS), τον δείκτη Cramér-von Mises (CvM) και τον δείκτη
Anderson-Darling (AD). Κάθε μέτρο έχει τη δική του στατιστική συνάρτηση που χρησιμοποιείται
για τον υπολογισμό του και αποτελεί μια ποσοτική μέτρηση της προσαρμογής των εκτιμητών στα
δεδομένα Pareto. Η παρουσίαση αυτών των στατιστικών συναρτήσεων επιτρέπει την ακριβή και
αντικειμενική αξιολόγηση της απόδοσης των εκτιμητών.
Στο πέμπτο κεφάλαιο αναλύεται η δυσκολία των κατανομών να περιγράψουν πλήρως ένα
σύνολο δεδομένων σε όλο το εύρος τους. Υποστηρίζεται ότι οι κατανομές μπορούν να
περιγράψουν ικανοποιητικά τις μικρές ή μεσαίες τιμές, αλλά όχι τις μεγάλες. Παρουσιάζονται οι
γενικές μορφές των σύνθετων (composite) συναρτήσεων, ειδικότερα της εκθετικής και της Pareto,
καθώς και η σχετική μορφή της hazard.
Το έκτο κεφάλαιο επικεντρώνεται στους ευνοϊκούς εκτιμητές (favorable estimators) της
κατανομής Pareto. Αρχικά, γίνεται μια εισαγωγή στο θέμα και αναλύονται τα μέτρα καλής
προσαρμογής, τα οποία χρησιμοποιούνται για να αξιολογηθεί η προσαρμογή του μοντέλου στα
δεδομένα. Ένα σημαντικό μέτρο καλής προσαρμογής είναι το σημείο απώλειας, το οποίο
υπολογίζει το ποσοστό των παρατηρήσεων που πέφτουν έξω από την προσαρμοσμένη κατανομή.
Στη συνέχεια, εξετάζεται το κριτήριο ευρωστίας, το οποίο χρησιμοποιεί τη διακύμανση των
εκτιμητών ως ένα μέτρο της αστάθειας της εκτίμησης και παρουσιάζονται διάφοροι ευνοϊκοί
εκτιμητές της κατανομής. Αυτοί περιλαμβάνουν εκτιμητές ποσοστημορίων, εκτιμητές κομμένου
μέσου όρου και γενικευμένους εκτιμητές διαμέσων. Κάθε εκτιμητής έχει τις δικές του ιδιότητες
και περιορισμούς και χρησιμοποιείται ανάλογα με την εφαρμογή και τα δεδομένα που διαθέτουμε.
Στο έβδομο κεφάλαιο της διπλωματικής αναλύεται η εφαρμογή όλων των εκτιμητών σε
πραγματικά δεδομένα και παρουσιάζονται σημαντικά συμπεράσματα σχετικά με την απόδοση και
την ακρίβεια των εκτιμητών. Αρχικά, περιγράφεται η επιλογή του δείγματος και η μεθοδολογία
που ακολουθήθηκε για την αξιολόγηση των εκτιμητών. Εξηγείται ο τρόπος υπολογισμού των
εκτιμητών και παρουσιάζονται γραφήματα που απεικονίζουν την αρχική εκτίμηση προσαρμογής
των δεδομένων. Στη συνέχεια, παρουσιάζονται οι στατιστικοί έλεγχοι που πραγματοποιήθηκαν
και τα αποτελέσματα τους. Τέλος, γίνεται η κατάταξη των εκτιμητών βάσει της ανθεκτικότητάς
τους και της απόδοσής τους, προκειμένου να προκύψουν συγκεκριμένες συστάσεις για την
επιλογή του βέλτιστου εκτιμητή. Οι αναλύσεις και τα αποτελέσματα αυτά συνοψίζουν την
αξιοπιστία και την απόδοση των εκτιμητών και αποτελούν σημαντική συνεισφορά στην
κατανόηση του μοντέλου. Τα σχήματα, ο προσδιορισμός των εκτιμητών και οι αντίστοιχοι έλεγχοι
πραγματοποιήθηκαν με χρήση της Mathematica. | el |
dc.format.extent | 99 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.title | Εφαρμογές της κατανομής Pareto σε δεδομένα αναλογισμού | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Χρηματοοικονομικής και Στατιστικής. Τμήμα Στατιστικής και Ασφαλιστικής Επιστήμης | el |
dc.description.abstractEN | The present thesis focuses on the Pareto distribution, the estimating methods of its parameters, and
the evaluation of them. The main objective of the thesis is to analyze and examine the Pareto
distribution based on real data, as well as to fit the distribution to this data.
Initially, an introduction to the Pareto distribution is provided, along with its significance
in various fields. The theoretical background of the distribution is examined, including its history,
mathematical form, measures of location, dispersion, and moments, as well as skewness and
kurtosis. Furthermore, the basic properties of the Pareto distribution are analyzed, and the survival
and mean residual life functions are presented.
In the third chapter, a series of methods for estimating the parameters of the Pareto
distribution are discussed. Firstly, the parameterization of the distribution is presented, which
includes the form of the distribution and its parameters. Using these estimation methods, it is
possible to estimate the parameters of the Pareto distribution and fit the distribution to observed
data.
The fourth chapter provides a detailed description of goodness-of-fit measures used for
evaluating the estimators, and the statistical functions used to compute them. These measures
include the Kolmogorov-Smirnov (KS) statistic, the Cramér-von Mises (CvM) statistic, and the
Anderson-Darling (AD) statistic. Each measure has its own statistical function used for its
computation and represents a quantitative measure of the fit of the estimators to the Pareto data.
The presentation of these statistical functions allows for accurate and objective evaluation of the
performance of the estimators.
In the fifth chapter, the difficulty of distributions to fully describe a dataset across its entire
range is analyzed. It is argued that distributions can adequately describe small or medium values
but not the large ones. The general forms of composite functions, specifically the exponential and
Pareto distributions, are presented, along with their respective hazard functions.
The sixth chapter focuses on the favorable estimators of the Pareto distribution. Initially,
an introduction to the topic is provided, and the goodness-of-fit measures used to assess the fit of
the Pareto model to the data are analyzed. An important measure of goodness-of-fit is the loss
function, which calculates the percentage of observations falling outside the fitted distribution.
Furthermore, the criterion of robustness is examined, which uses the variance of the estimators as
a measure of estimation instability, and various favorable estimators of the Pareto distribution are
presented. These include percentile estimators, truncated mean estimators, and generalized median
estimators. Each estimator has its own properties and limitations and is used according to the
application and available data.
The seventh chapter analyzes the application of all estimators to real data and presents
significant conclusions regarding the performance and accuracy of the estimators. Initially, the
selection of the sample and the methodology followed for the evaluation of the estimators are
described. The computation of the estimators is explained, and graphs depicting the initial fitting
of the data are presented. Subsequently, the conducted statistical tests and their results are
presented. Finally, a ranking of the estimators based on their robustness and performance is
performed to derive specific recommendations for selecting the optimal estimator. These analyses
and results summarize the reliability and performance of the estimators and contributes to the
better understanding of the model. The graphs, determination of estimators, and corresponding
tests were conducted using Mathematica. | el |
dc.contributor.master | Αναλογιστική Επιστήμη και Διαχείριση Κινδύνων | el |
dc.subject.keyword | Κατανομή Pareto | el |
dc.date.defense | 2023-07-27 | |