Εμφάνιση απλής εγγραφής

dc.contributor.advisorΚυριαζής, Δημοσθένης
dc.contributor.authorΛουλάκη, Μαρίνα
dc.date.accessioned2025-10-06T08:39:21Z
dc.date.available2025-10-06T08:39:21Z
dc.date.issued2025-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18173
dc.description.abstractΚατά την τελευταία δεκαετία, ο όγκος των δεδομένων που παράγονται έχει αυξηθεί δραστικά και η τάση αυτή αναμένεται να συνεχιστεί τα επόμενα χρόνια. Στον τομέα της υγειονομικής περίθαλψης, η ανάπτυξη αυτή είναι ιδιαίτερα σημαντική, καθώς η παραγωγή δεδομένων εξελίσσεται ραγδαία και διαθέτει τεράστιες δυνατότητες για την πρόοδο της κλινικής πρακτικής και της έρευνας. Ο απώτερος σκοπός της συλλογής, τόσο μεγάλων όγκων δεδομένων, είναι η δυνατότητα παραγωγής ακριβών και στοχευμένων προβλέψεων, οι οποίες μπορούν να βελτιώσουν τη διαδικασία λήψης αποφάσεων. Για να επιτευχθεί αυτό ωστόσο, δεν απαιτείται μόνο μεγάλος όγκος δεδομένων, αλλά και δεδομένα υψηλής ποιότητας και αξιοπιστίας. Στην πράξη, τα δεδομένα συχνά εμφανίζονται σε διαφορετικές μορφές και τύπους, με παρόμοιες πληροφορίες να αποθηκεύονται κάτω από διαφορετικά ονόματα μεταβλητών ή δομές. Αυτό δημιουργεί σημαντικές προκλήσεις ετερογένειας και καθιστά απαραίτητη τη διαδικασία ομογενοποίησης και ενοποίησης των δεδομένων. Η ομογενοποίηση των δεδομένων στοχεύει στη συνένωση δεδομένων από πολλαπλές αυτόνομες και ετερογενείς πηγές, σε ένα ενοποιημένο σύνολο, εξαλείφοντας τα προβλήματα που μπορεί να παρουσιάσουν, όπως διπλότυπες εγγραφές, αλλά και τυποποιώντας τα δεδομένα, έτσι ώστε να καθίσταται δυνατή η ομοιόμορφη πρόσβαση και μια ενιαία, συγκεντρωτική εικόνα. Παράλληλα, τα ακατέργαστα δεδομένα (raw data) περιέχουν συχνά λανθασμένες τιμές, οι οποίες υποβαθμίζουν την ποιότητά τους. Για τον λόγο αυτό, η προ επεξεργασία μέσω κατάλληλων τεχνικών καθαρισμού δεδομένων αποτελεί αναγκαίο βήμα, το οποίο περιλαμβάνει μια σειρά ενεργειών για τη διασφάλιση της ακρίβειας, της πληρότητας και της αξιοπιστίας των δεδομένων. Προς αυτή την κατεύθυνση, στην παρούσα διπλωματική εργασία παρουσιάζεται αρχικά μια βιβλιογραφική ανασκόπηση των υφιστάμενων μεθόδων για την ενοποίηση ετερογενών πηγών δεδομένων και, στη συνέχεια, παρουσιάζονται τεχνικές και αλγόριθμοι καθαρισμού που διασφαλίζουν την ποιότητάς τους. Επιπλέον, προτείνεται ένα πρακτικό περιβάλλον, όπου ο χρήστης μπορεί να εφαρμόσει τους συγκεκριμένους αλγορίθμους σε δεδομένα υγείας. Δεδομένης της ιδιαίτερης σημασίας τους, έχει την δυνατότητα να τα ομογενοποιήσει, να τα καθαρίσει και να διασφαλίσει την αξιοπιστία τους. Καταλήγοντας, μπορεί να αξιολογήσει την απόδοση της κάθε μεθόδου και να λάβει περισσότερες πληροφορίες σχετικά με τη συγκριτική αποτελεσματικότητα της κάθε μεθόδου.el
dc.format.extent103el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleΑλγόριθμοι ομογενοποίησης και διασφάλισης ποιότητας δεδομένωνel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENOver the last decade, the volume of data being generated has drastically increased, and this trend is expected to continue in the coming years. In the healthcare domain, this growth is particularly significant, as data production is rapidly evolving and holds great potential for advancing clinical practice and research. The ultimate purpose of collecting such large volumes of data is to enable accurate and targeted predictions that can improve decision-making. To achieve this, however, not only is a substantial quantity of data is required, but also data of high quality that can be reliable. In practice, data often comes in various forms and formats, with similar information being stored under different variable names or structures. This creates significant heterogeneity challenges and makes the process of data homogenization and integration essential. Data homogenization aims to combine data from multiple autonomous and heterogeneous sources into a unified dataset by addressing issues such as duplicate records, and standardizing data, so that uniform access and a consolidated view can be achieved. At the same time, raw data often contains numerous erroneous values that compromise their quality. For this reason, preprocessing through appropriate data cleaning techniques is an imperative step, including a series of actions to ensure accuracy, completeness, and reliability. To this end, this thesis first provides a literature review on existing methods for integrating heterogeneous data sources, followed by techniques and algorithms for data cleaning to ensure data quality. Furthermore, a practical environment is proposed, allowing users to apply these algorithms to healthcare data, given their particular importance, in order to homogenize, clean, and ensure the reliability of the data. Finally, users are able to evaluate the performance of each method and obtain additional insights regarding their comparative effectiveness.el
dc.contributor.masterΠληροφοριακά Συστήματα και Υπηρεσίεςel
dc.subject.keywordΟμογενοποίηση δεδομένωνel
dc.subject.keywordΕτερογενείς πηγές δεδομένωνel
dc.subject.keywordΚαθαρισμός δεδομένωνel
dc.subject.keywordΠοιότητα δεδομένωνel
dc.subject.keywordΤεχνικές προ-επεξεργασίαςel
dc.subject.keywordΑλγόριθμοι επεξεργασίας δεδομένωνel
dc.date.defense2025-09-17


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»