dc.contributor.advisor | Δουλκερίδης, Χρήστος | |
dc.contributor.advisor | Doulkeridis, Christos | |
dc.contributor.author | Κουτσιμπογιώργος, Γρηγόριος | |
dc.contributor.author | Koutsimpogiorgos, Grigorios | |
dc.date.accessioned | 2023-10-05T10:35:54Z | |
dc.date.available | 2023-10-05T10:35:54Z | |
dc.date.issued | 2023-09 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/15766 | |
dc.identifier.uri | http://dx.doi.org/10.26267/unipi_dione/3188 | |
dc.description.abstract | Στη σημερινή ψηφιακή εποχή, η αύξηση στον όγκο, την ποικιλομορφία και την ταχύτητα των δεδομένων έχει καταστήσει αναγκαία την αναζήτηση προηγμένων τεχνικών αποθήκευσης και ανάλυσης μεγάλων δεδομένων. Η συνεχής βελτίωση των υπολογιστών και η ανάπτυξη νέων τεχνολογιών για την αποθήκευση και επεξεργασία δεδομένων επεκτείνουν τις παραδοσιακές τεχνολογίες αποθήκευσης δεδομένων και πλαισίων ανάλυσης. Πολλοί οργανισμοί στρέφονται σε κατανεμημένα υπολογιστικά συστήματα για την επεξεργασία και ανάλυση μεγάλων συνόλων δεδομένων.
Μία από τις πιο δημοφιλείς τεχνολογίες σε αυτόν τον τομέα είναι το Apache Spark, ένα γρήγορο και γενικής χρήσης σύστημα που λειτουργεί πάνω σε υπολογιστικούς κόμβους. Ωστόσο, τα παραδοσιακά σχεσιακά συστήματα βάσεων δεδομένων, όπως η Oracle, χρησιμοποιούνται ακόμα ευρέως για την αποθήκευση και ανάκτηση δεδομένων. Σε αυτήν την διπλωματική εργασία συγκρίνουμε την απόδοση ενός συγκεκριμένου συνόλου ερωτημάτων, πάνω σε ένα σύνολο δεδομένων συλλεγμένα από αισθητήρες οχημάτων, που εκτελέστηκαν τόσο σε ένα παραδοσιακό σύστημα σχεσιακής βάσης δεδομένων όσο και στο Apache Spark . Στόχος μας είναι να προσδιορίσουμε εάν οι σύγχρονες τεχνολογίες μπορούν να επιτύχουν ίση ή ακόμα καλύτερη απόδοση από τις σχεσιακές βάσεις δεδομένων όταν πρόκειται για την επεξεργασία και ανάλυση μεγάλων συνόλων δεδομένων, όπως στην περίπτωσή μας. Επιπλέον, η εργασία εξερευνά τις τεχνικές βελτιστοποίησης που μπορούν να χρησιμοποιηθούν για τη βελτίωση της απόδοσης του Spark καθώς και της Oracle. | el |
dc.format.extent | 53 | el |
dc.language.iso | en | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Comparative analysis of SQL queries performance on vehicle sensor data in RDBMS and Apache Spark | el |
dc.title.alternative | Συγκριτική ανάλυση της απόδοσης ερωτημάτων SQL μεταξύ ΣΔΒΔ και Apache Spark για δεδομένα οχημάτων | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων | el |
dc.description.abstractEN | In today's digital era, the exponential growth in data volume, variety, and velocity has necessitated the exploration of advanced techniques for storing and analyzing big data. The continuous improvement of hardware has led to the development of new technologies for data storage and processing by expanding the traditional data storages technologies and analysis frameworks. Many organizations are turning to distributed computing frameworks to process and analyze large datasets.
One of the most popular technologies in this field is Apache Spark, a fast and general-purpose cluster computing system. However, traditional relational databases, such as Oracle, are still widely used for data storage and retrieval. In this thesis we are comparing the performance of a specific set of queries, on a Vehicle Sensor Dataset, executed on both a traditional RDBMS system as well as on Apache spark. Our goal is to determine whether modern technologies can perform as well or even better than relational databases when it comes to processing and analyzing large data sets like in our case. Additionally, the thesis explores the optimization techniques that can be used to improve the performance of Spark and Oracle. | el |
dc.contributor.master | Ψηφιακά Συστήματα και Υπηρεσίες | el |
dc.subject.keyword | Apache Spark | el |
dc.subject.keyword | RDBMS | el |
dc.subject.keyword | Big data | el |
dc.date.defense | 2023-09-22 | |