Query optimization with deep learning architectures

Goulas, Theodoros

dc.contributor.advisor	Konstantopoulos, Stasinos
dc.contributor.advisor	Κωνσταντόπουλος, Στασινός
dc.contributor.author	Goulas, Theodoros
dc.date.accessioned	2023-01-18T06:57:23Z
dc.date.available	2023-01-18T06:57:23Z
dc.date.issued	2022-06
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/15010
dc.identifier.uri	http://dx.doi.org/10.26267/unipi_dione/2432
dc.description.abstract	Η αυξανόμενη τάση μετάβασης από τα παραδοσιακά συγκεντρωμένα συστήματα βάσεων δεδομένων, σε αρχιτεκτονικές που δομούνται από κατανεμημένες μονάδες, αύξησε σημαντικά την πολυπλοκότητα του προβλήματος βελτιστοποίησης ερωτημάτων στις βάσεις δεδομένων, οδηγώντας σε περίπλοκους αλγορίθμους βελτιστοποίησης που βασίζονται σε αναλυτικές και στοχαστικές μεθόδους και αυξάνουν σημαντικά τις απαιτήσεις σε χρόνο και πόρους. Η παρούσα μελέτη προτείνει την χρήση τεχνικών επεξεργασίας φυσικής γλώσσας σε συνδυασμό με αρχιτεκτονικές Νευρωνικών Δικτύων ως στατιστική εναλλακτική λύση στην υφισταμένη αναλυτική προσέγγιση βελτιστοποίησης ερωτημάτων για την αντιμετώπιση αυτού του προβλήματος. Στα πλαίσια της παρούσας εργασίας, με βάση την παραδοχή ότι τα ερωτήματα σε μια βάση δεδομένων αλλά και το βέλτιστο πλάνο εκτέλεσης, αποτέλεσμα του optimizer της βάσης, πρόκειται για λεκτικές ακολουθίες, εξετάστηκε κατά πόσο μια αρχιτεκτονική sequence-to-sequence βαθύ νευρωνικού δικτύου (Neural Machine Translation) μπορεί να προβλέψει ή να προσεγγίσει επαρκώς το βέλτιστο πλάνο εκτέλεσης, δοθέντος ενός ερωτήματος σε μία υπάρχουσα βάση δεδομένων. Για την εκτέλεση των πειραμάτων χρησιμοποιήθηκε το σετ δεδομένων CoSQL, το οποίο φορτώθηκε σε μία PostgreSQL βάση. Με τη χρήση της εντολής EXPLAIN για κάθε ερώτημα πάνω στη βάση, παρήχθει το αντίστοιχο βέλτιστο πλάνο εκτέλεσης από τον optimizer της βάσης. Η λεκτική ακολουθία του ερωτήματος τροφοδοτήθηκε σαν είσοδο στο νευρωνικό δικτύο και το πλάνο εκτέλεσης χρησιμοποιήθηκε σαν επιθυμητή έξοδος για την εκπαίδευση του μοντέλου. Τα πειράματα που διεξήχθησαν έδειξαν ότι η πολυπλοκότητα και η δομή των ακολουθιών εισόδου και εξόδου υπερβαίνουν τις δυνατότητες μάθησης του προτεινόμενου βαθύ νευρωνικού δικτύου, παράγοντας αναποτελεσματικά ή ακόμη και μη εκπαιδεύσιμα μοντέλα. Ωστόσο, η συγκεκριμένη αρχιτεκτονική έδειξε υποσχόμενα αποτελέσματα όσον αφορά την εξαγωγή πολύτιμων πληροφοριών που οι συνήθεις optimizers μπορούν να χρησιμοποιήσουν ως υποδείξεις για να καταλήξουν σε ταχύτερες και ακριβέστερες αποφάσεις κατά τη διαδικασία βελτιστοποίησης όσον αφορά την εφαρμογή και τη σειρά εκτέλεσης των τελεστών.	el
dc.format.extent	62	el
dc.language.iso	en	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.title	Query optimization with deep learning architectures	el
dc.type	Master Thesis	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτων	el
dc.description.abstractEN	The increasing trend of moving from the old-fashioned centralized database systems into distributed ones significantly increased the query optimization problem's complexity, leading to complicated optimization algorithms based on time and resource-consuming analytical methods. This study proposes introducing natural language processing techniques combined with Deep Learning architectures as a statistical alternative to the traditional analytical query optimization approach to address this issue. In the context of this paper, based on the assumption that both the queries in a database and the corresponding optimal execution plans are text sequences, it was investigated whether a sequence-to-sequence deep neural network (Neural Machine Translation) architecture can adequately predict or approximate the optimal execution plan, given a query in an existing database. The experiment was based on the CoSQL dataset which was loaded into a PostgreSQL database and used to generate the experimental dataset. Using the EXPLAIN command for each query on the database, the corresponding optimal execution plan was generated by the database optimizer. The text sequence of each query was fed as input to the neural network and the optimal execution plan was used as the output for model training. The conducted experiments indicated that the complexity and the sparsity of the input and output sequences exceed the learning capabilities of the proposed deep neural network, producing inefficient or even non-trainable (resource-wise) models. However, the examined architecture showed promising results in extracting valuable insights that the ordinary optimizers can use as hints to conclude faster and more accurate decisions during the optimization process regarding operators' implementation and execution order.	el
dc.corporate.name	Institute of Informatics & Telecommunications at NCSR Demokritos	el
dc.contributor.master	Τεχνητή Νοημοσύνη - Artificial Intelligence	el
dc.subject.keyword	Query optimization	el
dc.subject.keyword	Deep learning	el
dc.subject.keyword	Natural language processing	el
dc.subject.keyword	Distributed databases	el
dc.date.defense	2022-06-20

Αρχεία σε αυτό το τεκμήριο

Name:: Query Optimization with Deep ...
Μέγεθος:: 1.245Mb
Τύπος:: PDF
Description:: Master thesis

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Τμήμα Ψηφιακών Συστημάτων
Department of Digital Systems

Εμφάνιση απλής εγγραφής

Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα