Design, optimization, development and explanation of artificial intelligence algorithms, capable of running on distributed big data systems, based on multidimensional and complex datasets
Σχεδιασμός, βελτιστοποίηση, ανάπτυξη και επεξήγηση αλγορίθμων μηχανικής και βαθιάς μάθησης, με δυνατότητα εκτέλεσης σε κατανεμημένα συστήματα μεγάλων δεδομένων, βασισμένα σε πολυδιάστατα και σύνθετα σύνολα δεδομένων
Doctoral Thesis
Συγγραφέας
Fatouros, Georgios D.
Φατούρος, Γεώργιος Δ.
Ημερομηνία
2024Επιβλέπων
Kyriazis, DimosthenisΚυριαζής, Δημοσθένης
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Artificial intelligence ; Large language models ; Chatgpt ; Financial analysis ; Retrieval augmented generation ; Knowledge mining ; Timeseries prediction ; Online learning ; Cloud computing ; Machine learning ; Deep learning ; Τεχνητή νοημοσύνη ; Μεγάλα γλωσσικά μοντέλα (LLMs) ; Χρηματοοικονομική ανάλυση ; Εξόρυξη γνώσης ; Πρόβλεψη χρονοσειρών ; Υπολογιστικό νέφος ; Μηχανική μάθηση ; Βαθιά μάθηση ; Ανάκτηση βάσει περιεχομένουΠερίληψη
Η εκθετική αύξηση των ψηφιακών δεδομένων και οι εξελίξεις στην Τεχνητή Νοημοσύνη (ΑΙ) έχουν επαναπροσδιορίσει τη λήψη αποφάσεων που βασίζεται σε δεδομένα σε διάφορους κλάδους. Ωστόσο, η διαχείριση και εκμετάλλευση σύνθετων, υψηλής διάστασης και διαφορετικών τύπων συνόλων δεδομένων παραμένει πρόκληση, ιδιαίτερα στους τομείς της χρηματοοικονομικής και του cloud computing, όπου η ποικιλία των δεδομένων, η προσαρμοστικότητα σε πραγματικό χρόνο και η ακρίβεια πρόβλεψης είναι κρίσιμες. H παρούσα διατριβή παρουσιάζει μεθοδολογίες ΑΙ με επίκεντρο τα δεδομένα, σχεδιασμένες να δημιουργούν ανθεκτικά και προσαρμοστικά συστήματα ικανά να επεξεργάζονται ποικίλα δεδομένα σε πολλαπλές μορφές και τομείς. Συγκεκριμένα, η διατριβή παρουσιάζει ένα Πλαίσιο Συλλογισμού και Γνώσης που αξιοποιεί οντολογίες και τεχνικές ανάκτησης-ενισχυμένης δημιουργίας (RAG) για την ενσωμάτωση, διαχείριση και επεξεργασία δομημένων και μη δομημένων δεδομένων. Αυτό επιτρέπει τη συνδυαστική χρήση διαφορετικών τύπων δεδομένων προερχόμενων από διαφορετικές πηγές. Επιπλέον, προτείνονται τεχνικές για τη βελτίωση της προσαρμοστικότητας μοντέλων ανάλυσης χρονοσειρών σε πραγματικό χρόνο, επιτρέποντας συνεχή ενημέρωση του συστήματος για την αποτύπωση εξελισσόμενων τάσεων και τη διατήρηση ισχυρής απόδοσης σε δυναμικά περιβάλλοντα. Παρουσιάζονται επίσης τεχνικές για βελτιστοποιημένη χρήση Μεγάλων Γλωσσικών Μοντέλων (LLMs) για ανάλυση και ταξινόμηση κειμένου, συγκρίνοντας την αποτελεσματικότητά τους με παραδοσιακές τεχνικές μεταφοράς μάθησης για ανάλυση συναισθήματος σε χρηματοοικονομικά άρθρα. Τέλος, προτείνεται ένα καινοτόμο σύστημα που συνδυάζει και επεκτείνει αυτές τις μεθοδολογίες, διαχειριζόμενο κείμενο, αριθμητικά δεδομένα και δεδομένα χρονοσειρών από ποικίλες πηγές, παρέχοντας μια ολοκληρωμένη λύση με εφαρμογές στον χρηματοπιστωτικό τομέα. Η διατριβή επικυρώνει τις προτεινόμενες μεθοδολογίες μέσω εφαρμογών στον πραγματικό κόσμο, όπως η πρόβλεψη χρονοσειρών για τη διαχείριση πόρων στο cloud computing, η αξιολόγηση χρηματοοικονομικού κινδύνου, η ανάλυση συναισθήματος και η συστηματική επιλογή μετοχών στη χρηματοοικονομική. Αυτές οι συνεισφορές επιδεικνύουν σημαντικές βελτιώσεις στη διαχείριση σύνθετων συνόλων δεδομένων, εξασφαλίζοντας προσαρμοστικότητα σε πραγματικό χρόνο και παρέχοντας ερμηνεύσιμα και αξιόπιστα αποτελέσματα με τη χρήση ΑΙ. Αντιμετωπίζοντας τις κοινές προκλήσεις της πολυπλοκότητας και της ετερογένειας των δεδομένων σε εφαρμογές του πραγματικού κόσμου μέσω συνδυασμένης χρήσης των προτεινόμενων μεθοδολογιών με επίκεντρο τα δεδομένα, αυτή η διατριβή προτείνει καινοτόμες λύσεις για την αποτελεσματική εκμετάλλευση ποικίλων και σύνθετων δεδομένων, συμβάλλοντας στην ανάπτυξη εφαρμοσμένων συστημάτων Τεχνητής Νοημοσύνης σε διάφορους τομείς.