Ανάπτυξη συστήματος ερωταποκρίσεων και σύνοψης εγγράφων με αξιοποίηση γλωσσικών μοντέλων και τεχνικών διανυσματικής αναζήτησης
Development of conversational interface and text summarizer using large language models

Bachelor Dissertation
Συγγραφέας
Κρομμύδας, Βασίλειος
Ημερομηνία
2025-09Επιβλέπων
Αποστόλου, ΔημήτριοςΠροβολή/ Άνοιγμα
Λέξεις κλειδιά
Απαντήσεις ερωτήσεων ; Σύνοψη ; RAG ; NLP ; FAISS ; Μοντέλα μετασχηματιστώνΠερίληψη
Η ταχεία διάδοση ψηφιακών εγγράφων σε πολλούς τομείς καθιστά αναγκαία την ανάπτυξη αποτελεσματικών και έξυπνων εργαλείων για την αυτοματοποιημένη εξαγωγή και σύνοψη πληροφοριών. Οι παραδοσιακές μέθοδοι αναζήτησης, βασισμένες στην αντιστοίχιση λέξεων-κλειδιών, συχνά αδυνατούν να παρέχουν ακριβείς και συμφραζόμενα σχετικές απαντήσεις, λόγω έλλειψης σημασιολογικής κατανόησης. Ο περιορισμός αυτός γίνεται ιδιαίτερα εμφανής σε μεγάλα αποθετήρια εγγράφων, όπου απαιτείται γρήγορη πρόσβαση σε σχετικό περιεχόμενο χωρίς χειροκίνητη αναζήτηση.
Η παρούσα εργασία παρουσιάζει ένα σύστημα ερωταποκρίσεων (QA) για έγγραφα PDF, αξιοποιώντας τεχνικές τεχνητής νοημοσύνης και Επεξεργασίας Φυσικής Γλώσσας (NLP),με στόχο την έξυπνη ανάκτηση πληροφοριών από τα επιθυμητά αρχεία. Το σύστημα συνδυάζει γλωσσικά μοντέλα τύπου «transformer» με διανυσματική αναζήτηση (vector search) για την ανάλυση, επεξεργασία και εξαγωγή ουσιαστικών συμπερασμάτων από PDF. Κύρια στοιχεία του είναι η μετατροπή του κειμένου εγγράφων σε αριθμητική μορφή, η σύνοψη του και η ενότητα ερωταποκρίσεων με χρήση γεννητικής τεχνητής νοημοσύνης, σχεδιασμένα για βελτίωση της ακρίβειας και της αποδοτικότητας.
Θα αναλυθούν η αρχιτεκτονική, οι λεπτομέρειες υλοποίησης και οι μετρικές αξιολόγησης, αναδεικνύοντας εφαρμογές στην έρευνα, την επιχειρηματική ευφυΐα και την ακαδημαϊκή κοινότητα. Τα πειραματικά αποτελέσματα καταδεικνύουν την ικανότητα του συστήματος να συνοψίζει περιεχόμενο με ακρίβεια και να παρέχει συμφραζόμενα σχετικές απαντήσεις ,καθιστώντας το αξιόπιστο εργαλείο για την έξυπνη πλοήγηση σε έγγραφα. Επιπλέον, θα εξεταστούν προκλήσεις όπως η διαχείριση σύνθετων ερωτημάτων, η διασφάλιση πραγματολογικής ακρίβειας και η επεκτασιμότητα ώστε να υποστηρίζεται η εφαρμογή της σε επιχειρησιακό περιβάλλον.
Τέλος, προτείνονται μελλοντικές βελτιώσεις που στοχεύουν στην βελτίωση της λειτουργικότητας και της εμπειρίας του χρήστη. Σε αυτές περιλαμβάνονται η υποστήριξη πολλαπλών γλωσσών, με σκοπό το σύστημα να είναι προσιτό σε ευρύτερο κοινό, η αναβάθμιση των τεχνικών σύνοψης για μεγαλύτερη ακρίβεια και περιεκτικότητα στις περιλήψεις, καθώς και βελτιώσεις στο περιβάλλον χρήστη (UI/UX) για καλύτερη εμπειρία του χρήστη. Οι παραπάνω βελτιώσεις αναμένεται να συμβάλλουν στην περαιτέρω αύξηση της αποτελεσματικότητας και της ευχρηστίας του συστήματος.


