Ανάπτυξη συστήματος ερωταποκρίσεων και σύνοψης εγγράφων με αξιοποίηση γλωσσικών μοντέλων και τεχνικών διανυσματικής αναζήτησης

Κρομμύδας, Βασίλειος

dc.contributor.advisor	Αποστόλου, Δημήτριος
dc.contributor.author	Κρομμύδας, Βασίλειος
dc.date.accessioned	2025-12-09T13:18:14Z
dc.date.available	2025-12-09T13:18:14Z
dc.date.issued	2025-09
dc.identifier.uri	https://dione.lib.unipi.gr/xmlui/handle/unipi/18678
dc.description.abstract	Η ταχεία διάδοση ψηφιακών εγγράφων σε πολλούς τομείς καθιστά αναγκαία την ανάπτυξη αποτελεσματικών και έξυπνων εργαλείων για την αυτοματοποιημένη εξαγωγή και σύνοψη πληροφοριών. Οι παραδοσιακές μέθοδοι αναζήτησης, βασισμένες στην αντιστοίχιση λέξεων-κλειδιών, συχνά αδυνατούν να παρέχουν ακριβείς και συμφραζόμενα σχετικές απαντήσεις, λόγω έλλειψης σημασιολογικής κατανόησης. Ο περιορισμός αυτός γίνεται ιδιαίτερα εμφανής σε μεγάλα αποθετήρια εγγράφων, όπου απαιτείται γρήγορη πρόσβαση σε σχετικό περιεχόμενο χωρίς χειροκίνητη αναζήτηση. Η παρούσα εργασία παρουσιάζει ένα σύστημα ερωταποκρίσεων (QA) για έγγραφα PDF, αξιοποιώντας τεχνικές τεχνητής νοημοσύνης και Επεξεργασίας Φυσικής Γλώσσας (NLP),με στόχο την έξυπνη ανάκτηση πληροφοριών από τα επιθυμητά αρχεία. Το σύστημα συνδυάζει γλωσσικά μοντέλα τύπου «transformer» με διανυσματική αναζήτηση (vector search) για την ανάλυση, επεξεργασία και εξαγωγή ουσιαστικών συμπερασμάτων από PDF. Κύρια στοιχεία του είναι η μετατροπή του κειμένου εγγράφων σε αριθμητική μορφή, η σύνοψη του και η ενότητα ερωταποκρίσεων με χρήση γεννητικής τεχνητής νοημοσύνης, σχεδιασμένα για βελτίωση της ακρίβειας και της αποδοτικότητας. Θα αναλυθούν η αρχιτεκτονική, οι λεπτομέρειες υλοποίησης και οι μετρικές αξιολόγησης, αναδεικνύοντας εφαρμογές στην έρευνα, την επιχειρηματική ευφυΐα και την ακαδημαϊκή κοινότητα. Τα πειραματικά αποτελέσματα καταδεικνύουν την ικανότητα του συστήματος να συνοψίζει περιεχόμενο με ακρίβεια και να παρέχει συμφραζόμενα σχετικές απαντήσεις ,καθιστώντας το αξιόπιστο εργαλείο για την έξυπνη πλοήγηση σε έγγραφα. Επιπλέον, θα εξεταστούν προκλήσεις όπως η διαχείριση σύνθετων ερωτημάτων, η διασφάλιση πραγματολογικής ακρίβειας και η επεκτασιμότητα ώστε να υποστηρίζεται η εφαρμογή της σε επιχειρησιακό περιβάλλον. Τέλος, προτείνονται μελλοντικές βελτιώσεις που στοχεύουν στην βελτίωση της λειτουργικότητας και της εμπειρίας του χρήστη. Σε αυτές περιλαμβάνονται η υποστήριξη πολλαπλών γλωσσών, με σκοπό το σύστημα να είναι προσιτό σε ευρύτερο κοινό, η αναβάθμιση των τεχνικών σύνοψης για μεγαλύτερη ακρίβεια και περιεκτικότητα στις περιλήψεις, καθώς και βελτιώσεις στο περιβάλλον χρήστη (UI/UX) για καλύτερη εμπειρία του χρήστη. Οι παραπάνω βελτιώσεις αναμένεται να συμβάλλουν στην περαιτέρω αύξηση της αποτελεσματικότητας και της ευχρηστίας του συστήματος.	el
dc.format.extent	39	el
dc.language.iso	el	el
dc.publisher	Πανεπιστήμιο Πειραιώς	el
dc.rights	Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα	*
dc.rights	Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/gr/	*
dc.title	Ανάπτυξη συστήματος ερωταποκρίσεων και σύνοψης εγγράφων με αξιοποίηση γλωσσικών μοντέλων και τεχνικών διανυσματικής αναζήτησης	el
dc.title.alternative	Development of conversational interface and text summarizer using large language models	el
dc.type	Bachelor Dissertation	el
dc.contributor.department	Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής	el
dc.description.abstractEN	The rapid proliferation of digital documents in many fields necessitates the development of effective and intelligent tools for automated extraction and summarization of information. Traditional search methods, based on keyword matching, often fail to provide accurate and contextually relevant answers due to a lack of semantic understanding. This limitation is particularly evident in large document repositories, where quick access to relevant content without manual searching is required. This paper presents a question-answering (QA) system for PDF documents, utilizing artificial intelligence and Natural Language Processing (NLP) techniques, with the aim of intelligently retrieving information from the desired files. The system combines transformer-type language models with vector search for the analysis, processing, and extraction of meaningful conclusions from PDFs. The main elements are the conversion of document text into numerical form, its summarization and the question-answering module using generative artificial intelligence, designed to improve accuracy and efficiency. The architecture, implementation details, and evaluation metrics will be analyzed, highlighting applications in research, business intelligence, and the academic community. Experimental results demonstrate the system's ability to accurately summarize content and provide contextually relevant answers, making it a reliable tool for intelligent document navigation. In addition, challenges such as handling complex queries, ensuring factual accuracy and scalability to support its implementation in an operational environment will be addressed. Finally, future improvements are proposed which aim to enhance functionality and user experience. These include multilingual support, with the aim of making the system accessible to a wider audience, upgrading summarization techniques for greater accuracy and comprehensiveness in summaries, and improvements to the user interface (UI/UX) for a better user experience. The above improvements are expected to contribute to further increasing the efficiency and usability of the system.	el
dc.subject.keyword	Απαντήσεις ερωτήσεων	el
dc.subject.keyword	Σύνοψη	el
dc.subject.keyword	RAG	el
dc.subject.keyword	NLP	el
dc.subject.keyword	FAISS	el
dc.subject.keyword	Μοντέλα μετασχηματιστών	el
dc.date.defense	2025-10-23

Files in this item

Name:: Krommydas_21078.pdf
Size:: 1.974Mb
Format:: PDF
Description:: Πτυχιακή εργασία

View/Open

This item appears in the following Collection(s)

Τμήμα Πληροφορικής

Show simple item record

Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα