Show simple item record

Ανάπτυξη συστήματος ερωταποκρίσεων και σύνοψης εγγράφων με αξιοποίηση γλωσσικών μοντέλων και τεχνικών διανυσματικής αναζήτησης

dc.contributor.advisorΑποστόλου, Δημήτριος
dc.contributor.authorΚρομμύδας, Βασίλειος
dc.date.accessioned2025-12-09T13:18:14Z
dc.date.available2025-12-09T13:18:14Z
dc.date.issued2025-09
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/18678
dc.description.abstractΗ ταχεία διάδοση ψηφιακών εγγράφων σε πολλούς τομείς καθιστά αναγκαία την ανάπτυξη αποτελεσματικών και έξυπνων εργαλείων για την αυτοματοποιημένη εξαγωγή και σύνοψη πληροφοριών. Οι παραδοσιακές μέθοδοι αναζήτησης, βασισμένες στην αντιστοίχιση λέξεων-κλειδιών, συχνά αδυνατούν να παρέχουν ακριβείς και συμφραζόμενα σχετικές απαντήσεις, λόγω έλλειψης σημασιολογικής κατανόησης. Ο περιορισμός αυτός γίνεται ιδιαίτερα εμφανής σε μεγάλα αποθετήρια εγγράφων, όπου απαιτείται γρήγορη πρόσβαση σε σχετικό περιεχόμενο χωρίς χειροκίνητη αναζήτηση. Η παρούσα εργασία παρουσιάζει ένα σύστημα ερωταποκρίσεων (QA) για έγγραφα PDF, αξιοποιώντας τεχνικές τεχνητής νοημοσύνης και Επεξεργασίας Φυσικής Γλώσσας (NLP),με στόχο την έξυπνη ανάκτηση πληροφοριών από τα επιθυμητά αρχεία. Το σύστημα συνδυάζει γλωσσικά μοντέλα τύπου «transformer» με διανυσματική αναζήτηση (vector search) για την ανάλυση, επεξεργασία και εξαγωγή ουσιαστικών συμπερασμάτων από PDF. Κύρια στοιχεία του είναι η μετατροπή του κειμένου εγγράφων σε αριθμητική μορφή, η σύνοψη του και η ενότητα ερωταποκρίσεων με χρήση γεννητικής τεχνητής νοημοσύνης, σχεδιασμένα για βελτίωση της ακρίβειας και της αποδοτικότητας. Θα αναλυθούν η αρχιτεκτονική, οι λεπτομέρειες υλοποίησης και οι μετρικές αξιολόγησης, αναδεικνύοντας εφαρμογές στην έρευνα, την επιχειρηματική ευφυΐα και την ακαδημαϊκή κοινότητα. Τα πειραματικά αποτελέσματα καταδεικνύουν την ικανότητα του συστήματος να συνοψίζει περιεχόμενο με ακρίβεια και να παρέχει συμφραζόμενα σχετικές απαντήσεις ,καθιστώντας το αξιόπιστο εργαλείο για την έξυπνη πλοήγηση σε έγγραφα. Επιπλέον, θα εξεταστούν προκλήσεις όπως η διαχείριση σύνθετων ερωτημάτων, η διασφάλιση πραγματολογικής ακρίβειας και η επεκτασιμότητα ώστε να υποστηρίζεται η εφαρμογή της σε επιχειρησιακό περιβάλλον. Τέλος, προτείνονται μελλοντικές βελτιώσεις που στοχεύουν στην βελτίωση της λειτουργικότητας και της εμπειρίας του χρήστη. Σε αυτές περιλαμβάνονται η υποστήριξη πολλαπλών γλωσσών, με σκοπό το σύστημα να είναι προσιτό σε ευρύτερο κοινό, η αναβάθμιση των τεχνικών σύνοψης για μεγαλύτερη ακρίβεια και περιεκτικότητα στις περιλήψεις, καθώς και βελτιώσεις στο περιβάλλον χρήστη (UI/UX) για καλύτερη εμπειρία του χρήστη. Οι παραπάνω βελτιώσεις αναμένεται να συμβάλλουν στην περαιτέρω αύξηση της αποτελεσματικότητας και της ευχρηστίας του συστήματος.el
dc.format.extent39el
dc.language.isoelel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rightsΑναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/3.0/gr/*
dc.titleΑνάπτυξη συστήματος ερωταποκρίσεων και σύνοψης εγγράφων με αξιοποίηση γλωσσικών μοντέλων και τεχνικών διανυσματικής αναζήτησηςel
dc.title.alternativeDevelopment of conversational interface and text summarizer using large language modelsel
dc.typeBachelor Dissertationel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικήςel
dc.description.abstractENThe rapid proliferation of digital documents in many fields necessitates the development of effective and intelligent tools for automated extraction and summarization of information. Traditional search methods, based on keyword matching, often fail to provide accurate and contextually relevant answers due to a lack of semantic understanding. This limitation is particularly evident in large document repositories, where quick access to relevant content without manual searching is required. This paper presents a question-answering (QA) system for PDF documents, utilizing artificial intelligence and Natural Language Processing (NLP) techniques, with the aim of intelligently retrieving information from the desired files. The system combines transformer-type language models with vector search for the analysis, processing, and extraction of meaningful conclusions from PDFs. The main elements are the conversion of document text into numerical form, its summarization and the question-answering module using generative artificial intelligence, designed to improve accuracy and efficiency. The architecture, implementation details, and evaluation metrics will be analyzed, highlighting applications in research, business intelligence, and the academic community. Experimental results demonstrate the system's ability to accurately summarize content and provide contextually relevant answers, making it a reliable tool for intelligent document navigation. In addition, challenges such as handling complex queries, ensuring factual accuracy and scalability to support its implementation in an operational environment will be addressed. Finally, future improvements are proposed which aim to enhance functionality and user experience. These include multilingual support, with the aim of making the system accessible to a wider audience, upgrading summarization techniques for greater accuracy and comprehensiveness in summaries, and improvements to the user interface (UI/UX) for a better user experience. The above improvements are expected to contribute to further increasing the efficiency and usability of the system.el
dc.subject.keywordΑπαντήσεις ερωτήσεωνel
dc.subject.keywordΣύνοψηel
dc.subject.keywordRAGel
dc.subject.keywordNLPel
dc.subject.keywordFAISSel
dc.subject.keywordΜοντέλα μετασχηματιστώνel
dc.date.defense2025-10-23


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα
Except where otherwise noted, this item's license is described as
Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Contact Us
Send Feedback
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»