Μεγάλα γλωσσικά μοντέλα & ανάκτηση με ενισχυμένη γενετική παραγωγή στην ιστορική έρευνα

Μαρκοδημητράκης, Λεωνίδας

Large language models & retrieval-augmented generation in historical research

Bachelor Dissertation

Συγγραφέας

Μαρκοδημητράκης, Λεωνίδας

Ημερομηνία

2025-09

Περίληψη

Η παρούσα πτυχιακή εργασία εξετάζει τη συμβολή των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs) και της μεθοδολογίας Παραγωγής με Ενισχυμένη Ανάκτηση (Retrieval-Augmented Generation – RAG) στην ιστορική έρευνα και εκπαίδευση. Αρχικά παρουσιάζεται το θεωρητικό υπόβαθρο των γλωσσικών μοντέλων, η εξέλιξή τους και η σημασία της αρχιτεκτονικής Transformer. Στη συνέχεια αναλύεται η τεχνική λειτουργία της RAG, με έμφαση σε εργαλεία όπως το FAISS, σε τεχνικές βελτιστοποίησης και σε συγκριτική αποτίμηση υλοποιήσεων (LangChain, LlamaIndex, Haystack). Το έργο προχωρά στην εφαρμογή των LLMs στις Ψηφιακές Ανθρωπιστικές Επιστήμες, δίνοντας ιδιαίτερη έμφαση σε ζητήματα διαγλωσσικής ιστορικής έρευνας, σε εκπαιδευτικές χρήσεις, αλλά και σε παιδαγωγικούς κινδύνους. Μέσα από μελέτες περίπτωσης (1821, Κατοχή, Βυζάντιο, Ψυχρός Πόλεμος, Μικρασιατική Καταστροφή, Μεταπολίτευση) παρουσιάζονται πρακτικά παραδείγματα χρήσης των LLMs και RAG pipelines, τα οποία αναδεικνύουν τόσο τις δυνατότητες όσο και τους περιορισμούς τους. Τέλος, συζητούνται δεοντολογικές διαστάσεις (ψηφιακός αναθεωρητισμός, GDPR, πνευματικά δικαιώματα), ζητήματα ανθεκτικότητας απέναντι σε επιθέσεις, καθώς και το ενεργειακό αποτύπωμα και η βιωσιμότητα των LLMs. Η εργασία καταλήγει ότι τα LLMs και τα RAG pipelines αποτελούν ισχυρά εργαλεία για την ιστορική έρευνα, υπό την προϋπόθεση ότι χρησιμοποιούνται με επιστημονική επιμέλεια, διαφάνεια και σεβασμό στις δεοντολογικές αρχές.

Τμήμα

Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής

Αριθμός σελίδων

112

Γλώσσα

Ελληνικά

URI

https://dione.lib.unipi.gr/xmlui/handle/unipi/18358

Συλλογή

Τμήμα Πληροφορικής

Εμφάνιση πλήρους εγγραφής