Μεγάλα γλωσσικά μοντέλα & ανάκτηση με ενισχυμένη γενετική παραγωγή στην ιστορική έρευνα
Large language models & retrieval-augmented generation in historical research

Bachelor Dissertation
Συγγραφέας
Μαρκοδημητράκης, Λεωνίδας
Ημερομηνία
2025-09Επιβλέπων
Σωτηρόπουλος, ΔιονύσιοςΠροβολή/ Άνοιγμα
Λέξεις κλειδιά
Μεγάλα γλωσσικά μοντέλα ; Retrieval-augmented generation ; Ψηφιακές ανθρωπιστικές επιστήμες ; Ιστορική έρευνα ; Δεοντολογία ; Ενεργειακό αποτύπωμα ; LLM ; RAG ; AIΠερίληψη
Η παρούσα πτυχιακή εργασία εξετάζει τη συμβολή των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs) και της μεθοδολογίας Παραγωγής με Ενισχυμένη Ανάκτηση (Retrieval-Augmented Generation – RAG) στην ιστορική έρευνα και εκπαίδευση. Αρχικά παρουσιάζεται το θεωρητικό υπόβαθρο των γλωσσικών μοντέλων, η εξέλιξή τους και η σημασία της αρχιτεκτονικής Transformer. Στη συνέχεια αναλύεται η τεχνική λειτουργία της RAG, με έμφαση σε εργαλεία όπως το FAISS, σε τεχνικές βελτιστοποίησης και σε συγκριτική αποτίμηση υλοποιήσεων (LangChain, LlamaIndex, Haystack). Το έργο προχωρά στην εφαρμογή των LLMs στις Ψηφιακές Ανθρωπιστικές Επιστήμες, δίνοντας ιδιαίτερη έμφαση σε ζητήματα διαγλωσσικής ιστορικής έρευνας, σε εκπαιδευτικές χρήσεις, αλλά και σε παιδαγωγικούς κινδύνους. Μέσα από μελέτες περίπτωσης (1821, Κατοχή, Βυζάντιο, Ψυχρός Πόλεμος, Μικρασιατική Καταστροφή, Μεταπολίτευση) παρουσιάζονται πρακτικά παραδείγματα χρήσης των LLMs και RAG pipelines, τα οποία αναδεικνύουν τόσο τις δυνατότητες όσο και τους περιορισμούς τους. Τέλος, συζητούνται δεοντολογικές διαστάσεις (ψηφιακός αναθεωρητισμός, GDPR, πνευματικά δικαιώματα), ζητήματα ανθεκτικότητας απέναντι σε επιθέσεις, καθώς και το ενεργειακό αποτύπωμα και η βιωσιμότητα των LLMs. Η εργασία καταλήγει ότι τα LLMs και τα RAG pipelines αποτελούν ισχυρά εργαλεία για την ιστορική έρευνα, υπό την προϋπόθεση ότι χρησιμοποιούνται με επιστημονική επιμέλεια, διαφάνεια και σεβασμό στις δεοντολογικές αρχές.

