Υλοποίηση συστημάτων RAG αξιοποιώντας τη νομοθεσία για τα τυχερά παίγνια

Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Retrieval-Augmented Generation ; Gambling regulation ; Multilingual embedding models ; Vector databases ; LLMsΠερίληψη
Η παρούσα διπλωματική εργασία εξετάζει την εφαρμογή της αρχιτεκτονικής
Retrieval-Augmented Generation (RAG) σε κανονιστικά/νομικά κείμενα, με έμφαση
στη νομοθεσία των τυχερών παιγνίων στην Ελλάδα. Στόχος είναι να διερευνηθεί πώς
ένα σύστημα RAG μπορεί να υποστηρίξει τον εποπτικό ρόλο μιας αρμόδιας αρχής,
παρέχοντας τεκμηριωμένες απαντήσεις που βασίζονται σε ανακτημένα
αποσπάσματα νομοθεσίας. Για τον σκοπό αυτό υλοποιούνται τρεις εφαρμογές: (α)
εντοπισμός άρθρων που ενδέχεται να παραβιάζει μια στοιχηματική εταιρεία με βάση
το κείμενο μιας καταγγελίας, (β) ανάκτηση και σύγκριση παρόμοιων καταγγελιών από
ιστορικό αρχείο, και (γ) chatbot ερωταποκρίσεων για θέματα αδειών
καταλληλότητας. Κάθε εφαρμογή υλοποιείται σε δύο εκδόσεις, ώστε να συγκριθεί η
επίδραση διαφορετικών πολυγλωσσικών μοντέλων ενσωμάτωσης (embedding
models) (LaBSE και intfloat/multilingual-e5-base) στην ποιότητα της ανάκτησης. Η
προσέγγιση βασίζεται σε προεπεξεργασία και τμηματοποίηση κειμένων, δημιουργία
embeddings, αποθήκευση σε βάση διανυσμάτων (vector database) και παραγωγή
απάντησης από μεγάλο γλωσσικό μοντέλο (LLM) με εμπλουτισμένο πλαίσιο. Τα
αποτελέσματα δείχνουν ότι η χρήση RAG μειώνει τον κίνδυνο μη τεκμηριωμένων
απαντήσεων και διευκολύνει την πρόσβαση σε εξειδικευμένη νομοθετική γνώση, ενώ
αναδεικνύονται πρακτικές παράμετροι όπως η επιλογή embedding model, η ποιότητα
των δεδομένων και οι περιορισμοί του context window.


