Ανάπτυξη chatbot φυσικής γλώσσας για αναζήτηση σε βάσεις δεδομένων MongoDB με χρήση μεγάλων γλωσσικών μοντέλων και LangChain
Development of chatbot natural language for MongoDB database retrieval using large language models and LangChain
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Chatbot ; NLP ; MongoDB ; LLMs ; LangChain ; NoSQL ; Claude API ; DataOps ; StreamlitΠερίληψη
Η παρούσα μεταπτυχιακή διπλωματική εργασία πραγματεύεται τον σχεδιασμό, την ανάπτυξη και την αξιολόγηση ενός ευφυούς συστήματος chatbot που επιτρέπει στους χρήστες να αναζητούν πληροφορίες σε βάσεις δεδομένων MongoDB χρησιμοποιώντας ερωτήματα φυσικής γλώσσας. Το σύστημα αξιοποιεί Μεγάλα Γλωσσικά Μοντέλα (Large Language Models — LLMs), συγκεκριμένα το μοντέλο Claude Opus 4.6 της Anthropic, σε συνδυασμό με το πλαίσιο ενορχήστρωσης LangChain, για τη μετατροπή ερωτημάτων φυσικής γλώσσας σε δομημένα ερωτήματα MongoDB. Η αρχιτεκτονική του συστήματος ακολουθεί τις αρχές του DataOps και περιλαμβάνει τέσσερα διακριτά επίπεδα: ένα επίπεδο παρουσίασης βασισμένο σε FastAPI και Streamlit, ένα επίπεδο ενορχήστρωσης μέσω LangChain LCEL chains, ένα επίπεδο πρόβλεψης ερωτημάτων μέσω LLM με schema-aware pre-prompting, και ένα επίπεδο δεδομένων βασισμένο σε MongoDB. Κεντρική καινοτομία αποτελεί η δυναμική ένεση του σχήματος της βάσης δεδομένων στο prompt του LLM, επιτρέποντας τη γένεση ακριβών ερωτημάτων χωρίς προηγούμενη εκπαίδευση σε συγκεκριμένο σύνολο δεδομένων. Το σύστημα αξιολογήθηκε με ένα συνθετικό σύνολο δεδομένων ηλεκτρονικού εμπορίου αποτελούμενο από 500 πελάτες, 50 πωλητές, 200 προϊόντα, 5.000 παραγγελίες και 3.000 αξιολογήσεις. Τα πειραματικά αποτελέσματα κατέδειξαν ποσοστό επιτυχίας 94% στη γένεση ορθών ερωτημάτων και 100% αποτελεσματικότητα στον αποκλεισμό κακόβουλων ερωτημάτων.

