Εμφάνιση απλής εγγραφής

Document clustering and topic mining

dc.contributor.advisorΠετάσης, Γεώργιος
dc.contributor.advisorPetasis, Georgios
dc.contributor.authorΑτλαμάζογλου, Ιωάννης
dc.contributor.authorAtlamazoglou, Ioannis
dc.date.accessioned2021-09-20T07:31:42Z
dc.date.available2021-09-20T07:31:42Z
dc.date.issued2021-07-05
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/13677
dc.identifier.urihttp://dx.doi.org/10.26267/unipi_dione/1100
dc.description.abstractΟ σκοπός αυτης της διατριβής είναι το θέμα της εξόρυξης θεματων από κείμενα στα ελληνικά και η ομαδοποίηση εγγράφων σύμφωνα με αυτά τα θεματα, έτσι ώστε τα κείμενα που αναφέρονται στο ίδιο θέμα ή είναι παρόμοια, να βρίσκονται στην ίδια ομάδα. Για την αξιολόγηση του clustering, εφαρμόζονται αρκετές μετρικές οι οποίες είναι ενδεδειγμένες για τέτοιου είδους εργασίες.el
dc.format.extent62el
dc.language.isoenel
dc.publisherΠανεπιστήμιο Πειραιώςel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/gr/*
dc.titleDocument clustering and topic miningel
dc.title.alternativeΟμαδοποίηση εγγράφων και εξόρυξη θεμάτωνel
dc.typeMaster Thesisel
dc.contributor.departmentΣχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Ψηφιακών Συστημάτωνel
dc.description.abstractENThe purpose of this thesis is topic of extraction from documents in Greek language and document clustering according to these topics, so that documents that that refer to the same topic or are similar, belong in the same cluster. After researching related work, popular methods of topic extraction models such as the LDA and text representation methods such as BERT and FASTTEXT, which are among the state if the art technologies used to export text representations in the form of vectors, were explored and applied. To evaluate the document clustering performance according to their vector embeddings, several metrics are applied which are suitable for such tasks.el
dc.corporate.nameΕθνικό Κέντρο Έρευνας Φυσικών Επιστημών «Δημόκριτος»el
dc.contributor.masterΤεχνητή Νοημοσύνη - Artificial Intelligenceel
dc.subject.keywordDocument clusteringel
dc.subject.keywordTopic modelingel
dc.subject.keywordTopic extractionel
dc.date.defense2021-07-09


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»