Εμφάνιση απλής εγγραφής

dc.contributor.advisorΤσιχριντζής, Γεώργιος
dc.contributor.authorΕφραιμίδης, Ζαχαρίας Η.
dc.date.accessioned2014-12-02T08:28:41Z
dc.date.available2014-12-02T08:28:41Z
dc.date.issued2014-12-02T08:28:41Z
dc.identifier.urihttps://dione.lib.unipi.gr/xmlui/handle/unipi/6186
dc.description.abstractΜε την εξάπλωση του Διαδικτύου δόθηκε η δυνατότητα σε κάθε ενδιαφερόμενο να επεκταθεί σε ευρύτερο κοινό. Άμεσα ξεκίνησε ο σχεδιασμός και η ανάπτυξη ολοκληρωμένων συστημάτων που να επιτρέπουν την απομακρυσμένη πρόσβαση των χρηστών σε κάθε είδους δεδομένα. Σύντομα παρήχθη πλεονάζουσα πληροφορία καθιστώντας αρκετά συστήματα δυσλειτουργικά, αφού οι χρήστες δυσκολεύονταν πλέον να εντοπίσουν ενδιαφέροντα στοιχεία. Έκτοτε έχει ξεκινήσει η αναζήτηση λύσεων, που να επιτρέπουν την περαιτέρω ανάπτυξη συστημάτων, χωρίς όμως να αποθαρρύνονται οι χρήστες τους. Τα συστήματα συστάσεων είναι μία από τις προτεινόμενες κατευθύνσεις προς τον στόχο αυτό, καθώς σκοπεύουν, μέσω διαφόρων τεχνικών, να προβλέψουν τον βαθμό αποδοχής κάθε στοιχείου από κάθε χρήστη και να κάνουν τις καταλληλότερες προτάσεις. Αν και οι τεχνικές ποικίλουν, ο βασικός τρόπος λειτουργίας σχετίζεται με τα υπάρχοντα δεδομένα του συστήματος, δηλαδή βασίζεται στα χαρακτηριστικά των στοιχείων ή των χρηστών, καθώς και τις μεταξύ τους αλληλεπιδράσεις, ώστε να προτείνει κατάλληλα στοιχεία στον εκάστοτε χρήστη. Ένα από τα σημαντικότερα προβλήματα των συστημάτων συστάσεων είναι τα αραιά δεδομένα. Δηλαδή παρατηρείται η έλλειψη μεγάλου ποσοστού από τα προαναφερθέντα χαρακτηριστικά, άλλοτε λόγω πρωτοεμφανιζόμενου χρήστη, όπου το σύστημα δεν έχει στη μνήμη του αρκετές πληροφορίες, και άλλοτε λόγω εσφαλμένης μοντελοποίησης των στοιχείων, με αποτέλεσμα η δομή τους να περιέχει κενές τιμές στα περιττά χαρακτηριστικά. Στην παρούσα εργασία για τη διαπίστωση αυτού του φαινομένου πραγματοποιείται μία πειραματική υλοποίηση αξιοποιώντας δεδομένα κινηματογραφικών ταινιών από MovieLens και IMDb. Στη συνέχεια επιδιώκεται η επίλυση του προβλήματος αυτού εξάγοντας θέματα από το σύνολο των χαρακτηριστικών με χρήση του αλγορίθμου latent Dirichlet allocation και περιγράφοντας τα στοιχεία ως μείγματα των θεμάτων.
dc.language.isoel
dc.rightsΑναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/deed.el
dc.subjectArtificial intelligence -- Mathematics
dc.subjectΕξόρυξη δεδομένων
dc.subjectRecommender systems (Information filtering)
dc.titleΣυστήματα συστάσεων: αντιμετώπιση αραιών δεδομένων με παραγωγή εγγράφων χαρακτηριστικών
dc.typeMaster Thesis
europeana.isShownAthttps://dione.lib.unipi.gr/xmlui/handle/unipi/6186
dc.identifier.call006.3'3 ΕΦΡ
dc.description.abstractENThe proliferation of the Internet has allowed every person to extend to a wider audience. The design and development of integrated systems that allowed users to remotely access any kind of data began. Soon redundant information was produced making systems quite dysfunctional, since most users had difficulty to find interesting data. Since then research has started for solutions which should allow further development of systems, but without discouraging their users. One of the suggested guidelines for this objective is the idea of recommender systems, which, through various techniques, try to predict the degree of acceptance of each item for each user and make appropriate recommendations. Although there is a broad range of techniques available, their basic function is associated with the system’s existing data, i.e. they are based on the features of the item or the user, and the interactions between them, in order to propose appropriate items to each user. One of the major problems of recommender systems is the data sparsity. A large proportion of the aforementioned features is missing, either because of the newcomer user, for whom the system has no memory, or due to incorrect modeling of the items, which makes their structure to consist of empty features. In order to confirm the existence of this problem an experimental solution is being developed by utilizing movies’ data from MovieLens and IMDb. Then the paper seeks to address this problem by extracting topics from the set of the features, using the latent Dirichlet allocation algorithm, and describing items as mixtures of topics.


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές
Εκτός από όπου διευκρινίζεται διαφορετικά, το τεκμήριο διανέμεται με την ακόλουθη άδεια:
Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 4.0 Διεθνές

Βιβλιοθήκη Πανεπιστημίου Πειραιώς
Επικοινωνήστε μαζί μας
Στείλτε μας τα σχόλιά σας
Created by ELiDOC
Η δημιουργία κι ο εμπλουτισμός του Ιδρυματικού Αποθετηρίου "Διώνη", έγιναν στο πλαίσιο του Έργου «Υπηρεσία Ιδρυματικού Αποθετηρίου και Ψηφιακής Βιβλιοθήκης» της πράξης «Ψηφιακές υπηρεσίες ανοιχτής πρόσβασης της βιβλιοθήκης του Πανεπιστημίου Πειραιώς»