dc.contributor.advisor | Δουληγέρης, Χρήστος | |
dc.contributor.author | Μακρυγιαννάκης, Νικόλαος | |
dc.date.accessioned | 2018-12-03T08:11:37Z | |
dc.date.available | 2018-12-03T08:11:37Z | |
dc.date.issued | 2018 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/11725 | |
dc.description.abstract | Ο χώρος που η εργασία κινείται και αναφέρεται είναι ο ‘web crawling’ ο οποίος σημαίνει μια εφαρμογή η οποία αναλύει το δέντρο δόμησης μια ιστοσελίδας (Dom) και αποσκοπεί στην άντληση πληροφοριών.
Η εκπόνηση της εργασίας περιλαμβάνει την άντληση πληροφοριών από διαφορετικές ιστοσελίδες και κατόπιν αποθήκευση αυτών σε βάση δεδομένων. Με αυτό τον τρόπο χρησιμοποιούνται τεχνολογίες web οι οποίες σε συνδυασμό με την μελέτη άρθρων και βιβλίων που θα αναλυθούν στα επόμενα κεφάλαια φέρουν εις πέρας την εφαρμογή που αναλαμβάνει την όλη διαδικασία.
Σαν αποτέλεσμα αυτών των δεδομένων δημιουργήθηκε και ένα διαχειριστικό εργαλείο ώστε να είναι πιο εύκολη η αναζήτηση και εκμετάλλευση αυτών των δεδομένων .
Επίσης μέσα στο σύνολο της η εργασία περιλαμβάνει και αυτοματοποιημένους μηχανισμούς που αναλαμβάνουν να κάνουν διεργασίες , όπως είναι η άντληση των δεδομένων καθώς και καθαρισμό δεδομένων που δεν έχουν αξία προς εκμετάλλευση . | el |
dc.format.extent | 66 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.title | Εφαρμογή ανιχνευτή ιστού για την κατηγοροποίηση και την αποθήκευση δεδομένων σε αποθήκες δεδομένων | el |
dc.title.alternative | Α web crawler application for categorization and data extraction in a data warehouse | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.description.abstractEN | The work aims to solve the problem of drawing information from different web pages and then storing them in a database. Web technologies are used which, in conjunction with the study of articles and books that will be analyzed in the following chapters, will complete the application that takes over the whole process.
As a result of this data, an administrative tool was created to make it easier to search for and exploit this data.
Also, in its entirety, the work includes automated mechanisms that undertake to do processes, such as pumping data as well as cleaning of non-worthwhile assets for exploitation. | el |
dc.contributor.master | Πληροφορική | el |
dc.subject.keyword | Crawlning | el |
dc.subject.keyword | Ανίχνευση ιστού | el |
dc.subject.keyword | React | el |
dc.subject.keyword | Node.js | el |
dc.subject.keyword | Web crawler | el |
dc.subject.keyword | Data mining | el |
dc.date.defense | 2018-11-06 | |