Εφαρμογή ανιχνευτή ιστού για την κατηγοροποίηση και την αποθήκευση δεδομένων σε αποθήκες δεδομένων
Α web crawler application for categorization and data extraction in a data warehouse
Προβολή/ Άνοιγμα
Λέξεις κλειδιά
Crawlning ; Ανίχνευση ιστού ; React ; Node.js ; Web crawler ; Data miningΠερίληψη
Ο χώρος που η εργασία κινείται και αναφέρεται είναι ο ‘web crawling’ ο οποίος σημαίνει μια εφαρμογή η οποία αναλύει το δέντρο δόμησης μια ιστοσελίδας (Dom) και αποσκοπεί στην άντληση πληροφοριών.
Η εκπόνηση της εργασίας περιλαμβάνει την άντληση πληροφοριών από διαφορετικές ιστοσελίδες και κατόπιν αποθήκευση αυτών σε βάση δεδομένων. Με αυτό τον τρόπο χρησιμοποιούνται τεχνολογίες web οι οποίες σε συνδυασμό με την μελέτη άρθρων και βιβλίων που θα αναλυθούν στα επόμενα κεφάλαια φέρουν εις πέρας την εφαρμογή που αναλαμβάνει την όλη διαδικασία.
Σαν αποτέλεσμα αυτών των δεδομένων δημιουργήθηκε και ένα διαχειριστικό εργαλείο ώστε να είναι πιο εύκολη η αναζήτηση και εκμετάλλευση αυτών των δεδομένων .
Επίσης μέσα στο σύνολο της η εργασία περιλαμβάνει και αυτοματοποιημένους μηχανισμούς που αναλαμβάνουν να κάνουν διεργασίες , όπως είναι η άντληση των δεδομένων καθώς και καθαρισμό δεδομένων που δεν έχουν αξία προς εκμετάλλευση .