dc.contributor.advisor | Θεοδωρίδης, Ιωάννης | |
dc.contributor.author | Λεπίδας, Αλέξανδρος Ε. | |
dc.date.accessioned | 2015-09-21T12:59:39Z | |
dc.date.available | 2015-09-21T12:59:39Z | |
dc.date.issued | 2011-04 | |
dc.identifier.uri | https://dione.lib.unipi.gr/xmlui/handle/unipi/7702 | |
dc.description.abstract | Οι οργανισμοί χρησιμοποιούν σήμερα τα συστήματα ψηφιακής απεικόνισης, περιμένοντας να βελτιωθεί η αποτελεσματικότητά τους. Η ψηφιακή εικόνα επιτρέπει την αποθήκευση, ανάκτηση και ανταλλαγή τεράστιου αριθμό εγγραφών σε υποδομή δικτύου και το Internet γενικότερα. Οι χρήστες μπορούν να βρουν ένα αρχείο με ένα σύστημα ψηφιακής απεικόνισης γρηγορότερα από ό, τι μπορούν να βρουν την έντυπη έκδοση ή την αντίστοιχη μικροφίλμ. Μπορούν επίσης να μοιράζονται αρχεία εύκολα με τη χρήση διαφόρων υποδομών, όπως e-mail και άμεσων μηνυμάτων. Από την άλλη πλευρά, υπάρχει η ανάγκη για αυξημένη αποθηκευτικό χώρο για εικόνες και φωτογραφίες. Αν και αυτό το τελευταίο σημείο είναι ότι κατά κύριο λόγο τονίζει το πραγματικό πλεονέκτημα της ψηφιακής απεικόνισης είναι η ηλεκτρονική πρόσβαση στα αρχεία και την ανταλλαγή των σχετικών πληροφοριών. Η απόφαση για το αν και πώς να εφαρμόζουν ένα σύστημα απεικόνισης είναι πολύπλοκη. Πολλοί παράγοντες πρέπει να λαμβάνονται υπόψη. Κατά κύριο λόγο, ποιο είναι το επιθυμητό αποτέλεσμα; Θα καλύψει τις πραγματικές ανάγκες και πώς να ενσωματώσουν την υπάρχουσα υποδομή; Υπάρχουν επαρκείς οικονομικοί πόροι για τη στήριξη των συστημάτων; Η μελέτη επικεντρώθηκε στην αποθήκευση και ανάκτηση καθώς και στην επιτυχή κατηγοριοποίηση. Ειδικότερα, υπάρχει μια διαδικασία εισαγωγής των εικόνων σε μια σχεσιακή βάση δεδομένων (Oracle Corporation RDBMS), μια επιτυχημένη μετατροπή σε κατάλληλη μορφή για την αναζήτηση σε αυτές τις εικόνες, τη δημιουργία της εξόρυξης δεδομένων και τη διεξαγωγή πειραμάτων για να καταλήξουμε σε σχετικές διαπιστώσεις. Το κλειδί για την επιτυχημένη σχεδίαση, ανάπτυξη και εφαρμογή ενός συστήματος για την επεξεργασία δεδομένων εικόνας είναι η σωστή ανάλυση. Οι τέσσερις κύριες φάσεις είναι οι εξής: α) Σχεδιασμός και ανάλυση απαιτήσεων, β) Ανάλυση της τεχνολογίας που επιλέγεται, γ) διαδικασία εφαρμογής, γ) Ανάλυση των αποτελεσμάτων. Σε αυτό το πλαίσιο, μελετήθηκαν τέσσερις διαφορετικοί αλγόριθμοι (decision trees, naive bayes, support vector machines and logistic regression), για ένα σύνολο περίπου χιλίων εικόνων. Τα αποτελέσματα είναι ικανοποιητικά, αν και υπάρχει πάντα περιθώριο για βελτίωση. Εκτός αυτού, ένας αλγόριθμος εξόρυξης δεδομένων που επιτυγχάνει πολύ υψηλό ποσοστό επιτυχίας για ένα συγκεκριμένο πρόβλημα που δημιουργείται από την πιθανότητα να είναι over optimized για το συγκεκριμένο πρόβλημα, καθιστώντας ενδεχομένως ακατάλληλο για ένα ευρύ φάσμα προβλημάτων. | el |
dc.format.extent | 98 | el |
dc.language.iso | el | el |
dc.publisher | Πανεπιστήμιο Πειραιώς | el |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Διεθνές | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Εξόρυξη δεδομένων | el |
dc.subject | Data mining | el |
dc.subject | Βάσεις δεδομένων -- Διαχείριση | el |
dc.subject | Επεξεργασία εικόνας -- Ψηφιακές τεχνικές | el |
dc.subject | Database management | el |
dc.subject | Image processing -- Digital techniques | el |
dc.title | Εξόρυξη γνώσης & ανάκτηση δεδομένων εικόνας με χρήση υποδομών σχεσιακών βάσεων δεδομένων | el |
dc.type | Master Thesis | el |
dc.contributor.department | Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών. Τμήμα Πληροφορικής | el |
dc.identifier.call | 006.3 ΛΕΠ | el |
dc.description.abstractEN | Organizations use nowadays digital imaging systems expecting to improve their effectiveness and multimedia presentation business and operation-wise. The digital image allows the capture, storage, retrieval and sharing of a huge number of recordings to network infrastructure and the Internet in general. Users can typically find a file with a digital imaging system faster than they can find the printed version or the respective microfilm. They can also share files easily using various infrastructures such as e-mail and instant messaging. On the other hand there is the need for increased storage space for images and photos. Although this last point is that primarily emphasizes the real advantage of digital imaging is the online access to files and the exchange of relevant information. The decision on whether and how to implement an imaging system is complex. Many factors must be considered. Primarily, what is the desired result? How will the display resolution of user problems? Will cover the real needs and how to integrate the existing infrastructure and are there sufficient financial resources to support systems over time? This study focused on the concepts of digital imaging and in particular in the storage and successful categorized search / retrieval. In particular there is a study of the import images process into a relational database (in specific Oracle Corporation RDBMS), a successful conversion to suitable format for the search patterns in these images, creating the data mining and conducting experiments to conclude to related findings. The decision to implement an image-processing system should be based on needs arising from the specific application requested. The key to successful design, development and implementation of a system for processing image data to find what is the correct analysis. The four main phases are: a) planning and analysis requirements, b) analysis of the technology chosen, c) process implementation, d) analysis of results. Observing that the process of creating, training and applying data mining algorithms is not a standardized procedure, which cannot comprise a uniform solution to all problems that require searching and processing large data sets. For this reason, it is understood that continuous study and research development in this sector is essential to the broad and heterogeneous range of problems requiring data mining. More specifically, applications that can only extract data sets of images - either medical or different categories as in our case - is perceived to be too many. Since applications for registration, search, image processing on the Internet, management of databases with medical images in large health facilities, and automatic comparison of these images to suggest for diagnosis / indications of certain pathogenicity. In this context, we studied four different algorithms (decision trees, naive bayes, support vector machines and logistic regression) for a total of approximately one thousand images, and a corresponding classification of those. The results are satisfactory, although there is always room for improvement. Besides, a data mining algorithm that achieves very high success rate for a specific problem posed by the chance to be over-optimized for the specific problem, making it potentially unsuitable for a wide range of problems. Customizing also showed that for the algorithms applied increasing the percentage of the available data in a training set of algorithms performance improved the performance of the algorithm significantly. | en |
dc.contributor.master | Προηγμένα Συστήματα Πληροφορικής | el |