Προσωποποιημένη ανωνυμοποίηση βάσεων δεδομένων κινούμενων αντικειμένων μέσω συσταδοποίησης και σύγχυσης
Personalized anonymization of moving objects databases by clustering and perturbation
Προβολή/ Άνοιγμα
Θεματική επικεφαλίδα
Βάσεις δεδομένων -- ΔιαχείρισηΛέξεις κλειδιά
Βάσεις δεδομένωνΠερίληψη
Η προστασία της ιδιωτικότητας όταν δημοσιεύονται χωροχρονικά δεδομένα είναι ένα πεδίο που τυγχάνει αυξανόμενου ενδιαφέροντος. Παρόλα αυτά, ενώ όλο και περισσότερες υπηρεσίες προσφέρουν επιλογές προσωποποίησης στους χρήστες τους, λίγοι αλγόριθμοι μπορούν να χειριστούν έναν τόσο υψηλό βαθμό προσωποποίησης αποτελεσματικά, χωρίς να επισύρουν αχρείαστη αλλοίωση δεδομένων. Σε αυτή την εργασία μελετούμε το πρόβλημα της Προσωποποιημένης (k,δ)-Ανωνυμίας, το οποίο βασίζεται πάνω στο μοντέλο της (k,δ)-Ανωνυμίας, κάνοντας την παραδοχή πως κάθε χρήστης στο σύστημα έχει τις δικές του απαιτήσεις ανωνυμίας και ποιότητας υπηρεσίας. Εξετάζουμε πόσο καλά διαχειρίζεται αυτό το πρόβλημα ο αλγόριθμος Wait For Me και προτείνουμε τον δικό μας αλγόριθμο, δημιουργημένο συγκεκριμένα για να εκμεταλλεύεται τις προσωποποιημένες απαιτήσεις ιδιωτικότητας και ποιότητας υπηρεσίας των χρηστών ώστε να αποφεύγει την υπερ-ανωνυμοποίηση και να μειώνει την αλλοίωση της πληροφορίας των δεδομένων. Εκτός του να λαμβάνει υπόψη τις προσωποποιημένες προτιμήσεις των χρηστών, η προσέγγισή μας χρησιμοποιεί επίσης κατάτμηση τροχιών βασισμένη στην αντίληψη των δεδομένων, με σκοπό να εξετάσει τα αποτελέσματα της ανωνυμοποίησης δεδομένων όπου οι τροχιές έχουν κατατμηθεί σε υπο-τροχιές με κριτήρια που βασίζονται στη γνώση των δεδομένων.
Επιπλέον, μελετούμε το πρόβλημα της Οριοθετημένης Προσωποποιημένης (k,δ)-Ανωνυμίας, όπου υπάρχει ένα όριο στην αποδεκτή αλλοίωση της πληροφορίας που προκαλεί η ανωνυμοποίηση. Παρουσιάζεται ένα νέο σύστημα όπου οι τροχιές αξιολογούνται και οι πιο απαιτητικές υφίστανται επεξεργασία όσο αφορά στις απαιτήσεις (k,δ) τους, με στόχο να μειωθεί η συνολική αλλοίωση πληροφορίας.
Πειραματικά αποτελέσματα δείχνουν το βαθμό στον οποίο η προσωποποιημένη ανωνυμοποίηση επιτυγχάνει χαμηλότερη απώλεια πληροφορίας από τους μη-προσωποποιημένους αλγόριθμους, και επίσης το βαθμό στον οποίο η κατάτμηση τροχιών επηρεάζει τη διαδικασία. Περαιτέρω αποτελέσματα επιδεικνύουν επίσης τις συνέπειες της επεξεργασίας τροχιών με βάση την απαιτητικότητά τους πάνω στο πλαίσιο της ικανοποίησης των κριτηρίων της οριοθετημένης ιδιωτικοποίησης.