Open Access
Knowledge hiding in decision trees
Author(s) -
Γεώργιος Φερετζάκης
Publication year - 2021
Language(s) - Uncategorized
Resource type - Dissertations/theses
DOI - 10.12681/eadd/46573
Subject(s) - decision tree , computer science , artificial intelligence
Η έρευνα αυτή εστιάζει στην αναδυόμενη ανάγκη για ανταλλαγή δεδομένων μεταξύ των διαφόρων οργανισμών. Σε αυτή τη διδακτορική διατριβή παρουσιάζουμε δύο διαφορετικές προσεγγίσεις για την απόκρυψη των κανόνων δέντρων αποφάσεων. Στην πρώτη, προτείνουμε μια τεχνική look-ahead χρησιμοποιώντας γραμμικές Διοφαντικές εξισώσεις για να προσθέσουμε τον κατάλληλο αριθμό παρατηρήσεων διατηρώντας την αρχική εντροπία των κόμβων. Αυτή η μέθοδος προσθέτει μια βελτιστοποιημένη οπτική γωνία σε μια υπάρχουσα μέθοδο και μπορεί να χρησιμοποιηθεί για να κρύψει έναν ή περισσότερους κανόνες δέντρων αποφάσεων, διαδοχικά ή παράλληλα. Αυτή η μέθοδος υιοθετεί μια προσέγγιση αύξησης παρατηρήσεων, τροποποιώντας επίσης τις τιμές των κλάσεων για την απόκρυψη των κριτηρίων κριτικής ταξινόμησης σε δυαδικά σύνολα δεδομένων. Στην συνέχεια παρουσιάζουμε μια νέα τεχνική, τη μέθοδο της απόκρυψης με τοπική παραμόρφωση (LDH), που δεν επηρεάζει τις τιμές των κλάσεων των ευαίσθητων παρατηρήσεων, όπως συμβαίνει στην προηγούμενη τεχνική, αλλά τροποποιεί τις τιμές των ιδιοτήτων αυτών των συγκεκριμένων παρατηρήσεων. Μια τέτοια μέθοδος απόκρυψης κανόνων σε ένα δέντρο απόφασης προτιμάται σε σχέση με άλλες ευρετικές λύσεις όπως διαταραχές εξόδου ή κρυπτογραφικές τεχνικές - που περιορίζουν τη χρηστικότητα των δεδομένων - δεδομένου ότι τα ίδια τα πρωτογενή δεδομένα είναι άμεσα διαθέσιμα για δημόσια χρήση. Στην προτεινόμενη μέθοδο, προσδιορίζουμε πρώτα τις παρατηρήσεις που συμβάλλουν στη δημιουργία ενός συγκεκριμένου κανόνα και στη συνέχεια, με κατάλληλες μεταβολές στις τιμές κάποιων χαρακτηριστικών, μπορούμε να κρύψουμε με επιτυχία αυτόν τον κανόνα με ελάχιστο αντίκτυπο στο υπόλοιπο δέντρο αποφάσεων. Επιπλέον, η νέα αυτή τεχνική (LDH) τροποποιεί τις τιμές των ιδιοτήτων του αρχικού συνόλου δεδομένων χωρίς να απαιτείτε η προσθήκη πρόσθετων παρατηρήσεων. Η τεχνική (LDH) θα μπορούσε να είναι ένα νέο εργαλείο για τον μηχανικό δεδομένων προκειμένου να μπορέσει να τροποποιήσει κατάλληλα τα δεδομένα με σκοπό να αποκρύψει κάποιον κανόνα, ο οποίος κρίνεται «ευαίσθητος» και θα μπορούσε να γνωστοποιηθεί μετά την εφαρμογή ενός μοντέλου δέντρου αποφάσεων σε αυτά τα δεδομένα. Τέλος, εφαρμόζουμε τη μέθοδο της απόκρυψης με τοπική παραμόρφωση (LDH) σε διαφορετικά σύνολα δεδομένων και παρουσιάζουμε μερικά επιλεγμένα παραδείγματα στους τομείς της Ιατρικής, των Οικονομικών και της Εκπαίδευσης για να αποδείξουμε την αποτελεσματική απόκρυψη των προεπιλεγμένων κανόνων δέντρων αποφάσεων και να μετρήσουμε την αντίστοιχη ακρίβεια αυτής της μεθόδου.