Open Access
Διερεύνηση οντολογιών, μηχανικής μάθησης, μορφομετρίας, και αντικειμενοστρεφούς ανάλυσης εικόνας για την αναγνώριση γεωμορφών, κτιρίων, και μεταβολών κτιρίων
Author(s) -
Argyros Argyridis,
Αργυρός Αργυρίδης
Publication year - 2021
Language(s) - Uncategorized
Resource type - Dissertations/theses
DOI - 10.12681/eadd/42008
Subject(s) - computer science
Στόχος της παρούσας διατριβής ήταν η διερεύνηση, ο σχεδιασμός, η επέκταση, και η υλοποίηση καινοτόμων μεθόδων Όρασης Υπολογιστών και Τεχνητής Ευφυΐας μέσα στα πλαίσια της Γεωγραφικής Αντικειμενοστρεφούς Ανάλυσης Εικόνας (GEographic Object-Based Image Analysis – GEOBIA) όπως εξαγωγή κτιρίων, οριοθέτηση αιγιαλού, ανίχνευση μεταβολών κτιρίων, και χαρτογράφηση αλουβιακών ριπιδίων. Ο πρώτος στόχος αυτής της διατριβής αφορούσε την ανάπτυξη μιας μηχανής συλλογιστικής η οποία θα επέτρεπε την τυποποίηση της φωτοερμηνευτικής γνώσης των εμπείρων φωτοερμηνευτών σε μέσα από την υλοποίηση ασαφών φασματικών, χωρικών, γεωμετρικών και τοπολογικών σχέσεων στα πλαίσια της πολυκλιμακωτής ανάλυσης εικόνας, το οποίο ονομάστηκε SPOR (SPatial Ontology Reasoner). Καθώς η αναγνώριση θεματικών κατηγοριών οι οποίες έχουν πολύπλοκες φασματικές, γεωμετρικές και χωρικές ιδιότητες, απαιτεί την αναπαράσταση και δόμηση της φωτοερμηνευτικής γνώσης για την παρατηρούμενη κατηγορία σε μια διαδικασία επίλυσης προβλήματος, απαιτούνται μέθοδοι αναπαράστασης της ανθρώπινης γνώσης σε μορφή κατανοητή από τον υπολογιστή. Λόγω του ότι οι φωτοερμηνευτές χρησιμοποιούν ”υψηλού επιπέδου” αναπαράσταση γνώσης για να περιγράψουν μια θεματική κατηγορία, ενώ ο υπολογιστής μπορεί να εξάγει “χαμηλού επιπέδου” αριθμητική πληροφορία από τα δεδομένα, παρουσιάζεται η ανάγκη να γεφυρωθεί το υπάρχον σημασιολογικό κενό (Semantic gap). Η τυποποίηση και αξιοποίηση αυτής της γνώσης σε μορφή “κατανοητή” από τον υπολογιστή επιτυγχάνεται με την χρήση μεθόδων όπως οι οντολογίες. Οι οντολογίες μπορούν να χρησιμοποιηθούν για να γεφυρώσουν το σημασιολογικό κενό και να αποτελέσουν τμήμα της υλοποίησης ενός αυτόματου συστήματος ανάλυσης εικόνας με βάση την GEOBIA. Η δυνατότητα που έχουν οι οντολογίες να τυποποιήσουν την φωτοερμηνευτική γνώση έχει ήδη αποδειχθεί από προηγούμενες μελέτες. Παρόλα αυτά, δεν είχε γίνει διερεύνηση των οντολογιών με ταυτόχρονη χρήση ασαφούς λογικής, χωρικών συσχετίσεων και πολυκλιμακωτής χωρικής ανάλυσης μέσα στο πλαίσιο της GEOBIA. Τέλος, έχει αναφερθεί στη βιβλιογραφία πως οι υπάρχουσες μηχανές συλλογιστικής για οντολογίες που στηρίζονται σε περιγραφικές λογικές χρειάζονται μεγάλο χρόνο για την περάτωση της συλλογιστικής διαδικασίας, όταν η βάση γνώσης περιέχει πολλές κατηγορίες ή/και αντικείμενα, όπως είναι οι μελέτες που στηρίζονται στην GEOBIA. Για να αντιμετωπισθούν αυτές οι ανάγκες, στην την ανάπτυξη και υλοποίηση του SPOR ως γλώσσα τυποποίησης της οντολογίας χρησιμοποιήθηκε η ΟWL 2 η οποία αποτελεί σήμερα το τελευταίο επίσημο πρότυπο της γλώσσας OWL για τον Σημασιολογικό Ιστό (ΣΙ). Έτσι διασφαλίζεται η συμβατότητα με τις τεχνολογίες του ΣΙ αλλά και την ανταλλαγή GEOBIA οντολογιών με χρήση των τεχνολογιών του. Καθώς τα συστήματα που στηρίζονται στην GEOBIA πρέπει να είναι συμβατά με τα ανοικτά γεωχωρικά πρότυπα(Open GIS Standards) και καθώς απαιτούνταν ο υπολογισμός χωρικών συσχετίσεων κατά τη διάρκεια της συλλογιστικής διαδικασίας, στο SPOR χρησιμοποιήθηκε η PostgreSQL η οποία ενσωματώνει τέτοιες δυνατότητες.Ο δεύτερος στόχος αυτής της διατριβής αφορά την διερεύνηση και ενσωμάτωση μεθόδων μηχανικής μάθησης μέσα στη συλλογιστική διαδικασία των οντολογιών. Στη βιβλιογραφία έχει ήδη διερευνηθεί ο συνδυασμός μεθόδων μηχανικής μάθησης με οντολογίες για την ταξινόμηση επίγειων λήψεων ή ιατρικών δεδομένων με ικανοποιητικά αποτελέσματα, αλλά κάτι τέτοιο δεν είχε διερευνηθεί στα πλαίσια της GEOBIA. Αποφασίστηκε η διερεύνηση μεθόδων Deep Learning, οι οποίες τυποποιούν πληροφορία υψηλής αφαιρετικότητας από τα δεδομένα, μέσω της υλοποίησης μη γραμμικών μετασχηματισμών. Σε αυτή την οικογένεια αλγορίθμων ανήκει και o Deep Belief Network (DBN). Ένα DBN εκπαιδεύεται σε δύο φάσεις. Αρχικά γίνεται μη επιβλεπόμενη εκπαίδευση όπου χρησιμοποιούνται πολλαπλά επίπεδα από Restricted Boltzmann Machines (RBM) τα οποία εκπαιδεύονται μέσω του αλγορίθμου contrastive divergence. Η τελική έξοδος των RBM δίνεται ως είσοδο στον αλγόριθμο επιβλεπόμενης μάθησης Logistic Regression, ο οποίος εκπαιδεύεται μέσω του stohastic gradient decent. Η έξοδος της επιβλεπόμενης εκπαίδευσης αποτελεί το τελικό αποτέλεσμα της ταξινόμησης του DBN. Για να μπορέσει να γίνει συνδυαστική συλλογιστική DBN και ασαφών περιορισμών, επαυξήθηκε η τυποποίηση των οντολογιών με κατάλληλες δηλώσεις – περιορισμούς οι οποίες επέτρεψαν τον ορισμό κατηγοριών με συνδυασμό ασαφών περιορισμών αλλά και μηχανική μάθηση. Επίσης επεκτάθηκε κατάλληλα η συλλογιστική διαδικασία του SPOR ώστε να συμπεριλάβει τον αλγόριθμο DBN.Ο τρίτος στόχος αυτής της διατριβής ήταν η διερεύνηση συγκεκριμένων προβλημάτων της τηλεπισκόπησης και υλοποίηση μεθοδολογιών για την αντιμετώπισή τους μέσα από την υλοποίηση μεθοδολογιών πολυκλιμακωτής ανάλυσης εικόνας. Ο SPOR δοκιμάστηκε σε ένα σενάριο εξαγωγής κτιρίων από εικόνες QuickBird στο οποίο σχεδιάστηκε και υλοποιήθηκε πολυκλιμακωτή ανάλυση εικόνας για την εξαγωγή τους. Υλοποιήθηκαν τρία (3) επίπεδα κατάτμησης. Για κάθε επίπεδο κατάτμησης υλοποιήθηκε ιεραρχία θεματικών κατηγοριών σε μια οντολογία. Στο επίπεδο 1 έγινε εντοπισμός κατηγοριών οι οποίες είχαν φασματικές ιδιότητες παρόμοιες με τα κτίρια. Στο επίπεδο 3,έγινε εξαγωγή των δρόμων ώστε να αφαιρεθούν από το τελικό αποτέλεσμα. Ο τελικός εντοπισμός των κτιρίων έγινε στο επίπεδο 2. Τα αποτελέσματα κρίθηκαν ικανοποιητικά μετά από σύγκρισή τους με φωτοερμηνευτικά δεδομένα αναφοράς, καθώς από τη συνολική επιφάνεια των κτιρίων, εντοπίστηκε επιτυχώς το 75%, ενώ υπήρχε σφάλμα συμπερίληψης της τάξης του 20%.Στη συνέχεια διερευνήθηκε η δυνατότητα εξαγωγής του αιγιαλού μέσω της υλοποίησης πολυκλιμακωτής ανάλυσης εικόνας και ασαφούς οντολογικής συλλογιστικής. Η διαχείριση των παράκτιων ζωνών είναι πολύ σημαντική σε παγκόσμιο επίπεδο καθώς πάνω από 50% του πληθυσμού του πλανήτη ζει σε απόσταση έως 60 Km από τις ακτές. Επίσης, η χαρτογράφηση του αιγιαλού είναι σημαντική λόγω των φυσικών διεργασιών που λαμβάνουν χώρα στη ζώνη αυτή, καθώς επηρεάζουν την ποιότητα του νερού. Στην Ελλάδα, η χαρτογράφηση της ζώνης του αιγιαλού θα συμβάλει και στην ολοκλήρωση του Εθνικού Κτηματολογίου. Παρόλο που η χαρτογράφηση αυτή έχει ήδη γίνει με φωτοερμηνεία, αποφασίστηκε η διερεύνηση μεθοδολογιών για την τυποποίηση των κριτηρίων της ΚΤΗΜΑΤΟΛΟΓΙΟ Α.Ε. με στόχο την αυτόματη χαρτογράφηση του αιγιαλού. Οι περιγραφές των κριτηρίων περιλαμβάνουν συσχετίσεις του αιγιαλού με γειτνιάζουσες χρήσεις γης (πχ βλάστηση, κλίσεις, τυχόν έργα υποδομής κτλ). Έτσι αποφασίστηκε η διερεύνηση της τυποποίησης των κριτηρίων με την υλοποίηση κατάλληλης οντολογίας στα πλαίσια τηςGEOBIA. Λόγω του πλήθους και της πολυπλοκότητας των κριτηρίων διερευνήθηκαν τα πιο κοινά εμφανιζόμενα στον ελλαδικό χώρο, το κριτήριο της βλάστησης και το κριτήριο της στέψης πρανούς. Για την αφαίρεση ανεπιθύμητης φασματικής και χωρικής πολυπλοκότητας από τις εικόνες, εφαρμόστηκε φίλτρο ανισοτροπικής διάχυσης στα δεδομένα. Τα φίλτρα αυτά εξομαλύνουν μικρές διαφορές φωτεινότητας, ενώ παράλληλα διατηρούν τις κύριες ακμές των αντικειμένων. Υλοποιήθηκε μια ιεραρχία τριών επιπέδων κατάτμησης όπου μικρότερα αντικείμενα σχεδιάστηκαν στα χαμηλότερα επίπεδα και μεγαλύτερα στα υψηλότερα. Για κάθε επίπεδο κατάτμησης υλοποιήθηκε στην οντολογία ιεραρχία θεματικών κατηγοριών στις οποίες ταξινομήθηκαν τα αντικείμενα. Η σειρά υλοποίησης των επιπέδων ήταν 1-2-3. Στο επίπεδο 1 αναγνωρίστηκαν γενικές θεματικές κατηγορίες (πχ βλάστηση, νερό, επιφάνειες με χαμηλή κλίση). Στη συνέχεια μέσω ερμηνευτικών κανόνων που προέκυψαν από τα κριτήρια χάραξης του αιγιαλού δημιουργήθηκαν ενδιάμεσες οντότητες συσχετιζόμενες με τα υποαντικείμενα του αιγιαλού, ο οποίος αιγιαλός αναγνωρίστηκε τελικά στο 3ο και τελευταίο επίπεδο. Η αξιολόγηση έγινε με φωτοερμηνευτικά δεδομένα αναφοράς και κρίθηκε ικανοποιητική καθώς αναγνωρίστηκε επιτυχώς περίπου το 89% της συνολικής έκτασης του αιγιαλού, ενώ τα σφάλματα συμπερίληψης δεν ξεπέρασαν το 14%. Επίσης, ένα σενάριο ανίχνευσης μεταβολών σε περιαστικό περιβάλλον σχεδιάστηκε και υλοποιήθηκε. Μια ιεραρχία τριών επιπέδων σχηματίστηκε για την αναγνώριση των αλλαγών. Η σειρά δημιουργίας των επιπέδων ήταν 1-2-3. Στο χαμηλότερο επίπεδο με χρήση ασαφών κανόνων και πολλαπλών DBN ταξινομήσεων έγινε μια πρώτη εκτίμηση των περιοχών όπου έγιναν αλλαγές. Στη συνέχεια με χρήση ερμηνευτικών κανόνων στα επίπεδα 2 και 3 προσδιορίστηκαν οι τελικές αλλαγές. Τα αποτελέσματα έπειτα από σύγκριση με φωτοερμηνευτικά δεδομένα αναφοράς κρίθηκαν ικανοποιητικά, καθώς 73 από συνολικά 87 αλλαγές εντοπίστηκαν επιτυχώς, με μικρά σφάλματα παράλειψης (10) και συμπερίληψης (14).Τέλος έγινε διερεύνηση, υλοποίηση και επέκταση προχωρημένων τεχνικών επεξεργασίας ψηφιακών μοντέλων αναγλύφων και την αξιοποίησή τους μέσα στο πλαίσιο της GEOBIA με στόχο την αναγνώριση αλουβιακών ριπιδίων και Bajadas. Η αναγνώριση στηρίχθηκε στην προσέγγιση της αναγνώρισης προτύπων γεωμορφών το οποίο έχει αναπτυχθεί στις ΗΠΑ και ευρέως χρησιμοποιηθεί διεθνώς για την χαρτογράφηση γεωμορφών. Η χαρτογράφηση αυτών των σχηματισμών είναι πολύ σημαντική ειδικά σε ερημικές και ημιερημικές περιοχές όπου πιθανότατα οι σχηματισμοί αυτοί είναι η κύρια πηγή επιφανειακού νερού για χρήση σε ύδρευση και άρδευση. Έχοντας αυτό ως κίνητρο, διερευνήθηκαν και αναπτύχθηκαν προχωρημένες τεχνικές ανάλυσης εικόνας, ψηφιακών μοντέλων αναγλύφου και αναπαράστασης γνώσης με απώτερο στόχο την αυτόματη αναγνώριση αυτών των γεωμορφών. Στα πλαίσια αυτής της διερεύνησης η αναγνώριση αυτών των γεωμορφών έγινε αρχικά από ψηφιακά μοντέλα εδάφους (ΨΜΕ) και στη συνέχεια το αποτέλεσμα βελτιώθηκε με χρήση πολυφασματικών δορυφορικών δεδομένων. Για την απομάκρυνση του θορύβου το ΨΜΕ φιλτραρίστηκε με βέλτιστο φίλτρο Weiner. Στη συνέχεια, καθώς ένα από τα απαραίτητα στοιχεία για τον εντοπισμό αυτών των μορφών είναι το υδρογραφικό δίκτυο, σύγχρονες τεχνικές σχετιζόμενες με τη διαχείριση βυθισμάτων και επίπεδων περιοχών, καθώς και εξαγωγής του υδρογραφικού δικτύου από ΨΜΕ διερευνήθηκαν, επεκτάθηκαν, υλοποιήθηκαν. Τα αποτελέσματα της εξαγωγής του δικτύου ήταν ικανοποιητικά όσον αφορά το δίκτυο των υπερκείμενων λεκανών, αλλά όχι τόσο ικανοποιητικά για την εξαγωγή του διχοτομικού υδρογραφικού προτύπου. Έτσι αποφασίστηκε πως στη μέθοδο αναγνώρισης θα γίνει προσέγγιση του προτύπου μέσω ευρετικών κανόνων οι οποίοι θα χαρακτήριζαν τις ιδιότητες του. Επίσης, λόγω του ιδιαίτερου ημικυκλικού σχήματος του αλουβιακού ριπιδίου, σχεδιάστηκε και υλοποιήθηκε ένας δείκτης ο οποίος λαμβάνει υπόψη το υδρογραφικό δίκτυο της υπερκείμενης κοιλάδας, τη θέση, τον προσανατολισμό, και το μέγεθος της κάθε υποψήφιας για αλουβιακό ριπίδιο μορφής. Ο δείκτης συνέκρινε την υποψήφια μορφή με ισεμβαδικό κυκλικό τομέα και υπολόγιζε ένα ποσοστό ταύτισης. Η τελική διαδικασία εξαγωγής έγινε μέσω της GEOBIA με την υλοποίηση δύο ιεραρχιών κατάτμησης και ταξινόμησης των αντικειμένων μέσω οντολογιών. Η πρώτη ιεραρχία περιείχε 4 επίπεδα με σειρά δημιουργίας 4-1-2-3. Στο επίπεδο 4 αναγνωρίστηκαν οι κοιλάδες που υπήρχαν στην περιοχή. Στο 1ο επίπεδο έγινε αναγνώριση των ζωνών στις οποίες πιθανώς να υπάρχουν αλλουβιακά ριπίδια ή/και bajadas. Στο αποτέλεσμα της ταξινόμησης του επιπέδου 1 έγινεδιόρθωση και πλήρωση κενών στα επίπεδα 2 και 3. Στο αποτέλεσμα της ταξινόμησης του επιπέδου 3 έγινε μορφολογικό άνοιγμα ώστε να μπορέσουν να διαχωριστούν οι αλλουβιακοί σχηματισμοί από άλλες περιοχές, και στο αποτέλεσμα αυτό έγινε κατάτμηση για τον υπολογισμό νέων αντικειμένων που θα αναπαριστούσαν τις επιθυμητές γεωμορφές, σχηματίζονταν το επίπεδο 2b. Για να εντοπισθούν υποψήφια τμήματα του υδρογραφικού δικτύου σχετιζόμενα με τη μεταφορά φερτών υλικών για το σχηματισμό των αλουβιακών ριπιδίων, το επίπεδο 1b δημιουργήθηκε κάτω από το επίπεδο 2b. Η τελική αναγνώριση των μορφών έγινε στο επίπεδο 2b. Τα αποτελέσματα της αναγνώρισης μετά από αξιολόγηση με φωτοερμηνευτικά δεδομένα αναφοράς κρίθηκαν ικανοποιητικά, καθώς για όλες τις μορφές εντοπίστηκε επιτυχώς το 90% των εκτάσεών τους, ενώ ο δείκτης ποιότητας του τελικού αποτελέσματος ήταν της τάξης του 89%.Ο τελευταίος στόχος της παρούσας διατριβής ήταν η υλοποίηση και δημοσίευση των αλγορίθμων οι οποίοι υλοποιήθηκαν ως ελεύθερο λογισμικό.