» Home » Υπηρεσίες » Γεωκωδικοποίηση

 

Γεωκωδικοποίηση

Η ΕΡΑΤΟΣΘΕΝΗΣ παρέχει προς τους πελάτες της υπηρεσίες καθαρισμού (cleansing) και Γεωκωδικοποίησης (Geocoding) μεγάλων αρχείων Βάσεων διευθύνσεων. Για το σκοπό αυτό έχει αναπτύξει ειδική Υπηρεσία (as web service) και εφαρμογή Γεωκωδικοποίησης (GeoMark).

Ο πελάτης μπορεί να επιλέξει την αγορά – χρονομίσθωση του service για χρήση μέσα από δικές του εφαρμογές, αλλά και την μαζική γεωκωδικοποίηση των διευθύνσεων του, παρέχοντας σε μορφή αρχείου (CSV, MDB, excel, κ.λ.π) τις εγγραφές του και λαμβάνοντας ως παραδοτέο το αρχείο (shape) των σημείων των Γεωκωδικοποιημένων διευθύνσεων.

Μεθοδολογία Γεωκωδικοποίησης

Η γεωκωδικοποίηση μιας βάσης διευθύνσεων περιλαμβάνει τις εξής διαδικασίες:

  1. Προετοιμασία δεδομένων διευθύνσεων
  2. Κανονικοποίηση διευθύνσεων
  3. Χωρικός εντοπισμός διευθύνσεων

Ειδικότερα, εκτός ειδικών περιπτώσεων και προσαρμογών, ισχύουν τα παρακάτω:

Προετοιμασία Δεδομένων

Η προετοιμασία των δεδομένων αφορά στα εξής:

  • Μεταφορά των δεδομένων σε μορφή διαχειρίσιμη από τις εφαρμογές καθαρισμού (MS Access, CSV)
  • Διαχωρισμός των δεδομένων εισόδου σε «πακέτα», ανάλογα με:
    • Τη γενική χωρική αναφορά των διευθύνσεων, εφόσον αυτή υπάρχει (π.χ. σύνολα διευθύνσεων από συγκεκριμένο Νομό ή Δήμο)
    • Την μορφή (σχήμα) των δεδομένων εφόσον δεν είναι σταθερή για το σύνολό τους. Για παράδειγμα, ένα υποσύνολο διευθύνσεων μπορεί να περιλαμβάνει εκτός από την πόλη, και πληροφορία ΤΚ, την οποία θέλουμε να αξιοποιήσουμε. Σε κάποιο άλλο υποσύνολο μπορεί η διεύθυνση να καταχωρείται σε δύο πεδία («Οδός», «Αριθμός»), αντί σε ένα («Οδός και Αριθμός»).
  • Εντοπισμός με απλά ερωτήματα διευθύνσεων που δεν μπορούν να γεωκωδικοποιηθούν λόγω ελλιπούς πληροφορίας (π.χ. διευθύνσεις με μόνη πληροφορία την οδό και τον αριθμό, ή διευθύνσεις χωρίς αριθμό οδού). Για αυτές τις διευθύνσεις θα πρέπει να προβλεφθεί ειδική μεταχείριση, έπειτα από σχετική συνεννόηση.


Οι διαδικασίες κανονικοποίησης και χωρικού εντοπισμού εφαρμόζονται χωριστά για κάθε «πακέτο» δεδομένων, ώστε να είναι δυνατή η προσαρμογή της λειτουργίας τους ειδικά για κάθε τέτοιο «πακέτο».

Κανονικοποίηση Διευθύνσεων

Η διαδικασία αυτή στόχο έχει την μεταφορά των στοιχείων των διευθύνσεων εισόδου σε μια κανονικοποιημένη μορφή, στην οποία θα έχουν διαχωριστεί οι διευθύνσεις στα συστατικά τους, ανεξάρτητα από τη μορφή στην οποία παρέχονται αρχικά.

Για να γίνει αυτό απαιτείται η αντιστοίχιση των λεκτικών (Ονόματα οδών, περιοχών, δήμων, κλπ) που εμφανίζονται στις διευθύνσεις, στα κατάλληλα λεκτικά που χρησιμοποιούνται στη γεωγραφική βάση αναφοράς της εταιρείας, η οποία θα χρησιμοποιηθεί για τον χωρικό εντοπισμό των διευθύνσεων. Στα πλαίσια της διαδικασίας αυτής διορθώνονται τυχόν ορθογραφικά λάθη, αλλά και πιο σύνθετα λάθη, όπως για παράδειγμα λάθη στον ΤΚ.

Η διαδικασία αντιστοίχισης λαμβάνει υπόψη δύο βασικά κριτήρια:

  • Το βαθμό ομοιότητας των λεκτικών που εμφανίζονται στις διευθύνσεις εισόδου με τα δεδομένα αναφοράς
  • Την ορθή συσχέτιση όσο το δυνατόν περισσότερων στοιχείων της διεύθυνσης εισόδου μεταξύ τους, σύμφωνα με τη βάση αναφοράς


Αρχικό αποτέλεσμα της διαδικασίας αυτής είναι ένα σύνολο από πιθανές κανονικοποιημένες διευθύνσεις, για κάθε μία από τις οποίες θα έχει υπολογιστεί σε μορφή ποσοστού ο βαθμός ταύτισής τους με τα στοιχεία της βάσης αναφοράς. Οι κανονικοποιημένες διευθύνσεις περιλαμβάνουν και τα στοιχεία διεύθυνσης που έλειπαν από την αρχική διεύθυνση (π.χ. ΤΚ, Νομός, κλπ).

Η διαδικασία αντιστοίχισης και απόδοσης βαθμού ταύτισης εφαρμόζει τα δύο κριτήρια παράλληλα, και όχι ξεχωριστά (στη σειρά), προκειμένου να καταλήξει σε όσο το δυνατόν πιο ακριβή αποτελέσματα. Για παράδειγμα, η διεύθυνση εισόδου «Κομνηνού 45, Αθήνα» θα ταυτιστεί σε μεγαλύτερο βαθμό στην κανονικοποιημένη διεύθυνση «Κομνηνών 45, Αθήνα», παρά στην «Κομνηνού 45, Αθήνα», εφόσον σύμφωνα με τη βάση αναφοράς δεν υπάρχει οδός Κομνηνού στην Αθήνα, παρά το γεγονός ότι χρησιμοποιείται το ίδιο όνομα οδού στη δεύτερη πιθανή διεύθυνση.

Το σύνολο των κανονικοποιημένων αυτών διευθύνσεων αποτελεί τη βάση στην οποία θα εφαρμοστεί η επόμενη διαδικασία του χωρικού εντοπισμού τους.

Χωρικός Εντοπισμός

Από την προηγούμενη διαδικασία ένα μέρος των διευθύνσεων θα εξαχθεί απευθείας σε αρχείο συντεταγμένων (Text ή Shapefile). Είναι οι διευθύνσεις με υψηλό βαθμό ταύτισης (άνω του 80%), για τις οποίες δεν εντοπίζονται άλλες πιθανές ταυτίσεις με συγκρίσιμο βαθμό. Από την εμπειρία οι διευθύνσεις αυτές αποτελούν ποσοστό του συνόλου που κυμαίνεται μεταξύ 60% και 80%.

Για καθεμιά από τις υπόλοιπες διευθύνσεις, αποδίδονται αυτόματα συντεταγμένες για κάθε πιθανή ταύτισή τους, ώστε να είναι δυνατός ο έλεγχός τους σε χάρτη αναφοράς.

Σε κάθε περίπτωση οι συντεταγμένες που αποδίδονται στις τελικές διευθύνσεις τοποθετούνται κατάλληλα σε σχέση με τα χωρικά δεδομένα που διαθέτει η εταιρεία, ούτως ώστε να εμφανίζονται πάνω στα οικοδομικά τετράγωνα και όχι στους δρόμους. Εξαίρεση αποτελούν οι περιπτώσεις διευθύνσεων που ορίζονται σαν διασταυρώσεις οδών, και για τις οποίες δεν προσδιορίζεται το ακριβές τετράγωνο της διασταύρωσης στην οποία ανήκουν.

[η Εταιρία] [Τεχνολογίες] [Έργα] [Υπηρεσίες] [Υποστήριξη]
Copyright © 2001-2022 ΕΡΑΤΟΣΘΕΝΗΣ Α.Ε. Με επιφύλαξη παντός δικαιώματος.