Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Jeśli uznamy system adresowy Państwowego Rejestru Granic za referencyjny, z którego czerpiemy dane, wówczas przenosimy te błędy na wszelkie rejestry dla których referencją jest ta baza PRG lub systemy pochodne które z niej korzystają.

Niestety, sytuacja z jakością danych adresowych nie poprawia się od wielu lat, ponieważ modele jakości dla poszczególnych rejestrów nie zostały utworzone lub nie są dostępne. A skoro nie zostały utworzone nie są też zaimplementowane w systemach dostawców danych czyli gmin.

Nie pomaga też fakt, że dane kodów pocztowych nie są ogólnie dostępne bo możemy je od Poczta Polska S. A. jedynie kupić na dość nieoczywistej licencji i w mało użytecznej dla GISowców postaci, którą można przeczytać dopiero po otrzymaniu tych danych.
https://www.poczta-polska.pl/dla-biznesu/oferta/uslugi-pozostale/pocztowe-numery-adresowe/

Mam nadzieję, że po tych kilkunastu latach, ktoś w końcu się tematem zajmie. Niezależnie od tego czy będzie to Główny Urząd Geodezji i Kartografii czy też posiadające Radę Infrastruktury Informacji Przestrzennej Ministerstwo Rozwoju i Technologii ponieważ problem dotyczy wielu rejestrów pochodnych, które przez to mogą nie działać prawidłowo.

Aktualność danych na obrazku 15-11-2024, źródło danych Główny Urząd Geodezji i Kartografii z geoportal.gov.pl Państwowy Rejestr Granic w postaci SHP.