Dzisiaj krótki wpis o jakości danych kodów pocztowych w punktach adresowych PRG.
Kod pocztowy w Polsce w zasadzie każdy wie jak wygląda – to dwie cyfry kreska trzy cyfry czyli np. 80-210. Będąc ciekawym jak wygląda jakość w danych punktów adresowych PRG (dane dostępne tutaj) zrobiłem małą analizę za pomocą funkcji REGEX. Odrzuciłem wszystkie kody pocztowe o prawidłowej strukturze oprócz 00-000, który nie istnieje i wygenerowałem z nich bazę geopackage z kodami pocztowymi wątpliwej jakości, którą możecie pobrać tutaj.
Portal danepubliczne.gov.pl jest portalem który zbiera ogólnodostępne dane np. z administracji publicznej i innych źródeł pozwalając na zintegrowanie ich w jednym miejscu. Prowadzony jest przez Ministerstwo Cyfryzacji w opensourcowym systemie CKAN, który powoli staje się podstawowym programem do publikowania w sieci tego typu danych w Europie.
1. Co to jest usługa ATOM ?
Usługa ATOM to w skrócie usługa pobierania zmieniających się treści. Klient usługi czyli program na komputerze co jakiś czas odpytuje usługę na serwerze pobierając mały plik XML. Zawiera on informację o tym jakie dane są dostępne, kiedy zostały aktualizowane i co zawierają. W momencie gdy dostawca danych zmienia pliki u siebie na serwerze, aktualizuje również automatycznie plik opisujący te dane wskutek czego klient po następnym pobraniu pliku XML i porównaniu z poprzednim Czytaj dalej Infrastruktura Informacji Przestrzennej po polsku. Część 3 – Usługa ATOM→
Po pierwszym wpisie dostępnym tutajw którym opisałem trudy związane z pozyskaniem prawidłowego schematu XSD dla danych EMUiA pora na analizę i przetworzenie zawartości plików z wszystkich gmin rejestru EMUiA udostępnianych przez Geo-System.
W celu przetworzenia danych EMUiA dla całej Polski od Geo-Systemu użyłem całości danych dostępnych na stronie http://danepubliczne.punktyadresowe.pl/ dostęp 04.02.2017r.
Teoretycznie każda gmina w Polsce prowadzi Ewidencję Miejscowości Ulic i Adresów zwaną EMUiA. Każda z gmin prowadzi ją w dowolnie wybranym przez siebie systemie (i dobrze), który powinien wydawać takie same dane GML w schemacie danych opisanym w rozporządzeniu. W idealnym teoretycznym modelu prawnym powinniśmy więc otrzymać dane z każdej gminy zapisane w jednakowej strukturze.
Dzisiaj tylko krótki film pokazujący jak wyglądają zwizualizowane relacje w danych oczywiście przy użyciu kilku „hobbystycznych” technik jakby to pewni ludzie w Warszawie powiedzieli. W ramach testów wydajnościowych pewnego rozwiązania z ponad 41 mln relacji występujących w danych dla punktów adresowych w całej Polsce wybrałem i zwizualizowałem te, które dotyczą ulic. Te które Czytaj dalej Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG→
Od samego początku udostępniania darmowych punktów adresowych w CODGiK na różnych forach i w różnych dyskusjach pojawia się pytanie o to jak bardzo aktualne i jak często aktualizowane są dane adresowe w rejestrze PRG.
Centralny Ośrodek Dokumentacji Geodezyjnej i Kartograficznej udostępnia dane Państwowego Rejestru Granic na swojej stronie za darmo. Mało kto wie, że pod jakże mylącym opisem linku punkty adresowe znajduje się w spakowanych plikach GML rejestr (uwaga duży plik), który zawiera również inne dane.
Jakiś czas temu GUGiK w ramach projektu geoportal udostępnił usługę OpenLS służącą do geokodowania adresów za pomocą państwowych danych adresowych z rejestru emuia.