[Aktualizacja 26-07-2018]
Jak już wspomniałem na tym blogu walidacja danych xml / gml za pomocą schematu XSD polega na sprawdzeniu zgodności struktury i warunków zapisanych w schemacie z zapisanymi w pliku xml zagnieżdżeniami i wartościami atrybutów oraz elementów.
Walidacja jest operacją automatyczną sprawdzającą plik i dającą jednoznaczny wynik „spełnia” lub „nie spełnia”. Nie powinno się dać również w procesie walidacji wyłączyć warunków ze schematu nie zmieniając go. Gwarantuje to z dość dużą pewnością że pliki Czytaj dalej Walidacja plików XML/GML – dlaczego jest potrzebna ? →
Dzisiaj krótki wpis o jakości danych kodów pocztowych w punktach adresowych PRG.
Kod pocztowy w Polsce w zasadzie każdy wie jak wygląda – to dwie cyfry kreska trzy cyfry czyli np. 80-210. Będąc ciekawym jak wygląda jakość w danych punktów adresowych PRG (dane dostępne tutaj) zrobiłem małą analizę za pomocą funkcji REGEX. Odrzuciłem wszystkie kody pocztowe o prawidłowej strukturze oprócz 00-000, który nie istnieje i wygenerowałem z nich bazę geopackage z kodami pocztowymi wątpliwej jakości, którą możecie pobrać tutaj.
Czytaj dalej Punkty adresowe PRG – kody pocztowe analiza jakości REGEX →
Po pierwszym wpisie dostępnym tutaj w którym opisałem trudy związane z pozyskaniem prawidłowego schematu XSD dla danych EMUiA pora na analizę i przetworzenie zawartości plików z wszystkich gmin rejestru EMUiA udostępnianych przez Geo-System.
W celu przetworzenia danych EMUiA dla całej Polski od Geo-Systemu użyłem całości danych dostępnych na stronie http://danepubliczne.punktyadresowe.pl/ dostęp 04.02.2017r.
Celem przetworzenia było uzyskanie jednej ciągłej warstwy ze wszystkich gmin zawierającej punkty adresowe, ulice, Czytaj dalej Infrastruktura informacji przestrzennej po polsku. Część 2 – Dane EMUiA Geo-Systemu →
Teoretycznie każda gmina w Polsce prowadzi Ewidencję Miejscowości Ulic i Adresów zwaną EMUiA. Każda z gmin prowadzi ją w dowolnie wybranym przez siebie systemie (i dobrze), który powinien wydawać takie same dane GML w schemacie danych opisanym w rozporządzeniu. W idealnym teoretycznym modelu prawnym powinniśmy więc otrzymać dane z każdej gminy zapisane w jednakowej strukturze.
Ze względu na to że firma Geo-System opublikowała dostęp do danych EMUiA dla gmin prowadzonych w systemie IMPA (duże brawa) postanowiłem zobaczyć jak wyglądają dane w Czytaj dalej Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD →
We wcześniejszych wpisach o punktach adresowych pokazywałem jak pobrać przetworzone dane adresowe z rejestru PRG oraz przeprowadzałem ich analizę.
Dzisiaj w związku z tym, że niektóre rejestry odwołują się referencyjnie wprost do rejestru EMUiA pokażę jak za pomocą protokołu SOAP usługi słownikowej pobrać na podstawie numeru TERYT dane dotyczące województwa w zakresie ulic i punktów. Czytaj dalej Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT →
Dzisiaj tylko krótki film pokazujący jak wyglądają zwizualizowane relacje w danych oczywiście przy użyciu kilku „hobbystycznych” technik jakby to pewni ludzie w Warszawie powiedzieli. W ramach testów wydajnościowych pewnego rozwiązania z ponad 41 mln relacji występujących w danych dla punktów adresowych w całej Polsce wybrałem i zwizualizowałem te, które dotyczą ulic. Te które Czytaj dalej Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG →
Od samego początku udostępniania darmowych punktów adresowych w CODGiK na różnych forach i w różnych dyskusjach pojawia się pytanie o to jak bardzo aktualne i jak często aktualizowane są dane adresowe w rejestrze PRG.
Poniżej prezentuje zestawienie danych punktów adresowych z rejestru PRG wykonane na podstawie zagregowanej do dnia Czytaj dalej Aktualność punktów adresowych w Państwowym Rejestrze Granic →
Centralny Ośrodek Dokumentacji Geodezyjnej i Kartograficznej udostępnia dane Państwowego Rejestru Granic na swojej stronie za darmo. Mało kto wie, że pod jakże mylącym opisem linku punkty adresowe znajduje się w spakowanych plikach GML rejestr (uwaga duży plik), który zawiera również inne dane.
Najprościej byłoby oczywiście zorientować się w zawartości pliku XML Czytaj dalej Darmowe dane CODGiK – PRG to nie tylko punkty adresowe. →
Strona o geoinformatyce, gis, xml, lidarze i wszystkim innym