Archiwum kategorii: punkty adresowe

Ewidencja zbiorów i usług na geoportal.gov.pl – Analiza usług Przeglądania WMS.

Ewidencja zbiorów i usług to rejestr prowadzony przez Głównego Geodetę Kraju do którego zgłaszane powinny być zbiory danych i usługi sieciowe przeglądania, pobierania, wyszukiwania, przetwarzania i uruchamiania usług przestrzennych, które zostały wytworzone dla danych w ramach grup tematycznych określonych w załączniku nr 1 rozporządzenia poniżej. http://prawo.sejm.gov.pl/isap.nsf/download.xsp/WDU20102011333/O/D20101333.pdf

Ostatnia nowelizacja ww. rozporządzenia wprowadziła obowiązek weryfikacji wpisanych do rejestru usług i zbiorów danych, który został nałożony na głównego geodetę kraju, przy współudziale instytucji zgłaszających zbiory i usługi do ewidencji zbiorów i usług. Przez ostatnie kilka tygodni Czytaj dalej Ewidencja zbiorów i usług na geoportal.gov.pl – Analiza usług Przeglądania WMS.

Walidacja plików XML/GML – dlaczego jest potrzebna ?

[Aktualizacja 26-07-2018]

Jak już wspomniałem na tym blogu walidacja danych xml / gml za pomocą schematu XSD polega na sprawdzeniu zgodności struktury i warunków zapisanych w schemacie z zapisanymi w pliku xml zagnieżdżeniami i wartościami atrybutów oraz elementów.

Walidacja jest operacją automatyczną sprawdzającą plik i dającą jednoznaczny wynik „spełnia” lub „nie spełnia”. Nie powinno się dać również w procesie walidacji wyłączyć warunków ze schematu nie zmieniając go. Gwarantuje to z dość dużą pewnością że pliki Czytaj dalej Walidacja plików XML/GML – dlaczego jest potrzebna ?

Punkty adresowe PRG – kody pocztowe analiza jakości REGEX

Dzisiaj krótki wpis o jakości danych kodów pocztowych w punktach adresowych PRG.

Kod pocztowy w Polsce w zasadzie każdy wie jak wygląda – to dwie cyfry kreska trzy cyfry czyli np. 80-210. Będąc ciekawym jak wygląda jakość w danych punktów adresowych PRG (dane dostępne tutaj) zrobiłem małą analizę za pomocą funkcji REGEX. Odrzuciłem wszystkie kody pocztowe o prawidłowej strukturze oprócz 00-000, który nie istnieje i wygenerowałem z nich bazę geopackage z kodami pocztowymi wątpliwej jakości, którą możecie pobrać tutaj.

Czytaj dalej Punkty adresowe PRG – kody pocztowe analiza jakości REGEX

Podłączanie danych z portalu danepubliczne.gov.pl (CKAN) do Qgis

Portal danepubliczne.gov.pl jest portalem który zbiera ogólnodostępne dane np. z administracji publicznej i innych źródeł pozwalając na zintegrowanie ich w jednym miejscu. Prowadzony jest przez Ministerstwo Cyfryzacji w opensourcowym systemie CKAN, który powoli staje się podstawowym programem do publikowania w sieci tego typu danych w Europie.

Na stronie danepubliczne.gov.pl w zakładce baza wiedzy znajduje się artykuł jak korzystać z danych serwisu za pomocą API. CKAN współpracuje z różnymi klientami i językami programowania min. Czytaj dalej Podłączanie danych z portalu danepubliczne.gov.pl (CKAN) do Qgis

Infrastruktura Informacji Przestrzennej po polsku. Część 3 – Usługa ATOM

1. Co to jest usługa ATOM ?
Usługa ATOM to w skrócie usługa pobierania zmieniających się treści. Klient usługi czyli program na komputerze co jakiś czas odpytuje usługę na serwerze pobierając mały plik XML. Zawiera on informację o tym jakie dane są dostępne, kiedy zostały aktualizowane i co zawierają. W momencie gdy dostawca danych zmienia pliki u siebie na serwerze, aktualizuje również automatycznie plik opisujący te dane wskutek czego klient po następnym pobraniu pliku XML i porównaniu z poprzednim Czytaj dalej Infrastruktura Informacji Przestrzennej po polsku. Część 3 – Usługa ATOM

Infrastruktura informacji przestrzennej po polsku. Część 2 – Dane EMUiA Geo-Systemu

Po pierwszym wpisie dostępnym tutaj w którym opisałem trudy związane z pozyskaniem prawidłowego schematu XSD dla danych EMUiA pora na analizę i przetworzenie zawartości plików z wszystkich gmin rejestru EMUiA  udostępnianych przez Geo-System.

W celu przetworzenia danych EMUiA dla całej Polski  od Geo-Systemu użyłem całości danych dostępnych na stronie http://danepubliczne.punktyadresowe.pl/ dostęp 04.02.2017r.

Celem przetworzenia było uzyskanie jednej ciągłej warstwy ze wszystkich gmin zawierającej punkty adresowe, ulice, Czytaj dalej Infrastruktura informacji przestrzennej po polsku. Część 2 – Dane EMUiA Geo-Systemu

Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD

Teoretycznie każda gmina w Polsce prowadzi Ewidencję Miejscowości Ulic i Adresów zwaną EMUiA. Każda z gmin prowadzi ją w dowolnie wybranym przez siebie systemie (i dobrze), który powinien wydawać takie same dane GML w schemacie danych opisanym w rozporządzeniu. W idealnym teoretycznym modelu prawnym powinniśmy więc otrzymać dane z każdej gminy zapisane w jednakowej strukturze.

Ze względu na to że firma Geo-System opublikowała dostęp do danych EMUiA dla gmin prowadzonych w systemie IMPA (duże brawa) postanowiłem zobaczyć jak wyglądają dane w Czytaj dalej Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD

Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Pobrane za pomocą usługi WSDL dane z usługi słownikowej GUGiK z poprzedniego wpisu możemy spróbować przetworzyć do postaci pliku csv np przy pomocy programu typu ETL. Użyjemy w tym celu programu Talend Open Studio Data Integration w jego darmowej wersji  który można go pobrać tutaj. Do działania programu musi być zainstalowana na komputerze java, którą można znaleźć tutaj.

Spróbujmy przetworzyć dane z ulicami, które pobraliśmy z serwera. Otwierając pobraną paczkę zip zobaczymy tam dużą ilość xml o takiej samej  strukturze, które zawierają ulice dla Czytaj dalej Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

We wcześniejszych wpisach o punktach adresowych pokazywałem jak pobrać przetworzone dane adresowe z rejestru PRG oraz przeprowadzałem ich analizę.

Dzisiaj w związku z tym, że niektóre rejestry odwołują się referencyjnie wprost do rejestru EMUiA pokażę jak za pomocą protokołu SOAP usługi słownikowej pobrać na podstawie numeru TERYT dane dotyczące województwa w zakresie ulic i punktów. Czytaj dalej Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG

Dzisiaj tylko krótki film pokazujący jak wyglądają zwizualizowane  relacje w danych oczywiście przy użyciu kilku „hobbystycznych” technik jakby to pewni ludzie w Warszawie powiedzieli. W ramach testów wydajnościowych pewnego rozwiązania z ponad 41 mln relacji występujących w danych dla punktów adresowych w całej Polsce wybrałem i zwizualizowałem te, które dotyczą ulic. Te które Czytaj dalej Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG