Archiwa tagu: XML

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Czytaj dalej

Walidacja plików APP GML za pomocą schematu XSD.

1.Narzędzia Ministerstwa Rozwoju i Technologii do kontroli poprawności plików GML APP.

Ministerstwo przygotowując się do procesu cyfryzacji planowania przestrzennego przygotowało i opublikowało narzędzia, którymi gminy miały tworzyć i kontrolować pliki GML zgodne z założeniami ministerstwa dotyczącymi tworzenia plików i zbiorów APP.

Jest to walidator danych APP dostępny na stronie https://www.gov.pl/web/gov/sprawdz-poprawnosc-danych-przestrzennych-oraz-metadanych którego zadaniem jest sprawdzać już przygotowane w innych narzędziach pliki GML w postaci APP oraz wtyczka APP, której zadaniem było ułatwienie tworzenia i kontroli plików GML w środowisku Qgis.

Czytaj dalej

APP i zbiór APP czyli planowanie przestrzenne w plikach GML. Część 1 – analiza i parsowanie plików XML/GML.

APP i zbiór APP – co to jest i skąd je wziąć.

Pliki APP (Akt Planowania Przestrzennego) to pliki GML zawierające dane z zakresu planowania przestrzennego, których obowiązek tworzenia powstał w związku z wprowadzeniem zmian do ustawy z dnia 27 marca 2003 r. o planowaniu i zagospodarowaniu przestrzennym w postaci rozdziału 5a.

Zbiór APP to wszystkie lub kilka plików APP z obszaru gminy, które znajdują się w jednym pliku GML.

W związku z obowiązkiem publikacji danych GML w postaci APP dla nowych aktów prawnych postanowiłem przyjrzeć się spójności wytworzonych już plików GML (APP) dla planowania przestrzennego dostępnym w dziennikach województw. Pliki GML zawarte są tam w załącznikach do opublikowanych uchwał rad gmin i miast, są ogólnie dostępne i jako opublikowany załącznik do aktu prawa miejscowego powinny być niezmienne.

Analiza nie dotyczy publikowanych i zmieniających się w czasie plików GML dostępnych na stronach niektórych producentów oprogramowania lub gmin ze względu na to. że nie zachowują one niezmienności danych w czasie oraz podstawowych zasad wersjonowania (zmiana elementów XML przy niezmienności jego wersji i identyfikatora) oraz są w części niepodpisane cyfrowo. Fakt tych zmian w części prawdopodobnie wynika z dostrzeżonych usterek w wytworzonych danych lub zmieniających się wytycznych ministerstwa.

Czytaj dalej

Walidacja plików XML/GML – dlaczego jest potrzebna ?

[Aktualizacja 26-07-2018]

Jak już wspomniałem na tym blogu walidacja danych xml / gml za pomocą schematu XSD polega na sprawdzeniu zgodności struktury i warunków zapisanych w schemacie z zapisanymi w pliku xml zagnieżdżeniami i wartościami atrybutów oraz elementów.

Walidacja jest operacją automatyczną sprawdzającą plik i dającą jednoznaczny wynik „spełnia” lub „nie spełnia”. Nie powinno się dać również w procesie walidacji wyłączyć warunków ze schematu nie zmieniając go. Gwarantuje to z dość dużą pewnością że pliki Czytaj dalej

Wczytywanie danych GML BDOO za pomocą wtyczki Qgis GML Application Schema Toolbox

Qgis ciągle się rozwija i oferuje nowe narzędzia w tym również do czytania i przetwarzania w sposób nieco bardziej zaawansowany plików GML. Odpowiadając na potrzebę wczytywania danych GML w sposób umożliwiający przekazanie relacji zawartych w schematach danych XSD powstała wtyczka Qgis GML Application Schema Toolbox umożliwiająca takie czytanie danych GML. Wtyczkę możecie doinstalować poprzez menu Qgis Wtyczki > Zarządzaj wtyczkami.

Spróbujmy użyć wtyczki do wczytania darmowych danych BDOO Czytaj dalej

Infrastruktura informacji przestrzennej po polsku. Część 2 – Dane EMUiA Geo-Systemu

Po pierwszym wpisie dostępnym tutaj w którym opisałem trudy związane z pozyskaniem prawidłowego schematu XSD dla danych EMUiA pora na analizę i przetworzenie zawartości plików z wszystkich gmin rejestru EMUiA  udostępnianych przez Geo-System.

W celu przetworzenia danych EMUiA dla całej Polski  od Geo-Systemu użyłem całości danych dostępnych na stronie http://danepubliczne.punktyadresowe.pl/ dostęp 04.02.2017r.

Celem przetworzenia było uzyskanie jednej ciągłej warstwy ze wszystkich gmin zawierającej punkty adresowe, ulice, Czytaj dalej

Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD

Teoretycznie każda gmina w Polsce prowadzi Ewidencję Miejscowości Ulic i Adresów zwaną EMUiA. Każda z gmin prowadzi ją w dowolnie wybranym przez siebie systemie (i dobrze), który powinien wydawać takie same dane GML w schemacie danych opisanym w rozporządzeniu. W idealnym teoretycznym modelu prawnym powinniśmy więc otrzymać dane z każdej gminy zapisane w jednakowej strukturze.

Ze względu na to że firma Geo-System opublikowała dostęp do danych EMUiA dla gmin prowadzonych w systemie IMPA (duże brawa) postanowiłem zobaczyć jak wyglądają dane w Czytaj dalej

Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Pobrane za pomocą usługi WSDL dane z usługi słownikowej GUGiK z poprzedniego wpisu możemy spróbować przetworzyć do postaci pliku csv np przy pomocy programu typu ETL. Użyjemy w tym celu programu Talend Open Studio Data Integration w jego darmowej wersji  który można go pobrać tutaj. Do działania programu musi być zainstalowana na komputerze java, którą można znaleźć tutaj.

Spróbujmy przetworzyć dane z ulicami, które pobraliśmy z serwera. Otwierając pobraną paczkę zip zobaczymy tam dużą ilość xml o takiej samej  strukturze, które zawierają ulice dla Czytaj dalej

Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

We wcześniejszych wpisach o punktach adresowych pokazywałem jak pobrać przetworzone dane adresowe z rejestru PRG oraz przeprowadzałem ich analizę.

Dzisiaj w związku z tym, że niektóre rejestry odwołują się referencyjnie wprost do rejestru EMUiA pokażę jak za pomocą protokołu SOAP usługi słownikowej pobrać na podstawie numeru TERYT dane dotyczące województwa w zakresie ulic i punktów. Czytaj dalej

Aktualność punktów adresowych w Państwowym Rejestrze Granic

Od samego początku udostępniania darmowych punktów adresowych w CODGiK  na różnych forach i w różnych dyskusjach pojawia się pytanie o to jak bardzo aktualne i jak często aktualizowane są dane adresowe w rejestrze PRG.

Poniżej prezentuje zestawienie danych punktów adresowych z rejestru PRG wykonane na podstawie zagregowanej do dnia Czytaj dalej