Archiwa tagu: ulice

Walidacja plików XML/GML – dlaczego jest potrzebna ?

[Aktualizacja 26-07-2018]

Jak już wspomniałem na tym blogu walidacja danych xml / gml za pomocą schematu XSD polega na sprawdzeniu zgodności struktury i warunków zapisanych w schemacie z zapisanymi w pliku xml zagnieżdżeniami i wartościami atrybutów oraz elementów.

Walidacja jest operacją automatyczną sprawdzającą plik i dającą jednoznaczny wynik „spełnia” lub „nie spełnia”. Nie powinno się dać również w procesie walidacji wyłączyć warunków ze schematu nie zmieniając go. Gwarantuje to z dość dużą pewnością że pliki Czytaj dalej Walidacja plików XML/GML – dlaczego jest potrzebna ?

Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD

Teoretycznie każda gmina w Polsce prowadzi Ewidencję Miejscowości Ulic i Adresów zwaną EMUiA. Każda z gmin prowadzi ją w dowolnie wybranym przez siebie systemie (i dobrze), który powinien wydawać takie same dane GML w schemacie danych opisanym w rozporządzeniu. W idealnym teoretycznym modelu prawnym powinniśmy więc otrzymać dane z każdej gminy zapisane w jednakowej strukturze.

Ze względu na to że firma Geo-System opublikowała dostęp do danych EMUiA dla gmin prowadzonych w systemie IMPA (duże brawa) postanowiłem zobaczyć jak wyglądają dane w Czytaj dalej Infrastruktura informacji przestrzennej po polsku. Część 1 – Dane EMUiA w poszukiwaniu zaginionego schematu XSD

Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Pobrane za pomocą usługi WSDL dane z usługi słownikowej GUGiK z poprzedniego wpisu możemy spróbować przetworzyć do postaci pliku csv np przy pomocy programu typu ETL. Użyjemy w tym celu programu Talend Open Studio Data Integration w jego darmowej wersji  który można go pobrać tutaj. Do działania programu musi być zainstalowana na komputerze java, którą można znaleźć tutaj.

Spróbujmy przetworzyć dane z ulicami, które pobraliśmy z serwera. Otwierając pobraną paczkę zip zobaczymy tam dużą ilość xml o takiej samej  strukturze, które zawierają ulice dla Czytaj dalej Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

We wcześniejszych wpisach o punktach adresowych pokazywałem jak pobrać przetworzone dane adresowe z rejestru PRG oraz przeprowadzałem ich analizę.

Dzisiaj w związku z tym, że niektóre rejestry odwołują się referencyjnie wprost do rejestru EMUiA pokażę jak za pomocą protokołu SOAP usługi słownikowej pobrać na podstawie numeru TERYT dane dotyczące województwa w zakresie ulic i punktów. Czytaj dalej Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG

Dzisiaj tylko krótki film pokazujący jak wyglądają zwizualizowane  relacje w danych oczywiście przy użyciu kilku „hobbystycznych” technik jakby to pewni ludzie w Warszawie powiedzieli. W ramach testów wydajnościowych pewnego rozwiązania z ponad 41 mln relacji występujących w danych dla punktów adresowych w całej Polsce wybrałem i zwizualizowałem te, które dotyczą ulic. Te które Czytaj dalej Analiza spójności wewnętrznej danych na przykładzie relacji punktów adresowych do ulic z PRG

Darmowe dane CODGiK – PRG to nie tylko punkty adresowe.

Centralny Ośrodek Dokumentacji Geodezyjnej i Kartograficznej udostępnia dane Państwowego Rejestru Granic na swojej stronie za darmo. Mało kto wie, że pod jakże mylącym opisem linku punkty adresowe znajduje się w spakowanych plikach GML rejestr (uwaga duży plik), który zawiera również inne dane.

Najprościej byłoby oczywiście zorientować się w zawartości pliku XML Czytaj dalej Darmowe dane CODGiK – PRG to nie tylko punkty adresowe.