Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Analiza jakości punktów adresowych PRG za pomocą sieci neuronowych GNN.


O punktach adresowych i ich jakości wiele już razy pisałem na tym blogu. W związku z tym, że ostatnio dość intensywnie zajmuję się analizą możliwości użycia różnych rozwiązań opartych o AI w celach automatyzacji monotonnych i czasochłonnych prac, postanowiłem potestować możliwości automatycznej kontroli jakości danych punktów adresowych PRG z GUGiK.

W dniu 26.12.2025 roku pobrałem więc dane adresowe PRG w SHP i zacząłem je przetwarzać w środowisku Pythona. Użyłem ~5.5 mln punktów adresowych, które posiadały identyfikatory miejscowości i ulic, w celu sprawdzenia czy na podstawie tych atrybutów wytrenowany model będzie stanie pokazać punkty odstające. Po kilku próbach z różnymi ustawieniami i parametrami do treningu modelu, uzyskałem wytrenowany model, którym sprawdziłem dane PRG.

W celu wizualizacji wyników wytworzyłem szybki portal z wynikamii analizy. Dla możliwości sprawdzenia poprawności wskazanych błędów dodałem warstwę z WMTS GUGiK z ortofotomapą i usługą WMS PRG, które są widoczne przy dużym powiększeniu.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Skorowidz usług pobierania WFS dla tematu działek wytworzony z EZiU GUGiK

EZiU czyli Ewidencja Zbiorów i Usług to rejestr, który prowadzi Główny Geodeta Kraju pod adresem https://integracja.gugik.gov.pl/eziudp

Rejestr ten jest skorowidzem adresów wszystkich usług sieciowych dla zgłoszonych zbiorów danych geoprzestrzennych prowadzonych przez administrację państwową, dzięki któremu można znaleźć aktualny adres usługi, która nas interesuje z danego zakresu, miejsca i tematu.

Ponieważ od jakiegoś czasu szczegółowo przyglądam się jakości i zawartości usług sieciowych postanowiłem podzielić się z Wami zrzutem stanu polskich usług sieciowych dla tematu 1.6 (działki ewidencji gruntów) czyli skorowidzem tego co można znaleźć w usługach pobierania powiatów serwujących dane EGiB.

Tabela w poniższym linku pozwoli Wam dla danej usługi pobierania z EZiU określić jakie posiada warstwy, strukturę oraz jaki format pobrania jest możliwy do użycia oraz pokaże czy usługa nie zgłaszała w momencie testów błędów.

Dowiedz się więcej

Scalone działki z powiatowych usług WFS EGiB dla Polski

Problem z łączeniem powiatowych danych WFS.

Jednym z kluczowych problemów, które występują w dostępie do otwartych danych EGiB jest brak aktualizowanej wersji scalonej dla działek i budynków dla obszarów większych niż powiat. Tylko takich danych bezproblemowo mogliby użyć operatorzy GIS w swoich analizach na większych obszarach.

W związku z licznymi pytaniami skąd można pobrać scalone dane EGiB, które są rozproszone w 384 powiatowych usługach sieciowych pobierania, poniżej publikuję scaloną postać tych danych z rozbiciem na poszczególne województwa z aktualnością na dzień 19.07.2025

EDIT: Uzupełniłem w danych brakujących kilku powiatów w dniu 22.07.2025

Wygląd udostępnianych danych w Qgis na obrazku poniżej

Dowiedz się więcej

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Dowiedz się więcej

Analiza ulic pobranych z usług WFS EMUiA z danymi PRG GUGiK

Po poprzedniej analizie aktualności punktów adresowych na podstawie wersji zawartej w plikach GML, pora na bezpośrednie porównanie danych zawartych w usługach WFS EMUiA i odpowiadających im danych pobranych z PRG. Jest to drugi wpis z zaplanowanych czterech postów o jakości danych adresowych w Polsce.

Założenie

Należało porównać geometrie ulic występujące w kilku tysiącach usług WFS Ewidencji Miejscowości Ulic i Adresów z zebranymi przez Główny Urząd Geodezji i Kartografii danymi zawartymi w Państwowym Rejestrze Granic.

Dowiedz się więcej

Walidacja plików APP GML za pomocą schematu XSD.

1.Narzędzia Ministerstwa Rozwoju i Technologii do kontroli poprawności plików GML APP.

Ministerstwo przygotowując się do procesu cyfryzacji planowania przestrzennego przygotowało i opublikowało narzędzia, którymi gminy miały tworzyć i kontrolować pliki GML zgodne z założeniami ministerstwa dotyczącymi tworzenia plików i zbiorów APP.

Jest to walidator danych APP dostępny na stronie https://www.gov.pl/web/gov/sprawdz-poprawnosc-danych-przestrzennych-oraz-metadanych którego zadaniem jest sprawdzać już przygotowane w innych narzędziach pliki GML w postaci APP oraz wtyczka APP, której zadaniem było ułatwienie tworzenia i kontroli plików GML w środowisku Qgis.

Dowiedz się więcej

APP i zbiór APP czyli planowanie przestrzenne w plikach GML. Część 1 – analiza i parsowanie plików XML/GML.

APP i zbiór APP – co to jest i skąd je wziąć.

Pliki APP (Akt Planowania Przestrzennego) to pliki GML zawierające dane z zakresu planowania przestrzennego, których obowiązek tworzenia powstał w związku z wprowadzeniem zmian do ustawy z dnia 27 marca 2003 r. o planowaniu i zagospodarowaniu przestrzennym w postaci rozdziału 5a.

Zbiór APP to wszystkie lub kilka plików APP z obszaru gminy, które znajdują się w jednym pliku GML.

W związku z obowiązkiem publikacji danych GML w postaci APP dla nowych aktów prawnych postanowiłem przyjrzeć się spójności wytworzonych już plików GML (APP) dla planowania przestrzennego dostępnym w dziennikach województw. Pliki GML zawarte są tam w załącznikach do opublikowanych uchwał rad gmin i miast, są ogólnie dostępne i jako opublikowany załącznik do aktu prawa miejscowego powinny być niezmienne.

Analiza nie dotyczy publikowanych i zmieniających się w czasie plików GML dostępnych na stronach niektórych producentów oprogramowania lub gmin ze względu na to. że nie zachowują one niezmienności danych w czasie oraz podstawowych zasad wersjonowania (zmiana elementów XML przy niezmienności jego wersji i identyfikatora) oraz są w części niepodpisane cyfrowo. Fakt tych zmian w części prawdopodobnie wynika z dostrzeżonych usterek w wytworzonych danych lub zmieniających się wytycznych ministerstwa.

Dowiedz się więcej

Scalona Baza Danych Ogólnogeograficznych BDOO dla Polski wersja 2022.

W serwisie geoportal.gov.pl GUGiK opublikował nową wersję danych Bazy Danych Obiektów Ogólnogeograficznych (BDOO) z dnia 26.05.2022 roku. W związku z tym, że są to oddzielne dane w postaci plików XML dla poszczególnych województw, pojawiły się zapytania o scaloną postać takiej bazy dla terenu całej Polski.

Poniżej udostępniam wytworzoną przeze mnie scaloną dla całego kraju bazę BDOO w postaci plików XML i bazy geopackage wraz z projektem do Qgis.

Nowa BDOO
Scalona baza BDOO dla całej Polski.

Dowiedz się więcej