Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Scalone działki z powiatowych usług WFS EGiB dla Polski

Problem z łączeniem powiatowych danych WFS.

Jednym z kluczowych problemów, które występują w dostępie do otwartych danych EGiB jest brak aktualizowanej wersji scalonej dla działek i budynków dla obszarów większych niż powiat. Tylko takich danych bezproblemowo mogliby użyć operatorzy GIS w swoich analizach na większych obszarach.

W związku z licznymi pytaniami skąd można pobrać scalone dane EGiB, które są rozproszone w 384 powiatowych usługach sieciowych pobierania, poniżej publikuję scaloną postać tych danych z rozbiciem na poszczególne województwa z aktualnością na dzień 19.07.2025

EDIT: Uzupełniłem w danych brakujących kilku powiatów w dniu 22.07.2025

Wygląd udostępnianych danych w Qgis na obrazku poniżej

Dowiedz się więcej

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Dowiedz się więcej

Scalona Baza Danych Ogólnogeograficznych BDOO dla Polski wersja 2022.

W serwisie geoportal.gov.pl GUGiK opublikował nową wersję danych Bazy Danych Obiektów Ogólnogeograficznych (BDOO) z dnia 26.05.2022 roku. W związku z tym, że są to oddzielne dane w postaci plików XML dla poszczególnych województw, pojawiły się zapytania o scaloną postać takiej bazy dla terenu całej Polski.

Poniżej udostępniam wytworzoną przeze mnie scaloną dla całego kraju bazę BDOO w postaci plików XML i bazy geopackage wraz z projektem do Qgis.

Nowa BDOO
Scalona baza BDOO dla całej Polski.

Dowiedz się więcej

Pobieranie Darmowych danych z Geoportalu – Ortofotomapy, NMT, LAS, BDOT10k

Główny Urząd Geodezji i Kartografii zaczął udostępniać w związku z nowelizacją Ustawy Prawo Geodezyjne i Kartograficzne wiele danych Państwowego Zasobu Geodezyjnego bez opłat na geoportalu.

Dostępne są NMT, NMPT, Ortofotomapa, BDOT10k (przetworzony przez GUGiK i częściowo odmienny od oryginału) czy dane pomiarowe LIDAR czyli pliki LAS lub LAZ.

Niestety, przyjęto zasadę maksymalnego utrudnienia użytkownikowi

Dowiedz się więcej

Ewidencja zbiorów i usług na geoportal.gov.pl – Analiza usług Przeglądania WMS.

Ewidencja zbiorów i usług to rejestr prowadzony przez Głównego Geodetę Kraju do którego zgłaszane powinny być zbiory danych i usługi sieciowe przeglądania, pobierania, wyszukiwania, przetwarzania i uruchamiania usług przestrzennych, które zostały wytworzone dla danych w ramach grup tematycznych określonych w załączniku nr 1 rozporządzenia poniżej. http://prawo.sejm.gov.pl/isap.nsf/download.xsp/WDU20102011333/O/D20101333.pdf

Ostatnia nowelizacja ww. rozporządzenia wprowadziła obowiązek weryfikacji wpisanych do rejestru usług i zbiorów danych, który został nałożony na głównego geodetę kraju, przy współudziale instytucji zgłaszających zbiory i usługi do ewidencji zbiorów i usług. Przez ostatnie kilka tygodni

Dowiedz się więcej

Infrastruktura Informacji Przestrzennej po polsku. Część 3 – Usługa ATOM

1. Co to jest usługa ATOM ?
Usługa ATOM to w skrócie usługa pobierania zmieniających się treści. Klient usługi czyli program na komputerze co jakiś czas odpytuje usługę na serwerze pobierając mały plik XML. Zawiera on informację o tym jakie dane są dostępne, kiedy zostały aktualizowane i co zawierają. W momencie gdy dostawca danych zmienia pliki u siebie na serwerze, aktualizuje również automatycznie plik opisujący te dane wskutek czego klient po następnym pobraniu pliku XML i porównaniu z poprzednim

Dowiedz się więcej

Usługi Słownikowe GUGiK część 2 – przetwarzanie danych XML za pomocą Talend Open Studio Data Integration

Pobrane za pomocą usługi WSDL dane z usługi słownikowej GUGiK z poprzedniego wpisu możemy spróbować przetworzyć do postaci pliku csv np przy pomocy programu typu ETL. Użyjemy w tym celu programu Talend Open Studio Data Integration w jego darmowej wersji  który można go pobrać tutaj. Do działania programu musi być zainstalowana na komputerze java, którą można znaleźć tutaj.

Spróbujmy przetworzyć dane z ulicami, które pobraliśmy z serwera. Otwierając pobraną paczkę zip zobaczymy tam dużą ilość xml o takiej samej  strukturze, które zawierają ulice dla

Dowiedz się więcej

Usługi słownikowe GUGiK część 1 – pobieranie danych XML na podstawie TERYT

We wcześniejszych wpisach o punktach adresowych pokazywałem jak pobrać przetworzone dane adresowe z rejestru PRG oraz przeprowadzałem ich analizę.

Dzisiaj w związku z tym, że niektóre rejestry odwołują się referencyjnie wprost do rejestru EMUiA pokażę jak za pomocą protokołu SOAP usługi słownikowej pobrać na podstawie numeru TERYT dane dotyczące województwa w zakresie ulic i punktów.

Dowiedz się więcej