Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Analiza jakości punktów adresowych PRG za pomocą sieci neuronowych GNN.


O punktach adresowych i ich jakości wiele już razy pisałem na tym blogu. W związku z tym, że ostatnio dość intensywnie zajmuję się analizą możliwości użycia różnych rozwiązań opartych o AI w celach automatyzacji monotonnych i czasochłonnych prac, postanowiłem potestować możliwości automatycznej kontroli jakości danych punktów adresowych PRG z GUGiK.

W dniu 26.12.2025 roku pobrałem więc dane adresowe PRG w SHP i zacząłem je przetwarzać w środowisku Pythona. Użyłem ~5.5 mln punktów adresowych, które posiadały identyfikatory miejscowości i ulic, w celu sprawdzenia czy na podstawie tych atrybutów wytrenowany model będzie stanie pokazać punkty odstające. Po kilku próbach z różnymi ustawieniami i parametrami do treningu modelu, uzyskałem wytrenowany model, którym sprawdziłem dane PRG.

W celu wizualizacji wyników wytworzyłem szybki portal z wynikamii analizy. Dla możliwości sprawdzenia poprawności wskazanych błędów dodałem warstwę z WMTS GUGiK z ortofotomapą i usługą WMS PRG, które są widoczne przy dużym powiększeniu.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Skorowidz usług pobierania WFS dla tematu działek wytworzony z EZiU GUGiK

EZiU czyli Ewidencja Zbiorów i Usług to rejestr, który prowadzi Główny Geodeta Kraju pod adresem https://integracja.gugik.gov.pl/eziudp

Rejestr ten jest skorowidzem adresów wszystkich usług sieciowych dla zgłoszonych zbiorów danych geoprzestrzennych prowadzonych przez administrację państwową, dzięki któremu można znaleźć aktualny adres usługi, która nas interesuje z danego zakresu, miejsca i tematu.

Ponieważ od jakiegoś czasu szczegółowo przyglądam się jakości i zawartości usług sieciowych postanowiłem podzielić się z Wami zrzutem stanu polskich usług sieciowych dla tematu 1.6 (działki ewidencji gruntów) czyli skorowidzem tego co można znaleźć w usługach pobierania powiatów serwujących dane EGiB.

Tabela w poniższym linku pozwoli Wam dla danej usługi pobierania z EZiU określić jakie posiada warstwy, strukturę oraz jaki format pobrania jest możliwy do użycia oraz pokaże czy usługa nie zgłaszała w momencie testów błędów.

Dowiedz się więcej

Scalone działki z powiatowych usług WFS EGiB dla Polski

Problem z łączeniem powiatowych danych WFS.

Jednym z kluczowych problemów, które występują w dostępie do otwartych danych EGiB jest brak aktualizowanej wersji scalonej dla działek i budynków dla obszarów większych niż powiat. Tylko takich danych bezproblemowo mogliby użyć operatorzy GIS w swoich analizach na większych obszarach.

W związku z licznymi pytaniami skąd można pobrać scalone dane EGiB, które są rozproszone w 384 powiatowych usługach sieciowych pobierania, poniżej publikuję scaloną postać tych danych z rozbiciem na poszczególne województwa z aktualnością na dzień 19.07.2025

EDIT: Uzupełniłem w danych brakujących kilku powiatów w dniu 22.07.2025

Wygląd udostępnianych danych w Qgis na obrazku poniżej

Dowiedz się więcej

Analiza ulic pobranych z usług WFS EMUiA z danymi PRG GUGiK

Po poprzedniej analizie aktualności punktów adresowych na podstawie wersji zawartej w plikach GML, pora na bezpośrednie porównanie danych zawartych w usługach WFS EMUiA i odpowiadających im danych pobranych z PRG. Jest to drugi wpis z zaplanowanych czterech postów o jakości danych adresowych w Polsce.

Założenie

Należało porównać geometrie ulic występujące w kilku tysiącach usług WFS Ewidencji Miejscowości Ulic i Adresów z zebranymi przez Główny Urząd Geodezji i Kartografii danymi zawartymi w Państwowym Rejestrze Granic.

Dowiedz się więcej

Aktualność danych w Państwowym Rejestrze Gruntów (PRG) określona na podstawie wersji punktów adresowych.

Rejestr PRG – adresy

Dane adresowe PRG są danymi integrowanymi przez Główny Urząd Geodezji i Kartografii (GUGiK) z danych pozyskiwanych przez gminy w drodze zgłoszeń punktów adresowych oraz uchwał o nadaniu i przebiegu ulic, które są uchwalane przez rady gminy oraz przekazywanych do systemu GUGiK przez systemy gmin.

PRG jest kluczowym rejestrem referencyjnym dla wielu systemów w tym tych związanych z zarządzaniem kryzysowym.

Jednym z istotnych elementów jakości tego rejestru jest aktualność danych, która ma bezpośredni wpływ na użyteczność informacji wykorzystywanych przez administrację publiczną, firmy prywatne i obywateli.

Różnice w PRG i EMUiA

W związku z zauważonymi przeze mnie różnicami występującymi w danych serwowanych przez usługi WFS gmin zawierającymi dane adresowe, a zebranymi w PRG danymi serwowanymi przez GUGiK stanąłem przed dylematem jak ustalić aktualność danych zawartych w paczce PRG pobranej z geoportalu.

Dowiedz się więcej

Pobieranie Darmowych danych z Geoportalu – Ortofotomapy, NMT, LAS, BDOT10k

Główny Urząd Geodezji i Kartografii zaczął udostępniać w związku z nowelizacją Ustawy Prawo Geodezyjne i Kartograficzne wiele danych Państwowego Zasobu Geodezyjnego bez opłat na geoportalu.

Dostępne są NMT, NMPT, Ortofotomapa, BDOT10k (przetworzony przez GUGiK i częściowo odmienny od oryginału) czy dane pomiarowe LIDAR czyli pliki LAS lub LAZ.

Niestety, przyjęto zasadę maksymalnego utrudnienia użytkownikowi

Dowiedz się więcej

Ewidencja zbiorów i usług na geoportal.gov.pl – Analiza usług Przeglądania WMS.

Ewidencja zbiorów i usług to rejestr prowadzony przez Głównego Geodetę Kraju do którego zgłaszane powinny być zbiory danych i usługi sieciowe przeglądania, pobierania, wyszukiwania, przetwarzania i uruchamiania usług przestrzennych, które zostały wytworzone dla danych w ramach grup tematycznych określonych w załączniku nr 1 rozporządzenia poniżej. http://prawo.sejm.gov.pl/isap.nsf/download.xsp/WDU20102011333/O/D20101333.pdf

Ostatnia nowelizacja ww. rozporządzenia wprowadziła obowiązek weryfikacji wpisanych do rejestru usług i zbiorów danych, który został nałożony na głównego geodetę kraju, przy współudziale instytucji zgłaszających zbiory i usługi do ewidencji zbiorów i usług. Przez ostatnie kilka tygodni

Dowiedz się więcej

Podłączanie danych z portalu danepubliczne.gov.pl (CKAN) do Qgis

Portal danepubliczne.gov.pl jest portalem który zbiera ogólnodostępne dane np. z administracji publicznej i innych źródeł pozwalając na zintegrowanie ich w jednym miejscu. Prowadzony jest przez Ministerstwo Cyfryzacji w opensourcowym systemie CKAN, który powoli staje się podstawowym programem do publikowania w sieci tego typu danych w Europie.

Na stronie danepubliczne.gov.pl w zakładce baza wiedzy znajduje się artykuł jak korzystać z danych serwisu za pomocą API. CKAN współpracuje z różnymi klientami i językami programowania min.

Dowiedz się więcej