Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Analiza jakości punktów adresowych PRG za pomocą sieci neuronowych GNN.


O punktach adresowych i ich jakości wiele już razy pisałem na tym blogu. W związku z tym, że ostatnio dość intensywnie zajmuję się analizą możliwości użycia różnych rozwiązań opartych o AI w celach automatyzacji monotonnych i czasochłonnych prac, postanowiłem potestować możliwości automatycznej kontroli jakości danych punktów adresowych PRG z GUGiK.

W dniu 26.12.2025 roku pobrałem więc dane adresowe PRG w SHP i zacząłem je przetwarzać w środowisku Pythona. Użyłem ~5.5 mln punktów adresowych, które posiadały identyfikatory miejscowości i ulic, w celu sprawdzenia czy na podstawie tych atrybutów wytrenowany model będzie stanie pokazać punkty odstające. Po kilku próbach z różnymi ustawieniami i parametrami do treningu modelu, uzyskałem wytrenowany model, którym sprawdziłem dane PRG.

W celu wizualizacji wyników wytworzyłem szybki portal z wynikamii analizy. Dla możliwości sprawdzenia poprawności wskazanych błędów dodałem warstwę z WMTS GUGiK z ortofotomapą i usługą WMS PRG, które są widoczne przy dużym powiększeniu.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Scalone działki z powiatowych usług WFS EGiB dla Polski

Problem z łączeniem powiatowych danych WFS.

Jednym z kluczowych problemów, które występują w dostępie do otwartych danych EGiB jest brak aktualizowanej wersji scalonej dla działek i budynków dla obszarów większych niż powiat. Tylko takich danych bezproblemowo mogliby użyć operatorzy GIS w swoich analizach na większych obszarach.

W związku z licznymi pytaniami skąd można pobrać scalone dane EGiB, które są rozproszone w 384 powiatowych usługach sieciowych pobierania, poniżej publikuję scaloną postać tych danych z rozbiciem na poszczególne województwa z aktualnością na dzień 19.07.2025

EDIT: Uzupełniłem w danych brakujących kilku powiatów w dniu 22.07.2025

Wygląd udostępnianych danych w Qgis na obrazku poniżej

Dowiedz się więcej

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Dowiedz się więcej

Analiza ulic pobranych z usług WFS EMUiA z danymi PRG GUGiK

Po poprzedniej analizie aktualności punktów adresowych na podstawie wersji zawartej w plikach GML, pora na bezpośrednie porównanie danych zawartych w usługach WFS EMUiA i odpowiadających im danych pobranych z PRG. Jest to drugi wpis z zaplanowanych czterech postów o jakości danych adresowych w Polsce.

Założenie

Należało porównać geometrie ulic występujące w kilku tysiącach usług WFS Ewidencji Miejscowości Ulic i Adresów z zebranymi przez Główny Urząd Geodezji i Kartografii danymi zawartymi w Państwowym Rejestrze Granic.

Dowiedz się więcej

Walidacja plików APP GML za pomocą schematu XSD.

1.Narzędzia Ministerstwa Rozwoju i Technologii do kontroli poprawności plików GML APP.

Ministerstwo przygotowując się do procesu cyfryzacji planowania przestrzennego przygotowało i opublikowało narzędzia, którymi gminy miały tworzyć i kontrolować pliki GML zgodne z założeniami ministerstwa dotyczącymi tworzenia plików i zbiorów APP.

Jest to walidator danych APP dostępny na stronie https://www.gov.pl/web/gov/sprawdz-poprawnosc-danych-przestrzennych-oraz-metadanych którego zadaniem jest sprawdzać już przygotowane w innych narzędziach pliki GML w postaci APP oraz wtyczka APP, której zadaniem było ułatwienie tworzenia i kontroli plików GML w środowisku Qgis.

Dowiedz się więcej

Pliki GTFS czyli jak wykorzystywać dane przestrzenne z rozkładów jazdy w QGIS

Standard GTFS co to jest
Standard GTFS (The General Transit Feed Specification) to standard zapisu rozkładów jazdy promowany przez Google. Można go logicznie podzielić na dwie części z których jedna pozwala na zestandaryzowane przekazywanie rozkładu jazdy (GTFS) oraz z części GTFS-RT czyli informacji o sposobie przekazywania na bieżąco informacji o ruchu, położeniu i opóźnieniach poszczególnych pojazdów.

Do czego GTFS może się przydać w GIS ?
Plik GTFS zawiera w sobie zapisane przystanki i trasy komunikacyjne poszczególnych linii wraz z ich położeniem geograficznym, które można w dość prosty sposób użyć np. do analiz GIS czy dostępności komunikacji w danym terenie. Dane te pochodzą od przewoźników i są przez nich aktualizowane na podstawie istniejących śladów GPS z pojazdów. Stanowią więc dość dokładne dane źródłowe na które nie nakładają się żadne błędy przetwarzania, a za ich aktualność odpowiadają przewoźnicy w których interesie leży poinformowanie zarówno klientów jak i dużych krajowych wyszukiwarek tras o ich ofercie w tym zmianach tras czy nowych lub aktualizowanych przystankach.

Dowiedz się więcej

Pobieranie Darmowych danych z Geoportalu – Ortofotomapy, NMT, LAS, BDOT10k

Główny Urząd Geodezji i Kartografii zaczął udostępniać w związku z nowelizacją Ustawy Prawo Geodezyjne i Kartograficzne wiele danych Państwowego Zasobu Geodezyjnego bez opłat na geoportalu.

Dostępne są NMT, NMPT, Ortofotomapa, BDOT10k (przetworzony przez GUGiK i częściowo odmienny od oryginału) czy dane pomiarowe LIDAR czyli pliki LAS lub LAZ.

Niestety, przyjęto zasadę maksymalnego utrudnienia użytkownikowi

Dowiedz się więcej

Import plików CAD DWG/DXF wraz z symboliką do Qgis

Jednym z problemów, które doskonale rozwiązuje QGiS jest wczytywanie danych CAD w tym oprogramowaniu. Zarówno pliki DXF jak i DWG mogą być w przeciwieństwie do niektórych informacji które znajdziecie w sieci zaimportowane do Qgis wraz z symboliką.

Procedura ładowania danych CAD w postaci plików DWG / DXF do Qgis:

1. Otwórz czysty projekt Qgis w wersji LTR (2.18.18) (Projekt > Nowy) w odwzorowaniu w którym znajduje się plik dwg. Jeśli jest inne kliknij w prawy dolny róg programu Qgis i wybierz odpowiednie odwzorowanie.

Dowiedz się więcej