Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Dowiedz się więcej

Analiza ulic pobranych z usług WFS EMUiA z danymi PRG GUGiK

Po poprzedniej analizie aktualności punktów adresowych na podstawie wersji zawartej w plikach GML, pora na bezpośrednie porównanie danych zawartych w usługach WFS EMUiA i odpowiadających im danych pobranych z PRG. Jest to drugi wpis z zaplanowanych czterech postów o jakości danych adresowych w Polsce.

Założenie

Należało porównać geometrie ulic występujące w kilku tysiącach usług WFS Ewidencji Miejscowości Ulic i Adresów z zebranymi przez Główny Urząd Geodezji i Kartografii danymi zawartymi w Państwowym Rejestrze Granic.

Dowiedz się więcej

APP i zbiór APP czyli planowanie przestrzenne w plikach GML. Część 1 – analiza i parsowanie plików XML/GML.

APP i zbiór APP – co to jest i skąd je wziąć.

Pliki APP (Akt Planowania Przestrzennego) to pliki GML zawierające dane z zakresu planowania przestrzennego, których obowiązek tworzenia powstał w związku z wprowadzeniem zmian do ustawy z dnia 27 marca 2003 r. o planowaniu i zagospodarowaniu przestrzennym w postaci rozdziału 5a.

Zbiór APP to wszystkie lub kilka plików APP z obszaru gminy, które znajdują się w jednym pliku GML.

W związku z obowiązkiem publikacji danych GML w postaci APP dla nowych aktów prawnych postanowiłem przyjrzeć się spójności wytworzonych już plików GML (APP) dla planowania przestrzennego dostępnym w dziennikach województw. Pliki GML zawarte są tam w załącznikach do opublikowanych uchwał rad gmin i miast, są ogólnie dostępne i jako opublikowany załącznik do aktu prawa miejscowego powinny być niezmienne.

Analiza nie dotyczy publikowanych i zmieniających się w czasie plików GML dostępnych na stronach niektórych producentów oprogramowania lub gmin ze względu na to. że nie zachowują one niezmienności danych w czasie oraz podstawowych zasad wersjonowania (zmiana elementów XML przy niezmienności jego wersji i identyfikatora) oraz są w części niepodpisane cyfrowo. Fakt tych zmian w części prawdopodobnie wynika z dostrzeżonych usterek w wytworzonych danych lub zmieniających się wytycznych ministerstwa.

Dowiedz się więcej

Import plików CAD DWG/DXF wraz z symboliką do Qgis

Jednym z problemów, które doskonale rozwiązuje QGiS jest wczytywanie danych CAD w tym oprogramowaniu. Zarówno pliki DXF jak i DWG mogą być w przeciwieństwie do niektórych informacji które znajdziecie w sieci zaimportowane do Qgis wraz z symboliką.

Procedura ładowania danych CAD w postaci plików DWG / DXF do Qgis:

1. Otwórz czysty projekt Qgis w wersji LTR (2.18.18) (Projekt > Nowy) w odwzorowaniu w którym znajduje się plik dwg. Jeśli jest inne kliknij w prawy dolny róg programu Qgis i wybierz odpowiednie odwzorowanie.

Dowiedz się więcej

Punkty adresowe PRG – kody pocztowe analiza jakości REGEX

Dzisiaj krótki wpis o jakości danych kodów pocztowych w punktach adresowych PRG.

Kod pocztowy w Polsce w zasadzie każdy wie jak wygląda – to dwie cyfry kreska trzy cyfry czyli np. 80-210. Będąc ciekawym jak wygląda jakość w danych punktów adresowych PRG (dane dostępne tutaj) zrobiłem małą analizę za pomocą funkcji REGEX. Odrzuciłem wszystkie kody pocztowe o prawidłowej strukturze oprócz 00-000, który nie istnieje i wygenerowałem z nich bazę geopackage z kodami pocztowymi wątpliwej jakości, którą możecie pobrać tutaj.

Dowiedz się więcej

Podłączanie danych z portalu danepubliczne.gov.pl (CKAN) do Qgis

Portal danepubliczne.gov.pl jest portalem który zbiera ogólnodostępne dane np. z administracji publicznej i innych źródeł pozwalając na zintegrowanie ich w jednym miejscu. Prowadzony jest przez Ministerstwo Cyfryzacji w opensourcowym systemie CKAN, który powoli staje się podstawowym programem do publikowania w sieci tego typu danych w Europie.

Na stronie danepubliczne.gov.pl w zakładce baza wiedzy znajduje się artykuł jak korzystać z danych serwisu za pomocą API. CKAN współpracuje z różnymi klientami i językami programowania min.

Dowiedz się więcej

Projekt w Qgis bazujący wyłącznie na usługach online.

Wraz ze wzrostem ilości danych dostępnych w sieci za pomocą usług coraz bardziej skłaniam się do wykorzystywania zasobów sieciowych w sposób który pozwala mi na automatyczne pobranie aktualnych danych przy każdorazowym otwarciu projektu w Qgis.

W ramach testów na podstawie usługi WFS GDOŚ oraz danych z Centralnego Rejestru Form Ochrony Przyrody i usługi WMTS ortofotomapy z geoportalu wytworzyłem projekt dla pomników przyrody z obszaru województwa pomorskiego.

Qgis był tu klientem usług, którego zadaniem było pobranie danych z warstwy pomników przyrody GDOŚ i CRFOP, połączenie

Dowiedz się więcej

Wczytywanie danych GML BDOO za pomocą wtyczki Qgis GML Application Schema Toolbox

Qgis ciągle się rozwija i oferuje nowe narzędzia w tym również do czytania i przetwarzania w sposób nieco bardziej zaawansowany plików GML. Odpowiadając na potrzebę wczytywania danych GML w sposób umożliwiający przekazanie relacji zawartych w schematach danych XSD powstała wtyczka Qgis GML Application Schema Toolbox umożliwiająca takie czytanie danych GML. Wtyczkę możecie doinstalować poprzez menu Qgis Wtyczki > Zarządzaj wtyczkami.

Spróbujmy użyć wtyczki do wczytania darmowych danych BDOO

Dowiedz się więcej