Automatyzacja analizy plików PDF i geokodowania w QGIS za pomocą Bielika i usługi ULDK.

Wielokrotnie słyszałem, że informacja rozproszona w postaci elementów lokalizacji zawarta w dokumentach to 80% informacji przestrzennej, która istnieje, lecz ze względu na pracochłonność jej pozyskanie jest problematyczne.

Największym wyzwaniem dla pozyskania takiej informacji nie jest samo rysowanie na mapie, czy geokodowanie, lecz żmudne ręczne wyciąganie informacji z setek, a czasem tysięcy stron dokumentów.

Ze względu na to że nie tak dawno uczestniczyłem w szkoleniu Eskadry Bielika i Google, zacząłem się zastanawiać jakby tu stworzyć jakieś narzędzie, które samo przeczyta dokumenty, przeanalizuje je, a następnie naniesie automatycznie na mapę w QGIS ich zakres przestrzenny.

Dodatkowymi zmiennymi, które brałem pod uwagę, było zachowanie prywatności i bezpieczeństwa przetwarzanych danych, w tym brak zewnętrznego promptowania w procesie przetwarzania oraz oparcie modelu AI wyłącznie o lokalną kartę graficzną w moim laptopie.

Założyłem, że celem takiego narzędzia będzie pobranie ze wskazanego katalogu wszystkich pdf z uchwałami o nadaniu nazw ulic, a następnie ich automatyczne przetworzenie do warstwy poligonowej GIS z wczytaniem do Qgis.

Dowiedz się więcej

Topologia działek w EGiB

Kilka miesięcy temu Główny Urząd Geodezji i Kartografii zaczął publikować aktualizowane, scalone do obszaru województw i kraju, dane działek EGiB z powiatowych WFS. Był to kluczowy krok w kierunku uzyskania spójnych i aktualnych danych z obszaru całego kraju bez potrzeby samodzielnego łączenia tych danych z powiatowych usług pobierania.

Dane te umożliwiają również przeprowadzanie różnych testów i analiz, w tym takich które sprawdzają ich spójność informacyjną i topologiczną na poziomie województw i kraju.

Topologia danych

Topologia czyli analiza wzajemnego położenia geometrii działek w skrócie polega na sprawdzeniu przylegania działek tak, aby tworzyły wspólna powierzchnię obejmującą obszar całego powiatu. Nie ma więc możliwości, żeby geometrie działek się nakładały lub między nimi tworzyły się tzw. szczeliny czyli pasy ziemi niczyjej.

Błędem będą też niepoprawne geometrie działek, w tym samozapętlenia lub podwójne punkty w tym samym miejscu ponieważ nie występują w rzeczywistości i tego typu błędy nie pozwalają na analizy GIS. Oczywiście takie błędy można poprawić automatycznie np. w Postgis, lecz nie robiłem tego, gdyż wpłynęłoby to na wynik poniższej analizy topologii.

Dowiedz się więcej