Analiza jakości punktów adresowych PRG za pomocą sieci neuronowych GNN.


O punktach adresowych i ich jakości wiele już razy pisałem na tym blogu. W związku z tym, że ostatnio dość intensywnie zajmuję się analizą możliwości użycia różnych rozwiązań opartych o AI w celach automatyzacji monotonnych i czasochłonnych prac, postanowiłem potestować możliwości automatycznej kontroli jakości danych punktów adresowych PRG z GUGiK.

W dniu 26.12.2025 roku pobrałem więc dane adresowe PRG w SHP i zacząłem je przetwarzać w środowisku Pythona. Użyłem ~5.5 mln punktów adresowych, które posiadały identyfikatory miejscowości i ulic, w celu sprawdzenia czy na podstawie tych atrybutów wytrenowany model będzie stanie pokazać punkty odstające. Po kilku próbach z różnymi ustawieniami i parametrami do treningu modelu, uzyskałem wytrenowany model, którym sprawdziłem dane PRG.

W celu wizualizacji wyników wytworzyłem szybki portal z wynikamii analizy. Dla możliwości sprawdzenia poprawności wskazanych błędów dodałem warstwę z WMTS GUGiK z ortofotomapą i usługą WMS PRG, które są widoczne przy dużym powiększeniu.

Dowiedz się więcej

Topologia działek w EGiB

Kilka miesięcy temu Główny Urząd Geodezji i Kartografii zaczął publikować aktualizowane, scalone do obszaru województw i kraju, dane działek EGiB z powiatowych WFS. Był to kluczowy krok w kierunku uzyskania spójnych i aktualnych danych z obszaru całego kraju bez potrzeby samodzielnego łączenia tych danych z powiatowych usług pobierania.

Dane te umożliwiają również przeprowadzanie różnych testów i analiz, w tym takich które sprawdzają ich spójność informacyjną i topologiczną na poziomie województw i kraju.

Topologia danych

Topologia czyli analiza wzajemnego położenia geometrii działek w skrócie polega na sprawdzeniu przylegania działek tak, aby tworzyły wspólna powierzchnię obejmującą obszar całego powiatu. Nie ma więc możliwości, żeby geometrie działek się nakładały lub między nimi tworzyły się tzw. szczeliny czyli pasy ziemi niczyjej.

Błędem będą też niepoprawne geometrie działek, w tym samozapętlenia lub podwójne punkty w tym samym miejscu ponieważ nie występują w rzeczywistości i tego typu błędy nie pozwalają na analizy GIS. Oczywiście takie błędy można poprawić automatycznie np. w Postgis, lecz nie robiłem tego, gdyż wpłynęłoby to na wynik poniższej analizy topologii.

Dowiedz się więcej

Połączone budynki EGiB dla obszaru całej Polski z usług sieciowych WFS.

W ostatnich miesiącach Główny Urząd Geodezji i Kartografii (GUGiK) udostępnił w geoportalu do pobrania połączone paczki danych dla aktualizowanych działek z EGiB. Więcej informacji o tym znajdziecie na blogu firmy GIS Support https://gis-support.pl/dzialki-ewidencyjne-dla-calej-polski-do-pobrania-w-jednym-pliku/

Kolejnym zasobem, który może się przydać do większych analiz są scalone budynki z obszaru całego kraju. Poniżej publikuję więc połączone warstwy budynków z usług WFS EGiB dla obszarów poszczególnych województw, które połączyłem do baz geopackage.

Dane budynków do pobrania

Dane budynków zostały scalone i opublikowane w takiej postaci w jakiej zostały pobrane z usług WFS. Nie wprowadzałem tam żadnych poprawek. Aktualność tych danych 1-5 listopada 2025. Dane zostały pobrane i złączone automatycznie za pomocą otwartego oprogramowania i były uzupełniane przez kilka dni o brakujące usługi.

Dowiedz się więcej

Scalone działki z powiatowych usług WFS EGiB dla Polski

Problem z łączeniem powiatowych danych WFS.

Jednym z kluczowych problemów, które występują w dostępie do otwartych danych EGiB jest brak aktualizowanej wersji scalonej dla działek i budynków dla obszarów większych niż powiat. Tylko takich danych bezproblemowo mogliby użyć operatorzy GIS w swoich analizach na większych obszarach.

W związku z licznymi pytaniami skąd można pobrać scalone dane EGiB, które są rozproszone w 384 powiatowych usługach sieciowych pobierania, poniżej publikuję scaloną postać tych danych z rozbiciem na poszczególne województwa z aktualnością na dzień 19.07.2025

EDIT: Uzupełniłem w danych brakujących kilku powiatów w dniu 22.07.2025

Wygląd udostępnianych danych w Qgis na obrazku poniżej

Dowiedz się więcej

Analiza jakości przypisania kodów pocztowych do punktów w danych Państwowego Rejestru Granic.

Na obrazku poniżej obszary ograniczające kod pocztowy wyznaczone na podstawie ~8mln punktów adresowych z danych PRG GUGiK. Dlaczego jakość tych danych jest ważna ? Ponieważ od nich zależy poprawność geokodowania danych w różnych systemach w tym systemach rządowych.

Widoczne czerwone obszary to obraz błędów, które są ewidentne i spektakularne, natomiast na obrazku nie widać tysięcy błędów, które są widoczne dopiero przy powiększeniu. (przykładowy rysunek poniżej).

Dowiedz się więcej

Analiza ulic pobranych z usług WFS EMUiA z danymi PRG GUGiK

Po poprzedniej analizie aktualności punktów adresowych na podstawie wersji zawartej w plikach GML, pora na bezpośrednie porównanie danych zawartych w usługach WFS EMUiA i odpowiadających im danych pobranych z PRG. Jest to drugi wpis z zaplanowanych czterech postów o jakości danych adresowych w Polsce.

Założenie

Należało porównać geometrie ulic występujące w kilku tysiącach usług WFS Ewidencji Miejscowości Ulic i Adresów z zebranymi przez Główny Urząd Geodezji i Kartografii danymi zawartymi w Państwowym Rejestrze Granic.

Dowiedz się więcej

Aktualność danych w Państwowym Rejestrze Gruntów (PRG) określona na podstawie wersji punktów adresowych.

Rejestr PRG – adresy

Dane adresowe PRG są danymi integrowanymi przez Główny Urząd Geodezji i Kartografii (GUGiK) z danych pozyskiwanych przez gminy w drodze zgłoszeń punktów adresowych oraz uchwał o nadaniu i przebiegu ulic, które są uchwalane przez rady gminy oraz przekazywanych do systemu GUGiK przez systemy gmin.

PRG jest kluczowym rejestrem referencyjnym dla wielu systemów w tym tych związanych z zarządzaniem kryzysowym.

Jednym z istotnych elementów jakości tego rejestru jest aktualność danych, która ma bezpośredni wpływ na użyteczność informacji wykorzystywanych przez administrację publiczną, firmy prywatne i obywateli.

Różnice w PRG i EMUiA

W związku z zauważonymi przeze mnie różnicami występującymi w danych serwowanych przez usługi WFS gmin zawierającymi dane adresowe, a zebranymi w PRG danymi serwowanymi przez GUGiK stanąłem przed dylematem jak ustalić aktualność danych zawartych w paczce PRG pobranej z geoportalu.

Dowiedz się więcej

Pobieranie Darmowych danych z Geoportalu – Ortofotomapy, NMT, LAS, BDOT10k

Główny Urząd Geodezji i Kartografii zaczął udostępniać w związku z nowelizacją Ustawy Prawo Geodezyjne i Kartograficzne wiele danych Państwowego Zasobu Geodezyjnego bez opłat na geoportalu.

Dostępne są NMT, NMPT, Ortofotomapa, BDOT10k (przetworzony przez GUGiK i częściowo odmienny od oryginału) czy dane pomiarowe LIDAR czyli pliki LAS lub LAZ.

Niestety, przyjęto zasadę maksymalnego utrudnienia użytkownikowi

Dowiedz się więcej

Ewidencja zbiorów i usług na geoportal.gov.pl – Analiza usług Przeglądania WMS.

Ewidencja zbiorów i usług to rejestr prowadzony przez Głównego Geodetę Kraju do którego zgłaszane powinny być zbiory danych i usługi sieciowe przeglądania, pobierania, wyszukiwania, przetwarzania i uruchamiania usług przestrzennych, które zostały wytworzone dla danych w ramach grup tematycznych określonych w załączniku nr 1 rozporządzenia poniżej. http://prawo.sejm.gov.pl/isap.nsf/download.xsp/WDU20102011333/O/D20101333.pdf

Ostatnia nowelizacja ww. rozporządzenia wprowadziła obowiązek weryfikacji wpisanych do rejestru usług i zbiorów danych, który został nałożony na głównego geodetę kraju, przy współudziale instytucji zgłaszających zbiory i usługi do ewidencji zbiorów i usług. Przez ostatnie kilka tygodni

Dowiedz się więcej

Walidacja plików XML/GML – dlaczego jest potrzebna ?

[Aktualizacja 26-07-2018]

Jak już wspomniałem na tym blogu walidacja danych xml / gml za pomocą schematu XSD polega na sprawdzeniu zgodności struktury i warunków zapisanych w schemacie z zapisanymi w pliku xml zagnieżdżeniami i wartościami atrybutów oraz elementów.

Walidacja jest operacją automatyczną sprawdzającą plik i dającą jednoznaczny wynik „spełnia” lub „nie spełnia”. Nie powinno się dać również w procesie walidacji wyłączyć warunków ze schematu nie zmieniając go. Gwarantuje to z dość dużą pewnością że pliki

Dowiedz się więcej