Posted on

Die häufigsten Fehler in Geodaten

Reparaturwerkstatt

Bei der Arbeit mit Geodaten stolpert man früher oder später über Fehler. QGIS verweigert das Puffern von Daten, weil die Geometrie ungültig ist, die Klassifizierung eines Attributs spuckt eine Reihe von Schreibweisen ein und der selben Klasse aus oder Flächen überlappen sich, obwohl sie eine gemeinsame Grenze haben sollten.

Dabei ist es zumeist unerheblich, aus welcher Quelle die Daten stammen. Daten aus einem Geoportal sind oftmals genau so fehlerhaft wie Daten aus OpenStreetMap. Bei eigenen Berechnungen und digitalisierten Daten ist aber ebenfalls Aufmerksamkeit gefordert.

Welche Fehler in Geodaten gibt es ?

Fehler in Geodaten lassen sich in grob drei Kategorien einteilen. Zum einen sind da die reinen Geometriefehler wie doppelte Knoten, sich selbst überlappende Polygone oder fehlerhafte innere Ringe (Donut-Polygone).

Ebenfalls sehr häufig sind Fehler in der Topologie der Daten. Die Topologie beschreibt die Beziehungen von Daten zueinander. Das sind zum Beispiel Landnutzungsklassen, Flächen wie Wald, Siedlung oder Wasser. Es kann immer nur eine Nutzungsart pro Polygon geben, Überlappung oder Lücken sind in diesem Sinne Fehler in der Topologie der Daten.

Ein weiteres Beispiel für häufige Topologiefehler sind Netzwerke wie Kanaldaten, Straßennetzwerke oder Leitungsnetze. Lücken in den Daten machen das Netzwerk zum Teil sogar unbrauchbar. So kann auf einen Straßennetzwerk mit Lücken kein Routing durchgeführt werden.

Inhaltliche Fehler tauchen auch immer wieder auf. Damit sind Fehler in den Attributdaten der Geodaten gemeint.
In OpenStreetMap erfasst man zum Beispiel Gebäude mit dem Tag “building:yes“. Unterschiedliche Eingaben, die aber alle dasselbe meinen, sind zum Beispiel “building:true“, “building:1“, “building:house” und so fort.

Um alle Gebäude in einer Karte darstellen zu können, müssen alle oben genannten Variationen zur offiziellen Lösung “building:yes” konsolidiert werden. Denn nur so erhält man einen konsistenten Datensatz, der mit einer Abfrage auch alle geforderten Daten zurück gibt.

Geometriefehler

Um die Geometriefehler besser zu verdeutlichen, sind unten einige Bilder von typischen Fällen zu finden. Es gibt natürlich von viel mehr Fälle, diese lassen sich aber nicht immer leicht erstellen. Diese Fehler können durch Berechnungsmethoden wie “Intersection” entstehen, wo zwei Polygone von einander subtrahiert werden.

Wie findet man nun solche Geometriefehler? QGIS bietet da mehrere Möglichkeiten. Zum einen zeigt QGIS im Editiermodus des Layers schon oft an, dass Fehler vorliegen, wie in den Screenshots in der Statusleiste zu sehen.

Außerdem gibt es eine Reihe von Werkzeugen, auch als Plugin, die Geodaten nach Fehlern durchsuchen und diese anzeigen und unter Umständen auch Lösungsvorschläge bieten oder Korrekturen durchführen.

In QGIS 3  gibt es ein Werkzeug, dass Geometrien reparieren kann und zumindest die einfachen Fälle repariert.

Topologiefehler

Die nachfolgenden Screenshots zeigen einige typische Fälle von Topologiefehlern. Das Beispiel mit den Linien ist aber zumindest nicht ganz so einfach zu interpretieren wie es vielleicht den Anschein hat. Dazu aber gleich mehr.

In den ersten beiden Screenshots sieht man exemplarisch die topologische Überlappung von Polygonen und die Lücken zwischen den beiden Flächen. Der Fall mit den Linien kann ein Topologiefehler sein, muss es aber nicht. Je nach dem, was der Layer darstellt, liegt hier ein Fehler vor oder eben nicht. Gesetzt den Fall, hier handelt es sich um ein Straßennetzwerk könnte man die Lage auch als Brücke oder Tunnel interpretieren und die Geometrien wären als solche korrekt ohne einen gemeinsamen Schnittpunkt. Bei einem Leitungsnetzwerk wären die blaue und die lila Linie an der Schnittstelle aufzutrennen um eine richtige Topologie herzustellen.

Wie man sieht, ist die Frage, ob ein Topologiefehler vorliegt oder nicht auch immer eine Frage der Bedeutung der Daten und muss in der Prüfung mit einbezogen werden.

QGIS bietet ein Standardplugin, mit dem man Geodaten auf Topologiefehler überprüfen kann. Hier erstellt man seine eigenen Regeln und lässt diese durch das Plugin überprüfen.

Die Behebung von Topologiefehlern ist mehr oder weniger aufwändig durchzuführen. Mit dem im Bild gezeigten QGIS-Plugin findet man zwar die Stellen, wo die Regeln gebrochen werden, es existiert aber direkt keine Möglichkeit, die Fehler beheben zu lassen.
Hierzu kann man andere Systeme wie GRASS GIS oder PostGIS bemühen.

Fehler in den Attributen

Attributfehler sind die dritte Kategorie von Fehlern in Geodaten, die ich gerne vorstellen möchte. Exemplarisch zeige ich auf dem folgenden Screenshot die Werte aus dem Attribut “building” aus OpenStreetMap.

Geodaten-Fehler Attributwerte
Fehler in den Attributwerten

Wie man sieht, gibt es da eine Reihe von Werten. Nicht alle Werte sind falsch, aber einige kann man konsolidieren. “bui” sieht wie ein Tippfehler aus, “building_company” entspricht nicht den OSM-Regeln, ebenso wie “Bäckerei” oder “boulordrôme” und einige mehr.

Solche Fehler lassen sich unter anderem mit dem Feldrechner in QGIS beheben, je nach Datenquellen stehen aber auch andere Möglichkeiten zur Verfügung.