Datenqualität: Wie kann sie gesichert werden?

Jump to: navigation, search

Methoden zur Qualitätssicherung

Anleitungen, Tutorials und Workshops können einen wichtigen Beitrag für die Gewährung einer hohen Datenqualität leisten[1]. Außerdem wird der Einsatz von standardisierten Erfassungsprotokollen empfohlen. Bei der Konzeption der Erfassungsprotokolle sollte darauf geachtet werden, dass umfassende Vorgaben zur Datenerhebung enthalten sind, gleichzeitig aber auch genügend Möglichkeiten für eigene Kommentare gegeben sind. Weitere Mechanismen zur Sicherung der Datenqualität sind:

  • Konsistenzprüfung möglichst direkt bei der Eingabe oder direkt danach durchführen und Fehler direkt den Erfassende mitteilen
  • Double oder Multi keying, Peer-Reviewing und Crowd Sourcing (Interrater-Agreement)
  • Validierung auf technischer Ebene
  • (Selbst)einschätzung des Expertenlevels
  • Vorgabe von technischen und administrativen Metadatenanforderungen
  • Abgleich mit (wissenschaftlich erhobenen) Referenzdaten

Ein Zielkonflikt kann sein, dass Einschränkungen für eine höhere Datenqualität vorgenommen werden, aber dies die Anzahl der Teilnehmenden reduziert. Insbesondere bei Bottom-up Vorhaben ist die Begleitung des Projekts durch Experten empfehlenswert. Für eine mögliche hohe Transparenz (Open Science) und Reproduzierbarkeit der Forschung sollte einerseits Wert auf klare Metadaten gelegt werden und andererseits alle Bearbeitungsschritte dokumentiert werden[1].

Best Practice Beispiele - Mechanismen zur Gewährleistung der Datenqualität

  • [artenfinder.rlp.de/ ArtenFinder Rheinland-Pfalz]: verschiedene Möglichkeiten zur Bestimmung des Expertenstatus: Eigenzuschreibung; Prozentsatz richtiger Klassifikationen (wie gut kann „richtig“ definiert werden); Expertengrad wird nach Artengruppe bestimmt; persönliche Rückmeldung an Melder zur Verbesserung der Bestimmung (Co-Benefit: Motivation)
  • Metadaten-Standards: INSPIRE (Europäischer Standard) oder Nutzung von Ontologien zur Beschreibung der Herkunft, z.B. Prov-Ontology
  • [Stunde der Gartenvögel - NABU Stunde der Gartenvögel]: Rauschen der Daten wird akzeptiert in Kombination mit Nutzung von Referenzdaten
  • Multikeying beim Genealogische Orts-Verzeichnis Projekt
  • Hohe Stringenz: [www.dda-web.de DDA]-Monitoringprogramme für Vögel und [www.tagfalter-monitoring.de/ Tagfalter-Monitoring Deutschland]
  • [www.naturgucker.de/ Naturgucker] / Inaturalist / iSpot als soziales Netzwerk zur Selbstkontrolle; Algorithmus für „upgrading“ der Melder
  • Beispiel: Beratung, Betreuung und Schulung von ehrenamtlichen MitarbeiterInnen der Bodendenkmalpflege zum Erhöhen der Datenqualität [Fachlicher Kontext:Archäologie][2]

Quellen

  1. 1,0 1,1 Richter, A., Mahla, A., Tochtermann, K., Scholz, W., Zedlitz, J., Wurbs, A., Vohland, K. & A. Bonn (2015): GEWISS Dialogforum: Datenqualität, Datenmanagement und rechtliche Aspekte in Citizen Science. GEWISS Bericht Nr. 6. Helmholtz-Zentrum für Umweltforschung – UFZ, Leipzig; Deutsches Zentrum für Integrative Biodiversitätsforschung (iDiv) Halle-Jena-Leipzig, Berlin-Brandenburgisches Institut für Biodiversitätsforschung (BBIB), Museum für Naturkunde, Leibniz-Institut für Evolutions- und Biodiversitätsforschung – MfN, Berlin. http://buergerschaffenwissen.de/sites/default/files/assets/dokumente/gewiss_6_datenbericht.pdf
  2. Bayerisches Landesamt für Denkmalpflege

This page was last modified on 8 April 2016, at 15:37. Content is available under CC-by unless otherwise noted.