Data Cleaning

Data Cleaning ist das automatisierte oder manuelle Aussortieren von Fällen, die bei Befragungen bestimmte Qualitätskriterien nicht erfüllen oder inkonsistente Antworten liefern. Ziel des Data Cleaning ist eine Verbesserung der Datenqualität und somit der Validität bzw. Aussagekraft von Umfrageergebnissen.

 

 

Wozu dient Data Cleaning?

 

Um im Datensatz eine gute Datenqualität der finalen Fälle garantieren zu können, werden Fälle aussortiert, die die Umfrage zu schnell beantworten, beim Beantworten bestimmte Muster verwenden oder inkonsistente Antworten geben.

 

 

 

Warum ist Data Cleaning wichtig?

 

In der Marktforschung wird großer Wert auf Datenqualität gelegt. Insights sind die Entscheidungsbasis wichtiger Fragestellungen für Produkte und Dienstleistungen. Gutes und korrekt angewandtes Data Cleaning gehört zum Standard und ist für valide, aussagekräftige Ergebnisse oft notwendig.

 

 

 

Woran erkennt man gutes Data Cleaning?

 

Die erhobenen Daten sollten stets – auch bei schnellen Studien unter Zeitdruck – die Anforderungen der Qualitätsrichtlinien von Marktforschungsergebnissen erfüllen. Für aussagekräftige, zielführende Ergebnisse und eine gute Entscheidungsbasis müssen die Daten frei von sogenannten Risiken der Ergebnisverzerrung sein. Die finalen Insights sollten daher in jedem Falle ein Data Cleaning durchlaufen haben.

 

 

 

Wie ist der Ablauf von Data Cleaning?

 

Während oder nach einer Befragung können verschiedene Qualitätskriterien angesetzt werden, mit denen Teilnehmer von der finalen Datenauswertung ausgeschlossen werden.

  1. Speeder: Speeder sind Befragungsteilnehmer, die „zu schnell“ antworten, beispielsweise schneller als 50% des Medians der Antwortzeit aller Befragten. Aufgrund der hohen Geschwindigkeit bei den Antworten besteht das Risiko, dass diese nicht bedacht getroffen wurden.
  2. Straightliner: Straightliner wählen generell in Matrixfragen, welche den Grad der Zustimmung zu verschiedenen Aussagen messen, die gleichen Antworten für jede einzelne Aussage. In der Regel ist leider davon auszugehen, dass der Befragte sich nicht wirklich Gedanken gemacht hat.
  3. Cheater: Teilnehmer mit offensichtlich nicht plausiblen Antworten oder sich widersprechenden Antworten sollten entfernt werden.

 

 

Weitere Empfehlungen zum Thema

Zur quantilope Homepage
Agile Insights Software