Statistische Daten: Der Überblick | NOVUSTAT Statistik-Glossar

Daten gibt es zwar viele – Auf relevante statistische Daten kommt es jedoch an

Daten sind der Rohstoff der Statistik. Sie können alle möglichen Formen, Typen und Formate haben. Dieser Artikel gibt Ihnen einen Überblick über Arten von statistischen Daten, deren unterschiedliche Einteilungen und den Ablauf bei der Auswertung dieser Daten.

Sollten Sie Unterstützung bei der Auswertung von Daten benötigen, helfen unsere Statistiker Ihnen gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

Welche Arten von Daten gibt es?

Statistische Daten treten in den unterschiedlichsten Formen auf. In einer Umfrage können beispielsweise offen Fragen formuliert sein. In diesem Fall hat es der Statistiker mit Text- Daten zu tun. Üblich bei Fragebögen sind vorgegebene Antwortoptionen, bei denen der Befragte ein oder mehrere Antworten auswählen kann. Hier stehen Wertelisten oder Kategorien zur Auswahl. Auch Zahlen sind beispielsweise auf visuellen Analogskalen (VAS) als Antworten möglich. Hier kann der Befragte beispielsweise die empfundene Scherzintensität auf einer 10 cm langen Strecke mit einem Kreuz einzeichnen.

Typische statistische Daten sind somit:

Text: Text kann beliebige Zeichen enthalten, auch Ziffern, auch Leerzeichen. Üblicherweise wird hier eine Maximallänge vorgegeben.
Werteliste / Kategorien: Für manche Variablen sind nur einige wenige konkrete Kategorien erlaubt, z.B. „Mann oder Frau“, „ja oder nein“ oder auch Farben wie Weiss, Gelb, Orange, Rot, Violett, Blau, Grün, Schwarz. Solche Daten sind einfacher auszuwerten als Freitext-Daten, aber die Kunst besteht darin, die Datenobjekte diesen Kategorien zuzuordnen. Diesen Vorgang nennt man Codieren oder Codierung.
Zahlen
Bilder, z.B. in jpg-Format

In welche Skalen können statistische Daten eingeordnet werden?

Für statistische Auswertungen spielt es eine grosse Rolle, welche Skala statistische Daten einnehmen können. Man unterscheidet fünf Skalen:

1. Nominalskala: Die Daten sind verschiedenen Kategorien zugeordnet, aber diese Kategorien sind reine Etiketten und bedeuten keine Rangfolge oder Anordnung, so wie „Mann / Frau“.

2. Ordinalskala: Die Daten sind ebenfalls Kategorien zugeordnet, aber diese bezeichnen eine Rangordnung. Eine häufig verwendete Ordinalskala ist „niedrig / mittel / hoch“ oder die Likert-Skala „trifft nicht zu / trifft eher nicht zu / teils-teils / trifft eher zu / trifft zu“.

3. Intervallskala: Hier bedeuten die Datenwerte nicht nur eine Reihenfolge, sondern der Abstand ihrer Zahlenwerte hat ebenfalls eine Bedeutung. Die Temperatur-Skala zählt hier dazu. Die Intervall-Skala hat keinen echten Nullpunkt in dem Sinne, dass man sagen kann dass 20 Grad Celsius doppelt so warm sind wie 10 Grad Celsius.

4. Verhältnisskala: Diese Skala hat alle Eigenschaften wie die Intervallskala, kennt jedoch auch einen Nullpunkt. Dies gilt beispielsweise für das Alter einer Person. Mit 20 Jahren ist sie doppelt so alt wie mit 10 Jahren.

5. Absolutskala: Die Absolutskala erfüllt zusätzlich zu den Bedingungen der Verhältnisskala noch die Bedingung, dass es sich um eine natürlich gegebene Masseinheit handelt. Beispielsweise die Anzahl der Bewohner eines Landes wäre eine solche Grösse.

Diese Datentypen beeinflussen die Anzahl an Ausprägungen, die eine Variable haben kann, den nötigen Speicherplatzbedarf und die statistischen Verfahren und statistischen Tests, die darauf angewendet werden können.

Jetzt unverbindlich anfragen

Statistische Daten aufbereiten

Vor der Datenanalyse müssen statistische Daten vollständig und im richtigen Format bereitstehen, von Datenfehlern bereinigt sein und mittels einer Datenstrategie organisiert werden.
Dabei stellen sich die folgenden Herausforderungen:

Auswahl der Daten: Welche der vorhandenen Daten passen zur gestellten Frage? Oder auch: Welche Daten können bzw. wollen wir in welcher Form neu erheben, um die Frage zu beantworten?
Bereitstellen der Daten: Die nötigen Daten liegen oft in verschiedenen Datenbanken vor. Von dort müssen sie exportiert und für die Auswertung bereitgestellt werden. Oder sie liegen überhaupt nicht elektronisch vor und müssen erst digitalisiert werden.
Zusammenführen von Daten: Daten aus verschiedenen Quellen müssen irgendwie zusammengeführt werden, z.B. in einem Data Warehouse oder in einer gemeinsamen Datei. Welche der beiden Alternativen Sie wählen, hängt u.a. von der Datenmenge ab.
Transformation der Daten: Eventuell sind die Daten im falschen Format und müssen in ein anderes Format überführt werden, beispielsweise Texte hinten abgeschnitten oder auch um Leerzeichen ergänzt, Zahlen gerundet, Freitext in Kategorien codiert. Manches davon lässt sich automatisieren, aber eventuell nicht alles.
Bereinigen der Daten: Die Daten enthalten oft Werte, die bei der Auswertung stören. Dazu zählen beispielsweise fehlende Daten oder unplausible Daten. Auch offensichtlich falsche Daten wie ein Geburtsjahr einer angeblich heute noch lebenden Person, das im Jahr 1489 liegt (vermutlich ein Tippfehler bei der Eingabe). Solche Daten kann man automatisch suchen und ersetzen, indem man Intervalle für gültige Werte definiert sowie eine Ersetzungsregel.

Gerade die Datenbereinigung lässt sich nur teilweise automatisieren. Hier ist noch viel Handarbeit und insbesondere Fachwissen nötig.

Statistische Daten analysieren

Abhängig vom Skalenniveau können statistische Daten in aufbereiteter Form ausgewertet werden.

Häufig gestellte Fragen

Was sind statistische Daten?

Statistische Daten sind Informationen, die aus einer Stichprobe oder Population gewonnen wurden und die durch mathematische oder statistische Methoden analysiert werden. Sie können quantitative oder qualitative Merkmale enthalten und helfen dabei, Muster und Zusammenhänge in einer Gruppe von Daten zu identifizieren.

Wie werden statistische Daten erhoben?

Statistische Daten können durch verschiedene Methoden erhoben werden, wie beispielsweise Umfragen, Experimente oder Beobachtungen. Die Art der Datenerhebung hängt von der Art der Fragestellung ab und davon, welche Daten benötigt werden, um diese Frage zu beantworten.

Was ist der Unterschied zwischen quantitativen und qualitativen Daten?

Quantitative Daten sind numerische Daten, die sich messen oder zählen lassen, wie zum Beispiel Grösse, Alter oder Anzahl. Qualitative Daten hingegen sind beschreibende Daten, die sich nicht numerisch messen lassen, wie zum Beispiel Geschlecht, Beruf oder Lieblingsfarbe.

Wie werden statistische Daten analysiert?

Statistische Daten werden mithilfe von statistischen Analysen und Verfahren wie Hypothesentests, Regressionsanalysen oder Clusteranalysen analysiert. Diese Methoden helfen dabei, Muster und Zusammenhänge in den Daten zu identifizieren und statistische Schlussfolgerungen zu ziehen.

Wo werden statistische Daten verwendet?

Statistische Daten werden in vielen verschiedenen Bereichen verwendet, wie zum Beispiel in der Wissenschaft, der Wirtschaft, der Politik oder der Medizin. Sie werden genutzt, um Trends und Entwicklungen zu analysieren, Prognosen zu erstellen oder Entscheidungen zu treffen, die auf objektiven Daten basieren.

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Google Analytics
Name	Google Analytics
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Monate

Akzeptieren	Vimeo Statistiken
Name	Vimeo Statistiken
Anbieter	Vimeo.com, Inc.
Zweck	Sammelt Daten über Besuche des Benutzers auf der Website, wie zum Beispiel welche Seiten gelesen wurden.
Datenschutzerklärung	https://vimeo.com/legal/privacy/policy
Host(s)	vimeo.com
Cookie Name	vuid
Cookie Laufzeit	2 Jahre

Akzeptieren	Proven Expert
Name	Proven Expert
Anbieter	Expert Systems AG
Zweck	Sammelt Informationen zum Besucherverhalten auf mehreren Webseiten. Diese Informationen wird auf der Webseite verwendet, um die Relevanz der Werbung zu optimieren.
Datenschutzerklärung	https://www.provenexpert.com/en-us/privacy-policy/
Host(s)	provenexpert.com
Cookie Name	PE_SESSION
Cookie Laufzeit	Session

Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

+49 211 99346512

+41 78 89 11111

+43 720 3035410

Statistische Daten