Modus, Median und Mittelwert sind so genannte Lageparameter, die eine Vorstellung von der Größenordnung einer Reihe von Daten vermitteln. Sie geben keinen Aufschluss über die Streuung der Beobachtungen.
Hierfür sollten Streuungsmaße wie die Spannweite verwendet werden.
Die Spannweite ist die Abweichung zwischen dem größten und dem kleinsten Messwert. Die Spannweite gibt uns Auskunft über den Abstand zwischen dem Maximum und dem Minimum unserer Daten.
Je größer die Spannweite, desto weiter liegen die Messwerte auseinander; je kleiner die Spannweite, desto näher liegen die Messwerte beieinander.
Betrachten wir 2 Klassen mit je 14 Schülern. Die Schüler/-innen erhielten eine Note auf 10 für eine Aufgabe.
Dies sind die Ergebnisse der beiden Klassen.
Die Noten von Klasse Nr. 2 sind also viel mehr gestreut als die Noten der Klasse Nr. 1.
Daten sind für jede statistische Studie unerlässlich.
Eine der Aufträge der Statistikerin/des Statistikers ist die Sammlung von Daten die für die Beantwortung der gestellten Frage notwendig sind.
Beispiele
Wie viel Zeit fernsehen Kinder deines Alters?
Was ist das Alter der belgischen Bevölkerung?
Welche von zwei verschiedenen Kartoffelarten hat den höchsten Ertrag?
Wie groß sind die Ohren von afrikanischen Elefanten?
Woher kommen diesen Daten?
Es gibt verschiedene Datenquellen:
Experimentelle Daten: Diese Daten werden von Wissenschaftlern gewonnen, die Versuchspläne aufstellen, um eine ganze Reihe von Hypothesen zu testen, z. B. über die Wirksamkeit eines Medikaments oder die Resistenz bestimmter Pflanzensorten gegen Krankheiten usw.
Administrative Daten: Das sind Daten die von einer anderen Verwaltung oder Administration erfasst wurden. Diese Daten existieren schon. Es ist also nicht nötig, Bürger oder Unternehmen erneut um Informationen zu bitten. Das spart Zeit und Geld ein und vermeidet, dass Menschen unnötig belästigt werden.
Erhebungsdaten: Wenn die Daten nicht verfügbar sind, gibt es keine andere Möglichkeit, als sie durch Erhebungen zu sammeln. Erhebungen sind Formulare, die die Menschen ausfüllen sollen. Wusstest du, dass Statbel eine der wenigen Einrichtungen in Belgien ist, die befugt ist, Bürgerinnen und Bürgern, Unternehmen und Organisationen obligatorische Umfragen aufzuerlegen?
Zum Beispiel: Die Statistiken die in der Themen Bevölkerung, Entwicklung der Bevölkerung und Staatsangehörigkeiten werden vorgestellt, basieren sich auf Daten aus dem Nationalregister, das aus administrativen Daten besteht. Die Statistiken zur Landwirtschaft bestehen teilweise aus Erhebungsdaten.
Wenn die Variablen proportional sind und du kennst 3 Werte, kannst du den Dreisatz anwenden, um den vierten Wert zu finden.
9 Ananasse kosten 36 €. Wie viel kosten 11 Ananasse?
Um diese Aufgabe zu lösen, ermittelst du zunächst den Preis für 1 Ananas und multiplizierst diesen Preis dann mit 11.
11 Ananasse kosten also 44 €.
Eine Grafik ist eine visuelle Darstellung von Daten.
Eine Grafik sollte die folgenden Daten enthalten:
Grafiken gibt es in verschiedenen Formen: Kurven, Balkendiagramme, Histogramme, Tortendiagramme, ... .
Ein Balkendiagramm wird verwendet, um Beobachtungen nach ihrer Häufigkeit darzustellen. Je größer der Balken, desto größer die Häufigkeit der Wahrnehmung.
Die Kurven zeigen im Allgemeinen eine Entwicklung. Hier zeigt sie die Entwicklung von zwei Indizes im Laufe der Zeit.
Ein Tortendiagramm stellt die Beziehung zwischen einzelnen Anteilen und dem großen Ganzen einer Variable dar. Hier wird der Anteil der einzelnen Tierkategorien an der Gesamtzahl der Tiere in belgischen Bauernhöfen im Jahr 2016 dargestellt.
Um ein Tortendiagramm in ein Balkendiagramm umzuwandeln, muss man die Gesamthäufigkeit, d. h. die Gesamtzahl der Beobachtungen, kennen. Dabei genügt es, jeden Prozentsatz auf diese Gesamtsumme anzuwenden, um die Häufigkeit jeder Kategorie zu erfahren.
Die Daten stammen aus einer Erhebung von Statbel.
Grafiken sind in jedem Thema zu finden.
Die Grundgesamtheit oder Population ist die Menge der Einheiten (auch Individuen genannt), auf der eine statistische Studie basiert ist.
Die Anzahl oder die absolute Häufigkeit ist die Anzahl, wie oft ein Wert in einer statistischen Reihe beobachtet wird.
Die Gesamtzahl ist die Gesamtzahl der Beobachtungen.
Nachstehend findest du die Noten auf 10 von einem Test, den 24 Schüler/-innen einer Klasse abgelegt haben, in Form einer Häufigkeitsverteilung,
Noten auf 10 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Beobachtungen der Schüler/-innen | 1 | 2 | 1 | 0 | 1 | 2 | 5 | 5 | 4 | 2 | 1 |
Die kumulative Häufigkeit ist die Summe aller Häufigkeiten bis zu einem bestimmten Wert der betreffenden Datenreihe.
Um die kumulative Häufigkeit berechnen zu können, muss die statistische Reihe geordnet werden, d.h. die Beobachtungen müssen in aufsteigender Reihenfolge zugeordnet werden.
Die absoluten Häufigkeiten können summiert werden, ebenso wie die relativen Häufigkeiten.
Nachstehend findest du die Noten auf 10 von einem Test, den 24 Schüler/-innen einer Klasse abgelegt haben, in Form einer Häufigkeitsverteilung,
Noten auf 10 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | Insgesamt |
Beobachtungen der Schüler/-innen | 1 | 2 | 1 | 0 | 1 | 2 | 5 | 5 | 4 | 2 | 1 | 24 |
In dieser Tabelle sind die Noten der Schülerinnen bzw. der Schüler schon in aufsteigender Reihenfolge geordnet.
Die Zahl der Schüler/-innen mit einer Note von 5/10 oder niedriger ist 1+2+1+0+1+2=7.
Die Zahl der Schüler/-innen mit einer Note von mehr als 5/10 ist
5+5+4+2+1= 17
Möchtest du mehr über die kumulativen Häufigkeiten wissen, dann kannst du das im Thema ‚Bevölkerung‘ nachlesen.
Der Median ist ein Lagemaß, das verwendet werden kann, um die Informationen in einem manchmal sehr großen Datensatz zusammenzufassen.
Der Median ist die mittlere Zahl einer Zahlengruppe. Das bedeutet, dass die Hälfte der Zahlen Werte enthält, die größer als der Median sind, und die Hälfte der Zahlen Werte, die kleiner als der Median sind.
Der Median ist der zentrale Wert einer Datenreihe.
Um den Median zu bestimmen, müssen die Daten zunächst in aufsteigender Reihenfolge geordnet werden.
Stell dich vor, wir interessieren uns für die Größe der Schülerinnen und Schüler einer Klasse, gemessen in cm.
Dies sind die aufgezeichneten Längen für die 15 Schüler/-innen der Klasse.
Yana 135 cm, Alice 130 cm, Jules 132 cm, Samuel 150 cm, Fabio 133 cm, Lucile 138 cm, Emma 129 cm, Louis 133 cm, Ilan 134 cm, Selena 128 cm, Adriano 136 cm, Aisha 133 cm, Sofiane 135 cm, Aaron 140 cm und Noémie 139 cm.
Der erste Schritt besteht darin, die Daten von klein nach groß zu ordnen. Deshalb bitten wir die Schüler/-innen, eine Rangfolge zu erstellen, der Größe nach. Dann bekommen wir diese Reihe:
Selena | 128 cm |
Emma | 129 cm |
Alice | 130 cm |
Jules | 132 cm |
Emilie | 133 cm |
Fabio | 133 cm |
Louis | 133 cm |
Ilan | 134 cm |
Paul | 135 cm |
Michèle | 135 cm |
Nicolas | 136 cm |
Lucile | 138 cm |
Noémie | 139 cm |
Patrick | 140 cm |
Samuel | 150 cm |
Danach musst du die Mitte der Datenreihe finden.
Selena | 128 cm | 7 Beobachtungen sind kleiner als 134 cm |
Emma | 129 cm | |
Alice | 130 cm | |
Jules | 132 cm | |
Emilie | 133 cm | |
Fabio | 133 cm | |
Louis | 133 cm | |
Ilan | 134 cm | 134 cm ist der Wert, der die Reihe in 2 teilt, 134 cm ist der Median |
Paul | 135 cm | 7 Beobachtungen sind größer als 134 cm
|
Michèle | 135 cm | |
Nicolas | 136 cm | |
Lucile | 138 cm | |
Noémie | 139 cm | |
Patrick | 140 cm | |
Samuel | 150 cm |
Stellen wir uns vor, dass Fabio die Schule gewechselt hat. Das bedeutet, dass die Klasse nur noch 14 Schüler/-innen zählt. Die Reihe der geordneten Daten kann wie folgt dargestellt werden:
Selena | 128 cm | 7 Beobachtungen sind kleiner als 134,5 cm |
Emma | 129 cm | |
Alice | 130 cm | |
Jules | 132 cm | |
Emilie | 133 cm | |
Louis | 133 cm | |
Ilan | 134 cm | |
134,5 cm ist der Wert, der die Reihe in 2 teilt, 134,5 cm ist der Median | ||
Paul | 135 cm | 7 Beobachtungen sind größer als 134,5 cm |
Michèle | 135 cm | |
Nicolas | 136 cm | |
Lucile | 138 cm | |
Noémie | 139 cm | |
Patrick | 140 cm | |
Samuel | 150 cm |
In diesem Fall ist der Median kein beobachteter Wert in der statistischen Reihe.
Wenn du mehr darüber erfahren möchtest, lies bitte den Abschnitt "Bevölkerung“ über den Median.
Das (arithmetische) Mittel ist ein Lagemaß, das zur Zusammenfassung der Informationen in einem manchmal sehr großen Datensatz verwendet werden kann.
Zur Berechnung des Mittelwerts müssen alle Beobachtungen addiert werden und die Summe durch die Anzahl der Beobachtungen geteilt werden.
Zum Beispiel
Jules erhielt 5 Muffins, Alice erhielt 3, Samuel erhielt 1, Yana erhielt 10 und Lucile erhielt 6.
Lass uns alle Muffins zusammenzählen.
Insgesamt gibt es 25 Muffins.
Danach verteilen wir die Muffins gleichmäßig unter allen Kindern.
Jedes Kind bekommt 5 Muffins. Der Durchschnitt beträgt also 5 Muffins.
Der Mittelwert, der in unserer Alltagssprache als Durchschnitt bezeichnet wird, kann als die Anzahl der Muffins interpretiert werden, die jedes Kind erhalten würde, wenn alle Muffins gleichmäßig unter den Kindern verteilt würden.Wenn du mehr über den Mittelwert erfahren möchtest, findest du mehr Informationen darüber in den Themen "Bevölkerung" und "Landwirtschaft".
Der Mittelwert und der Median sind beides Lagemaße.
Ein Lagemaß gibt einen typischen Wert an, um den die Beobachtungen verteilt sind.
Dieser typische Wert ist eine Art Zusammenfassung der gesamten Datenreihe.
Wenn du den Mittelwert und den Median einer Datenreihe berechnest, berechnest du zwei typische Werte deiner Reihe, die manchmal sehr unterschiedlich sein können.
Wie kannst du entscheiden, welcher Wert am sinnvollsten ist?
Stellen dir Folgendes vor. Diesmal geht es um Obst: 14 Kirschen und eine Wassermelone. Die Kirschen sind leicht und wiegen nur 10 Gramm pro Stück. Die Wassermelone dagegen ist riesig: Sie wiegt 5 Kilo, also 5.000 Gramm!
Nun wollen wir berechnen, wie viel jedes Stück Obst im Durchschnitt wiegt. Dazu addieren wir das Gewicht aller Kirschen und der Wassermelone und teilen das durch die Gesamtzahl der Stücke Obst, also 15.
(14x10) +5000
15
Nach der Berechnung stellt sich heraus, dass der Durchschnitt bei 333,33 Gramm pro Frucht liegt, was etwa 0,33 Kilogramm entspricht. Aber das ist viel zu schwer für eine Kirsche, selbst für eine große!
Versuchen wir nun, den Median, also das mediane Gewicht unserer Obstmenge, zu berechnen: 10, 10 , 10 , 10 , 10, ... 5.000, mit einem Median von 10 Gramm. Das ist doch viel repräsentativer für unsere Obstmenge, oder?
Dieses Beispiel lmacht deutlich, dass die Berechnung des Mittelwerts nicht unbedingt sinnvoll ist, wenn deine Datenreihe einige sehr große Werte oder im Gegenteil einige sehr kleine Werte enthält; es ist daher besser, den Median als "typischen" Wert für deine Reihe zu verwenden.
Der Modus ist der Wert mit der höchsten Zahl (oder Häufigkeit).
Der Modus ist der Wert, der in einer Datenmenge am häufigsten vorkommt.
Der Modus (oder Modalwert) ist ein Lageparameter.
Dies ist die Häufigkeitsverteilung des Alters der Mitglieder einer Fußballmannschaft.
Alter | Anzahl |
---|---|
19 | 1 |
20 | 1 |
21 | 1 |
23 | 1 |
24 | 2 |
25 | 3 |
26 | 1 |
28 | 2 |
30 | 1 |
32 | 1 |
35 | 1 |
Total | 15 |
Was ist das häufigste Alter in dieser Mannschaft? Was ist der häufigste Wert? Um diese Fragen zu beantworten, musst du die höchste Frequenz ermitteln.
Alter | Anzahl |
---|---|
19 | 1 |
20 | 1 |
21 | 1 |
23 | 1 |
24 | 2 |
25 | 3 |
26 | 1 |
28 | 2 |
30 | 1 |
32 | 1 |
35 | 1 |
Total | 15 |
3 ist die höchste Häufigkeit und entspricht dem Alter von 25 Jahren.
25 ist das am häufigsten beobachtete Alter in der Mannschaft, es ist der häufigste Wert in der Datenreihe.
25 Jahre ist der Modus der Datenreihe.
Wenn du mehr darüber wissen möchtest, findest du weitere Informationen im Thema "Bevölkerung" und auch im Thema "Verkehrsunfälle".
Ein Prozentsatz stellt einen Teil eines Ganzen dar und wird als 100 ausgedrückt. Ein Prozentsatz ist ein Bruchteil von 100. Zu diesem Zweck wird das Symbol % verwendet.
20% bedeutet 20 von 100 Teilen oder 20/100.
Ein Prozentsatz, der sich auf nichts bezieht, ist bedeutungslos.
20% von was?
Beispiel 1
Hier siehst du ein Quadrat, das aus 100 Quadraten besteht.
Von diesen 100 Quadraten sind 20 gelb, 10 blau, 25 orange, 1 rot und 44 gar nicht eingefärbt.
Beispiel 2
In einer Klasse sind 4 Mädchen und 16 Jungen.
Wie hoch ist der Anteil der Mädchen in der Klasse?
Der Anteil der Mädchen in der Klasse (4 Mädchen von insgesamt 20) kann als 4/20 geschrieben werden. Zur Berechnung des Prozentsatzes ist dieser Anteil auf 100 zu beziehen.
Um die Antwort zu finden, multipliziert man den Nenner und damit den Zähler mit 5.
Das bedeutet, dass die Klasse 20% Mädchen zählt.
Im Thema "Staatsangehörigkeiten" werden viele Prozentsätze verwendet.
Proportionalität ist ein Konzept, das sich auf Variablen bezieht, die durch dieselbe Zahl verbunden sind.
Multipliziert man die Werte der einen Variablen mit einer Zahl ungleich Null und wir bekommen die Werte der anderen Variablen, so sagt man, dass diese Variablen proportional sind.
Die Zahl, mit der man den Wert der ersten Variablen multiplizieren muss, um den Wert der zweiten Variablen zu ermitteln, wird als Proportionalitätsfaktor bezeichnet.
Proportionale Variablen können in einer Proportionalitätstabelle dargestellt werden.
Anzahl der verbrauchten Liter Benzin | 2,5 | 4 | 6 | 10 |
Anzahl der gefahrenen Kilometer | 50 | 80 | 120 | 200 |
Sind die Anzahl der verbrauchten Liter Benzin und die Anzahl der gefahrenen Kilometer zwei proportionale Größen? Mit anderen Worten: Mit welcher Zahl muss man die erste Zeile der Tabelle multiplizieren, um die zweite Zeile zu erhalten
*20 | Anzahl der verbrauchten Liter Benzin | 2,5 | 4 | 6 | 10 |
Anzahl der gefahrenen Kilometer | 50 | 80 | 120 | 200 |
20 ist der Proportionalitätsfaktor. Er gibt die Anzahl der gefahrenen Kilometer pro Liter Benzin an. Die beiden Variablen sind also proportional.
Du wirst feststellen, dass:
2,5 * 1,5 = 4 | In einer Proportionalitätstabelle die Werte in einer Spalte mit einer Zahl multipliziert werden können, um die Werte in einer anderen Spalte zu ermitteln. |
50 * 1,5 = 80 | |
2,5 * 4 = 10 | |
50 * 4 = 200 | |
4 + 6 = 10 | In einer Proportionalitätstabelle können die Werte von zwei Spalten mit einer Zahl summiert werden, um die Werte einer anderen Spalte zu ermitteln. |
80 + 120 = 200 |
Die Merkmale, die in einer statistischen Studie wichtig sind, werden Variablen genannt, weil der Wert dieser Merkmale in der Studie von Individuum zu Individuum unterschiedlich sein kann.
Manche Variablen können ausgedrückt werden als:
Die Variablen, auf die du stößt, wenn du die Themen von Statbel Junior durchgehst, sind quantitative Variablen.
Die relative Häufigkeit einer Beobachtung erhält man indem die Anzahl der Beobachtungen durch die Gesamtzahl in der statistischen Reihe geteilt wird.
Die relative Häufigkeit liegt immer zwischen 0 und 1. Sie kann auch als Prozentsatz ausgedrückt werden.
Die Summe aller relativen Häufigkeiten ist immer 1.
Nachstehend findest du die Noten auf 10 von einem Test, den 24 Schüler/-innen einer Klasse abgelegt haben, in Form einer Häufigkeitsverteilung,
Noten auf 10 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | Total |
Anzahl der Schülerinnen und Schüler mit dieser Note | 1 | 2 | 1 | 0 | 1 | 2 | 5 | 5 | 4 | 2 | 1 | 24 |
Das bedeutet, dass 20,8% der Schüler/-innen der Klasse eine 7/0 im Test erhielten.
Du kannst dies für alle Noten von 0 bis 10 tun.
Damit keine Fehler bei den Schlussfolgerungen der Erhebung gemacht werden, ist es wichtig, dass die Stichprobe repräsentativ ist, d.h. dass sie dieselben Merkmale aufweist wie die Grundgesamtheit, aus der sie gezogen wird.
Stell dir eine Klasse mit 24 Schülerinnen und Schülern vor, die aus 6 Mädchen und 18 Jungen besteht.
Stell dir vor, dass du wissen möchtest wie zufrieden die Klasse mit einer Klassenfahrt ist.
Stell dir vor, dass du nicht die ganze Klasse befragen kann. Du entscheidest, eine Stichprobe mit 6 Schülerinnen und Schülern zu befragen.
Du entscheidest dich, 5 Mädchen und 1 Jungen über ihre Zufriedenheit zu befragen.
Die 5 Mädchen sind unzufrieden, die jungen is zufrieden.
Aus diesem Beispiel folgt, dass die Mehrheit der Klasse unzufrieden war mit dem Klassenfahrt.
Ist das die Realität? Nein. Da die Stichprobe nicht repräsentativ ist. Die Mädchen aus der Stichprobe sind überrepräsentiert, weil die Jungen unterrepräsentiert sind. Und in der Realität dieser Klasse, sind die Mädchen nicht der gleichen Meinung wie die Jungen.
Das sind die Ergebnisse die du bekommen hättest, wenn du alle Schüler/-innen der Klasse befragt hättest.
Statistik ist die Lehre von Daten. Es ist die Gesamtheit der Methoden zur Sammlung und Analyse von Daten.
Das Ziel der Statistik ist:
Daten über ein Merkmal, Thema oder Phänomen einer Grundgesamtheit oder Teil dieser Grundgesamtheit sammeln. Das wird Datensammlung genannt.
Informationen aus Daten erfassen. Das ist die Rolle der deskriptiven Statistik: anhand von Parametern, Grafiken und Tabellen Informationen aus Daten zusammenfassen.
Schlussfolgerungen von einem Teil der Grundgesamtheit auf die gesamte Grundgesamtheit verallgemeinern: das ist die Inferenzstatistik.
Alle Statistiken auf dieser Website wurden von Statbel, dem belgischen Statistikamt, erstellt.
Eine Beobachtung ist ein beobachteter Wert für eine bestimmte Variable. Sie kann qualitativ oder quantitativ sein.
Zum Beispiel: Im Rahmen einer Studie über das Alter der Spieler einer Fußballmannschaft, wurde jeder Spieler nach seinem Alter gefragt.
In diesem Fall, ist die untersuchte Variable oder das untersuchte Merkmal das Alter der Spieler.
Die Ergebnisse.
24, 25, 30, 24, 25, 23, 28, 32, 20, 19, 35, 26, 28, 21, 25
Die Beobachtungen formen insgesamt eine Reihe.
Diese Reihe kann geordnet werden, indem die Werte der Beobachtungen von klein nach groß sortiert werden.
19, 20, 21, 23, 24, 24, 25, 25, 25, 26, 28, 28, 30, 32, 35
Diese Reihe kann auch in einer Tabelle umgesetzt werden, die als Häufigkeitsverteilung bezeichnet wird.
Alter | Anzahl Spieler |
---|---|
19 | 1 |
20 | 1 |
21 | 1 |
23 | 1 |
24 | 2 |
25 | 3 |
26 | 1 |
28 | 2 |
30 | 1 |
32 | 1 |
35 | 1 |
Total | 15 |
Die Stichprobe stellt einen Teil der Grundgesamtheit (Population) vor, auf der die statistische Studie sich basiert.
Warum eine Stichprobe analysieren anstatt der ganzen Grundgesamtheit?
Ganz einfach wegen der Ressourcen.
Alle Einheiten in der Grundgesamtheit befragen ist sehr teuer und zeitaufwendig.
Aber Achtung, die Stichprobe muss repräsentativ für die Population sein.
Statbel
North Gate
Koning Albert II-Laan 16
1000 Brussel
FÖD Wirtschaft, K.M.U., Mittelstand und Energie / ©2024 Statbel