Der Interquartilsabstand, oft als IQR abgekürzt, repräsentiert den Bereich vom 25. Perzentil bis zum 75. Perzentil oder den mittleren 50 Prozent eines bestimmten Datensatzes. Der Interquartilabstand kann verwendet werden, um den durchschnittlichen Leistungsbereich bei einem Test zu bestimmen: Sie können ihn verwenden, um zu sehen wo die Ergebnisse der meisten Leute bei einem bestimmten Test fallen, oder bestimmen Sie, wie viel Geld der durchschnittliche Mitarbeiter eines Unternehmens jeweils verdient Monat. Der Interquartilsabstand kann ein effektiveres Werkzeug der Datenanalyse sein als der Mittelwert oder Median eines Datensatzes, da Sie damit den Streuungsbereich und nicht nur eine einzelne Zahl identifizieren können.
TL; DR (zu lang; nicht gelesen)
Der Interquartilsabstand (IQR) repräsentiert die mittleren 50 Prozent eines Datensatzes. Um es zu berechnen, ordnen Sie zuerst Ihre Datenpunkte vom kleinsten zum größten und bestimmen dann Ihr erstes und drittes Quartiltil Positionen unter Verwendung der Formeln (N+1)/4 bzw. 3*(N+1)/4, wobei N die Anzahl der Punkte in den Daten ist einstellen. Ziehen Sie schließlich das erste Quartil vom dritten Quartil ab, um den Interquartilabstand für den Datensatz zu bestimmen.
Datenpunkte bestellen
Die Berechnung des Interquartilbereichs ist eine einfache Aufgabe, aber vor der Berechnung müssen Sie die verschiedenen Punkte Ihres Datensatzes anordnen. Um dies zu tun, beginnen Sie damit, Ihre Datenpunkte vom kleinsten zum größten anzuordnen. Wenn Ihre Datenpunkte beispielsweise 10, 19, 8, 4, 9, 12, 15, 11 und 20 wären, würden Sie sie wie folgt neu anordnen: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Nachdem Ihre Datenpunkte auf diese Weise geordnet wurden, können Sie mit dem nächsten Schritt fortfahren.
Bestimmen Sie die Position des ersten Quartils
Bestimmen Sie als Nächstes die Position des ersten Quartils mithilfe der folgenden Formel: (N+1)/4, wobei N die Anzahl der Punkte im Datensatz ist. Wenn das erste Quartil zwischen zwei Zahlen liegt, nehmen Sie den Durchschnitt der beiden Zahlen als Wert für das erste Quartil. Da es im obigen Beispiel neun Datenpunkte gibt, würden Sie 1 zu 9 addieren, um 10 zu erhalten, und dann durch 4 teilen, um 2,5 zu erhalten. Seit der Wenn das erste Quartil zwischen dem zweiten und dritten Wert liegt, würden Sie den Durchschnitt von 8 und 9 nehmen, um eine Position im ersten Quartil von zu erhalten 8.5.
Position im dritten Quartil bestimmen
Nachdem Sie Ihr erstes Quartil bestimmt haben, bestimmen Sie die Position des dritten Quartils mit der folgenden Formel: 3*(N+1)/4 wobei N wiederum die Anzahl der Punkte im Datensatz ist. Wenn das dritte Quartil zwischen zwei Zahlen liegt, nehmen Sie einfach den Durchschnitt wie bei der Berechnung des ersten Quartils. Da es im obigen Beispiel neun Datenpunkte gibt, würden Sie 1 zu 9 addieren, um 10 zu erhalten, mit 3 multiplizieren, um 30 zu erhalten, und dann durch 4 teilen, um 7,5 zu erhalten. Da das erste Quartil zwischen dem siebten und achten Wert liegt, würden Sie den Durchschnitt von 15 und 19 nehmen, um einen Wert von 17 im dritten Quartil zu erhalten.
Interquartilabstand berechnen
Nachdem Sie Ihr erstes und drittes Quartil bestimmt haben, berechnen Sie den Interquartilabstand, indem Sie den Wert des ersten Quartils vom Wert des dritten Quartils subtrahieren. Um das in diesem Artikel verwendete Beispiel zu beenden, würden Sie 8,5 von 17 subtrahieren, um herauszufinden, dass der Interquartilsabstand des Datensatzes gleich 8,5 ist.
Vor- und Nachteile von IQR
Der Interquartilbereich hat den Vorteil, dass er Ausreißer an beiden Enden eines Datensatzes identifizieren und beseitigen kann. Der IQR ist auch ein gutes Maß für die Variation bei schiefer Datenverteilung, und diese Methode zur Berechnung des IQR kann für gruppierte Datensätze funktionieren, solange Sie eine kumulative Häufigkeitsverteilung verwenden, um Ihre Daten zu organisieren Punkte. Die Formel für den Interquartilbereich für gruppierte Daten ist dieselbe wie für nicht gruppierte Daten, wobei IQR gleich dem Wert des ersten Quartils subtrahiert vom Wert des dritten Quartils ist. Sie hat jedoch im Vergleich zur Standardabweichung mehrere Nachteile: geringere Empfindlichkeit gegenüber einigen extremen Werten und eine Stichprobenstabilität, die nicht so stark ist wie die Standardabweichung.