Comment faire un Boxplot d'un résumé en cinq chiffres
Pour faire un boxplot, procédez comme suit:
Le minimum est la plus petite valeur dans l'ensemble de données, et le maximum est la plus grande valeur dans l'ensemble de données. Utilisez les étapes suivantes pour trouver le 25e percentile (appelé Q1), le 50e percentile (la médiane), et le 75e percentile (Q3).
Commandez toutes les valeurs dans l'ensemble des données du plus petit au plus grand.
Multiplier k cent fois le nombre total de valeurs dans les données, n.
Le résultat est connu comme l'indice.
Si l'indice obtenu à l'étape 2 n'est pas un nombre entier, arrondir au nombre entier le plus proche et passez à l'étape 4a.
Si l'indice obtenu à l'étape 2 est un nombre entier, passez à l'étape 4b.
Choisissez une des options suivantes.
une. Compter les valeurs dans votre ensemble de données de gauche à droite (du plus petit au plus grand valeur) jusqu'à ce que vous atteignez le nombre indiqué par l'étape 3. La valeur correspondante dans votre ensemble de données est le centile kième.
b. Compter les valeurs dans votre ensemble de données de gauche à droite (le plus petit au plus grand) jusqu'à atteindre le nombre indiqué par l'étape 2. Le kième centile est la moyenne de cette valeur correspondante dans votre ensemble de données et la valeur qui le suit directement.
Tracer une ligne dans la zone où la médiane se trouve.
Déterminer si oui ou non les valeurs aberrantes sont présentes.
Pour cette détermination, calculer la Interquartile (IQR). qui se trouve en soustrayant Q3- Q1; puis multiplier par 1,5 IQR. Ajouter ce montant à la valeur de Q3 et soustraire ce montant par rapport au T1. Cela vous donne une limite plus large autour de la médiane que la boîte fait. Tous les points de données qui se situent en dehors de cette limite sont déterminées à des valeurs aberrantes.
S'il n'y a pas des valeurs aberrantes (en accord avec les résultats de l'étape 6), tracer des lignes à partir des bords supérieur et inférieur de la boîte sur les valeurs minimales et maximales dans l'ensemble de données.
S'il y a des valeurs aberrantes (en fonction de vos résultats de l'étape 6), indiquer leur emplacement sur le boxplot avec des signes *.
Au lieu de tracer une ligne à partir du bord de la boîte tout le chemin à la valeur aberrante la plus extrême, arrêtez la ligne à la dernière valeur de données qui ne sont pas une valeur aberrante.
Beaucoup, sinon la plupart des logiciels indiquent des valeurs aberrantes dans un ensemble de données à l'aide d'un astérisque (*) ou symbole étoile et utiliser la procédure décrite à l'étape 6 pour identifier les valeurs aberrantes. Cependant, tous les paquets utilisent ces symboles et procédures; vérifiez ce que votre package fait avant d'analyser vos données avec un boxplot.
Boxplots peut être vertical (vers le haut et vers le bas) avec les valeurs sur l'axe allant du fond (la plus basse) vers le haut (le plus haut); ou ils peuvent être horizontaux, avec les valeurs sur l'axe allant de gauche (le plus bas) à droite (le plus élevé).