Analyse multivariée de la variance (MANOVA) - Vérification Hypothèses Modèle de données Poterie -Exemple -
Exemple: Poterie données - Vérification Hypothèses du modèle
- Les données du groupe i a vecteur moyen commun μi
- Les données de tous les groupes ont la matrice de variance-covariance σ commune.
- Indépendance. Les sujets sont échantillonnés de façon indépendante.
- Normalité. Les données sont normalement distribués à plusieurs variables.
Hypothèse 1. Les données du groupe i a vecteur moyen commun μi
Hypothèse 4. Normalité. Les données sont normalement distribués à plusieurs variables.
- Pour les grands échantillons, le théorème central limite indique que la moyenne d'échantillon des vecteurs sont approximativement à plusieurs variables distribuées normalement, même si les observations individuelles ne sont pas.
- Pour les seules données de poterie, cependant, nous avons un total de N = 26 observations, dont seulement deux échantillons de Caldicot. Donc, nous ne pouvons pas compter sur le théorème central limite.
Les procédures de diagnostic sont basées sur les valeurs résiduelles, calculées en prenant les différences entre les observations individuelles et le groupe des moyens pour chaque variable:
- Tracer les histogrammes des résidus pour chaque variable. Recherchez une distribution symétrique.
- Tracer une matrice de diagrammes de dispersion. Recherchez les distributions elliptiques et les valeurs aberrantes.
- Terrain en trois dimensions des diagrammes de dispersion. Recherchez les distributions elliptiques et les valeurs aberrantes.
Si les histogrammes ne sont pas symétriques ou les diagrammes de dispersion ne sont pas elliptique, ce serait la preuve que les données ne sont pas échantillonnées à partir d'une distribution normale multivariée en violation de l'Assomption 4. Dans ce cas, la transformation normalisant doivent être pris en considération. Le programme SAS potterya.sas ci-dessous nous aideront à vérifier cette hypothèse.
- Les histogrammes indiquent que, à l'exception de sodium, les distributions sont relativement symétrique. Cependant, l'histogramme de sodium donne à penser qu'il y a deux valeurs aberrantes dans les données. Ces deux valeurs aberrantes sont en Llanadyrn.
- Deux valeurs aberrantes peuvent également être identifiés à partir de la matrice des diagrammes de dispersion.
- L'élimination des deux valeurs extrêmes se traduit par une distribution plus symétrique de sodium.
Hypothèse 2. Les données de tous les groupes ont la matrice de variance-covariance σ commune.
Cette hypothèse peut être vérifiée à l'aide du test de Bartlett pour l'homogénéité des matrices de variance-covariance. Pour obtenir le test de Bartlett, nous σi matrice indiqueraient la variance-covariance population pour le groupe i. test Considérez:
Sous l'hypothèse alternative, au moins deux des matrices de variance-covariance diffèrent sur au moins un de leurs éléments. Laisser:
désigne la matrice de variance-covariance échantillon pour le groupe i. Calculer la matrice de variance-covariance mis en commun
Le test de Bartlett est basé sur la statistique de test suivant:
où le facteur de correction est
La version de test de Bartlett considéré dans la leçon des deux échantillons T-carré de Hotelling est un cas particulier où g = 2. Sous l'hypothèse nulle de matrices de variance-covariance homogènes, L » est d'environ chi-carré distribué avec
degrés de liberté. Rejeter Ho au niveau α si
Exemple: Données de la poterie
Ici, nous allons utiliser les pottery2.sas du programme SAS.