test du chi carré de bonté d'ajustement - Manuel de statistiques biologiques
Vous utilisez le test de chi-carré de la bonté d'ajustement quand vous avez une variable nominale, vous voulez voir si le nombre d'observations dans chaque catégorie correspond à une attente théorique, et la taille de l'échantillon est grande.
Quand l'utiliser
Utilisez le test de chi-carré de la bonté d'ajustement quand vous avez une variable nominale avec deux ou plusieurs valeurs (comme les fleurs rouge, rose et blanc). Vous comparez les décomptes observés des observations dans chaque catégorie avec les comptes attendus qui vous calculez en utilisant une sorte d'attente théorique (par exemple un rapport 1: 1 sexe ou 1: 2: 1 dans un croisement génétique).
Hypothèse nulle
L'hypothèse nulle statistique est que le nombre d'observations dans chaque catégorie est égal à celui prédit par une théorie biologique, et l'autre hypothèse est que les nombres observés sont différents de l'attendu. L'hypothèse nulle est généralement une hypothèse extrinsèque, où vous connaissiez les proportions attendues avant de faire l'expérience. Des exemples comprennent un rapport 1: 1 du sexe ou de 1: 2: 1 dans un échantillon génétique. Un autre exemple serait à la recherche dans une zone de rivage qui avait 59% de la superficie couverte de sable, 28% de la boue et 13% des roches; si vous enquêtez où les mouettes aiment se tenir debout, votre hypothèse nulle serait que 59% des goélands étaient debout sur le sable, 28% sur la boue et 13% sur les rochers.
Dans certaines situations, vous avez une hypothèse intrinsèque. Ceci est une hypothèse nulle où vous calculer les proportions attendues une fois que vous faites l'expérience, en utilisant certaines des informations à partir des données. L'exemple le plus connu d'une hypothèse intrinsèque est la proportion de Hardy-Weinberg de la génétique des populations: si la fréquence d'un allèle dans une population est p et l'autre allele est q. l'hypothèse nulle est que les fréquences attendues des trois génotypes sont p 2. 2pq. et q 2. Ceci est une hypothèse intrinsèque, parce que vous estimez p et q à partir des données après la collecte des données, vous ne pouvez pas prédire p et q avant l'expérience.
Comment les travaux d'essai
Contrairement à l'épreuve exacte de la bonté de l'ajustement. le test du chi carré ne calcule pas directement la probabilité d'obtenir les résultats observés ou quelque chose de plus extrême. Au lieu de cela, comme presque tous les tests statistiques, le test du chi-carré a une étape intermédiaire; il utilise les données pour calculer une statistique de test qui mesure dans quelle mesure les données observées sont de l'attente nulle. Vous utilisez ensuite une relation mathématique, dans ce cas, la distribution du chi carré, pour estimer la probabilité d'obtenir cette valeur de la statistique de test.
Vous calculez la statistique de test en prenant un nombre observé (O), en soustrayant le nombre attendu (E), alors cette différence d'élévation au carré. Plus l'écart par rapport à l'hypothèse nulle, plus la différence entre observées et attendues est. Quadrature les différences qui les rend tous positifs. Vous pouvez ensuite diviser chaque différence par le nombre prévu, et vous ajoutez ces différences normalisées. La statistique de test est approximativement égal au rapport de log-vraisemblance utilisé dans le G -test. Il est convenu d'appeler une statistique « chi-carré », bien que ce soit un peu déroutant car il est juste l'une des nombreuses statistiques de test qui suit la distribution chi-carré théorique. L'équation est
chi 2 = Σ (O-E) 2 / E
Comme avec la plupart des tests statistiques, plus la différence entre les changements observés et attendus, plus la statistique de test devient. Pour donner un exemple, disons que votre hypothèse nulle est un rapport 3: 1 des ailes lisses ailes froissées chez les descendants d'un groupe de croix drosophile. Vous observez 770 mouches avec des ailes lisses et 230 mouches avec des ailes froissées; les valeurs attendues sont de 750 à ailes lisses et 250 mouches ridée ailes. La saisie de ces nombres dans l'équation, la valeur de chi carré est 2,13. Si vous aviez observé 760 mouches à ailes lisses et 240 mouches aile froissée, ce qui est plus proche de l'hypothèse nulle, la valeur de votre chi carré aurait été plus petite, à 0,53; si vous aviez observé 800 ailes lisses et 200 mouches aile froissée, ce qui est plus éloigné de l'hypothèse nulle, la valeur de votre chi carré aurait été 13,33.
La distribution de la statistique de test sous l'hypothèse nulle est approximativement la même que la distribution du chi carré théorique. Cela signifie qu'une fois que vous connaissez la valeur du chi carré et le nombre de degrés de liberté, vous pouvez calculer la probabilité d'obtenir cette valeur de chi carré en utilisant la distribution du chi carré. Le nombre de degrés de liberté est le nombre de catégories moins un, donc pour notre exemple, il y a un degré de liberté. Utilisation de la fonction CHIDIST dans une feuille de calcul, on entre CHIDIST = (2,13, 1) et de calculer la probabilité d'obtenir une valeur de chi-carré 2,13 avec un degré de liberté est P = 0,144.
La forme de la distribution du chi carré dépend du nombre de degrés de liberté. Pour une hypothèse nulle extrinsèque (la situation beaucoup plus commune, où vous savez que les proportions prévues par l'hypothèse nulle avant de recueillir les données), le nombre de degrés de liberté est tout simplement le nombre de valeurs de la variable, moins un. Ainsi, si vous testez une hypothèse nulle d'un rapport 1: 1 de sexe, il y a deux valeurs possibles (hommes et femmes), et donc un degré de liberté. En effet, une fois que vous savez combien du total sont des femmes (un nombre qui est « libre » de faire varier de 0 à la taille de l'échantillon), le nombre d'hommes est déterminé. S'il y a trois valeurs de la variable (comme le rouge, rose et blanc), il y a deux degrés de liberté, et ainsi de suite.
test post-hoc
S'il y a plus de deux catégories et que vous voulez savoir ceux qui sont significativement différents de leur attente nulle, vous pouvez utiliser la même méthode pour tester chaque catégorie par rapport à la somme de toutes les autres catégories, avec la correction de Bonferroni, comme je décris pour le test exact. Vous utilisez des tests de chi carré pour chaque catégorie, bien sûr.
Hypothèses
Le chi-carré de la bonté de l'ajustement suppose l'indépendance. comme décrit pour le test exact.
Exemples: hypothèse extrinsèque

Mâle rouge, le bec-croisé Loxia curvirostra. montrant les deux types de factures.
Calculer la fréquence attendue des oiseaux à bec droit en multipliant la taille de l'échantillon total (3647) par la proportion attendue (0,5) pour donner 1823,5. Faites la même chose pour les oiseaux à bec gauche. Le nombre de degrés de liberté lorsqu'une pour une hypothèse extrinsèque est le nombre de classes moins un. Dans ce cas, il y a deux classes (droite et gauche), donc il y a un degré de liberté.
Le résultat est chi-carré = 5,61, 1 D.F. P = 0,018, ce qui indique que vous pouvez rejeter l'hypothèse nulle; il y a beaucoup plus à gauche que droite facturés le bec-croisé à bec.
Mannan et Meslow (1984) ont étudié le comportement de recherche de nourriture des oiseaux dans une forêt dans l'Oregon. Dans une forêt gérée, 54% du volume du couvert était le sapin de Douglas, 40% était le pin Ponderosa, 5% était grand sapin, et 1% était mélèze de l'Ouest. Ils ont fait 156 observations de la recherche de nourriture par sittelles à poitrine rousse; 70 observations (45% du total) dans le sapin de Douglas, 79 (51%) dans le pin ponderosa, 3 (2%) à Grand sapin, et 4 (3%) en mélèze de l'Ouest. L'hypothèse nulle biologique est que les oiseaux se nourrissent au hasard, sans tenir compte de ce que les espèces d'arbres qu'ils sont en; l'hypothèse nulle statistique est que les proportions des événements de recherche de nourriture sont égales aux proportions de volume de la voilure. La différence de proportions est significative (chi-carré = 13,59, P = 3 D.F. 0,0035).
Les chiffres attendus dans cet exemple sont assez petites, donc il serait préférable de l'analyser avec un test exact. Je laisse ici parce qu'il est un bon exemple d'une hypothèse extrinsèque qui vient de mesurer quelque chose (volume du couvert, dans ce cas), et non pas une théorie mathématique; J'ai eu du mal à trouver de bons exemples.
Exemple: hypothèse intrinsèque
McDonald (1989) a examiné la variation au niveau du locus Mpi dans le crustacé amphipode Orchestia Agilis recueillies à partir d'un seul endroit à Long Island, New York. Il y avait deux allèles, Mpi 90 et 100 Mpi et les fréquences de génotype dans les échantillons de plusieurs dates ont été mises en commun 1203 Mpi 90/90. 2919 Mpi 90/100. et 1678 Mpi 100/100. L'estimation de la proportion d'allèles Mpi 90 à partir des données est 5325/11600 = 0,459. En utilisant la formule de Hardy-Weinberg et cette proportion d'allèles estimée, les proportions génotypiques attendues sont 0,211 Mpi 90/90. 0,497 Mpi 90/100. et 0,293 Mpi 100/100. Il existe trois catégories (les trois génotypes) et un paramètre estimés à partir des données (la proportion de allèle Mpi 90), donc il y a un degré de liberté. Le résultat est chi-carré = 1,08, 1 D.F. P = 0,299, ce qui est significatif. Vous ne pouvez pas rejeter l'hypothèse nulle que les données correspondent aux proportions de Hardy-Weinberg attendus.
Les résultats graphiquement
Avec plus de deux valeurs de la variable nominale, vous devez généralement présenter les résultats d'un test ajustement de la bonté dans un tableau des proportions observées et attendues. Si les valeurs attendues sont évidentes (par exemple 50%) ou facilement calculé à partir des données (telles que les proportions de Hardy-Weinberg), vous pouvez omettre les chiffres attendus de votre table. Pour une présentation, vous aurez probablement besoin d'un graphique montrant les proportions observées et attendues, pour donner une impression visuelle de la distance qui les sépare. Vous devez utiliser un graphique à barres pour les proportions observées; l'attendu peut être représenté par une ligne en pointillé horizontale, ou avec des barres d'un modèle différent.
Si vous voulez ajouter des barres d'erreur au graphique, vous devez utiliser des intervalles de confiance pour une proportion. Notez que les intervalles de confiance ne seront pas symétriques, et ce sera particulièrement évident si la proportion est proche de 0 ou 1.
Utilisation de l'habitat dans la sittelle à poitrine rousse .. Les barres grises sont des pourcentages d'événements observés dans la recherche de nourriture chaque espèce d'arbre, avec 95% des intervalles de confiance; barres noires sont les pourcentages prévus.
Certaines personnes utilisent un « graphique à barres empilées » pour afficher des proportions, surtout s'il y a plus de deux catégories. Cependant, il peut rendre difficile de comparer les tailles des valeurs observées et attendues pour les catégories moyennes, puisque les deux leurs hauts et les bas sont à des niveaux différents, donc je ne le recommande pas.
Des tests similaires
Vous utilisez le test du chi-carré d'indépendance pour deux variables nominales, pas un seul.
Il existe plusieurs tests qui utilisent des statistiques du chi carré. Celui décrit ici est officiellement connu comme chi carré de Pearson. Il est de loin le test du chi carré le plus courant, il est généralement appelé simplement le test du chi carré.
Vous avez le choix entre trois bonté de l'ajustement des tests: le test exact de la bonté de l'ajustement, le G -test de bonté d'ajustement ,. ou le test du chi-carré de la bonté de l'ajustement. Pour les petites valeurs des nombres attendus, les -Tests chi-carré et G sont inexactes, parce que les distributions des statistiques de test ne correspondent pas à la distribution de chi carré très bien.
La règle habituelle de base est que vous devez utiliser le test exact où la plus petite valeur attendue est inférieure à 5, et les -Tests-chi carré et G sont suffisamment précises pour les grandes valeurs attendues. Cette règle des dates de pouce des temps anciens où les gens devaient faire des calculs statistiques à la main, et les calculs pour le test exact était très fastidieux et à éviter si possible. De nos jours, les ordinateurs font tout aussi facile de faire le test exact que le simple calcul chi carré ou G -test, à moins que la taille de l'échantillon est si grand que même les ordinateurs ne peuvent pas le gérer. Je vous recommande d'utiliser le test exact lorsque la taille de l'échantillon total est inférieur à 1000. Avec la taille des échantillons entre 50 et 1000 et les valeurs attendues supérieures à 5, généralement il ne fait pas une grande différence que vous utilisez tester, de sorte que vous shouldn » t critiquer quelqu'un pour utiliser le chi carré ou G -test pour des expériences où je recommande le test exact. Voir la page web sur la petite taille des échantillons pour examen plus approfondi.
Chi-carré par rapport à G -test
Bien sûr, vous ne devriez pas analyser vos données à la fois le G -test et le test du chi carré, puis choisissez celui que vous donne le résultat le plus intéressant; qui serait tricher. Chaque fois que vous essayez plus d'une technique statistique et il suffit d'utiliser celui qui donne la plus faible valeur P, vous augmentez vos chances d'un faux positif.
Comment faire le test
Tableur
Je l'ai mis en place une feuille de calcul pour le test de chi-carré de la bonté de l'ajustement. Il est en grande partie explicite. Il sera pour vous calculer les degrés de liberté si vous utilisez une hypothèse nulle extrinsèque; si vous utilisez une hypothèse intrinsèque, vous devez saisir les degrés de liberté dans la feuille de calcul.
Il y a des pages Web qui effectueront le test du chi-carré ici et ici. Aucun de ces pages web vous permet de définir les degrés de liberté à la valeur appropriée pour tester une hypothèse nulle intrinsèque.
Voici un programme SAS qui utilise FREQ PROC pour un test de chi carré. Il utilise les données de pois Mendel d'en haut. Le « nombre de poids » indique SAS que la variable « compte » est le nombre de fois que chaque valeur de « texture » a été observée. L'option ZEROS indique à inclure des observations dont le nombre de zéro, par exemple, si vous aviez 20 pois lisses et 0 pois ridés; il ne fait pas mal d'inclure toujours l'option ZEROS. Chisq dit SAS de faire un test de chi-carré, et TESTP = (75 25); dit qu'il les pourcentages prévus. Les pourcentages attendus doivent ajouter jusqu'à 100. Vous devez donner les pourcentages prévus dans l'ordre alphabétique: parce que « lisse » vient avant « ridée », vous donner les fréquences attendues pour lisse 75%, 25% ridée.
Voici un programme SAS qui utilise FREQ PROC pour un test-chi carré sur des données brutes, où vous avez énuméré chaque observation au lieu de les compter vous-même. Je l'ai utilisé trois points pour indiquer que je ne l'ai pas montré l'ensemble de données complète.
La sortie comprend les éléments suivants:
Vous déclarer comme « chi carré = 0,3453, P = 1 D.F. 0,5568. »
Pour faire une analyse de puissance à l'aide du G * programme d'alimentation, choisissez « tests de qualité de l'ajustement: tableaux de contingence » dans le menu test statistique, puis choisissez « tests Chi carré » dans le menu Famille Test. Pour calculer la taille de l'effet, cliquez sur le bouton Déterminer et entrer dans les proportions d'hypothèse nulle dans la première colonne et les proportions que vous espérez voir dans la deuxième colonne. Cliquez ensuite sur le Calculer et transfert à bouton de la fenêtre principale. Réglez votre alpha et de la puissance, et assurez-vous de définir les degrés de liberté (ddl); pour une hypothèse nulle extrinsèque, ce sera le nombre de lignes moins un.
À titre d'exemple, disons que vous voulez faire une croix génétique de mufliers avec un attendu 1: 2: 1, et que vous voulez être en mesure de détecter un motif avec 5% de plus hétérozygotes qui devraient. Entrée 0,25, 0,50 et 0,25 dans la première colonne, entrez 0,225, 0,55, 0,225 et dans la deuxième colonne, cliquez sur Calculer et transfert à la fenêtre principale, entrez 0,05 pour alpha, de 0,80 pour la puissance, et pour deux degrés de liberté. Si vous avez fait cela correctement, le résultat devrait être une taille totale de l'échantillon de 964.
Les références
Mannan, et R.W. E.C Meslow. 1984. Les populations d'oiseaux et les caractéristiques de la végétation dans les forêts aménagées et anciennes, Oregon nord-est. Journal of Wildlife Management 48: 1219-1238.
McDonald, J. H. 1989. L'analyse en composantes de sélection du locus Mpi dans le amphipod Orchestia Agilis. Hérédité 62: 243-249.