Corrélation - Techniques statistiques, échelles de notation, coefficients de corrélation et plus - Creative
La corrélation est une technique statistique qui peut montrer si et à quel point les paires de variables sont liées. Par exemple, la taille et le poids sont liés; personnes de grande taille ont tendance à être plus lourd que les plus courtes. La relation est pas parfait. Les gens de la même hauteur varient en poids, et vous pouvez facilement penser deux personnes que vous savez où le plus court est plus lourd que le plus grand un. Néanmoins, le poids moyen des personnes 5'5 « » est inférieur au poids moyen des personnes 5'6 « », et leur poids moyen est inférieur à celui des personnes 5'7 « », etc. La corrélation peut vous dire à quel point une grande partie de la variation des poids des peuples est liée à leurs hauteurs.
Les techniques de détermination de corrélation
Il existe plusieurs techniques de corrélation différentes. Le module de statistiques en option du système d'enquête comprend le type le plus commun, appelé Pearson ou corrélation moment produit. Le module comprend aussi une variante de ce type appelé corrélation partielle. Ce dernier est utile lorsque vous voulez regarder la relation entre deux variables tout en supprimant l'effet d'un ou deux autres variables.
Comme toutes les techniques statistiques, la corrélation est approprié que pour certains types de données. La corrélation fonctionne pour les données quantifiables dont le nombre est significatif, généralement des quantités de quelque sorte. Il ne peut pas être utilisé pour les données purement qualitatives, telles que le sexe, les marques achetées ou couleur préférée.
Échelles de notation
Les échelles d'évaluation sont un cas milieu controversé. Les chiffres des échelles de notation ont un sens, mais ce sens ne sont pas très précis. Ils ne sont pas comme des quantités. Avec une quantité (comme le dollar), la différence entre 1 et 2 est exactement la même que celle entre 2 et 3. Avec une échelle de notation, ce n'est pas vraiment le cas. Vous pouvez être sûr que vos répondants pensent une cote de 2 se situe entre une note de 1 et une note de 3, mais vous ne pouvez pas être sûr qu'ils pensent qu'il est exactement à mi-chemin entre les deux. Cela est particulièrement vrai si vous étiquetée au milieu des points de votre échelle (vous ne pouvez pas supposer « bon » est exactement à mi-chemin entre « excellent » et « juste »).
La plupart des statisticiens disent que vous ne pouvez pas utiliser des corrélations avec des échelles de notation, car les mathématiques de la technique supposent les différences entre les nombres sont exactement égaux. Néanmoins, de nombreux chercheurs de l'enquête font des corrélations d'utilisation avec des échelles d'évaluation, car les résultats reflètent généralement le monde réel. Notre position est que vous pouvez utiliser des corrélations avec des échelles de notation, mais vous devriez le faire avec soin. Lorsque l'on travaille avec des quantités, des corrélations fournissent des mesures précises. Lorsque vous travaillez avec des échelles d'évaluation, les corrélations donnent des indications générales.
Coefficient de corrélation
Le principal résultat de la corrélation est appelé le coefficient de corrélation (ou « r »). Il varie de -1,0 à 1,0. Le plus proche r est de +1 ou -1, plus étroitement les deux variables sont liées.
Si r est proche de 0, cela signifie qu'il n'y a aucune relation entre les variables. Si r est positif, cela signifie que l'une variable devient plus l'autre devient plus grande. Si r est négatif, cela signifie que l'on obtient plus, l'autre devient plus petit (souvent appelé une corrélation « inverse »).
Une chose clé à retenir lorsque l'on travaille avec des corrélations est de ne jamais supposer une corrélation signifie qu'un changement d'une cause un changement de variable dans une autre. Les ventes d'ordinateurs personnels et des chaussures de sport ont tous deux fortement augmenté au cours des dernières années et il y a une forte corrélation entre eux, mais vous ne pouvez pas supposer que l'achat d'ordinateurs pousse les gens à acheter des chaussures de sport (ou vice versa).
La deuxième mise en garde est que la technique de corrélation de Pearson fonctionne mieux avec des relations linéaires: comme une variable devient plus grande, l'autre devient plus grande (ou plus petit) en proportion directe. Il ne fonctionne pas bien avec les relations curvilignes (où la relation ne suit pas une ligne droite). Un exemple d'une relation est curvilignes âge et soins de santé. Ils sont liés, mais la relation ne suit pas une ligne droite. Les jeunes enfants et les personnes âgées ont tendance à utiliser les deux beaucoup plus de soins de santé que les adolescents ou les jeunes adultes. La régression multiple (également inclus dans les statistiques du module) peut être utilisé pour examiner les relations curvilignes, mais il est hors de la portée de cet article.