Techniques de corrélation non paramétriques

Corrélation est une technique statistique pour examiner la relation linéaire entre deux variables quantitatives . En d’autres termes , il se penche sur la façon dont une ligne droite correspond aux données . Les corrélations varient de -1 à +1 ; une corrélation de -1 signifie une relation négative parfaite ( comme une variable monte , l’autre descend ) , tandis qu’une valeur de 1 une relation positive parfaite ( comme on monte , l’autre monte ) . Une corrélation de 0 signifie pas de relation linéaire . Corrélation non paramétrique fait moins d’hypothèses que la corrélation paramétrique . Régression paramétrique suppose que les variables sont intervalle ou de rapport à l’échelle. Rho de Spearman

rho de Spearman (la lettre grecque ) suppose seulement que les variables sont ordinales échelle . Signifie échelle ordinale les chiffres donnés pour chaque variable sont dans le bon ordre , mais pas nécessairement également espacés . Par exemple, si vous demandez aux gens combien ils aiment le président Obama et les choix étaient «Pas du tout », « Un peu », « Un peu », « Pretty much », et « beaucoup» et ces choix ont été marqués 1 , 2 , 3 , 4 et 5 , les chiffres sont dans le bon ordre , mais il est difficile de dire si la différence entre «pas du tout » et « un peu » est la même que la différence entre  » Pretty much  » et  » Une grande partie .  » Pour calculer le R de Spearman , classer les données et de calculer la corrélation habituelle entre les rangs .
Tau
Kendall

tau de Kendall ( la lettre grecque ) suppose également que les données sont ordinales , mais il a une signification différente de celle de R. Spearman Pour comprendre le tau de Kendall , vous devez d’abord comprendre paires concordantes et discordantes . Une paire est tout deux sujets dans l’ensemble de données , par exemple , si vous faites affaire avec les gens, une paire pourrait être Bob et Joe . Une paire de valeurs est concordante si l’objet qui est supérieure à une variable est également supérieure à l’autre . Une paire est discordant si l’objet qui est supérieure à une variable est inférieur à l’autre . Tau de Kendall peut être calculé comme ( CD ) /( n * n -1/2 ) , où C est le nombre de paires concordantes , D est le nombre de paires discordantes et n est le nombre de sujets .

Goodman – Kruskal gamma

gamma de Goodman – Kruskal ( la lettre grecque ) suppose également des données ordinales . Il est calculé comme ( CD ) /( C + D ) où C et D ont la même signification que dans la section 2 Gamma est plus approprié quand il ya de nombreuses observations liées . Il est également un peu plus facile à comprendre.
Chi -Square

Chi – carré suppose que seules les données nominale , qui n’a pas ordre inhérent . Par exemple, si vous demandez aux gens de leur groupe ethnique , et les choix sont  » blanc « ,  » noir « ,  » Latino « ,  » asiatique » et  » Autres « , puis il n’y a pas pour les réponses . Pour cette raison , certains diront que Chi – carré n’est pas vraiment une mesure de corrélation , mais c’est certainement une mesure de la relation entre deux variables . Pour calculer Chi – carré , les données doivent être dans un tableau de contingence . Étiqueter les lignes et les colonnes de chiffres, puis de calculer la valeur attendue dans chaque cellule ( la ligne Total fois le total de la colonne divisé par le total ) . Ensuite , trouver les différences entre les fréquences observées et attendues dans chaque cellule , la quadrature eux, les diviser par les fréquences observées , et ajouter tous les quotients . Contrairement aux autres mesures , Chi – carré peut prendre n’importe quel nombre positif .

Laisser un commentaire