Qu’est-ce que R2 de régression linéaire

? Statisticiens et les scientifiques ont souvent une exigence pour étudier la relation entre deux variables , communément appelées x et y . Le but est de tester deux de ces variables est souvent pour voir si il ya un lien entre eux, connu sous le nom de corrélation dans la science . Par exemple , un chercheur peut vouloir savoir si les heures d’exposition au soleil peuvent être liés à des taux de cancer de la peau . Pour décrire mathématiquement la force d’une corrélation entre deux variables , ces chercheurs utilisent souvent R2 . Régression Linéaire

Les statisticiens utilisent la technique de régression linéaire pour trouver la ligne droite qui correspond le mieux à une série de x et y données paires . Ils le font grâce à une série de calculs qui découlent de l’équation de la meilleure ligne . Cette description mathématique de la ligne sera une équation linéaire et ont la forme générale de y = mx + b , où x et y sont les deux variables des paires de données , m est la pente de la droite et b est l’ ordonnée à l’origine .
Coefficient de corrélation

les calculs qui trouvent la meilleure ligne droite va produire une équation linéaire pour s’adapter à n’importe quel ensemble de données, même si ces données ne sont pas vraiment très linéaire . Afin d’avoir une indication de la façon dont les données correspondent en fait une ligne droite , les statisticiens calculent également un nombre connu comme le coefficient de corrélation . Ceci est donné le r symbole ou R et est une mesure de la façon dont étroitement aligné sur les paires de données sont à la meilleure ligne droite à travers eux .
Importance de R
< p> R peut avoir une valeur comprise entre -1 et 1 Une valeur négative de R signifie simplement que la droite de régression s’incline vers le bas se déplaçant de gauche à droite , plutôt que vers le haut . Le plus proche de R est soit de la des deux extrêmes , le mieux la forme des points de données de la ligne , soit avec -1 ou 1 étant un ajustement parfait et une valeur R de sens zéro qu’il n’y a pas de correspondance et les points sont totalement aléatoire . Si les points de données sont bien alignés sur la ligne droite , il est dit être une certaine corrélation entre eux , d’où le coefficient de corrélation pour nom R.
R2

Certains statisticiens préfèrent travailler avec la valeur de R2 , qui est simplement le coefficient de corrélation au carré, ou multipliée par elle-même, et est connu comme le coefficient de détermination . R2 est très semblable à R , et également décrit la corrélation entre les deux variables , mais il est également légèrement différente. Il mesure le pour cent de variation de la variable y qui peut être attribuée à la variation de la variable x . Une valeur R2 de 0,9 , par exemple , signifie que 90 pour cent de la variation dans les données de y est due à la variation dans le x données . Cela ne signifie pas nécessairement que x affecte vraiment y, mais il semble être le faire.

Laisser un commentaire