Formule de corrélation de rang. Un exemple de recherche du coefficient de corrélation des rangs de Spearman
Coefficient corrélation de rang Spearman est une méthode non paramétrique utilisée dans le but d’étudier statistiquement la relation entre les phénomènes. Dans ce cas, le degré réel de parallélisme entre les deux séries quantitatives des caractéristiques étudiées est déterminé et une évaluation de l'étroitesse du lien établi est donnée à l'aide d'un coefficient exprimé quantitativement.
1. Historique de l'évolution du coefficient de corrélation de rang
Ce critère a été développé et proposé pour l'analyse de corrélation en 1904 Charles Édouard Spearman, psychologue anglais, professeur aux universités de Londres et de Chesterfield.
2. A quoi sert le coefficient de Spearman ?
Le coefficient de corrélation de rang de Spearman est utilisé pour identifier et évaluer l'étroitesse de la relation entre deux séries de données comparées. indicateurs quantitatifs. Dans le cas où les rangs des indicateurs, classés par degré d'augmentation ou de diminution, coïncident dans la plupart des cas (une valeur plus élevée d'un indicateur correspond à une valeur plus élevée d'un autre indicateur - par exemple, en comparant la taille et le poids corporel du patient), on conclut qu'il existe direct connexion de corrélation. Si les rangs des indicateurs ont le sens opposé (une valeur plus élevée d'un indicateur correspond à une valeur inférieure d'un autre - par exemple, en comparant l'âge et la fréquence cardiaque), puis ils parlent de inverse liens entre les indicateurs.
- Le coefficient de corrélation de Spearman a les propriétés suivantes:
- Le coefficient de corrélation peut prendre des valeurs de moins un à un, et avec rs=1 il existe une relation strictement directe, et avec rs= -1 il existe une relation strictement de rétroaction.
- Si le coefficient de corrélation est négatif, il existe une relation de rétroaction ; s’il est positif, il existe une relation directe.
- Si le coefficient de corrélation est nul, alors il n'y a pratiquement aucun lien entre les quantités.
- Plus le module du coefficient de corrélation est proche de l'unité, plus la relation entre les grandeurs mesurées est forte.
3. Dans quels cas le coefficient de Spearman peut-il être utilisé ?
Du fait que le coefficient est une méthode analyse non paramétrique, aucun test de distribution normale n'est requis.
Des indicateurs comparables peuvent être mesurés à la fois dans échelle continue(par exemple, le nombre de globules rouges dans 1 µl de sang), et dans ordinal(par exemple, des points expertise de 1 à 5).
L'efficacité et la qualité de l'évaluation de Spearman diminuent si la différence entre les différentes valeurs de l'une des quantités mesurées est suffisamment grande. Il n'est pas recommandé d'utiliser le coefficient de Spearman s'il existe une répartition inégale des valeurs de la grandeur mesurée.
4. Comment calculer le coefficient de Spearman ?
Le calcul du coefficient de corrélation de rang de Spearman comprend les étapes suivantes :
5. Comment interpréter la valeur du coefficient de Spearman ?
Lors de l'utilisation du coefficient de corrélation de rang, l'étroitesse du lien entre les caractéristiques est évaluée de manière conditionnelle, en considérant les valeurs du coefficient égales à 0,3 ou moins comme indicateurs de lien faible ; les valeurs supérieures à 0,4, mais inférieures à 0,7 sont des indicateurs d'une proximité modérée de la connexion, et les valeurs de 0,7 ou plus sont des indicateurs d'une forte proximité de la connexion.
La signification statistique du coefficient obtenu est évaluée à l'aide du test t de Student. Si la valeur calculée du test t est inférieure à la valeur du tableau pour un nombre donné de degrés de liberté, signification statistique Il n’y a aucune relation observée. Si elle est supérieure, la corrélation est considérée comme statistiquement significative.
Date de publication : 03/09/2017 13:01
Le terme « corrélation » est activement utilisé dans les sciences humaines et la médecine ; apparaît souvent dans les médias. Les corrélations jouent un rôle clé en psychologie. En particulier, le calcul des corrélations est étape importante mise en œuvre de recherches empiriques lors de la rédaction d'une thèse en psychologie.
Les documents sur les corrélations sur Internet sont trop scientifiques. Il est difficile pour un non-spécialiste de comprendre les formules. Dans le même temps, comprendre la signification des corrélations est nécessaire pour un spécialiste du marketing, un sociologue, un médecin, un psychologue – toute personne menant des recherches sur des personnes.
Dans cet article, nous dans un langage simple nous expliquerons l'essence de la relation de corrélation, les types de corrélations, les méthodes de calcul, les caractéristiques de l'utilisation de la corrélation dans recherche psychologique, ainsi que lors de la rédaction de thèses en psychologie.
Contenu
Qu'est-ce que la corrélation
La corrélation est la connexion. Mais pas n’importe qui. Quelle est sa particularité ? Regardons un exemple.
Imaginez que vous conduisez une voiture. Vous appuyez sur la pédale d'accélérateur et la voiture va plus vite. Vous ralentissez le gaz et la voiture ralentit. Même quelqu'un qui ne connaît pas la structure d'une voiture dira : « Il existe un lien direct entre la pédale d'accélérateur et la vitesse de la voiture : plus la pédale est enfoncée fort, plus la vitesse est élevée. »
Il s'agit d'une relation fonctionnelle : la vitesse est une fonction directe de la pédale d'accélérateur. Le spécialiste vous expliquera que la pédale contrôle l'alimentation en carburant des cylindres, où le mélange est brûlé, ce qui entraîne une augmentation de la puissance de l'arbre, etc. Cette connexion est rigide, déterministe et ne permet aucune exception (à condition que la machine fonctionne correctement).
Imaginez maintenant que vous êtes le directeur d'une entreprise dont les employés vendent des produits. Vous décidez d’augmenter vos ventes en augmentant les salaires des employés. Vous augmentez votre salaire de 10 % et les ventes en moyenne de l'entreprise augmentent. Au bout d'un moment, vous l'augmentez encore de 10 %, et à nouveau il y a une croissance. Puis encore 5%, et encore une fois il y a un effet. La conclusion s'impose : il existe une relation directe entre les ventes de l'entreprise et les salaires des employés : plus les salaires sont élevés, plus les ventes de l'organisation sont élevées. Est-ce le même lien qu'entre la pédale d'accélérateur et la vitesse de la voiture ? Quelle est la principale différence ?
C'est vrai, la relation entre salaire et ventes n'est pas stricte. Cela signifie que les ventes de certains salariés pourraient même diminuer, malgré l’augmentation des salaires. Certains resteront inchangés. Mais en moyenne, les ventes de l’entreprise ont augmenté, et nous disons qu’il existe un lien entre les ventes et les salaires des employés, et qu’il est corrélationnel.
La base de la connexion fonctionnelle (pédale d'accélérateur - vitesse) est loi physique. La base de la relation de corrélation (ventes - salaire) est la simple cohérence des évolutions de deux indicateurs. Il n’y a aucune loi (au sens physique du terme) derrière la corrélation. Il n’existe qu’un modèle probabiliste (stochastique).
Expression numérique de la dépendance de corrélation
Ainsi, la relation de corrélation reflète la dépendance entre les phénomènes. Si ces phénomènes peuvent être mesurés, ils reçoivent alors une expression numérique.
Par exemple, le rôle de la lecture dans la vie des gens est étudié. Les chercheurs ont pris un groupe de 40 personnes et ont mesuré deux indicateurs pour chaque sujet : 1) combien de temps il lit par semaine ; 2) dans quelle mesure il se considère prospère (sur une échelle de 1 à 10). Les scientifiques ont saisi ces données dans deux colonnes et ont utilisé un programme statistique pour calculer la corrélation entre lecture et bien-être. Disons qu'ils ont obtenu le résultat suivant -0,76. Mais que signifie ce chiffre ? Comment l'interpréter ? Voyons cela.
Le nombre obtenu est appelé coefficient de corrélation. Pour l’interpréter correctement, il est important de considérer les éléments suivants :
- Le signe « + » ou « - » reflète le sens de la dépendance.
- La valeur du coefficient reflète la force de la dépendance.
Direct et inverse
Le signe plus devant le coefficient indique que la relation entre phénomènes ou indicateurs est directe. Autrement dit, plus un indicateur est élevé, plus l'autre est élevé. Un salaire plus élevé signifie des ventes plus élevées. Cette corrélation est dite directe ou positive.
Si le coefficient a un signe moins, cela signifie que la corrélation est inverse ou négative. Dans ce cas, plus un indicateur est élevé, plus l'autre est bas. Dans l'exemple avec la lecture et le bien-être, nous avons obtenu -0,76, ce qui signifie que plus de gens lire, plus leur niveau de bien-être est faible.
Fort et faible
Une corrélation en termes numériques est un nombre compris entre -1 et +1. Désigné par la lettre "r". Plus le nombre est élevé (en ignorant le signe), plus la corrélation est forte.
Plus la valeur numérique du coefficient est faible, moins la relation entre phénomènes et indicateurs est importante.
La force de dépendance maximale possible est de 1 ou -1. Comment comprendre et présenter cela ?
Regardons un exemple. Ils ont pris 10 étudiants et ont mesuré leur niveau d’intelligence (QI) et leurs performances académiques pour le semestre. Disposé ces données sous la forme de deux colonnes.
Sujet |
QI |
Performance académique (points) |
Regardez attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Mais le niveau de réussite augmente également. Parmi deux élèves, celui ayant le QI le plus élevé obtiendra de meilleurs résultats. Et il n’y aura aucune exception à cette règle.
Voici un exemple de changement complet et cohérent à 100 % de deux indicateurs dans un groupe. Et ceci est un exemple de la relation la plus positive possible. Autrement dit, la corrélation entre l’intelligence et les résultats scolaires est égale à 1.
Regardons un autre exemple. Les mêmes 10 étudiants ont été évalués à l'aide d'une enquête dans quelle mesure ils se sentaient capables de communiquer avec le sexe opposé (sur une échelle de 1 à 10).
Sujet |
QI |
Réussite dans la communication avec le sexe opposé (points) |
Examinons attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Dans le même temps, dans la dernière colonne, le niveau de réussite dans la communication avec le sexe opposé diminue constamment. Parmi deux élèves, celui dont le QI est le plus faible réussira mieux à communiquer avec le sexe opposé. Et il n’y aura aucune exception à cette règle.
Ceci est un exemple de cohérence totale dans les changements de deux indicateurs dans un groupe - la relation négative maximale possible. La corrélation entre le QI et la réussite dans la communication avec le sexe opposé est de -1.
Comment comprendre le sens d’une corrélation égale à zéro (0) ? Cela signifie qu’il n’y a aucun lien entre les indicateurs. Revenons encore une fois à nos étudiants et considérons un autre indicateur mesuré par eux : la longueur de leur saut debout.
Sujet |
QI |
Longueur de saut debout (m) |
Il n’y a aucune cohérence observée entre la variation d’une personne à l’autre du QI et de la longueur du saut. Cela indique l’absence de corrélation. Le coefficient de corrélation entre le QI et la longueur du saut debout chez les élèves est de 0.
Nous avons examiné des cas extrêmes. Dans les mesures réelles, les coefficients sont rarement exactement égaux à 1 ou 0. L'échelle suivante est adoptée :
- si le coefficient est supérieur à 0,70, la relation entre les indicateurs est forte ;
- de 0,30 à 0,70 - connexion modérée,
- moins de 0,30 - la relation est faible.
Si l'on évalue la corrélation entre lecture et bien-être que nous avons obtenue ci-dessus sur cette échelle, il s'avère que cette relation est forte et négative de -0,76. Autrement dit, il existe une forte relation négative entre le fait d’être bien lu et le bien-être. Ce qui confirme une fois de plus la sagesse biblique sur la relation entre sagesse et tristesse.
La gradation donnée donne des estimations très approximatives et est rarement utilisée dans la recherche sous cette forme.
Les gradations des coefficients selon les niveaux de signification sont plus souvent utilisées. Dans ce cas, le coefficient effectivement obtenu peut être significatif ou non. Ceci peut être déterminé en comparant sa valeur avec la valeur critique du coefficient de corrélation tirée d'un tableau spécial. De plus, ces valeurs critiques dépendent de la taille de l'échantillon (plus le volume est grand, plus la valeur critique est faible).
Analyse de corrélation en psychologie
La méthode de corrélation est l'une des principales méthodes de recherche psychologique. Et ce n’est pas un hasard, car la psychologie s’efforce d’être une science exacte. Est-ce que ça marche ?
Quelles sont les particularités des lois dans les sciences exactes ? Par exemple, la loi de la gravité en physique fonctionne sans exception : plus la masse d'un corps est grande, plus il attire d'autres corps. Cette loi physique reflète la relation entre la masse corporelle et la gravité.
En psychologie, la situation est différente. Par exemple, les psychologues publient des données sur le lien entre les relations chaleureuses dans l'enfance avec les parents et le niveau de créativité à l'âge adulte. Cela signifie-t-il que l'un des sujets ayant une très relations chaleureuses avec les parents dans l'enfance aura un niveau très élevé créativité? La réponse est claire : non. Il n’y a pas de loi comme la loi physique. Il n’existe aucun mécanisme permettant d’influencer l’expérience de l’enfance sur la créativité des adultes. Ce sont nos fantasmes ! Il y a une cohérence des données (relations – créativité), mais il n’y a aucune loi derrière cela. Mais il n'y a qu'une corrélation. Les psychologues appellent souvent les relations identifiées des modèles psychologiques, soulignant leur nature probabiliste et non leur rigidité.
L’exemple d’étude d’étudiant de la section précédente illustre bien l’utilisation des corrélations en psychologie :
- Analyse de la relation entre les indicateurs psychologiques. Dans notre exemple, le QI et la réussite dans la communication avec le sexe opposé sont des paramètres psychologiques. Identifier la corrélation entre eux élargit la compréhension de l'organisation mentale d'une personne, des relations entre diverses fêtes sa personnalité - en l'occurrence entre l'intellect et la sphère de la communication.
- L'analyse de la relation entre le QI et les résultats scolaires et le saut d'obstacles est un exemple du lien entre un paramètre psychologique et des paramètres non psychologiques. Les résultats obtenus révèlent les caractéristiques de l'influence de l'intelligence sur les activités éducatives et sportives.
Voici à quoi pourrait ressembler une synthèse de l’étude étudiante concoctée :
- Une relation positive significative entre l’intelligence des étudiants et leurs performances académiques a été révélée.
- Il existe une relation négative significative entre le QI et la réussite dans la communication avec le sexe opposé.
- Il n'y avait aucun lien entre le QI des étudiants et la capacité de sauter.
Ainsi, le niveau d'intelligence des étudiants agit comme un facteur positif dans leurs résultats scolaires, tout en affectant négativement les relations avec le sexe opposé et n'ayant pas d'impact significatif sur la réussite sportive, en particulier la capacité de sauter.
Comme nous le voyons, l’intelligence aide les élèves à apprendre, mais les empêche d’établir des relations avec le sexe opposé. Toutefois, cela n’affecte en rien leur réussite sportive.
L'influence ambiguë de l'intelligence sur la personnalité et les activités des étudiants reflète la complexité de ce phénomène dans la structure caractéristiques personnelles et l'importance de poursuivre les recherches dans cette direction. En particulier, il semble important d'analyser la relation entre le renseignement et caractéristiques psychologiques et les activités des étudiants en tenant compte de leur sexe.
Coefficients de Pearson et Spearman
Considérons deux méthodes de calcul.
Le coefficient de Pearson est une méthode spéciale pour calculer la relation entre les indicateurs entre la gravité de valeurs numériques dans un groupe. Très simplement, cela se résume à ceci :
- Les valeurs de deux paramètres dans un groupe de sujets sont prises (par exemple, l'agressivité et le perfectionnisme).
- Les valeurs moyennes de chaque paramètre du groupe sont trouvées.
- Les différences entre les paramètres de chaque sujet et la valeur moyenne sont trouvées.
- Ces différences se substituent à formulaire spécial pour calculer le coefficient de Pearson.
Le coefficient de corrélation de rang de Spearman est calculé de la même manière :
- Les valeurs de deux indicateurs du groupe de matières sont prises.
- On retrouve les rangs de chaque facteur du groupe, c'est-à-dire la place dans la liste par ordre croissant.
- Les différences de rang sont trouvées, mises au carré et additionnées.
- Ensuite, les différences de rang sont substituées sous une forme spéciale pour calculer le coefficient de Spearman.
Dans le cas de Pearson, le calcul a été effectué en utilisant la valeur moyenne. Par conséquent, des valeurs aberrantes aléatoires dans les données (différences significatives par rapport à la moyenne), dues par exemple à des erreurs de traitement ou à des réponses peu fiables, peuvent fausser considérablement le résultat.
Dans le cas de Spearman, les valeurs absolues des données ne jouent aucun rôle, puisque seules leurs positions relatives les unes par rapport aux autres (rangs) sont prises en compte. Autrement dit, les données aberrantes ou autres inexactitudes n’auront pas d’impact sérieux sur le résultat final.
Si les résultats du test sont corrects, alors les différences entre les coefficients de Pearson et de Spearman sont insignifiantes, tandis que le coefficient de Pearson montre davantage valeur exacte relations de données.
Comment calculer le coefficient de corrélation
Les coefficients de Pearson et Spearman peuvent être calculés manuellement. Cela peut être nécessaire lorsque étude approfondie méthodes statistiques.
Cependant, dans la plupart des cas, lors de la résolution de problèmes appliqués, y compris en psychologie, il est possible d'effectuer des calculs à l'aide de programmes spéciaux.
Calcul à l'aide de feuilles de calcul Microsoft Excel
Revenons à l'exemple avec les élèves et considérons les données sur leur niveau d'intelligence et la longueur de leur saut debout. Entrons ces données (deux colonnes) dans un tableau Excel.
En déplaçant le curseur vers une cellule vide, cliquez sur l'option « Insérer une fonction » et sélectionnez « CORREL » dans la section « Statistiques ».
Le format de cette fonction implique la sélection de deux tableaux de données : CORREL (tableau 1 ; tableau"). Nous mettons en évidence la colonne avec le QI et la longueur du saut en conséquence.
Les feuilles de calcul Excel ont une formule pour calculer uniquement le coefficient de Pearson.
Calcul à l'aide du programme STATISTICA
Nous entrons des données sur l'intelligence et sautons dans le champ de données initial. Ensuite, sélectionnez l'option « Tests non paramétriques », « Spearman ». Nous sélectionnons les paramètres de calcul et obtenons le résultat suivant.
Comme vous pouvez le constater, le calcul a donné un résultat de 0,024, qui diffère du résultat de Pearson - 0,038, obtenu ci-dessus avec en utilisant Excel. Toutefois, les différences sont mineures.
Utiliser l'analyse de corrélation dans les thèses de psychologie (exemple)
La plupart des sujets des travaux finaux de qualification en psychologie (diplômes, cours, maîtrise) impliquent la réalisation de recherches de corrélation (le reste est lié à l'identification des différences d'indicateurs psychologiques dans différents groupes).
Le terme « corrélation » lui-même est rarement entendu dans les noms de sujets - il se cache derrière les formulations suivantes :
- « La relation entre le sentiment subjectif de solitude et la réalisation de soi chez les femmes d'âge mûr » ;
- « Caractéristiques de l'influence de la résilience des managers sur le succès de leur interaction avec les clients dans des situations de conflit » ;
- "Facteurs personnels de résistance au stress des employés du ministère des Situations d'urgence."
Ainsi, les mots « relation », « influence » et « facteurs » sont des signes certains que la méthode d'analyse des données en recherche empirique il devrait y avoir une analyse de corrélation.
Considérons brièvement les étapes de sa mise en œuvre lors de la rédaction thèse en psychologie sur le thème : « La relation entre l'anxiété personnelle et l'agressivité chez les adolescents. »
1. Pour le calcul, des données brutes sont nécessaires, qui correspondent généralement aux résultats des tests des sujets. Ils sont saisis dans un tableau croisé dynamique et placés dans l'application. Ce tableau est organisé comme suit :
- chaque ligne contient des données pour un sujet ;
- chaque colonne contient des indicateurs sur une échelle pour tous les sujets.
Sujet n° |
Anxiété de la personnalité |
Agressivité |
2. Il est nécessaire de décider lequel des deux types de coefficients - Pearson ou Spearman - sera utilisé. Nous vous rappelons que Pearson donne un résultat plus précis, mais il est sensible aux valeurs aberrantes des données. Les coefficients de Spearman peuvent être utilisés avec n'importe quelle donnée (sauf l'échelle nominative), c'est pourquoi ils sont le plus souvent utilisés dans les diplômes de psychologie.
3. Entrez le tableau de données brutes dans le programme statistique.
4. Calculez la valeur.
5. Activé prochaine étape il est important de déterminer si la relation est significative. Le programme statistique a mis en évidence les résultats en rouge, ce qui signifie que la corrélation est statistiquement significative au niveau de signification de 0,05 (indiqué ci-dessus).
Cependant, il est utile de savoir comment déterminer manuellement la signification. Pour ce faire, vous aurez besoin d'un tableau des valeurs critiques de Spearman.
Tableau des valeurs critiques des coefficients de Spearman
Niveau de signification statistique |
|||
Nombre de sujets |
p=0,05 |
p=0,01 |
p=0,001 |
0,88 |
0,96 |
0,99 |
|
0,81 |
0,92 |
0,97 |
|
0,75 |
0,88 |
0,95 |
|
0,71 |
0,83 |
0,93 |
|
0,67 |
|||
0,63 |
0,77 |
0,87 |
|
0,74 |
0,85 |
||
0,58 |
0,71 |
0,82 |
|
0,55 |
0,68 |
||
0,53 |
0,66 |
0,78 |
|
0,51 |
0,64 |
0,76 |
Nous nous intéressons à un niveau de signification de 0,05 et notre échantillon est de 10 personnes. A l'intersection de ces données on retrouve la valeur critique de Spearman : Rcr=0,63.
La règle est la suivante : si la valeur empirique de Spearman qui en résulte est supérieure ou égale à la valeur critique, alors elle est statistiquement significative. Dans notre cas : Ramp (0,66) > Rcr (0,63), la relation entre agressivité et anxiété dans le groupe d'adolescents est donc statistiquement significative.
5. Dans le texte de la thèse, vous devez insérer les données dans un tableau au format Word, et non dans un tableau provenant d'un programme statistique. Sous le tableau, nous décrivons le résultat obtenu et l'interprétons.
Tableau 1
Coefficients de Spearman d'agressivité et d'anxiété dans un groupe d'adolescents
Agressivité |
|
Anxiété de la personnalité |
0,665* |
* - statistiquement significatif (p≤ 0,05)
L'analyse des données présentées dans le tableau 1 montre qu'il existe une relation positive statistiquement significative entre l'agressivité et l'anxiété chez les adolescents. Cela signifie que plus l'anxiété personnelle des adolescents est élevée, plus leur niveau d'agressivité est élevé. Ce résultat suggère que l’agressivité chez les adolescents est l’un des moyens de soulager l’anxiété. Le doute de soi, l'anxiété due aux menaces pour l'estime de soi, particulièrement sensibles dans adolescence, l'adolescent utilise souvent comportement agressif, donc de manière improductive réduire l’anxiété.
6. Est-il possible de parler d'influence lors de l'interprétation des connexions ? Peut-on dire que l’anxiété affecte l’agressivité ? À proprement parler, non. Nous avons montré plus haut que la corrélation entre les phénomènes est de nature probabiliste et reflète uniquement la cohérence des changements de caractéristiques au sein du groupe. En même temps, on ne peut pas dire que cette cohérence soit due au fait que l'un des phénomènes est la cause de l'autre et l'influence. C'est-à-dire que la présence d'une corrélation entre les paramètres psychologiques ne permet pas de parler de l'existence d'une relation de cause à effet entre eux. Cependant, la pratique montre que le terme « influence » est souvent utilisé lors de l'analyse des résultats de l'analyse de corrélation.
Le calculateur ci-dessous calcule le coefficient de corrélation de rang de Spearman entre deux variables aléatoires. La partie théorique, afin de ne pas se laisser distraire de la calculatrice, se situe traditionnellement en dessous de celle-ci.
ajouter import_export mode_edit supprimer
Changements dans les variables aléatoires
arrow_upwardarrow_downward X | arrow_upwardarrow_downward Oui | ||
---|---|---|---|
mode_edit |
Changements dans les variables aléatoires
Importer des données Erreur d'importation
Vous pouvez utiliser l'un de ces symboles pour séparer les champs : Tabulation, ";" ou "," Exemple : -50,5 ; -50,5
Importer Retour Annuler
La méthode de calcul du coefficient de corrélation de rang de Spearman est en fait décrite très simplement. Il s'agit du même coefficient de corrélation de Pearson, calculé uniquement non pas pour les résultats des mesures des variables aléatoires elles-mêmes, mais pour leur valeurs de classement.
C'est,
Il ne reste plus qu'à comprendre quelles sont les valeurs de classement et pourquoi tout cela est nécessaire.
Si les éléments d’une série de variations sont classés par ordre croissant ou décroissant, alors rang l'élément sera son numéro dans cette série ordonnée.
Par exemple, ayons une série de variations (17,26,5,14,21). Trions ses éléments par ordre décroissant (26,21,17,14,5). 26 a le rang 1, 21 a le rang 2, etc. La série de variations des valeurs de classement ressemblera à ceci (3,1,5,4,2).
Autrement dit, lors du calcul du coefficient de Spearman, les séries de variations originales sont transformées en séries de variations de valeurs de rang, après quoi la formule de Pearson leur est appliquée.
Il y a une subtilité - le rang des valeurs répétées est considéré comme la moyenne des rangs. C'est-à-dire que pour la ligne (17, 15, 14, 15), la ligne de valeurs de rang ressemblera à (1, 2,5, 4, 2,5), puisque le premier élément égal à 15 a le rang 2, et le second a le rang 3, et .
S'il n'y a pas de valeurs répétitives, c'est-à-dire que toutes les valeurs de la série de rangs sont des nombres compris entre 1 et n, la formule de Pearson peut être simplifiée en
Eh bien, d'ailleurs, cette formule est le plus souvent donnée comme formule de calcul du coefficient de Spearman.
Quelle est l'essence du passage des valeurs elles-mêmes à leurs valeurs de rang ?
Le fait est qu'en étudiant la corrélation des valeurs de rang, vous pouvez déterminer dans quelle mesure la dépendance de deux variables est décrite par une fonction monotone.
Le signe du coefficient indique le sens de la relation entre les variables. Si le signe est positif, alors les valeurs Y ont tendance à augmenter à mesure que les valeurs X augmentent ; si le signe est négatif, alors les valeurs Y ont tendance à diminuer à mesure que les valeurs X augmentent. Si le coefficient est 0, alors il n'y a pas de tendance. Si le coefficient est 1 ou -1, alors la relation entre X et Y a la forme d'une fonction monotone - c'est-à-dire que lorsque X augmente, Y augmente également, ou vice versa, à mesure que X augmente, Y diminue.
Autrement dit, contrairement au coefficient de corrélation de Pearson, qui ne peut révéler qu'une dépendance linéaire d'une variable par rapport à une autre, le coefficient de corrélation de Spearman peut révéler une dépendance monotone dans laquelle aucune relation linéaire directe n'est détectée.
Laissez-moi vous expliquer avec un exemple. Supposons que nous examinions la fonction y=10/x.
Nous avons les mesures X et Y suivantes
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Pour ces données, le coefficient de corrélation de Pearson est de -0,4686, c'est-à-dire que la relation est faible ou absente. Mais le coefficient de corrélation de Spearman est strictement égal à -1, ce qui semble laisser entendre au chercheur que Y a une dépendance monotone strictement négative à l'égard de X.
Analyse de corrélation est une méthode qui permet de détecter des dépendances entre un certain nombre de variables aléatoires. Le but de l'analyse de corrélation est d'identifier une évaluation de la force des liens entre ces variables ou caractéristiques aléatoires qui caractérisent certains processus réels.
Aujourd'hui, nous proposons d'examiner comment l'analyse de corrélation de Spearman est utilisée pour afficher visuellement les formes de communication dans le trading pratique.
Corrélation de Spearman ou base d'analyse de corrélation
Afin de comprendre ce qu'est l'analyse de corrélation, vous devez d'abord comprendre le concept de corrélation.
Dans le même temps, si le prix commence à évoluer dans la direction souhaitée, vous devez débloquer vos positions à temps.
Pour cette stratégie, basée sur l'analyse de corrélation, de la meilleure façon possible instruments de trading appropriés ayant haut degré corrélations (EUR/USD et GBP/USD, EUR/AUD et EUR/NZD, AUD/USD et NZD/USD, contrats CFD, etc.).
Vidéo : Application de la corrélation de Spearman sur le marché Forex
Un étudiant en psychologie (sociologue, manager, manager, etc.) s'intéresse souvent à la façon dont deux ou plus variables dans un ou plusieurs groupes d’étude.
En mathématiques, pour décrire les relations entre quantités variables, on utilise le concept de fonction F, qui associe chaque valeur spécifique de la variable indépendante X à une valeur spécifique de la variable dépendante Y. La dépendance résultante est notée Y=F( X).
Dans le même temps, les types de corrélations entre les caractéristiques mesurées peuvent être différents : par exemple, la corrélation peut être linéaire et non linéaire, positive et négative. C'est linéaire - si avec une augmentation ou une diminution d'une variable X, la deuxième variable Y, en moyenne, augmente ou diminue également. Il est non linéaire si, avec une augmentation d'une quantité, la nature du changement dans la seconde n'est pas linéaire, mais est décrite par d'autres lois.
La corrélation sera positive si, avec une augmentation de la variable X, la variable Y en moyenne augmente également, et si, avec une augmentation de X, la variable Y a tendance à diminuer en moyenne, alors on parle de la présence d'un négatif corrélation. Il est possible qu'il soit impossible d'établir une relation entre les variables. Dans ce cas, ils disent qu’il n’y a pas de corrélation.
La tâche de l'analyse de corrélation revient à établir la direction (positive ou négative) et la forme (linéaire, non linéaire) de la relation entre différentes caractéristiques, à mesurer sa proximité et, enfin, à vérifier le niveau de signification des coefficients de corrélation obtenus.
Le coefficient de corrélation de rang, proposé par K. Spearman, fait référence à une mesure non paramétrique de la relation entre des variables mesurées sur une échelle de rang. Lors du calcul de ce coefficient, aucune hypothèse n'est requise sur la nature des distributions de caractéristiques dans population. Ce coefficient détermine le degré d'étroitesse de connexion entre les caractéristiques ordinales, qui représentent dans ce cas les rangs des quantités comparées.
Coefficient de classement corrélation linéaire Spearman est calculé à l'aide de la formule :
où n est le nombre de caractéristiques classées (indicateurs, sujets) ;
D est la différence entre les classements de deux variables pour chaque sujet ;
D2 est la somme des carrés des différences de rangs.
Les valeurs critiques du coefficient de corrélation de rang de Spearman sont présentées ci-dessous :
La valeur du coefficient de corrélation linéaire de Spearman se situe entre +1 et -1. Le coefficient de corrélation linéaire de Spearman peut être positif ou négatif, caractérisant la direction de la relation entre deux traits mesurés sur une échelle de rang.
Si le coefficient de corrélation en module s'avère proche de 1, alors cela correspond à haut niveau connexions entre variables. Ainsi, notamment, lorsqu'une variable est corrélée avec elle-même, la valeur du coefficient de corrélation sera égale à +1. Une telle relation caractérise une dépendance directement proportionnelle. Si les valeurs de la variable X sont classées par ordre croissant et que les mêmes valeurs (maintenant désignées comme variable Y) sont classées par ordre décroissant, alors dans ce cas, la corrélation entre les variables X et Y sera exactement - 1. Cette valeur du coefficient de corrélation caractérise une relation inversement proportionnelle.
Le signe du coefficient de corrélation est très important pour interpréter la relation résultante. Si le signe du coefficient de corrélation linéaire est plus, alors la relation entre les caractéristiques corrélées est telle qu'une valeur plus grande d'une caractéristique (variable) correspond à une valeur plus grande d'une autre caractéristique (une autre variable). En d’autres termes, si un indicateur (variable) augmente, alors l’autre indicateur (variable) augmente en conséquence. Cette dépendance est appelée dépendance directement proportionnelle.
Si un signe moins est reçu, alors une valeur plus grande d'une caractéristique correspond à une valeur plus petite d'une autre. Autrement dit, s’il y a un signe moins, une augmentation d’une variable (signe, valeur) correspond à une diminution d’une autre variable. Cette dépendance est appelée dépendance inversement proportionnelle. Dans ce cas, le choix de la variable à laquelle est attribué le caractère (tendance) d’augmentation est arbitraire. Il peut s'agir soit de la variable X, soit de la variable Y. Cependant, si la variable X est considérée comme augmentant, alors la variable Y diminuera en conséquence, et vice versa.
Regardons l'exemple de la corrélation de Spearman.
Le psychologue découvre comment les indicateurs individuels de préparation à l'école, obtenus avant la rentrée scolaire auprès de 11 élèves de première année, sont liés entre eux et à leurs performances moyennes à la fin de l'année scolaire.
Pour résoudre ce problème, dans un premier temps, les valeurs des indicateurs ont été classées préparation à l'école reçus à l'admission à l'école et, d'autre part, les indicateurs de performance finaux en fin d'année pour ces mêmes élèves en moyenne. Nous présentons les résultats dans le tableau :
Nous remplaçons les données obtenues dans la formule ci-dessus et effectuons le calcul. On obtient :
Pour trouver le niveau de signification, nous nous référons au tableau « Valeurs critiques du coefficient de corrélation de rang de Spearman », qui présente les valeurs critiques pour les coefficients de corrélation de rang.
Nous construisons l’« axe de signification » correspondant :
Le coefficient de corrélation résultant coïncidait avec la valeur critique pour le niveau de signification de 1 %. Par conséquent, on peut affirmer que les indicateurs de maturité scolaire et notes finales les élèves de première année sont liés par une corrélation positive - en d'autres termes, plus l'indicateur de préparation à l'école est élevé, meilleures sont les études de première année. En termes d'hypothèses statistiques, le psychologue doit rejeter l'hypothèse nulle (H0) sur la similitude et accepter l'alternative (H1) sur la présence de différences, ce qui suggère que la relation entre les indicateurs de maturité scolaire et le rendement scolaire moyen est différente de zéro.
Corrélation de Spearman. Analyse de corrélation selon la méthode Spearman. Classement de Spearman. Coefficient de corrélation de Spearman. Corrélation des rangs de Spearman