Coefficient de corrélation de Spearman. Coefficient de corrélation de rang de Spearman
Corrélation des rangs de Spearman(corrélation des rangs). La corrélation de rang de Spearman est le moyen le plus simple de déterminer le degré de relation entre les facteurs. Le nom de la méthode indique que la relation est déterminée entre des rangs, c'est-à-dire des séries de valeurs quantitatives obtenues, classées par ordre décroissant ou croissant. Il faut garder à l'esprit que, premièrement, la corrélation de rang n'est pas recommandée si la connexion entre les paires est inférieure à quatre et supérieure à vingt ; d'autre part, la corrélation de rang permet de déterminer la relation dans un autre cas, si les valeurs sont de nature semi-quantitative, c'est-à-dire qu'elles n'ont pas expression numérique, reflètent un ordre clair de ces quantités ; troisièmement, il est conseillé d'utiliser la corrélation de rang dans les cas où elle suffit pour obtenir des données approximatives. Exemple de calcul de coefficient corrélation de rang pour déterminer la question : mesurer le questionnaire X et Y sont similaires qualités personnelles sujets. À l'aide de deux questionnaires (X et Y), qui nécessitent des réponses alternatives « oui » ou « non », les principaux résultats ont été obtenus - les réponses de 15 sujets (N = 10). Les résultats ont été présentés comme la somme des réponses affirmatives séparément pour le questionnaire X et pour le questionnaire B. Ces résultats sont résumés dans le tableau. 5.19.
Tableau 5.19. Tabulation des résultats primaires pour calculer le coefficient de corrélation de rang de Spearman (p) *
Analyse de la matrice récapitulative de corrélation. Méthode de corrélation des galaxies.
Exemple. Dans le tableau La figure 6.18 montre les interprétations de onze variables testées à l'aide de la méthode Wechsler. Les données ont été obtenues à partir d'un échantillon homogène âgé de 18 à 25 ans (n = 800).
Avant la stratification, il est conseillé de classer la matrice de corrélation. Pour ce faire, les valeurs moyennes des coefficients de corrélation de chaque variable avec toutes les autres sont calculées dans la matrice d'origine.
Puis selon le tableau. 5.20 déterminer les niveaux de stratification admissibles de la matrice de corrélation pour des probabilité de confiance 0,95 et n - quantités
Tableau 6.20. Matrice de corrélation ascendante
Variables | 1 | 2 | 3 | 4 | serait | 0 | 7 | 8 | 0 | 10 | 11 | M(rij) | Rang |
1 | 1 | 0,637 | 0,488 | 0,623 | 0,282 | 0,647 | 0,371 | 0,485 | 0,371 | 0,365 | 0,336 | 0,454 | 1 |
2 | 1 | 0,810 | 0,557 | 0,291 | 0,508 | 0,173 | 0,486 | 0,371 | 0,273 | 0,273 | 0,363 | 4 | |
3 | 1 | 0,346 | 0,291 | 0,406 | 0,360 | 0,818 | 0,346 | 0,291 | 0,282 | 0,336 | 7 | ||
4 | 1 | 0,273 | 0,572 | 0,318 | 0,442 | 0,310 | 0,318 | 0,291 | 0,414 | 3 | |||
5 | 1 | 0,354 | 0,254 | 0,216 | 0,236 | 0,207 | 0,149 | 0,264 | 11 | ||||
6 | 1 | 0,365 | 0,405 | 0,336 | 0,345 | 0,282 | 0,430 | 2 | |||||
7 | 1 | 0,310 | 0,388 | 0,264 | 0,266 | 0,310 | 9 | ||||||
8 | 1 | 0,897 | 0,363 | 0,388 | 0,363 | 5 | |||||||
9 | 1 | 0,388 | 0,430 | 0,846 | 6 | ||||||||
10 | 1 | 0,336 | 0,310 | 8 | |||||||||
11 | 1 | 0,300 | 10 |
Désignations : 1 - sensibilisation générale ; 2 - conceptualité ; 3 - attention ; 4 - vdataness K de généralisation ; b - mémorisation directe (en chiffres) 6 - niveau de maîtrise de la langue maternelle ; 7 - rapidité de maîtrise des compétences sensorimotrices (codage des symboles) 8 - observation ; 9 - capacités combinatoires (pour l'analyse et la synthèse) 10 - capacité à organiser des parties en un tout significatif ; 11 - capacité de synthèse heuristique ; M (rij) - la valeur moyenne des coefficients de corrélation de la variable avec d'autres variables d'observation (dans notre cas n = 800) : r (0) - la valeur du plan zéro "Dissection" - la valeur absolue significative minimale du coefficient de corrélation (n - 120, r (0) = 0,236 ; n = 40, r (0) = 0,407) | Δr | - pas de stratification admissible (n = 40, | Δr | = 0,558) dans - nombre admissible de niveaux de stratification (n = 40, s = 1 ; n = 120, s = 2) ; r (1), r (2), ..., r (9) - valeur absolue du plan de coupe (n = 40, r (1) = 0,965).
Pour n = 800, nous trouvons la valeur de gtype et les limites de gi, après quoi nous stratifions la matrice de corrélation, en mettant en évidence les pléiades de corrélation dans les couches, ou des parties séparées de la matrice de corrélation, en dessinant des associations de pléiades de corrélation pour les couches sus-jacentes (Fig. .5.5).
Une analyse significative des galaxies résultantes dépasse les limites des statistiques mathématiques. Il convient de noter qu’il existe deux indicateurs formels qui facilitent l’interprétation significative des Pléiades. Un indicateur important est le degré d’un sommet, c’est-à-dire le nombre d’arêtes adjacentes à un sommet. Variable avec le plus grand nombre Les bords constituent le « noyau » de la galaxie et peuvent être considérés comme un indicateur des variables restantes de cette galaxie. Un autre indicateur important est la densité de la communication. Une variable peut avoir moins de connexions dans une galaxie, mais plus proches, et plus de connexions dans une autre galaxie, mais moins proches.
Prédictions et estimations. L'équation y = b1x + b0 s'appelle équation générale direct. Cela indique que les paires de points (x, y), qui
Riz. 5.5. Galaxies de corrélation obtenues par superposition matricielle
se trouvent sur une certaine ligne, connectée de telle manière que pour toute valeur x, la valeur b qui lui est associée peut être trouvée en multipliant x par un certain nombre b1 et en ajoutant deuxièmement le nombre b0 à ce produit.
Le coefficient de régression vous permet de déterminer le degré de changement du facteur d'enquête lorsque le facteur causal change d'une unité. Les valeurs absolues caractérisent la relation entre les facteurs variables par leurs valeurs absolues. Le coefficient de régression est calculé à l'aide de la formule :
Conception et analyse d'expériences. La conception et l'analyse d'expériences constituent la troisième branche importante méthodes statistiques, conçu pour trouver et tester les relations causales entre les variables.
Étudier les dépendances multifactorielles dans dernièrement les méthodes de planification expérimentale mathématique sont de plus en plus utilisées.
La possibilité de faire varier simultanément tous les facteurs permet de : a) réduire le nombre d'expériences ;
b) réduire les erreurs expérimentales au minimum ;
c) simplifier le traitement des données reçues ;
d) garantir la clarté et la facilité de comparaison des résultats.
Chaque facteur peut acquérir un certain nombre correspondant de valeurs différentes, appelées niveaux et notées -1, 0 et 1. Un ensemble fixe de niveaux de facteurs détermine les conditions de l'une des expériences possibles.
La totalité de toutes les combinaisons possibles est calculée à l'aide de la formule :
Une expérience factorielle complète est une expérience dans laquelle toutes les combinaisons possibles de niveaux de facteurs sont mises en œuvre. Les expériences factorielles complètes peuvent avoir la propriété d'orthogonalité. Avec la planification orthogonale, les facteurs de l'expérience ne sont pas corrélés ; les coefficients de régression finalement calculés sont déterminés indépendamment les uns des autres.
Un avantage important de la méthode de planification expérimentale mathématique est sa polyvalence et son adéquation à de nombreux domaines de recherche.
Considérons un exemple de comparaison de l'influence de certains facteurs sur la formation du niveau de stress mental dans les contrôleurs de télévision couleur.
L'expérience est basée sur un plan orthogonal 2 à trois (trois facteurs changent à deux niveaux).
L'expérience a été réalisée avec une partie complète 2 + 3 avec trois répétitions.
La planification orthogonale repose sur la construction d'une équation de régression. Pour trois facteurs, cela ressemble à ceci :
Le traitement des résultats dans cet exemple comprend :
a) construction d'une table de plan orthogonal 2 +3 pour le calcul ;
b) calcul des coefficients de régression ;
c) vérifier leur signification ;
d) interprétation des données obtenues.
Pour les coefficients de régression de l'équation mentionnée, il a fallu mettre N = 2 3 = 8 options afin de pouvoir évaluer la significativité des coefficients, où le nombre de répétitions K était de 3.
La matrice de planification de l'expérience ressemblait à ceci :
En pratique, le coefficient de corrélation de rang de Spearman (P) est souvent utilisé pour déterminer l'étroitesse de la relation entre deux caractéristiques. Les valeurs de chaque caractéristique sont classées par degré d'augmentation (de 1 à n), puis la différence (d) entre les rangs correspondant à une observation est déterminée.
Exemple n°1. La relation entre le volume de la production industrielle et l'investissement en capital fixe dans 10 régions de l'un des districts fédéraux de la Fédération de Russie en 2003 est caractérisée par les données suivantes.
Calculer Coefficients de corrélation des rangs de Spearman et Kendal. Vérifiez leur signification à α = 0,05. Formuler une conclusion sur la relation entre le volume de la production industrielle et l'investissement en capital fixe pour les régions considérées de la Fédération de Russie.
Attribuons des rangs à la fonctionnalité Y et au facteur X. Trouvons la somme de la différence des carrés d 2.
À l'aide d'une calculatrice, nous calculons le coefficient de corrélation de rang de Spearman :
X | Oui | rang X, d x | rang Y, jour y | (d x - d y) 2 |
1.3 | 300 | 1 | 2 | 1 |
1.8 | 1335 | 2 | 12 | 100 |
2.4 | 250 | 3 | 1 | 4 |
3.4 | 946 | 4 | 8 | 16 |
4.8 | 670 | 5 | 7 | 4 |
5.1 | 400 | 6 | 4 | 4 |
6.3 | 380 | 7 | 3 | 16 |
7.5 | 450 | 8 | 5 | 9 |
7.8 | 500 | 9 | 6 | 9 |
17.5 | 1582 | 10 | 16 | 36 |
18.3 | 1216 | 11 | 9 | 4 |
22.5 | 1435 | 12 | 14 | 4 |
24.9 | 1445 | 13 | 15 | 4 |
25.8 | 1820 | 14 | 19 | 25 |
28.5 | 1246 | 15 | 10 | 25 |
33.4 | 1435 | 16 | 14 | 4 |
42.4 | 1800 | 17 | 18 | 1 |
45 | 1360 | 18 | 13 | 25 |
50.4 | 1256 | 19 | 11 | 64 |
54.8 | 1700 | 20 | 17 | 9 |
364 |
Le lien entre le trait Y et le facteur X est fort et direct.
Estimation du coefficient de corrélation de rang de Spearman
En utilisant la table Student, nous trouvons Ttable.
Tableau T = (18;0,05) = 1,734
Puisque Tob > Ttabl, nous rejetons l’hypothèse selon laquelle le coefficient de corrélation de rang est égal à zéro. En d’autres termes, le coefficient de corrélation des rangs de Spearman est statistiquement significatif.
Estimation d'intervalle pour le coefficient de corrélation de rang (intervalle de confiance)
Intervalle de confiance
pour le coefficient de corrélation de rang de Spearman : p (0,5431 ; 0,9095).
Exemple n°2. Données initiales.
5 | 4 |
3 | 4 |
1 | 3 |
3 | 1 |
6 | 6 |
2 | 2 |
Nouveaux classements | ||
1 | 1 | 1 |
2 | 2 | 2 |
3 | 3 | 3.5 |
4 | 3 | 3.5 |
5 | 5 | 5 |
6 | 6 | 6 |
Numéros de siège dans la rangée ordonnée | Disposition des facteurs selon l'évaluation de l'expert | Nouveaux classements |
1 | 1 | 1 |
2 | 2 | 2 |
3 | 3 | 3 |
4 | 4 | 4.5 |
5 | 4 | 4.5 |
6 | 6 | 6 |
rang X, dx | rang Y, jour y | (d x - d y) 2 |
5 | 4.5 | 0.25 |
3.5 | 4.5 | 1 |
1 | 3 | 4 |
3.5 | 1 | 6.25 |
6 | 6 | 0 |
2 | 2 | 0 |
21 | 21 | 11.5 |
Où
j - nombre de connecteurs dans l'ordre pour la caractéristique x ;
Et j est le nombre de rangs identiques dans j-ème ligament par x ;
k - nombres de connecteurs dans l'ordre pour la caractéristique y ;
En k - le nombre de rangs identiques dans k-ème connecteur selon
UNE = [(2 3 -2)]/12 = 0,5
B = [(2 3 -2)]/12 = 0,5
D = A + B = 0,5 + 0,5 = 1
La relation entre le trait Y et le facteur X est modérée et directe.
Le coefficient de corrélation de rang de Spearman est une méthode non paramétrique utilisée pour étudier statistiquement la relation entre les phénomènes. Dans ce cas, le degré réel de parallélisme entre les deux séries quantitatives des caractéristiques étudiées est déterminé et une évaluation de l'étroitesse du lien établi est donnée à l'aide d'un coefficient exprimé quantitativement.
1. Historique de l'évolution du coefficient de corrélation de rang
Ce critère a été développé et proposé pour réaliser analyse de corrélation en 1904 Charles Édouard Spearman, psychologue anglais, professeur aux universités de Londres et de Chesterfield.
2. A quoi sert le coefficient de Spearman ?
Le coefficient de corrélation de rang de Spearman est utilisé pour identifier et évaluer l'étroitesse de la relation entre deux séries de données comparées. indicateurs quantitatifs. Dans le cas où les rangs des indicateurs, classés par degré d'augmentation ou de diminution, coïncident dans la plupart des cas (une valeur plus élevée d'un indicateur correspond à une valeur plus élevée d'un autre indicateur - par exemple, en comparant la taille et le poids corporel du patient), on conclut qu'il existe direct connexion de corrélation. Si les rangs des indicateurs ont le sens opposé (une valeur plus élevée d'un indicateur correspond à une valeur inférieure d'un autre - par exemple, en comparant l'âge et la fréquence cardiaque), puis ils parlent de inverse liens entre les indicateurs.
- Le coefficient de corrélation de Spearman a les propriétés suivantes:
- Le coefficient de corrélation peut prendre des valeurs de moins un à un, et avec rs=1 il existe une relation strictement directe, et avec rs= -1 il existe une relation strictement de rétroaction.
- Si le coefficient de corrélation est négatif, il existe une relation de rétroaction ; s’il est positif, il existe une relation directe.
- Si le coefficient de corrélation est nul, alors il n'y a pratiquement aucun lien entre les quantités.
- Plus le module du coefficient de corrélation est proche de l'unité, plus la relation entre les grandeurs mesurées est forte.
3. Dans quels cas le coefficient de Spearman peut-il être utilisé ?
Du fait que le coefficient est une méthode analyse non paramétrique, aucun test de distribution normale n'est requis.
Des indicateurs comparables peuvent être mesurés à la fois dans échelle continue(par exemple, le nombre de globules rouges dans 1 µl de sang), et dans ordinal(par exemple, points d'expertise de 1 à 5).
L'efficacité et la qualité de l'évaluation de Spearman diminuent si la différence entre les différentes valeurs de l'une des quantités mesurées est suffisamment grande. Il n'est pas recommandé d'utiliser le coefficient de Spearman s'il existe une répartition inégale des valeurs de la grandeur mesurée.
4. Comment calculer le coefficient de Spearman ?
Le calcul du coefficient de corrélation de rang de Spearman comprend les étapes suivantes :
5. Comment interpréter la valeur du coefficient de Spearman ?
Lors de l'utilisation du coefficient de corrélation de rang, l'étroitesse du lien entre les caractéristiques est évaluée de manière conditionnelle, en considérant les valeurs du coefficient égales à 0,3 ou moins comme indicateurs de lien faible ; les valeurs supérieures à 0,4, mais inférieures à 0,7 sont des indicateurs d'une proximité modérée de la connexion, et les valeurs de 0,7 ou plus sont des indicateurs d'une forte proximité de la connexion.
La signification statistique du coefficient obtenu est évaluée à l'aide du test t de Student. Si la valeur calculée du test t est inférieure à la valeur du tableau pour un nombre donné de degrés de liberté, signification statistique Il n’y a aucune relation observée. Si elle est supérieure, la corrélation est considérée comme statistiquement significative.
Le calculateur ci-dessous calcule le coefficient de corrélation de rang de Spearman entre deux variables aléatoires. La partie théorique, afin de ne pas se laisser distraire de la calculatrice, se situe traditionnellement en dessous de celle-ci.
ajouter import_export mode_edit supprimer
Changements dans les variables aléatoires
arrow_upwardarrow_downward X | arrow_upwardarrow_downward Oui | ||
---|---|---|---|
mode_edit |
Changements dans les variables aléatoires
Importer des données Erreur d'importation
Vous pouvez utiliser l'un de ces symboles pour séparer les champs : Tabulation, ";" ou "," Exemple : -50,5 ; -50,5
Importer Retour Annuler
La méthode de calcul du coefficient de corrélation de rang de Spearman est en fait décrite très simplement. Il s'agit du même coefficient de corrélation de Pearson, calculé uniquement et non pour les résultats de mesure eux-mêmes. variables aléatoires, et pour eux valeurs de classement.
C'est,
Il ne reste plus qu'à comprendre quelles sont les valeurs de classement et pourquoi tout cela est nécessaire.
Si les éléments d’une série de variations sont classés par ordre croissant ou décroissant, alors rang l'élément sera son numéro dans cette série ordonnée.
Par exemple, ayons une série de variations (17,26,5,14,21). Trions ses éléments par ordre décroissant (26,21,17,14,5). 26 a le rang 1, 21 a le rang 2, etc. La série de variations des valeurs de classement ressemblera à ceci (3,1,5,4,2).
Autrement dit, lors du calcul du coefficient de Spearman, les séries de variations originales sont transformées en séries de variations de valeurs de rang, après quoi la formule de Pearson leur est appliquée.
Il y a une subtilité - le rang des valeurs répétées est considéré comme la moyenne des rangs. C'est-à-dire que pour la ligne (17, 15, 14, 15), la ligne de valeurs de rang ressemblera à (1, 2,5, 4, 2,5), puisque le premier élément égal à 15 a le rang 2, et le second a le rang 3, et .
S'il n'y a pas de valeurs répétitives, c'est-à-dire que toutes les valeurs de la série de rangs sont des nombres compris entre 1 et n, la formule de Pearson peut être simplifiée en
Eh bien, d'ailleurs, cette formule est le plus souvent donnée comme formule de calcul du coefficient de Spearman.
Quelle est l'essence du passage des valeurs elles-mêmes à leurs valeurs de rang ?
Le fait est qu'en étudiant la corrélation des valeurs de rang, vous pouvez déterminer dans quelle mesure la dépendance de deux variables est décrite par une fonction monotone.
Le signe du coefficient indique le sens de la relation entre les variables. Si le signe est positif, alors les valeurs Y ont tendance à augmenter à mesure que les valeurs X augmentent ; si le signe est négatif, alors les valeurs Y ont tendance à diminuer à mesure que les valeurs X augmentent. Si le coefficient est 0, alors il n'y a pas de tendance. Si le coefficient est 1 ou -1, alors la relation entre X et Y a la forme d'une fonction monotone - c'est-à-dire que lorsque X augmente, Y augmente également, ou vice versa, à mesure que X augmente, Y diminue.
Autrement dit, contrairement au coefficient de corrélation de Pearson, qui ne peut révéler qu'une dépendance linéaire d'une variable par rapport à une autre, le coefficient de corrélation de Spearman peut révéler une dépendance monotone dans laquelle aucune relation linéaire directe n'est détectée.
Laissez-moi vous expliquer avec un exemple. Supposons que nous examinions la fonction y=10/x.
Nous avons les mesures X et Y suivantes
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Pour ces données, le coefficient de corrélation de Pearson est de -0,4686, c'est-à-dire que la relation est faible ou absente. Mais le coefficient de corrélation de Spearman est strictement égal à -1, ce qui semble laisser entendre au chercheur que Y a une dépendance monotone strictement négative à l'égard de X.
Le coefficient de corrélation de rang, proposé par K. Spearman, fait référence à une mesure non paramétrique de la relation entre des variables mesurées sur une échelle de rang. Lors du calcul de ce coefficient, aucune hypothèse n'est requise sur la nature des distributions des caractéristiques au sein de la population. Ce coefficient détermine le degré d'étroitesse de connexion entre les caractéristiques ordinales, qui représentent dans ce cas les rangs des quantités comparées.
Le coefficient de corrélation de Spearman se situe également entre +1 et -1. Comme le coefficient de Pearson, il peut être positif et négatif, caractérisant le sens de la relation entre deux caractéristiques mesurées sur une échelle de rang.
En principe, le nombre de caractéristiques classées (qualités, traits, etc.) peut être quelconque, mais le processus de classement de plus de 20 caractéristiques est difficile. Il est possible que ce soit la raison pour laquelle le tableau des valeurs critiques du coefficient de corrélation de rang n'a été calculé que pour quarante entités classées (n< 40, табл. 20 приложения 6).
Le coefficient de corrélation de rang de Spearman est calculé à l'aide de la formule :
où n est le nombre de caractéristiques classées (indicateurs, sujets) ;
D est la différence entre les classements de deux variables pour chaque sujet ;
Somme des différences de rang au carré.
En utilisant le coefficient de corrélation de rang, considérons l'exemple suivant.
Exemple: Un psychologue découvre comment les indicateurs individuels de préparation à l'école, obtenus avant la rentrée scolaire auprès de 11 élèves de première année, sont liés entre eux et à leurs performances moyennes à la fin de l'année scolaire.
Pour résoudre ce problème, nous avons classé, d'une part, les valeurs des indicateurs de maturité scolaire obtenues à l'admission à l'école, et, d'autre part, les indicateurs finaux de performance scolaire en fin d'année pour ces mêmes élèves en moyenne. Nous présentons les résultats dans le tableau. 13.
Tableau 13
Numéro d'étudiant. | |||||||||||
Classements des indicateurs préparation à l'école | |||||||||||
Classements de performance annuels moyens | |||||||||||
Nous substituons les données obtenues dans la formule et effectuons le calcul. On obtient :
Pour trouver le niveau de signification, reportez-vous au tableau. 20 de l'annexe 6, qui montre les valeurs critiques pour les coefficients de corrélation de rang.
Nous le soulignons dans le tableau. 20 Annexe 6, comme dans le tableau pour corrélation linéaire Pearson, toutes les valeurs des coefficients de corrélation sont données selon valeur absolue. Le signe du coefficient de corrélation n’est donc pris en compte que lors de son interprétation.
La recherche des niveaux de signification dans ce tableau s'effectue par le nombre n, c'est-à-dire par le nombre de sujets. Dans notre cas n = 11. Pour ce nombre on trouve :
0,61 pour P 0,05
0,76 pour P 0,01
Nous construisons l'« axe de signification » correspondant :
Le coefficient de corrélation résultant coïncidait avec la valeur critique pour le niveau de signification de 1 %. Par conséquent, on peut affirmer que les indicateurs de maturité scolaire et notes finales les élèves de première année sont liés par une corrélation positive - en d'autres termes, plus l'indicateur de préparation à l'école est élevé, meilleures sont les études de première année. En termes d'hypothèses statistiques, le psychologue doit rejeter l'hypothèse nulle de similarité et accepter l'hypothèse alternative de différences, qui suggère que la relation entre les indicateurs de maturité scolaire et le rendement scolaire moyen est différente de zéro.
Le cas de rangs identiques (égaux)
S'il existe des rangs identiques, la formule de calcul du coefficient de corrélation linéaire de Spearman sera légèrement différente. Dans ce cas, deux nouveaux termes sont ajoutés à la formule de calcul des coefficients de corrélation, en tenant compte des mêmes rangs. Elles sont appelées corrections de rang égal et s'ajoutent au numérateur de la formule de calcul.
où n est le nombre de rangs identiques dans la première colonne,
k est le nombre de rangs identiques dans la deuxième colonne.
S'il y a deux groupes de rangs identiques dans une colonne, la formule de correction devient un peu plus compliquée :
où n est le nombre de rangs identiques dans le premier groupe de la colonne classée,
k est le nombre de rangs identiques dans le deuxième groupe de la colonne classée. La modification de la formule dans le cas général est la suivante :
Exemple: Un psychologue, à l'aide d'un test de développement mental (MDT), mène une étude de l'intelligence chez 12 élèves de 9e. Parallèlement, il demande aux professeurs de lettres et de mathématiques de classer ces mêmes élèves selon des indicateurs développement mental. La tâche consiste à déterminer comment les indicateurs objectifs du développement mental (données SHTUR) et les évaluations d'experts des enseignants sont liés les uns aux autres.
Nous présentons les données expérimentales de ce problème et les colonnes supplémentaires nécessaires au calcul du coefficient de corrélation de Spearman sous forme de tableau. 14.
Tableau 14
Numéro d'étudiant. |
Rangs de tests utilisant SHTURA |
Expertises d’enseignants de mathématiques |
Expertises d'enseignants en littérature |
D (deuxième et troisième colonnes) |
D (deuxième et quatrième colonnes) |
(deuxième et troisième colonnes) |
(deuxième et quatrième colonnes) |
Puisque les mêmes rangs ont été utilisés dans le classement, il est nécessaire de vérifier l’exactitude du classement dans les deuxième, troisième et quatrième colonnes du tableau. La somme de chacune de ces colonnes donne le même total – 78.
Nous vérifions à l'aide de la formule de calcul. Le chèque donne :
Les cinquième et sixième colonnes du tableau présentent les valeurs de la différence de classement entre les expertises du psychologue au test SHTUR pour chaque élève et les valeurs des expertises des enseignants, respectivement, en mathématiques et en littérature. La somme des valeurs de différence de rang doit être égale à zéro. La somme des valeurs D dans les cinquième et sixième colonnes a donné le résultat souhaité. La soustraction des rangs a donc été effectuée correctement. Une vérification similaire doit être effectuée à chaque fois lors de la réalisation de types de classement complexes.
Avant de commencer le calcul à l'aide de la formule, il est nécessaire de calculer des corrections pour les mêmes rangs pour les deuxième, troisième et quatrième colonnes du tableau.
Dans notre cas, dans la deuxième colonne du tableau il y a deux rangs identiques, donc, selon la formule, la valeur de la correction D1 sera :
La troisième colonne comporte trois rangs identiques, donc selon la formule, la valeur de la correction D2 sera :
Dans la quatrième colonne du tableau il y a deux groupes de trois rangs identiques, donc, selon la formule, la valeur de la correction D3 sera :
Avant de passer à la solution du problème, rappelons que le psychologue clarifie deux questions : comment les valeurs des rangs au test SHtUR sont-elles liées à expertises en mathématiques et en littérature. C'est pourquoi le calcul est effectué deux fois.
Nous calculons le premier coefficient de classement en tenant compte des additifs selon la formule. On obtient :
Calculons sans prendre en compte l'additif :
Comme on peut le constater, la différence dans les valeurs des coefficients de corrélation s'est avérée très insignifiante.
Nous calculons le coefficient de deuxième classement en tenant compte des additifs selon la formule. On obtient :
Calculons sans prendre en compte l'additif :
Encore une fois, les différences étaient très mineures. Puisque le nombre d'étudiants dans les deux cas est le même, selon le tableau. 20 de l'annexe 6 on retrouve les valeurs critiques à n = 12 pour les deux coefficients de corrélation à la fois.
0,58 pour P 0,05
0,73 pour P 0,01
Nous traçons la première valeur sur « l'axe de signification » :
Dans le premier cas, le coefficient de corrélation de rang obtenu se situe dans la zone de signification. Par conséquent, le psychologue doit rejeter l’hypothèse nulle selon laquelle le coefficient de corrélation est similaire à zéro et accepter l’hypothèse alternative selon laquelle le coefficient de corrélation est significativement différent de zéro. En d’autres termes, le résultat obtenu suggère que plus les évaluations d’experts des étudiants au test SHTUR sont élevées, plus leurs évaluations d’experts en mathématiques sont élevées.
Nous traçons la deuxième valeur sur « l'axe de signification » :
Dans le second cas, le coefficient de corrélation de rang se situe dans la zone d’incertitude. Par conséquent, un psychologue peut accepter l’hypothèse nulle selon laquelle le coefficient de corrélation est similaire à zéro et rejeter l’hypothèse alternative selon laquelle le coefficient de corrélation est significativement différent de zéro. Dans ce cas, le résultat obtenu suggère que les expertises des étudiants au test SHTUR ne sont pas liées aux expertises en littérature.
Pour appliquer le coefficient de corrélation de Spearman, les conditions suivantes doivent être remplies :
1. Les variables comparées doivent être obtenues sur une échelle ordinale (de rang), mais peuvent également être mesurées sur une échelle d'intervalle et de rapport.
2. La nature de la distribution des quantités corrélées n'a pas d'importance.
3. Le nombre de caractéristiques variables dans les variables comparées X et Y doit être le même.
Les tableaux de détermination des valeurs critiques du coefficient de corrélation de Spearman (tableau 20, annexe 6) sont calculés à partir du nombre de caractéristiques égal à n = 5 à n = 40, et avec un plus grand nombre de variables comparées, le tableau du Le coefficient de corrélation de Pearson doit être utilisé (tableau 19, annexe 6). La recherche des valeurs critiques s'effectue à k = n.