Conception de la chambre / 15.10.2019

Comment calculer la variance dans les statistiques. Comment calculer la variance dans Excel à l'aide de la fonction disp.v

La variance d'une variable aléatoire est une mesure de la dispersion des valeurs de cette variable. Une faible variance signifie que les valeurs sont regroupées à proximité. Une grande dispersion indique une forte dispersion des valeurs. La notion de variance d'une variable aléatoire est utilisée en statistique. Par exemple, si vous comparez la variance de deux valeurs (par exemple entre des patients de sexe masculin et féminin), vous pouvez tester la signification d'une variable. La variance est également utilisée lors de la création de modèles statistiques, car une faible variance peut être le signe que vous surajustez les valeurs.

Mesures

Calcul de la variance de l'échantillon

Enregistrez les exemples de valeurs. Dans la plupart des cas, les statisticiens n’ont accès qu’à des échantillons de populations spécifiques. Par exemple, en règle générale, les statisticiens n'analysent pas le coût d'entretien de la totalité de toutes les voitures en Russie - ils analysent un échantillon aléatoire de plusieurs milliers de voitures. Un tel échantillon aidera à déterminer le coût moyen d'une voiture, mais, très probablement, la valeur résultante sera loin d'être la valeur réelle.
- Par exemple, analysons le nombre de petits pains vendus dans un café sur 6 jours, pris en ordre aléatoire. L'échantillon ressemble à ceci : 17, 15, 23, 7, 9, 13. Il s'agit d'un échantillon, pas d'une population, car nous ne disposons pas de données sur les petits pains vendus pour chaque jour d'ouverture du café.
- Si vous recevez une population plutôt qu’un échantillon de valeurs, passez à la section suivante.
Écrivez une formule pour calculer la variance de l’échantillon. La dispersion est une mesure de la propagation des valeurs d'une certaine quantité. Comment valeur plus proche dispersion à zéro, plus les valeurs sont regroupées les unes aux autres. Lorsque vous travaillez avec un échantillon de valeurs, utilisez la formule suivante pour calculer la variance :
- s 2 (\displaystyle s^(2)) = ∑[(x je (\ displaystyle x_ (i))-x̅) 2 (\style d'affichage ^(2))] / (n-1)
- s 2 (\displaystyle s^(2))– c’est la dispersion. La dispersion est mesurée en unités carrées mesures.
- x je (\ displaystyle x_ (i))– chaque valeur de l'échantillon.
- x je (\ displaystyle x_ (i)) vous devez soustraire x̅, le mettre au carré, puis ajouter les résultats.
- x̅ – moyenne de l’échantillon (moyenne de l’échantillon).
- n – nombre de valeurs dans l'échantillon.
Calculez la moyenne de l’échantillon. Il est noté x̅. La moyenne de l'échantillon est calculée comme une simple moyenne arithmétique : additionnez toutes les valeurs de l'échantillon, puis divisez le résultat par le nombre de valeurs de l'échantillon.
- Dans notre exemple, additionnez les valeurs de l'échantillon : 15 + 17 + 23 + 7 + 9 + 13 = 84
  Divisez maintenant le résultat par le nombre de valeurs dans l'échantillon (dans notre exemple il y en a 6) : 84 ÷ 6 = 14.
  Moyenne de l'échantillon x̅ = 14.
- La moyenne de l'échantillon est la valeur centrale autour de laquelle les valeurs de l'échantillon sont distribuées. Si les valeurs de l'échantillon se regroupent autour de la moyenne de l'échantillon, alors la variance est faible ; sinon, la variance est grande.
Soustrayez la moyenne de l’échantillon de chaque valeur de l’échantillon. Calculons maintenant la différence x je (\ displaystyle x_ (i))- x̅, où x je (\ displaystyle x_ (i))– chaque valeur de l'échantillon. Chaque résultat obtenu indique le degré d'écart d'une valeur particulière par rapport à la moyenne de l'échantillon, c'est-à-dire la distance entre cette valeur et la moyenne de l'échantillon.
- Dans notre exemple :
  x 1 (\style d'affichage x_(1))- x = 17 - 14 = 3
  x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
  x 3 (\style d'affichage x_(3))- x = 23 - 14 = 9
  x 4 (\style d'affichage x_(4))- x̅ = 7 - 14 = -7
  x 5 (\style d'affichage x_(5))- x̅ = 9 - 14 = -5
  x 6 (\style d'affichage x_(6))- x̅ = 13 - 14 = -1
- L'exactitude des résultats obtenus est facile à vérifier, puisque leur somme doit être égale à zéro. Ceci est lié à la détermination de la valeur moyenne, puisque valeurs négatives(les distances de la valeur moyenne aux valeurs plus petites) sont entièrement compensées valeurs positives(distances des valeurs moyennes aux valeurs élevées).
Comme indiqué ci-dessus, la somme des différences x je (\ displaystyle x_ (i))- x̅ doit être égal à zéro. Cela signifie que écart moyen est toujours égal à zéro, ce qui ne donne aucune idée de la répartition des valeurs d'une certaine quantité. Pour résoudre ce problème, mettez au carré chaque différence x je (\ displaystyle x_ (i))- x̅. Vous obtiendrez ainsi uniquement des nombres positifs, dont la somme ne sera jamais égale à 0.
- Dans notre exemple :
  (x 1 (\style d'affichage x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
  (x 2 (\displaystyle (x_(2))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
  9 2 = 81
  (-7) 2 = 49
  (-5) 2 = 25
  (-1) 2 = 1
- Vous avez trouvé le carré de la différence - x̅) 2 (\style d'affichage ^(2)) pour chaque valeur de l'échantillon.
Calculez la somme des carrés des différences. Autrement dit, trouvez la partie de la formule qui s'écrit comme ceci : ∑[( x je (\ displaystyle x_ (i))-x̅) 2 (\style d'affichage ^(2))]. Ici, le signe Σ signifie la somme des carrés des différences pour chaque valeur x je (\ displaystyle x_ (i)) dans l'échantillon. Vous avez déjà trouvé les carrés des différences (x je (\displaystyle (x_(i))-x̅) 2 (\style d'affichage ^(2)) pour chaque valeur x je (\ displaystyle x_ (i)) dans l'échantillon ; maintenant, ajoutez simplement ces carrés.
- Dans notre exemple : 9 + 1 + 81 + 49 + 25 + 1 = 166 .
Divisez le résultat par n - 1, où n est le nombre de valeurs dans l'échantillon. Il y a quelque temps, pour calculer la variance d’un échantillon, les statisticiens divisaient simplement le résultat par n ; dans ce cas, vous obtiendrez la moyenne de la variance au carré, ce qui est idéal pour décrire la variance d'un échantillon donné. Mais rappelez-vous que tout échantillon n'est qu'une petite partie population valeurs. Si vous prenez un autre échantillon et effectuez les mêmes calculs, vous obtiendrez un résultat différent. Il s'avère que diviser par n - 1 (plutôt que par n) donne une estimation plus précise de la variance de la population, ce qui vous intéresse. La division par n – 1 est devenue courante, elle est donc incluse dans la formule de calcul de la variance de l’échantillon.
- Dans notre exemple, l'échantillon comprend 6 valeurs, soit n = 6.
  Variance de l'échantillon = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
La différence entre la variance et l'écart type. Notez que la formule contient un exposant, la dispersion est donc mesurée en unités carrées de la valeur analysée. Parfois, une telle ampleur est assez difficile à exploiter ; dans de tels cas, utilisez l’écart type, qui est égal à la racine carrée de la variance. C'est pourquoi la variance de l'échantillon est notée s 2 (\displaystyle s^(2)), UN écart typeéchantillons - comment s (style d'affichage s).
- Dans notre exemple, l'écart type de l'échantillon est : s = √33,2 = 5,76.
Calcul de la variance de la population
1. Analysez un ensemble de valeurs. L'ensemble comprend toutes les valeurs de la quantité considérée. Par exemple, si vous étudiez l'âge des résidents Région de Léningrad, alors la population comprend l'âge de tous les résidents de cette zone. Lorsque vous travaillez avec une population, il est recommandé de créer un tableau et d'y saisir les valeurs de la population. Prenons l'exemple suivant :
  - Dans une certaine pièce, il y a 6 aquariums. Chaque aquarium contient le nombre de poissons suivant :
    x 1 = 5 (\displaystyle x_(1)=5)
    x 2 = 5 (\displaystyle x_(2)=5)
    x 3 = 8 (\displaystyle x_(3)=8)
    x 4 = 12 (\displaystyle x_(4)=12)
    x 5 = 15 (\displaystyle x_(5)=15)
    x 6 = 18 (\displaystyle x_(6)=18)
2. Écrivez une formule pour calculer la variance de la population. Puisque la totalité comprend toutes les valeurs d'une certaine quantité, la formule ci-dessous permet d'obtenir valeur exacte les écarts de population. Pour distinguer la variance de la population de la variance de l'échantillon (qui n'est qu'une estimation), les statisticiens utilisent diverses variables :
  - σ 2 (\style d'affichage ^(2)) = (∑(x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2)))/n
  - σ 2 (\style d'affichage ^(2))– la dispersion de la population (lire « sigma au carré »). La dispersion est mesurée en unités carrées.
  - x je (\ displaystyle x_ (i))– chaque valeur dans son intégralité.
  - Σ – signe somme. Autrement dit, à partir de chaque valeur x je (\ displaystyle x_ (i)) vous devez soustraire μ, le mettre au carré, puis ajouter les résultats.
  - μ – moyenne de la population.
  - n – nombre de valeurs dans la population.
3. Calculez la moyenne de la population. Lorsque l’on travaille avec une population, sa moyenne est notée μ (mu). La moyenne de la population est calculée comme une moyenne arithmétique simple : additionnez toutes les valeurs de la population, puis divisez le résultat par le nombre de valeurs de la population.
  - Gardez à l’esprit que les moyennes ne sont pas toujours calculées comme moyenne arithmétique.
  - Dans notre exemple, la moyenne de la population : μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
4. Soustrayez la moyenne de la population de chaque valeur de la population. Plus la valeur de différence est proche de zéro, plus la valeur spécifique est proche de la moyenne de la population. Trouvez la différence entre chaque valeur de la population et sa moyenne, et vous aurez une première idée de la distribution des valeurs.
  - Dans notre exemple :
    x 1 (\style d'affichage x_(1))- µ = 5 - 10,5 = -5,5
    x 2 (\displaystyle x_(2))- µ = 5 - 10,5 = -5,5
    x 3 (\style d'affichage x_(3))- µ = 8 - 10,5 = -2,5
    x 4 (\style d'affichage x_(4))- µ = 12 - 10,5 = 1,5
    x 5 (\style d'affichage x_(5))- µ = 15 - 10,5 = 4,5
    x 6 (\style d'affichage x_(6))- µ = 18 - 10,5 = 7,5
5. Mettez au carré chaque résultat obtenu. Les valeurs de différence seront à la fois positives et négatives ; Si ces valeurs sont tracées sur une droite numérique, elles se situeront à droite et à gauche de la moyenne de la population. Ce n'est pas bon pour calculer la variance car les nombres positifs et négatifs s'annulent. Mettez donc au carré chaque différence pour obtenir des nombres exclusivement positifs.
  - Dans notre exemple :
    (x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2)) pour chaque valeur de population (de i = 1 à i = 6) :
    (-5,5)2 (\style d'affichage ^(2)) = 30,25
    (-5,5)2 (\style d'affichage ^(2)), Où x n (\style d'affichage x_(n)) – dernière valeur dans la population générale.
  - Pour calculer la valeur moyenne des résultats obtenus, il faut trouver leur somme et la diviser par n :(( x 1 (\style d'affichage x_(1)) - μ) 2 (\style d'affichage ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\style d'affichage ^(2)) + ... + (x n (\style d'affichage x_(n)) - μ) 2 (\style d'affichage ^(2)))/n
  - Écrivons maintenant l'explication ci-dessus en utilisant des variables : (∑( x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2))) / n et obtenez une formule pour calculer la variance de la population.

Dispersionvariable aléatoire- mesure de la propagation d'un variable aléatoire, c'est-à-dire elle écarts depuis espérance mathématique. En statistique, la notation (sigma au carré) est souvent utilisée pour désigner la dispersion. La racine carrée de la variance égale à s'appelle écart type ou tartinade standard. L'écart type est mesuré dans les mêmes unités que la variable aléatoire elle-même, et la variance est mesurée dans les carrés de cette unité.

Bien qu’il soit très pratique d’utiliser une seule valeur (telle que la moyenne ou le mode et la médiane) pour estimer l’ensemble de l’échantillon, cette approche peut facilement conduire à des conclusions erronées. La raison de cette situation ne réside pas dans la valeur elle-même, mais dans le fait qu'une valeur ne reflète en aucun cas la répartition des valeurs des données.

Par exemple, dans l'exemple :

la valeur moyenne est de 5.

Cependant, dans l'échantillon lui-même, il n'y a pas un seul élément avec une valeur de 5. Vous devrez peut-être connaître le degré de proximité de chaque élément de l'échantillon par rapport à sa valeur moyenne. Ou en d’autres termes, vous aurez besoin de connaître la variance des valeurs. Connaissant le degré de changement des données, vous pouvez mieux interpréter valeur moyenne, médian Et mode. Le degré de modification des valeurs des échantillons est déterminé en calculant leur variance et leur écart type.

Écart et racine carrée de la variance, appelé écart type, caractérise l'écart moyen par rapport à la moyenne de l'échantillon. Parmi ces deux grandeurs, la plus importante est écart type. Cette valeur peut être considérée comme la distance moyenne entre les éléments et l’élément central de l’échantillon.

La variance est difficile à interpréter de manière significative. Cependant, la racine carrée de cette valeur est l’écart type et peut être facilement interprétée.

L'écart type est calculé en déterminant d'abord la variance, puis en prenant la racine carrée de la variance.

Par exemple, pour le tableau de données présenté sur la figure, les valeurs suivantes seront obtenues :

Figure 1

Ici, la valeur moyenne des carrés des différences est de 717,43. Pour obtenir l’écart type, il ne reste plus qu’à prendre la racine carrée de ce nombre.

Le résultat sera d'environ 26,78.

N'oubliez pas que l'écart type est interprété comme la distance moyenne entre les éléments et la moyenne de l'échantillon.

L'écart type mesure dans quelle mesure la moyenne décrit l'ensemble de l'échantillon.

Disons que vous êtes à la tête d'un département de production d'assemblages de PC. Le rapport trimestriel indique que la production du dernier trimestre était de 2 500 PC. Est-ce bon ou mauvais ? Vous avez demandé (ou il y a déjà cette colonne dans le rapport) d'afficher l'écart type de ces données dans le rapport. Le chiffre de l'écart type, par exemple, est de 2000. Il devient clair pour vous, en tant que chef du département, que ligne de production nécessite meilleure gestion(écarts trop importants dans le nombre de PC assemblés).

Rappelons que lorsque l'écart type est grand, les données sont largement dispersées autour de la moyenne, et lorsque l'écart type est petit, elles se regroupent près de la moyenne.

Les quatre fonctions statistiques VAR(), VAR(), STDEV() et STDEV() sont conçues pour calculer la variance et l'écart type des nombres dans une plage de cellules. Avant de pouvoir calculer la variance et l'écart type d'un ensemble de données, vous devez déterminer si les données représentent une population ou un échantillon de population. Dans le cas d'un échantillon issu d'une population générale, vous devez utiliser les fonctions VAR() et STDEV(), et dans le cas d'une population générale, les fonctions VAR() et STDEV() :

Population	Fonction
	DISPR()
	STANDOTLONP()
Échantillon
	DISP()
	STDEV()

La dispersion (ainsi que l'écart type), comme nous l'avons noté, indique dans quelle mesure les valeurs incluses dans l'ensemble de données sont dispersées autour de la moyenne arithmétique.

Une petite valeur de variance ou d'écart type indique que toutes les données sont concentrées autour de la moyenne arithmétique, et grande valeur ces valeurs - dans lesquelles les données sont dispersées large gamme valeurs.

La dispersion est assez difficile à interpréter de manière significative (que signifie une petite valeur, une grande valeur ?). Exécution Tâches 3 vous permettra de montrer visuellement, sur un graphique, la signification de la variance pour un ensemble de données.

Quêtes

· Tâche 1.

· 2.1. Donner les notions : dispersion et écart type ; leur désignation symbolique lorsque traitement statistique données.

· 2.2. Remplissez la feuille de travail conformément à la figure 1 et effectuez les calculs nécessaires.

· 2.3. Donner les formules de base utilisées dans les calculs

· 2.4. Expliquez toutes les désignations ( , , )

· 2.5. Expliquer signification pratique notions de dispersion et d’écart type.

Tâche 2.

1.1. Donner les concepts : population générale et échantillon ; espérance mathématique et leur moyenne arithmétique désignation symbolique pour le traitement des données statistiques.

1.2. Conformément à la figure 2, préparez une feuille de travail et effectuez les calculs.

1.3. Fournissez les formules de base utilisées dans les calculs (pour la population générale et l’échantillon).

Figure 2

1.4. Expliquez pourquoi il est possible d'obtenir des moyennes arithmétiques dans des échantillons telles que 46,43 et 48,78 (voir dossier Annexe). Tirez des conclusions.

Tâche 3.

Il y a deux échantillons avec ensemble différent données, mais leur moyenne sera la même :

Figure 3

3.1. Remplissez la feuille de travail conformément à la figure 3 et effectuez les calculs nécessaires.

3.2. Donnez les formules de calcul de base.

3.3. Construire des graphiques conformément aux figures 4, 5.

3.4. Expliquez les dépendances obtenues.

3.5. Effectuez des calculs similaires pour les données de deux échantillons.

Échantillon d'origine 11119999

Sélectionnez les valeurs du deuxième échantillon pour que la moyenne arithmétique du deuxième échantillon soit la même, par exemple :

Sélectionnez vous-même les valeurs du deuxième échantillon. Organisez les calculs et les graphiques similaires aux figures 3, 4 et 5. Montrez les formules de base qui ont été utilisées dans les calculs.

Tirez les conclusions appropriées.

Préparez toutes les tâches sous la forme d'un rapport avec toutes les images, graphiques, formules et brèves explications nécessaires.

Remarque : la construction des graphiques doit être expliquée avec des dessins et de brèves explications.

Les principaux indicateurs généralisants de variation des statistiques sont les dispersions et les écarts types.

Dispersion ceci moyenne arithmétique écarts carrés de chaque valeur caractéristique par rapport à la moyenne globale. La variance est généralement appelée carré moyen des écarts et est notée  2. Selon les données sources, la variance peut être calculée à l'aide de la moyenne arithmétique simple ou pondérée :

 variance non pondérée (simple) ;

 variance pondérée.

Écart type c'est une caractéristique généralisatrice des tailles absolues variantes signes dans l’ensemble. Il est exprimé dans les mêmes unités de mesure que l'attribut (en mètres, tonnes, pourcentage, hectares, etc.).

L'écart type est la racine carrée de la variance et est noté  :

 écart type non pondéré ;

 écart type pondéré.

L'écart type est une mesure de la fiabilité de la moyenne. Plus l’écart type est petit, plus la moyenne arithmétique reflète l’ensemble de la population représentée.

Le calcul de l'écart type est précédé du calcul de la variance.

La procédure de calcul de la variance pondérée est la suivante :

1) déterminer la moyenne arithmétique pondérée :

2) calculer les écarts des options par rapport à la moyenne :

3) mettre au carré l'écart de chaque option par rapport à la moyenne :

4) multiplier les carrés des écarts par des poids (fréquences) :

5) résumer les produits obtenus :

6) le montant obtenu est divisé par la somme des poids :

Exemple 2.1

Calculons la moyenne arithmétique pondérée :

Les valeurs des écarts par rapport à la moyenne et leurs carrés sont présentés dans le tableau. Définissons la variance :

L'écart type sera égal à :

Si les données sources sont présentées sous forme d'intervalle série de distribution , vous devez d'abord déterminer la valeur discrète de l'attribut, puis appliquer la méthode décrite.

Exemple 2.2

Montrons le calcul de la variance pour une série d'intervalles à l'aide de données sur la répartition de la superficie ensemencée d'une ferme collective en fonction du rendement du blé.

La moyenne arithmétique est :

Calculons la variance :

6.3. Calcul de la variance à l'aide d'une formule basée sur des données individuelles

Technique de calcul écarts complexe, et avec de grandes valeurs d'options et de fréquences, cela peut être fastidieux. Les calculs peuvent être simplifiés en utilisant les propriétés de dispersion.

La dispersion a les propriétés suivantes.

1. Réduire ou augmenter les poids (fréquences) d’une caractéristique variable d’un certain nombre de fois ne modifie pas la dispersion.

2. Diminuer ou augmenter chaque valeur d'une caractéristique du même montant constant UN ne change pas la dispersion.

3. Diminuer ou augmenter chaque valeur d'une caractéristique d'un certain nombre de fois k respectivement réduit ou augmente la variance de k 2 fois et écart type  dans k une fois.

4. La dispersion d'une caractéristique par rapport à une valeur arbitraire est toujours supérieure à la dispersion par rapport à la moyenne arithmétique par carré de la différence entre la moyenne et les valeurs arbitraires :

Si UN 0, alors on arrive à l’égalité suivante :

c'est-à-dire que la variance de la caractéristique est égale à la différence entre le carré moyen des valeurs caractéristiques et le carré de la moyenne.

Chaque propriété peut être utilisée indépendamment ou en combinaison avec d'autres lors du calcul de la variance.

La procédure de calcul de la variance est simple :

1) déterminer moyenne arithmétique :

2) mettre au carré la moyenne arithmétique :

3) au carré l'écart de chaque variante de la série :

X je 2 .

4) trouver la somme des carrés des options :

5) diviser la somme des carrés des options par leur nombre, c'est-à-dire déterminer le carré moyen :

6) déterminer la différence entre le carré moyen de la caractéristique et le carré de la moyenne :

Exemple 3.1 Les données suivantes sont disponibles sur la productivité des travailleurs :

Faisons les calculs suivants :

Parmi les nombreux indicateurs utilisés en statistique, il faut souligner le calcul de la variance. Il convient de noter que réaliser ce calcul manuellement est une tâche assez fastidieuse. Heureusement, Excel dispose de fonctions qui permettent d'automatiser la procédure de calcul. Découvrons l'algorithme pour travailler avec ces outils.

La dispersion est un indicateur de variation, qui est le carré moyen des écarts par rapport à l'espérance mathématique. Ainsi, il exprime la répartition des nombres autour de la valeur moyenne. Le calcul de la variance peut être effectué aussi bien pour la population générale que pour l'échantillon.

Méthode 1 : calcul basé sur la population

Pour le calcul cet indicateur dans Excel, la fonction est utilisée pour la population DISP.G. La syntaxe de cette expression est la suivante :

DISP.G(Numéro1;Numéro2;…)

Au total, de 1 à 255 arguments peuvent être utilisés. Les arguments peuvent être soit des valeurs numériques, soit des références aux cellules dans lesquelles ils sont contenus.

Voyons comment calculer cette valeur pour une plage contenant des données numériques.

Méthode 2 : calcul par échantillon

Contrairement au calcul d’une valeur basée sur une population, dans le calcul d’un échantillon, le dénominateur n’indique pas le nombre total de nombres, mais un de moins. Ceci est fait dans le but de corriger les erreurs. Excel prend en compte cette nuance dans une fonction spéciale destinée à ce type de calcul - DISP.V. Sa syntaxe est représentée par la formule suivante :

DISP.B(Numéro1;Numéro2;…)

Le nombre d'arguments, comme dans la fonction précédente, peut également aller de 1 à 255.

Comme vous pouvez le constater, le programme Excel peut grandement faciliter le calcul de la variance. Cette statistique peut être calculée par l'application, soit à partir de la population, soit à partir de l'échantillon. Dans ce cas, toutes les actions de l'utilisateur se résument en réalité à spécifier uniquement la plage de nombres à traiter, et le principal Travail sur Excel le fait lui-même. Bien entendu, cela permettra à l’utilisateur de gagner beaucoup de temps.

Si la population est divisée en groupes selon la caractéristique étudiée, alors les types de variance suivants peuvent être calculés pour cette population : total, groupe (intra-groupe), moyenne de groupe (moyenne intra-groupe), intergroupe.

Initialement, il calcule le coefficient de détermination, qui montre quelle partie de la variation totale du trait étudié est une variation intergroupe, c'est-à-dire en raison de la caractéristique de regroupement :

La relation de corrélation empirique caractérise l'étroitesse du lien entre le regroupement (factoriel) et les caractéristiques de performance.

Le rapport de corrélation empirique peut prendre des valeurs de 0 à 1.

Pour évaluer l'étroitesse de la connexion sur la base du rapport de corrélation empirique, vous pouvez utiliser les relations de Chaddock :

Exemple 4. Les données suivantes sont disponibles sur l'exécution des travaux des organismes de conception et d'enquête différentes formes propriété:

Définir:

1) variance totale ;

2) écarts de groupe ;

3) la moyenne des écarts de groupe ;

4) variance intergroupes ;

5) variance totale basée sur la règle d'addition des variances ;

6) coefficient de détermination et rapport de corrélation empirique.

Tirez des conclusions.

Solution:

1. Déterminons le volume moyen de travail effectué par les entreprises de deux formes de propriété :

Calculons la variance totale :

2. Déterminez les moyennes du groupe :

millions de roubles;

millions de roubles

Variations de groupe :

;

3. Calculez la moyenne des écarts de groupe :

4. Déterminons la variance intergroupe :

5. Calculez l'écart total en fonction de la règle d'addition des écarts :

6. Déterminons le coefficient de détermination :

Ainsi, le volume de travail effectué par les organismes de conception et d'enquête dépend à 22 % de la forme de propriété des entreprises.

Le rapport de corrélation empirique est calculé à l'aide de la formule

La valeur de l'indicateur calculé indique que la dépendance du volume de travail à la forme de propriété de l'entreprise est faible.

Exemple 5.À la suite d'une enquête sur la discipline technologique des zones de production, les données suivantes ont été obtenues :

Déterminer le coefficient de détermination

Article précédent

Université technique d'aviation d'État de Rybinsk, du nom de P.

Entrée suivante

La quatrième révolution industrielle : implications pour les États, les entreprises et les citoyens

En haut

Comment calculer la variance dans les statistiques. Comment calculer la variance dans Excel à l'aide de la fonction disp.v