La dispersion des données groupées est déterminée par la formule. Dispersion discrète variable aléatoire
Dispersion dans les statistiques Situé comme des signes individuels sur la place de. Selon les données initiales, il est déterminé par les formules de dispersions simples et suspendues:
1. (pour les données non frontalières) est calculé par la formule:
2. Dispersion pondérée (pour la série variationnelle):
où n est la fréquence (répétabilité du facteur x)
Un exemple de recherche de dispersion
Cette page décrit un exemple standard d'une dispersion, vous pouvez également afficher d'autres tâches pour la trouver.
Exemple 1. Il existe les données suivantes sur un groupe de 20 étudiants du service de correspondance. Il est nécessaire de créer une ligne d'intervalle de la distribution des fonctionnalités, calculer la valeur caractéristique moyenne et explorer sa dispersion
Construire un regroupement d'intervalles. Nous définissons la portée de l'intervalle par la formule:
où x max est la valeur maximale de la fonction de regroupement;
X min-Valeur minimale d'une fonctionnalité de regroupement;
n - Nombre d'intervalles:
Prendre n \u003d 5. L'étape est: h \u003d (192 - 159) / 5 \u003d 6,6
Faire un groupe d'intervalles
Pour des calculs ultérieurs, nous construisons une table subsidiaire:
X'i-intervalle. (Par exemple, le milieu de l'intervalle 159 - 165.6 \u003d 162.3)
L'ampleur de croissance moyenne des étudiants déterminera la formule de l'arithmétique moyenne pondérée:
Déterminez la dispersion par la formule:
La formule de dispersion peut être convertie de sorte:
De cette formule, il suit que la dispersion est égale La différence entre les carrés des carrés d'options et de carrés et de moyens.
Dispersion en rangées variationnelles À intervalles égaux, selon la méthode des moments, il peut être calculé par la méthode suivante à l'aide des deuxièmes propriétés de la dispersion (divisant toutes les variantes de la taille de l'intervalle). Définition de décisioncalculé par la méthode des moments, selon la formule suivante, moins de temps prenant de temps:
où je suis l'ampleur de l'intervalle;
A - zéro conditionnel, qui est pratique d'utiliser le milieu de l'intervalle possédant la plus grande fréquence;
M1 - le carré de la première commande;
M2 - le moment du deuxième ordre
(Si dans un ensemble statistique, le signe change de manière à ce qu'il n'y ait que deux options d'options mutuellement exclusives, une telle variabilité est appelée alternative) peut être calculée par la formule:
Substituer dans cette dispersion de formule q \u003d 1- p, nous obtenons:
Types de dispersion
Dispersion totale Mesure la variation de la fonctionnalité tout au long de la totalité dans son ensemble sous l'influence de tous les facteurs qui déterminent cette variation. Il est égal au carré moyen des écarts de valeurs individuelles de la particularité de X de la valeur moyenne totale de x et peut être définie comme une simple dispersion ou une dispersion suspendue.
caractérise une variation aléatoire, c'est-à-dire Une partie de la variation, qui est due à l'influence de facteurs non comptabilisés et indépendamment du facteur de signalisation posé dans la base du regroupement. Une telle dispersion est égale au carré moyen des écarts de valeurs individuelles de la fonctionnalité à l'intérieur du groupe X à partir du groupe arithmétique moyen et peut être calculé comme une simple dispersion ou une dispersion pondérée.
De cette façon, mesures de dispersion sous marie Variation d'une fonctionnalité à l'intérieur du groupe et est déterminée par la formule:
où xi est une moyenne de groupe;
NI - Le nombre d'unités du groupe.
Par exemple, des dispersions intragroupes qui doivent être déterminées dans la tâche d'étudier l'impact des qualifications de travail pour la productivité du travail dans l'atelier Afficher les variations de la production dans chaque groupe causée par tous les facteurs possibles (état technique de l'équipement, des outils de sécurité et des matériaux, la Âge des travailleurs, intensité de la main-d'œuvre, etc.), outre les différences dans la décharge admissible (à l'intérieur du groupe, tous les travailleurs ont les mêmes qualifications).
La moyenne des dispersions du groupe intérieur reflète aléatoire, c'est-à-dire une partie de la variation survenue sous l'influence de tous les autres facteurs, à l'exception du facteur de regroupement. Il est calculé par la formule:
Il caractérise la variation systématique d'une caractéristique efficace, qui est due à l'influence d'un facteur de signalisation posé dans la base du regroupement. Il est égal au carré moyen des écarts de moyennes de groupe de la moyenne totale. La dispersion intergroupe est calculée par la formule:
Règle d'addition de dispersion dans les statistiques
Selon règle d'addition dispersions La dispersion totale est égale à la somme de la moyenne des dispersions d'intragroupe et d'intergroupe:
Le sens de cette règle C'est que la dispersion globale qui survient sous l'influence de tous les facteurs est égale à la quantité de dispersions qui se produisent sous l'influence de tous les autres facteurs et dispersion résultant du facteur de regroupement.
En utilisant la formule pour l'ajout de dispersions, on peut déterminer par deux dispersions connues du troisième inconnu, ainsi que de juger de la force de l'influence d'une caractéristique de regroupement.
Propriétés de la dispersion
1. Si toutes les valeurs de signe sont réduites (agrandir) de la même valeur constante, la dispersion ne changera pas.
2. Si toutes les caractéristiques sont réduites (zoom) au même nombre de fois n, la dispersion diminuera en conséquence (augmentation) en N ^ 2 fois.
Pas
Calcul de la dispersion des échantillons
-
Notez les valeurs d'échantillonnage. Dans la plupart des cas, seuls des échantillons de certains agrégats généraux sont disponibles pour les statistiques. Par exemple, en règle générale, les statistiques n'analysent pas les coûts du contenu de la totalité de toutes les voitures en Russie - ils analysent l'échantillon aléatoire de plusieurs milliers de voitures. Un tel échantillon contribuera à déterminer les dépenses moyennes de la voiture, mais probablement la valeur obtenue sera loin d'être réelle.
- Par exemple, nous analysons le nombre de petits pains vendus dans un café pendant 6 jours pris dans un ordre aléatoire. L'échantillon a la forme suivante: 17, 15, 23, 7, 9, 13. Il s'agit d'un échantillon, pas d'une totalité, car nous n'avons aucune donnée sur Bun Vendu pour chaque jour du café.
- Si vous avez une totalité, et non un échantillon de valeurs, allez à la section suivante.
-
Enregistrez la formule pour calculer la dispersion des échantillons. La dispersion est une mesure de la diffusion de certaines valeurs. Plus la valeur de la dispersion à zéro est la plus proche, plus la valeur est regroupée les unes aux autres. Travailler avec un échantillon de valeurs, utilisez la formule suivante pour calculer la dispersion:
- S 2 (\\ DisplayStyle S ^ (2)) = ∑[( X i (\\ displaystyle x_ (i))) - X) 2 (\\ displaystyle ^ (2))] / (n - 1)
- S 2 (\\ DisplayStyle S ^ (2)) - Ceci est une dispersion. La dispersion est mesurée dans des unités de mesure carrées.
- X i (\\ displaystyle x_ (i))) - chaque valeur dans l'échantillon.
- X i (\\ displaystyle x_ (i))) Il est nécessaire de soustraire x̅, de construire un carré, puis de plier les résultats obtenus.
- x̅ - moyenne sélective (valeur d'échantillonnage moyenne).
- n - Le nombre de valeurs dans l'échantillon.
-
Calculer la valeur d'échantillonnage moyenne. Il est indiqué comme x̅. La valeur d'échantillonnage moyenne est calculée en tant que moyenne arithmétique habituelle: pliez toutes les valeurs de l'échantillon, puis le résultat est divisé par le nombre de valeurs de l'échantillon.
- Dans notre exemple, pliez les valeurs de l'échantillon: 15 + 17 + 23 + 7 + 9 + 13 \u003d 84
Le résultat est maintenant divisé par le nombre de valeurs de l'échantillon (dans notre exemple, ils sont 6): 84 ÷ 6 \u003d 14.
Moyenne sélective x̅ \u003d 14. - La moyenne sélective est une valeur centrale autour desquelles les valeurs sont distribuées dans l'échantillon. Si les valeurs de l'échantillon sont regroupées autour du milieu échantillon, la dispersion est petite; Sinon, la dispersion est grande.
- Dans notre exemple, pliez les valeurs de l'échantillon: 15 + 17 + 23 + 7 + 9 + 13 \u003d 84
-
Supprimez la moyenne sélectionnée de chaque valeur dans l'échantillon. Maintenant, calculez la différence X i (\\ displaystyle x_ (i))) - x̅, où X i (\\ displaystyle x_ (i))) - chaque valeur dans l'échantillon. Chaque résultat obtenu témoigne de la déviation d'une valeur particulière du milieu échantillon, c'est-à-dire à quelle distance cette valeur provient de la valeur d'échantillonnage moyenne.
- Dans notre exemple:
X 1 (\\ displaystyle x_ (1)) - x̅ \u003d 17 - 14 \u003d 3
x 2 (\\ displaystyle x_ (2)) - x̅ \u003d 15 - 14 \u003d 1
x 3 (\\ displaystyle x_ (3)) - x̅ \u003d 23 - 14 \u003d 9
x 4 (\\ displaystyle x_ (4)) - x̅ \u003d 7 - 14 \u003d -7
x 5 (\\ displaystyle x_ (5)) - x̅ \u003d 9 - 14 \u003d -5
X 6 (\\ displaystyle x_ (6)) - x̅ \u003d 13 - 14 \u003d -1 - L'exactitude des résultats obtenus est facile à vérifier, car leur somme devrait être nulle. Cela est dû à la définition de la valeur moyenne, car les valeurs négatives (distances de la valeur moyenne aux valeurs plus petites) sont entièrement compensées par des valeurs positives (distances de la valeur moyenne aux grandes valeurs).
- Dans notre exemple:
-
Comme indiqué ci-dessus, la quantité de différences X i (\\ displaystyle x_ (i))) - x̅ doit être zéro. Cela signifie que la dispersion moyenne est toujours égale à zéro, ce qui ne donne aucune idée de diffusion des valeurs d'une certaine quantité. Pour résoudre ce problème, prenez chaque différence sur la place X i (\\ displaystyle x_ (i))) - X. Cela conduira au fait que vous ne recevrez que des chiffres positifs que, lors de l'addition, ne donnez jamais 0.
- Dans notre exemple:
( X 1 (\\ displaystyle x_ (1)) - X) 2 \u003d 3 2 \u003d 9 (\\ displaystyle ^ (2) \u003d 3 ^ (2) \u003d 9)
(x 2 (\\ displaystyle (x_ (2)) - X) 2 \u003d 1 2 \u003d 1 (\\ displaystyle ^ (2) \u003d 1 ^ (2) \u003d 1)
9 2 = 81
(-7) 2 = 49
(-5) 2 = 25
(-1) 2 = 1 - Vous avez trouvé un carré de la différence - x̅) 2 (\\ displaystyle ^ (2)) Pour chaque valeur dans l'échantillon.
- Dans notre exemple:
-
Calculer la somme des carrés des différences. C'est-à-dire que la partie de la formule est écrite comme suit: σ [( X i (\\ displaystyle x_ (i))) - X) 2 (\\ displaystyle ^ (2))]. Ici le signe σ signifie la somme des carrés des différences pour chaque valeur X i (\\ displaystyle x_ (i))) Dans l'échantillon. Vous avez déjà trouvé des carrés de différences (X i (\\ displaystyle (x_ (i)) - X) 2 (\\ displaystyle ^ (2)) Pour chaque valeur X i (\\ displaystyle x_ (i))) Dans l'échantillon; Maintenant, pliez ces carrés.
- Dans notre exemple: 9 + 1 + 81 + 49 + 25 + 1 \u003d 166 .
-
Le résultat résultant est divisé en N-1, où n est le nombre de valeurs de l'échantillon. Il y a quelque temps, pour calculer la dispersion des statistiques, le résultat était simplement sur n; Dans ce cas, vous recevrez la taille moyenne du carré de dispersion, idéal pour décrire la dispersion de cet échantillon. Mais rappelez-vous que tout échantillon n'est qu'une petite partie de l'ensemble général des valeurs. Si vous prenez un autre échantillon et effectuez les mêmes calculs, vous recevrez un autre résultat. Comme il s'est avéré, la division sur N-1 (et pas seulement sur N) donne une évaluation plus précise de la dispersion de la population en général, qui vous intéresse. La division sur N-1 est devenue généralement acceptée, elle est donc incluse dans la formule de calcul de la dispersion des échantillons.
- Dans notre exemple, l'échantillon comprend 6 valeurs, c'est-à-dire n \u003d 6.
Dispersion d'échantillonnage \u003d. S 2 \u003d 166 6 - 1 \u003d (\\ displaystyle S ^ (2) \u003d (\\ frac (166) (6-1) \u003d) 33,2
- Dans notre exemple, l'échantillon comprend 6 valeurs, c'est-à-dire n \u003d 6.
-
Dispersion de différence de l'écart type. Notez que la formule est présente dans la formule, la dispersion est donc mesurée dans des unités carrées de mesure de la valeur analysée. Parfois, une telle ampleur est assez difficile à utiliser; Dans de tels cas, utilisez l'écart type, qui est également une racine carrée de la dispersion. C'est pourquoi la dispersion de l'échantillon est indiquée comme S 2 (\\ DisplayStyle S ^ (2))et la déviation type de l'échantillon - comme S (\\ displaystyle s).
- Dans notre exemple, l'écart type de l'échantillon: S \u003d √33,2 \u003d 5.76.
Calcul de la dispersion de l'agrégat
-
Analyser une certaine totalité des valeurs. L'agrégat inclut toutes les valeurs de la valeur considérée. Par exemple, si vous étudiez l'âge des résidents de la région de Leningrad, l'agrégat comprend l'âge de tous les résidents de cette zone. En cas de travail avec un ensemble, il est recommandé de créer une table et de faire un ensemble de totalité. Considérez l'exemple suivant:
- Il y a 6 aquariums dans une certaine chambre. Dans chaque aquarium, le nombre de poissons suivant vit:
x 1 \u003d 5 (\\ displaystyle x_ (1) \u003d 5)
x 2 \u003d 5 (\\ displaystyle x_ (2) \u003d 5)
x 3 \u003d 8 (\\ displaystyle x_ (3) \u003d 8)
x 4 \u003d 12 (\\ displaystyle x_ (4) \u003d 12)
x 5 \u003d 15 (\\ displaystyle x_ (5) \u003d 15)
x 6 \u003d 18 (\\ displaystyle x_ (6) \u003d 18)
- Il y a 6 aquariums dans une certaine chambre. Dans chaque aquarium, le nombre de poissons suivant vit:
-
Notez la formule pour calculer la dispersion de la population générale. Étant donné que la combinaison inclut toutes les valeurs d'une certaine valeur, la formule ci-dessous vous permet d'obtenir la valeur exacte de la dispersion de l'ensemble. Afin de distinguer la dispersion d'un ensemble de dispersion d'échantillonnage (la valeur est seulement estimée), les statistiques utilisent différentes variables:
- σ 2 (\\ displaystyle ^ (2)) = (∑( X i (\\ displaystyle x_ (i))) - μ) 2 (\\ displaystyle ^ (2))) / N.
- σ 2 (\\ displaystyle ^ (2)) - dispersion de l'agrégat (lire comme «Sigma dans un carré»). La dispersion est mesurée dans des unités de mesure carrées.
- X i (\\ displaystyle x_ (i))) - Chaque valeur dans l'agrégat.
- Σ - signe du montant. C'est-à-dire de chaque valeur X i (\\ displaystyle x_ (i))) Il est nécessaire de soustraire μ, de construire un carré, puis de plier les résultats obtenus.
- μ est la valeur définie moyenne.
- n - Le nombre de valeurs dans la population en général.
-
Calculer la valeur moyenne de la totalité. Lorsque vous travaillez avec l'ensemble général, sa valeur moyenne est indiquée comme μ (MJ). La valeur de réglage moyenne est calculée comme l'arithmétique moyenne habituelle: pliez toutes les valeurs de la population en général, puis le résultat est divisé par le nombre de valeurs dans l'ensemble général.
- N'oubliez pas que les valeurs moyennes ne sont pas toujours calculées comme la moyenne arithmétique.
- Dans notre exemple, la valeur moyenne de la totalité: μ \u003d 5 + 5 + 8 + 12 + 15 + 18 6 (\\ displaystyle (\\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
-
Supprimez la valeur définie moyenne de chaque valeur de la population générale. Plus la valeur de la différence à zéro est la plus proche, plus la valeur spécifique à la valeur moyenne de la totalité. Trouvez la différence entre chaque valeur dans l'agrégat et sa valeur moyenne, et vous recevrez la première idée de la distribution de valeurs.
- Dans notre exemple:
X 1 (\\ displaystyle x_ (1)) - μ \u003d 5 - 10.5 \u003d -5.5
x 2 (\\ displaystyle x_ (2)) - μ \u003d 5 - 10.5 \u003d -5.5
x 3 (\\ displaystyle x_ (3)) - μ \u003d 8 - 10.5 \u003d -2.5
x 4 (\\ displaystyle x_ (4)) - μ \u003d 12 - 10.5 \u003d 1,5
x 5 (\\ displaystyle x_ (5)) - μ \u003d 15 - 10.5 \u003d 4.5
X 6 (\\ displaystyle x_ (6)) - μ \u003d 18 - 10.5 \u003d 7.5
- Dans notre exemple:
-
Écoutez le carré chaque résultat. Les valeurs de différence seront à la fois positives et négatives; Si vous appliquez ces valeurs à la droite numérique, ils se situeront à droite et à gauche de la valeur moyenne de l'ensemble. Cela ne convient pas au calcul de la dispersion, car les nombres positifs et négatifs se compensent mutuellement. Par conséquent, prenez une carrée chaque différence pour obtenir des nombres exceptionnellement positifs.
- Dans notre exemple:
( X i (\\ displaystyle x_ (i))) - μ) 2 (\\ displaystyle ^ (2)) Pour chaque valeur de l'ensemble (de i \u003d 1 à i \u003d 6):
(-5,5) 2 (\\ displaystyle ^ (2)) = 30,25
(-5,5) 2 (\\ displaystyle ^ (2))où x n (\\ displaystyle x_ (n)) - Dernière valeur dans la population générale. - Pour calculer la valeur moyenne des résultats, vous devez trouver leur somme et la diviser sur N: ((( X 1 (\\ displaystyle x_ (1)) - μ) 2 (\\ displaystyle ^ (2)) + ( x 2 (\\ displaystyle x_ (2)) - μ) 2 (\\ displaystyle ^ (2)) + ... + ( x n (\\ displaystyle x_ (n)) - μ) 2 (\\ displaystyle ^ (2))) / N.
- Maintenant, écrivez l'explication à l'aide de variables: (σ ( X i (\\ displaystyle x_ (i))) - μ) 2 (\\ displaystyle ^ (2))) / N et nous obtenons une formule pour calculer la dispersion de la totalité.
- Dans notre exemple:
Selon l'examen sélectif, les déposants regroupaient en termes de dépôt à Sberbank de la ville:
Déterminer:
1) variation de variation;
2) la taille de dépôt moyen;
3) la déviation linéaire moyenne;
4) dispersion;
5) Déviation quadratique secondaire;
6) Coefficient de variation des dépôts.
Décision:
Cette plage de distribution contient des intervalles ouverts. Dans de telles lignes, l'ampleur de l'intervalle du premier groupe est conditionnée de manière conditionnelle égale à la valeur de l'intervalle suivant et la magnitude de l'intervalle du dernier groupe est égale à la magnitude de l'intervalle de la précédente.
L'ampleur du deuxième groupe du groupe est de 200 ans, la quantité du premier groupe est également égale à 200. La taille de l'intervalle de l'avant-dernier groupe est de 200, ce qui signifie que le dernier intervalle aura une valeur égale à 200 .
1) Nous définirons la portée de la variation comme une différence entre le plus grand et le plus petit signe de la fonctionnalité:
La portée de la variation de la taille de la contribution est de 1000 roubles.
2) La taille moyenne du dépôt est déterminée par la formule de l'arithmétique moyenne pondérée.
Déterminez précédemment la valeur discrète du trait dans chaque intervalle. Pour ce faire, selon la formule arithmétique moyenne, nous trouverons le milieu des intervalles.
La valeur moyenne du premier intervalle sera la suivante:
deuxièmement - 500, etc.
Passons-nous dans les résultats des calculs du tableau:
Taille de dépôt, frottez. | Le nombre de déposants, f | Intervalle moyen, x | xf. |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
LE TOTAL | 400 | - | 312000 |
Le dépôt moyen dans la Sberbank de la ville sera de 780 roubles:
3) La déviation linéaire moyenne est l'arithmétique moyenne des écarts absolus des valeurs individuelles de la particularité de la moyenne totale:
La procédure de calcul de la linéaire de déflection moyenne dans la plage d'intervalles de la distribution est la suivante:
1. L'arithmétique moyen pondéré est calculé, comme indiqué au paragraphe 2).
2. Les écarts absolus sont déterminés à partir de la moyenne:
3. Les écarts obtenus sont multipliés par des fréquences:
4. Il y a une somme d'écarts pondérés sans prendre en compte le signe:
5. La quantité de déviations pondérées est divisée en fréquences:
Il est pratique d'utiliser la table de données calculée:
Taille de dépôt, frottez. | Le nombre de déposants, f | Intervalle moyen, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
LE TOTAL | 400 | - | - | - | 81280 |
La déviation linéaire moyenne de la contribution des clients de Sberbank est de 203,2 roubles.
4) La dispersion est la moyenne des carrés arithmétiques des déviations de chaque valeur de caractère de l'arithmétique moyen.
Le calcul de la dispersion dans les lignes de distribution d'intervalles est faite par la formule:
La procédure de calcul de la dispersion dans ce cas est la suivante:
1. Déterminer l'arithmétique moyen pondéré, comme indiqué au paragraphe 2).
2. Trouvez des écarts d'option de la moyenne:
3. Début des écarts de chaque option de la moyenne:
4. Plusieurs carrés pour déviations de poids (fréquences):
5. Minceur des travaux obtenus:
6. Le montant résultant est divisé en sommation (fréquences):
Calculs à émis dans le tableau:
Taille de dépôt, frottez. | Le nombre de déposants, f | Intervalle moyen, x | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
LE TOTAL | 400 | - | - | - | 23040000 |
Étendue variationnelle (ou variation de variation) - C'est la différence entre les valeurs de fonctionnalité maximale et minimale:
Dans notre exemple, la variation de la production de travailleurs de remplacement est la suivante: dans la première brigade R \u003d 105-95 \u003d 10 enfants, dans la deuxième brigade R \u003d 125-75 \u003d 50 enfants. (5 fois plus). Cela suggère que le développement de la 1ère brigade est plus "stable", mais les réserves de production de la production davantage à la deuxième brigade, car Si tous les travailleurs sont réalisés par tous les travailleurs de cette brigade, il peut être fabriqué 3 * 125 \u003d 375 parties, et dans la 1ère brigade seulement 105 * 3 \u003d 315 parties.
Si les signes extrêmes de l'attribut ne sont pas typiques de l'agrégat, les sautes de l'appartement ou de la décili sont utilisées. L'appartement RQ \u003d Q3-Q1 couvre 50% du volume total, la portée décisive est la première RD1 \u003d D9-D1) de 80% des données, le deuxième Raman Decile Raman RD2 \u003d D8-D2 est de 60%.
L'inconvénient de l'indicateur de l'échelle de variation est, mais que sa valeur ne reflète pas toutes les oscillations de la fonctionnalité.
L'indicateur résumant le plus simple reflétant tous les signes de la fonctionnalité est déviation linéaire moyenne, représentant les écarts d'absolute arithmétiques moyens de l'option individuelle de leur taille moyenne:
,
Pour les données groupées
,
où Xi est la valeur du signe dans la ligne discrète ou le milieu de l'intervalle dans la distribution d'intervalle.
Dans les formules ci-dessus de la différence dans le numérateur, le module est pris, sinon, selon la propriété de l'arithmétique moyen, le numérateur sera toujours zéro. Par conséquent, la déflexion linéaire moyenne dans la pratique statistique est rarement utilisée, uniquement dans les cas où la résumé des indicateurs sans prendre en compte le signe a une signification économique. Avec son aide, par exemple, la composition de travail, la rentabilité de la production, le chiffre d'affaires du commerce extérieur est analysé.
Caractéristique de dispersion - Il s'agit du carré moyen des écarts d'option de leur taille moyenne:
Dispersion simple
,
Dispersion pondérée
.
La formule de calcul de la dispersion peut être simplifiée:
Ainsi, la dispersion est égale à la différence au milieu de l'option de carrés et du carré de la moyenne de l'option de combinaison:
.
Cependant, en raison de la somme des carrés des déviations, la dispersion donne une compréhension déformée des écarts, il est donc calculé sur la base de la moyenne de la moyenne. déviation quadratiqueCe qui montre combien d'options spécifiques moyennes pour une fonctionnalité de leur valeur moyenne sont rejetées. Il est calculé en extrayant la racine carrée de la dispersion:
Pour les données non majeures
,
Pour les séries variationnelles
Plus la valeur de la dispersion et la déviation quadratique moyenne, plus l'une uniforme de la totalité, plus fiable (typique), il y aura une valeur moyenne.
L'écart quadratique linéaire et secondaire moyen est les numéros nommés, c'est-à-dire exprimé en unités du panneau, identiques en contenu et à proximité de la valeur.
Calculer les indicateurs de variation absolus est recommandé avec des tables.
Tableau 3 - Calcul des caractéristiques de la variation (sur l'exemple de l'ampleur des données de l'atelier de remplacement des brigades des travailleurs)
Nombre de travailleurs |
Intervalle intervalle |
Valeurs calculées |
|||||
LE TOTAL: |
Ouvriers miniers moyens:
Déviation linéaire moyenne:
Dispersion de la production:
La déviation quadratique moyenne de la production de travailleurs individuels de la production moyenne:
.
1 Calcul de la dispersion par la méthode des moments
Le calcul des dispersions est associé à des calculs volumineux (surtout si la valeur moyenne est exprimée dans un grand nombre avec plusieurs signes décimaux). Les calculs peuvent être simplifiés si vous utilisez une formule simplifiée et des propriétés de dispersion.
La dispersion a les propriétés suivantes:
- si toutes les valeurs de signe sont réduites ou augmentées de la même valeur A, la dispersion ne diminuera pas à partir de ceci:
,
, alors ou
Utilisation des propriétés de la dispersion et réduisez d'abord toutes les variantes de l'ensemble par la valeur d'A, puis divisant la valeur de l'intervalle H, nous obtenons la formule pour calculer la dispersion des lignes de variation avec des intervalles égaux avec des intervalles égaux. façon de moments:
,
où - la dispersion calculée par la méthode des moments;
H - l'ampleur de l'intervalle de la série de variations;
- option de valeurs neuves (transformées);
Une valeur permanente, qui utilise le milieu de l'intervalle avec la fréquence la plus élevée; soit l'option ayant la fréquence la plus élevée;
- le carré de la première commande;
- moment de deuxième ordre.
Effectuer le calcul de la dispersion par la méthode de moments basée sur des données sur l'atelier de remplacement des brigades des travailleurs.
Tableau 4 - Calcul de la dispersion par la méthode des moments
Groupes de modération de travail, morceaux. |
Nombre de travailleurs |
Intervalle intervalle |
Valeurs calculées |
||
Procédure de calcul:
- calculer la dispersion:
2 Calcul de la dispersion d'une autre caractéristique
Parmi les signes étudiés par des statistiques, il y a aussi ceux qui sont particuliers à seulement deux significations mutuellement exclusives. Ce sont des signes alternatifs. Il est joint, respectivement, deux valeurs quantitatives: options 1 et 0. La fréquence des options 1, notée par p, est la proportion d'unités avec cette fonctionnalité. La différence 1-p \u003d q est la fréquence des options 0. Ainsi,
xi |
|
Caractéristique alternative arithmétique moyenne
, T. K. P + Q \u003d 1.
Dispersion d'une autre caractéristique
car 1-p \u003d q
Ainsi, la dispersion d'une fonctionnalité alternative est égale au travail de la part des unités avec cette fonctionnalité et les actions d'unités qui n'ont pas cette fonctionnalité.
Si les valeurs 1 et 0 sont également différentes, c'est-à-dire P \u003d Q, la dispersion atteint son maximum de PQ \u003d 0,25.
La dispersion d'une alternative est utilisée dans des enquêtes sélectives, par exemple la qualité du produit.
3 dispersion intergroupe. Règle d'addition de dispersions
La dispersion, contrairement à d'autres caractéristiques de la variation, est une valeur additive. C'est-à-dire que dans l'agrégat, qui est divisé en groupes par facteur h. , dispersion de la fonctionnalité productive y.il peut être décomposé sur la dispersion dans chaque groupe (intragroupe) et dispersion entre groupes (intergroupe). Ensuite, avec l'étude de la variation de la caractéristique tout au long de la totalité dans son ensemble, il devient possible d'étudier la variation de chaque groupe, ainsi qu'entre ces groupes.
Dispersion totalemesure la variation de la fonctionnalité w. Tout au long de la combinaison sous l'influence de tous les facteurs qui ont provoqué cette variation (déviations). Il est égal au carré moyen des écarts de valeurs individuelles de la fonctionnalité w. De la moyenne totale et peut être calculé comme une dispersion simple ou suspendue.
Dispersion intergroupe caractérise la variation de la performance w.causée par l'influence d'un facteur de signalisation h.basé sur le groupement. Il caractérise la variation de la moyenne du groupe et est égale au carré moyen des écarts moyens du groupe par rapport à la moyenne totale:
,
Où est l'arithmétique moyenne i-que le groupe;
- le nombre d'unités dans le I-ce groupe (fréquence du groupe I-que le groupe);
- Agrégat moyen total.
Dispersion de sous-groupes Reflète la variation aléatoire, c'est-à-dire qu'une partie de la variation, causée par l'influence de facteurs non comptabilisés et ne dépend pas du facteur de signalisation basé sur le regroupement. Il caractérise la variation des valeurs individuelles relatives aux moyennes de groupe, est égale au carré moyen des écarts de valeurs caractéristiques individuelles. w. À l'intérieur du groupe depuis l'arithmétique moyen de ce groupe (moyenne du groupe) et est calculé comme une dispersion simple ou suspendue pour chaque groupe:
ou alors ,
Où est le nombre d'unités du groupe.
Basé sur des dispersions intragroupes pour chaque groupe, vous pouvez déterminer dispersion du milieu de l'intragroupe:
.
La relation entre les trois dispersions a été appelée règles d'addition dispersionsSelon lesquels la dispersion totale est égale à la somme de la dispersion intergroupe et la moyenne des dispersions intragroupes:
Exemple. Lors de l'étude de l'influence des décharges tarifaires (qualifications) des travailleurs, les données suivantes ont été obtenues pour la performance de leur travail.
Tableau 5 - Répartition des travailleurs dans la génération de la mi-heure.
№ P / p. |
Exploitation 4ème catégories |
5ème catégorie |
|||||
Développement |
Développement |
||||||
1 |
7 |
7-10=-3 |
9 |
1 |
14 |
14-15=-1 |
1 |
Dans cet exemple, les travailleurs sont divisés en deux groupes sur le facteur h.- qualifications, qui se caractérise par leur décharge. Caractéristique de l'exécutif - Développement - Varie à la fois sous son influence (variation de l'intergroupe) et aux dépens d'autres facteurs aléatoires (variation intragroupe). La tâche consiste à mesurer ces variations en utilisant trois dispersions: générale, intergroupe et intragroupe. Le coefficient de détermination empirique montre la proportion de la variation de la productivité w.sous l'influence d'un facteur h.. Le reste de la variation totale w.causée par le changement d'autres facteurs.
Dans l'exemple, le coefficient de détermination empirique est:
ou 66,7%,
Cela signifie que 66,7% de variations des travailleurs de la productivité du travail sont dues à des différences de qualifications et de 33,3% - l'influence d'autres facteurs.
Corrélation empirique Montre l'étanchéité de la relation entre le regroupement et les caractéristiques efficaces. Calculé comme le carré racinaire du coefficient empirique de détermination:
Attitude de corrélation empirique, comme, peut prendre des valeurs de 0 à 1.
S'il n'y a pas de connexion, alors \u003d 0. Dans ce cas, \u003d 0, c'est-à-dire que les moyennes de groupe sont égales les unes aux autres et la variation intergroupe n'est pas. Cela signifie un signe de regroupement - le facteur n'affecte pas la formation d'une variation commune.
Si la connexion est fonctionnelle, alors \u003d 1. Dans ce cas, la dispersion de la moyenne du groupe est égale à la dispersion générale (), c'est-à-dire qu'il n'y a pas de variation intragroupe. Cela signifie que la fonctionnalité de regroupement détermine pleinement la variation de la fonctionnalité caractéristique étudiée.
Plus la valeur de corrélation est plus proche, plus elle est plus proche de la relation de fonctionnalité entre les signes.
Pour une évaluation qualitative de l'étanchéité de la relation entre les signes, les ratios de la Caddoka sont utilisés.
Dans l'exemple Ce qui témoigne de la connexion étroite entre la capacité de travail des travailleurs et de leurs qualifications.
Dispersion Variable aléatoire - mesure de la dispersion de cette variable aléatoirec'est sa déviation des attentes mathématiques. Dans les statistiques à désigner la dispersion, la désignation (Sigma sur la place) est souvent utilisée. Racine carrée de la dispersion, égale appelée Écart-type ou dispersion standard. L'écart type est mesuré dans les mêmes unités que la variable aléatoire elle-même et la dispersion est mesurée dans les carrés de cette unité de mesure.
Bien qu'il soit très pratique d'utiliser une seule valeur pour évaluer l'ensemble de l'échantillon (tel que la valeur moyenne ou la mode et médiane), cette approche peut facilement conduire à des sorties incorrectes. La raison de cette position n'est pas dans la meilleure ampleur, mais dans le fait qu'une valeur ne reflète pas la dispersion des valeurs de données.
Par exemple, dans l'échantillon:
la valeur moyenne est de 5.
Cependant, dans l'échantillon lui-même, il n'y a pas un seul élément avec une valeur 5. Vous devrez peut-être connaître le degré de proximité de chaque élément de l'échantillon à sa valeur moyenne. Ou, en d'autres termes, vous devrez connaître la dispersion de la variance. Connaître le degré de changement de données, vous pouvez être mieux interprété moyenne, médian et mode. Le degré de changement de valeurs d'échantillonnage est déterminé en calculant leur dispersion et leur écart-type.
Dispersion et racine carrée d'une dispersion appelée écart type, caractérisent la déviation moyenne de la valeur d'échantillonnage moyenne. Parmi ces deux magnitudes est la plus grande valeur écart-type. Cette valeur peut être représentée comme une distance moyenne sur laquelle des éléments de l'élément d'échantillonnage moyen sont situés.
La dispersion est difficile à interpréter de manière significative. Cependant, la racine carrée de cette valeur est une écart type et est bien amenée à interprétation.
L'écart type est calculé en déterminant d'abord la dispersion, puis calculez la racine carrée de la dispersion.
Par exemple, pour la matrice des données présentées sur la figure, les valeurs suivantes seront obtenues:
Image 1
Ici, la valeur moyenne des carrés des différences est de 717,43. Pour obtenir un écart-type, il reste seulement de prendre une racine carrée de ce nombre.
Le résultat sera d'environ 26,78.
Il convient de rappeler que l'écart type est interprété comme la distance moyenne sur laquelle sont situées les éléments de la valeur d'échantillonnage moyenne.
L'écart-type montre comment bien la valeur moyenne décrit l'ensemble de l'échantillon.
Supposons que vous soyez le chef du service manufacturier pour l'assemblage du PC. Le rapport trimestriel indique que la libération du dernier trimestre s'élevait à 2500 pcs. Est-ce mauvais ou bon? Vous avez demandé (ou déjà dans le rapport, il existe ce graphique) dans le rapport pour afficher l'écart type en fonction de ces données. Le chiffre de l'écart type, par exemple, est de 2000. Il devient clair pour vous comme le chef du département, que la chaîne de production nécessite un meilleur contrôle (des écarts trop importants dans le nombre de PC collectés).
Rappelez-vous: avec un écart-type important, les données sont largement dispersées par rapport à la valeur moyenne et avec les petites - elles sont regroupées près de la valeur moyenne.
Quatre fonctions statistiques de l'écran (), un différend (), StandotClone () et StandotClick () - sont conçues pour calculer la dispersion et l'écart type des nombres dans les intervalles de cellule. Avant de calculer la dispersion et l'écart type de l'ensemble de données, il est nécessaire de déterminer si ces données représentent l'ensemble général ou l'échantillon de la population générale. Dans le cas d'un échantillon de la population générale, les fonctions de l'affichage () et de StandotonClone () doivent être utilisées et dans le cas de l'ensemble général - la fonction de la dispensaire () et de StandotLoup ():
Agrégat général | Une fonction |
| Dispenser () |
| Stadothotlip () |
Goûter | |
| Dis () |
| StandotClone () |
Comme nous l'avons noté, la dispersion (ainsi que l'écart type) indiquent dans quelle mesure la quantité incluse dans l'ensemble des données est dispersée autour de l'arithmétique moyenne.
Une faible valeur de la dispersion ou de l'écart type indique que toutes les données sont concentrées autour de l'arithmétique moyenne et la valeur importante de ces valeurs est que les données sont dispersées dans une large gamme de valeurs.
La dispersion est assez difficile à interpréter de manière significative (qu'est-ce que cela signifie une petite valeur, une grande valeur?). Performance Tâches 3.permet visuellement sur le graphique, indiquez la signification de la dispersion d'un ensemble de données.
Tâches
· Exercice 1.
· 2.1. Écriture: dispersion et déviation standard; Leur désignation symbolique avec le traitement des données statistiques.
· 2.2. Organisez la feuille de travail conformément à la figure 1 et apportez les calculs nécessaires.
· 2.3. Créer les formules de base utilisées dans les calculs
· 2.4. Expliquer tous les symboles (,,)
· 2.5. Calculez la signification pratique du concept de dispersion et de déviation standard.
Tâche 2.
1.1. Donner le concept: agrégat général et échantillon; Attente mathématique et moyenne arithmétique de leur désignation symbolique avec le traitement de données statistiques.
1.2. Conformément à la figure 2, organiser une feuille de travail et effectuer des calculs.
1.3. Créez les formules de base utilisées dans les calculs (pour la population générale et l'échantillon).
Figure 2.
1.4. Expliquez pourquoi les valeurs arithmétiques moyennes sont possibles dans les échantillons de 46,43 et 48,78 (voir le fichier d'application). Conclure.
Tâche 3.
Il existe deux échantillons avec un autre jeu de données différent, mais la moyenne pour eux sera la même:
Figure 3.
3.1. Organisez la feuille de travail conformément à la figure 3 et produisez les calculs nécessaires.
3.2. Donner des formules de base pour calculer.
3.3. Construire des graphiques conformes aux figures 4, 5.
3.4. Expliquer les dépendances obtenues.
3.5 Spécifiez des calculs similaires pour deux échantillons.
Échantillon source 11119999.
Les valeurs du deuxième échantillon sont sélectionnées de sorte que la moyenne arithmétique du second échantillon était la même, par exemple:
Décrochez les valeurs du deuxième échantillon vous-même. Inscrivez-vous et créez des graphiques tels que les figures 3, 4, 5. Affichez les formules de base utilisées lors du calcul.
Faire des conclusions appropriées.
Toutes les tâches à émettre sous la forme d'un rapport avec tous les dessins, graphiques, formules et brèves explications nécessaires.
Remarque: les graphiques de construction doivent être clarifiés avec des dessins et des explications brèves.