Règles de construction de séries de distribution discrètes et par intervalles. Série de distribution
Qu'est-ce qu'un regroupement de données statistiques et comment est-il lié aux séries de distribution a été abordé dans cette conférence, où vous pourrez également en apprendre davantage sur ce qu'est une série de distribution discrète et variationnelle.
Série de distribution une des variétés série statistique(en plus d'eux, les séries chronologiques sont utilisées en statistiques), utilisées pour analyser les données sur les phénomènes vie publique. Construire des séries de variations est une tâche tout à fait réalisable pour tout le monde. Il y a cependant des règles à retenir.
Comment construire une série de distribution variationnelle discrète
Exemple 1. Il existe des données sur le nombre d'enfants dans 20 familles interrogées. Construire une série de variations discrètes répartition familiale par nombre d'enfants.
0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2
Solution:
- Commençons par une présentation en tableau, dans laquelle nous saisirons ensuite les données. Étant donné que les lignes de distribution comportent deux éléments, le tableau sera composé de deux colonnes. La première colonne est toujours une option - ce que l'on étudie - on tire son nom de la tâche (la fin de la phrase avec la tâche dans les conditions) - par nombre d'enfants– cela signifie que notre option est le nombre d’enfants.
La deuxième colonne est la fréquence - la fréquence à laquelle notre variante se produit dans le phénomène étudié - nous prenons également le nom de la colonne de la tâche - répartition familiale – cela signifie que notre fréquence est le nombre de familles avec le nombre d'enfants correspondant.
- Désormais, à partir des données sources, nous sélectionnons les valeurs qui apparaissent au moins une fois. Dans notre cas c'est
Et organisons ces données dans la première colonne de notre tableau dans un ordre logique, dans ce cas croissant de 0 à 4. Nous obtenons
Et enfin, comptons combien de fois chaque valeur de la variante apparaît.
0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2
En conséquence, nous obtenons un tableau complété ou la ligne requise de répartition des familles par nombre d'enfants.
Exercice . Il existe des données sur les niveaux de salaire de 30 travailleurs de l'entreprise. Construire une série à variations discrètes de répartition des travailleurs selon catégorie tarifaire. 2 3 2 4 4 5 5 4 6 3
1 4 4 5 5 6 4 3 2 3
4 5 4 5 5 6 6 3 3 4
Comment construire une série de distribution variationnelle d'intervalle
Construisons une série de distributions d'intervalles et voyons en quoi sa construction diffère d'une série discrète.
Exemple 2. Il existe des données sur le montant des bénéfices perçus par 16 entreprises, en millions de roubles. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Construire une série de variations d'intervalles de la répartition des entreprises par volume de bénéfices, en identifiant 3 groupes avec des intervalles égaux.
Le principe général de construction de la série restera bien entendu les mêmes deux colonnes, les mêmes options et fréquence, mais dans ce cas les options seront situées dans l'intervalle et les fréquences seront comptées différemment.
Solution:
- Commençons de la même manière que la tâche précédente en créant une disposition de tableau, dans laquelle nous saisirons ensuite des données. Étant donné que les lignes de distribution comportent deux éléments, le tableau sera composé de deux colonnes. La première colonne est toujours une option - ce que nous étudions - nous prenons son nom de la tâche (la fin de la phrase avec la tâche dans les conditions) - par le montant du profit - ce qui signifie que notre option est le montant du profit reçu .
La deuxième colonne est la fréquence - la fréquence à laquelle notre variante se produit dans le phénomène étudié - nous prenons également le nom de la colonne de la tâche - la répartition des entreprises - ce qui signifie que notre fréquence est le nombre d'entreprises avec le bénéfice correspondant, dans ce cas tombant dans l’intervalle.
En conséquence, la disposition de notre table ressemblera à ceci :
où je est la valeur ou la longueur de l'intervalle,
Хmax et Xmin – maximum et valeur minimale signe,
n est le nombre de groupes requis selon les conditions du problème.
Calculons la taille de l'intervalle pour notre exemple. Pour ce faire, parmi les données initiales, nous trouverons le plus grand et le plus petit
23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – la valeur maximale est de 118 millions de roubles et la valeur minimale est de 9 millions de roubles. Effectuons le calcul en utilisant la formule.
Dans le calcul, nous avons obtenu le nombre 36, (3) trois dans la période, dans de telles situations, la valeur de l'intervalle doit être arrondie afin qu'après les calculs le maximum de données ne soit pas perdu, c'est pourquoi dans le calcul la valeur de l'intervalle est de 36,4 millions de roubles.
- Construisons maintenant des intervalles - nos options dans ce problème. Le premier intervalle commence à être construit à partir de la valeur minimale, la valeur de l'intervalle y est ajoutée et la limite supérieure du premier intervalle est obtenue. Ensuite, la limite supérieure du premier intervalle devient la limite inférieure du deuxième intervalle, la valeur de l'intervalle y est ajoutée et le deuxième intervalle est obtenu. Et ainsi de suite autant de fois que nécessaire pour construire des intervalles selon la condition.
Faisons attention si nous n'avions pas arrondi la valeur de l'intervalle à 36,4, mais l'avions laissé à 36,3, alors dernière valeur nous obtiendrions 117,9. C'est afin d'éviter la perte de données qu'il est nécessaire d'arrondir la valeur de l'intervalle à une valeur plus grande.
- Comptons le nombre d'entreprises entrant dans chaque intervalle spécifique. Lors du traitement des données, vous devez vous rappeler que la valeur supérieure de l'intervalle dans un intervalle donné n'est pas prise en compte (n'est pas incluse dans cet intervalle), mais est prise en compte dans l'intervalle suivant (la limite inférieure de l'intervalle est incluse dans cet intervalle, et celui du haut n'est pas inclus), à l'exception du dernier intervalle.
Lors du traitement des données, il est préférable d'indiquer les données sélectionnées avec des symboles ou des couleurs pour simplifier le traitement.
23 48 57 12 118 9 16 22
27 48 56 87 45 98 88 63
Nous notons le premier intervalle jaune- et déterminer combien de données tombent dans l'intervalle de 9 à 45,4, tandis que ce 45,4 sera pris en compte dans le deuxième intervalle (à condition qu'il soit dans les données) - au final on obtient 7 entreprises dans le premier intervalle. Et ainsi de suite à tous les intervalles.
- (action supplémentaire) Calculons le montant total des bénéfices perçus par les entreprises pour chaque intervalle et en général. Pour ce faire, additionnez les données marquées différentes couleurs et obtenez la valeur totale du profit.
Pour le premier intervalle - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 millions de roubles.
Pour le deuxième intervalle - 48 + 57 + 48 + 56 + 63 = 272 millions de roubles.
Pour le troisième intervalle - 118 + 87 + 98 + 88 = 391 millions de roubles.
Exercice . Il existe des données sur le montant des dépôts à la banque de 30 déposants, en milliers de roubles. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,
600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,
500, 520, 480, 630, 650, 670, 220, 140, 680, 320
Construire série de variations d'intervalle répartition des déposants, selon la taille du dépôt, en identifiant 4 groupes à intervalles égaux. Compter pour chaque groupe taille globale dépôts.
Les résultats du regroupement des données statistiques collectées sont généralement présentés sous forme de séries de distribution. Une série de distribution est une répartition ordonnée d'unités de population en groupes selon la caractéristique étudiée.
Les séries de distribution sont divisées en attributives et variationnelles, en fonction de la caractéristique qui constitue la base du regroupement. Si l'attribut est qualitatif, alors la série de distribution est dite attributive. Un exemple de série d'attributs est la répartition des entreprises et des organisations par type de propriété (voir tableau 3.1).
Si la caractéristique par laquelle la série de distribution est construite est quantitative, alors la série est dite variationnelle.
La série variationnelle d'une distribution se compose toujours de deux parties : une variante et les fréquences (ou fréquences) correspondantes. Une variante est la valeur qu'une caractéristique peut prendre en unités de population, tandis que la fréquence est le nombre d'unités d'observation qui ont une valeur donnée de la caractéristique. La somme des fréquences est toujours égale au volume de la population. Parfois, au lieu de fréquences, des fréquences sont calculées - ce sont des fréquences exprimées soit en fractions d'unité (la somme de toutes les fréquences est alors égale à 1), soit en pourcentage du volume de la population (la somme des fréquences sera être égal à 100 %).
Les séries de variations sont discrètes et à intervalles. Pour les séries discrètes (tableau 3.7), les options sont exprimées en nombres spécifiques, le plus souvent des nombres entiers.
Répartition des salariés selon le temps de travail dans la compagnie d'assurance Temps passé à travailler dans l'entreprise années complètes | (options) | |
---|---|---|
Nombre d'employés | Homme (fréquences) | |
en % du total (fréquence) | 15 | 11,6 |
1 | 17 | 13,2 |
2 | 19 | 14,7 |
3 | 26 | 20,2 |
4 | 10 | 7,8 |
5 | 18 | 13,9 |
6 | 24 | 18,6 |
jusqu'à un an | 129 | 100,0 |
Total
Dans les séries d'intervalles (voir tableau 3.2), les valeurs des indicateurs sont spécifiées sous forme d'intervalles. Les intervalles ont deux limites : inférieure et supérieure. Les intervalles peuvent être ouverts ou fermés. Les ouverts n'ont pas l'une des limites, donc dans le tableau. 3.2 le premier intervalle n'a pas de limite inférieure et le dernier n'a pas de limite supérieure. Lors de la construction d'une série d'intervalles, selon la nature de la répartition des valeurs d'attribut, des intervalles égaux et inégaux sont utilisés (le tableau 3.2 montre une série de variations avec des intervalles égaux).
Si une caractéristique prend un nombre limité de valeurs, généralement pas plus de 10, des séries de distribution discrètes sont construites. Si l'option est plus grande, alors la série discrète perd sa clarté ; dans ce cas, il est conseillé d'utiliser la forme d'intervalle de la série de variations. Avec une variation continue d'une caractéristique, lorsque ses valeurs dans certaines limites diffèrent les unes des autres d'une quantité arbitrairement petite, une série de distribution d'intervalles est également construite.
3.3.1. Construction de séries à variations discrètes
Considérons la méthodologie pour construire des séries à variations discrètes à l'aide d'un exemple.
Exemple 3.2. Les données suivantes sont disponibles sur la composition quantitative de 60 familles :
Ensuite, vous devez compter le nombre de familles ayant la même composition. Le nombre de membres d'une famille (la valeur d'une caractéristique variable) sont des variantes (nous les désignerons par x), le nombre de familles de même composition sont des fréquences (nous les désignerons par f). Nous présentons les résultats de regroupement sous la forme de la série de distribution variationnelle discrète suivante :
Nombre de membres de la famille (x) | Nombre de familles (y) |
---|---|
1 | 8 |
2 | 14 |
3 | 20 |
4 | 9 |
5 | 5 |
6 | 4 |
jusqu'à un an | 60 |
3.3.2. Construction de séries de variations d'intervalles
Démontrons la technique de construction de séries de distribution de variations d'intervalles à l'aide de l'exemple suivant.
Exemple 3.3. Par conséquent observation statistique les données suivantes sur la valeur moyenne ont été obtenues taux d'intérêt 50 banques commerciales (%) :
14,7 | 19,0 | 24,5 | 20,8 | 12,3 | 24,6 | 17,0 | 14,2 | 19,7 | 18,8 |
18,1 | 20,5 | 21,0 | 20,7 | 20,4 | 14,7 | 25,1 | 22,7 | 19,0 | 19,6 |
19,0 | 18,9 | 17,4 | 20,0 | 13,8 | 25,6 | 13,0 | 19,0 | 18,7 | 21,1 |
13,3 | 20,7 | 15,2 | 19,9 | 21,9 | 16,0 | 16,9 | 15,3 | 21,4 | 20,4 |
12,8 | 20,8 | 14,3 | 18,0 | 15,1 | 23,8 | 18,5 | 14,4 | 14,4 | 21,0 |
Comme nous pouvons le constater, la visualisation d'un tel éventail de données est extrêmement gênante ; de plus, aucun modèle de changement dans l'indicateur n'est visible. Construisons une série de distributions d'intervalles.
- Déterminons le nombre d'intervalles.
Le nombre d'intervalles en pratique est souvent fixé par le chercheur lui-même en fonction des objectifs de chaque observation spécifique. En même temps, il peut également être calculé mathématiquement à l'aide de la formule de Sturgess.
n = 1 + 3,322lgN,
où n est le nombre d'intervalles ;
N est le volume de la population (nombre d'unités d'observation).
Pour notre exemple on obtient : n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6"7.
- Déterminons la taille des intervalles (i) à l'aide de la formule
où x max est la valeur maximale de l'attribut ;
x min - valeur minimale de l'attribut.
Pour notre exemple
Les intervalles d'une série de variations sont clairs si leurs limites ont des valeurs « rondes », arrondissons donc la valeur de l'intervalle de 1,9 à 2 et la valeur minimale de la caractéristique de 12,3 à 12,0.
- Déterminons les limites des intervalles.
En règle générale, les intervalles sont écrits de telle manière que la limite supérieure d'un intervalle soit également la limite inférieure de l'intervalle suivant. Ainsi, pour notre exemple, nous obtenons : 12,0-14,0 ; 14,0-16,0 ; 16,0-18,0 ; 18,0-20,0 ; 20,0-22,0 ; 22,0-24,0 ; 24,0-26,0.
Une telle entrée signifie que l'attribut est continu. Si les variantes d'une caractéristique prennent des valeurs strictement définies, par exemple uniquement des nombres entiers, mais que leur nombre est trop grand pour construire une série discrète, vous pouvez alors créer une série d'intervalles, où la limite inférieure de l'intervalle ne coïncidera pas avec la limite supérieure. limite de l'intervalle suivant (cela signifiera que la caractéristique est discrète). Par exemple, dans la répartition des employés de l'entreprise par âge, vous pouvez créer les groupes d'intervalles d'années suivants : 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 et plus.
De plus, dans notre exemple, nous pourrions ouvrir le premier et le dernier intervalles, etc. écrire : jusqu'à 14,0 ; 24.0 et supérieur.
- Sur la base des données initiales, nous construirons une série classée. Pour ce faire, on note par ordre croissant les valeurs que prend le signe. Nous présentons les résultats dans le tableau :
Tableau 3.13.
Série classée des taux d'intérêt des banques commerciales 12,3 17,0 19,9 23,8 12,8 17,4 20,0 24,5 13,0 18,0 20,0 24,6 13,3 18,1 20,4 25,1 13,8 18,5 20,4 25,6 14,2 18,7 20,5 14,3 18,8 20,7 14,4 18,9 20,7 14,7 19,0 20,8 14,7 19,0 21,0 15,1 19,0 21,0 15,2 19,0 21,1 15,3 19,0 21,4 16,0 19,6 21,9 16,9 19,7 22,7 - Taux d'escompte % (options)
Comptons les fréquences.
Lors du comptage des fréquences, une situation peut survenir lorsque la valeur d'une caractéristique tombe à la limite d'un intervalle. Dans ce cas, vous pouvez vous laisser guider par la règle : une unité donnée est affectée à l'intervalle pour lequel sa valeur est la limite supérieure. Ainsi, la valeur 16,0 dans notre exemple fera référence au deuxième intervalle.
Tableau 3.14. | Répartition des banques commerciales par taux débiteur | Taux court, % |
---|---|---|
12,0-14,0 | 5 | 5 |
14,0-16,0 | 9 | 14 |
16,0-18,0 | 4 | 18 |
18,0-20,0 | 15 | 33 |
20,0-22,0 | 11 | 44 |
22,0-24,0 | 2 | 46 |
24,0-26,0 | 4 | 50 |
jusqu'à un an | 50 | - |
Nombre de banques, unités (fréquences)
Fréquences accumulées La dernière colonne du tableau présente les fréquences accumulées, qui sont obtenues en additionnant séquentiellement les fréquences à partir de la première (par exemple, pour le premier intervalle - 5, pour le deuxième intervalle 5 + 9 = 14, pour le troisième intervalle 5 + 9 + 4 = 18, etc.). La fréquence cumulée, par exemple 33, montre que 33 banques ont un taux de prêt qui ne dépasse pas 20 % (limite supérieure de l'intervalle correspondant). Dans le processus de regroupement des données lors de la construction de séries de variations, des intervalles inégaux sont parfois utilisés. Ceci s'applique aux cas où les valeurs d'une caractéristique obéissent à la règle de progression arithmétique ou géométrique ou lorsque l'application de la formule de Sturgess conduit à l'apparition de groupes d'intervalles « vides » qui ne contiennent pas une seule unité d'observation. Ensuite, les limites des intervalles sont fixées arbitrairement par le chercheur lui-même en fonction de
bon sens et les objectifs de l'enquête ou à l'aide de formules. Ainsi, pour les données qui changent selon une progression arithmétique, la taille des intervalles est calculée comme suit.Regroupement- c'est la division d'une population en groupes homogènes selon certaines caractéristiques.
- Objet de la prestation. Grâce au calculateur en ligne, vous pouvez :
- construire une série de variations
Instructions. Pour regrouper une série, vous devez sélectionner le type de série de variations obtenue (discrète ou intervalle) et indiquer la quantité de données (nombre de lignes). La solution obtenue est enregistrée dans un fichier Word (voir exemple de regroupement de données statistiques).
Si le regroupement a déjà été effectué et que le série à variation discrète ou série d'intervalles, vous devez alors utiliser le calculateur en ligne Indices de Variation. Tester l'hypothèse sur le type de distribution s'effectue à l'aide du service Etude du formulaire de répartition.
Types de regroupements statistiques
Série de variantes. En cas d'observations discrètes variable aléatoire le même sens peut être retrouvé plusieurs fois. De telles valeurs x i d'une variable aléatoire sont enregistrées en indiquant n i le nombre de fois où elle apparaît dans n observations, c'est la fréquence de cette valeur.Dans le cas d'une variable aléatoire continue, le regroupement est utilisé en pratique.
- Regroupement typologique- c'est la division de la population qualitativement hétérogène étudiée en classes, types socio-économiques, groupes d'unités homogènes. Pour construire ce regroupement, utilisez le paramètre Série de variations discrètes.
- Un regroupement est dit structurel, dans lequel une population homogène est divisée en groupes qui caractérisent sa structure selon des caractéristiques variables. Pour créer ce regroupement, utilisez le paramètre de série Intervalle.
- Un regroupement qui révèle les relations entre les phénomènes étudiés et leurs caractéristiques est appelé groupe analytique(voir regroupement analytique des séries).
Principes de construction de regroupements statistiques
Une série d’observations classées par ordre croissant est appelée série de variations.. Fonction de regroupement est une caractéristique par laquelle une population est divisée en groupes séparés. C'est ce qu'on appelle la base du groupe. Le regroupement peut être basé sur des caractéristiques à la fois quantitatives et qualitatives.Après avoir déterminé la base du regroupement, il convient de trancher la question du nombre de groupes en lesquels la population étudiée doit être divisée.
Lors de l'utilisation ordinateurs personnels Pour traiter les données statistiques, le regroupement des unités d'objets est effectué à l'aide de procédures standards.
L'une de ces procédures est basée sur l'utilisation de la formule de Sturgess pour déterminer le nombre optimal de groupes :
k = 1+3,322*log(N)
Où k est le nombre de groupes, N est le nombre d'unités de population.
La longueur des intervalles partiels est calculée comme h=(x max -x min)/k
Ensuite, le nombre d'observations qui tombent dans ces intervalles est compté, qui sont considérés comme des fréquences n i . Peu de fréquences dont les valeurs sont inférieures à 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Les valeurs médianes des intervalles x i =(c i-1 +c i)/2 sont prises comme nouvelles valeurs.
Une série de variations discrètes est construite pour des caractéristiques discrètes.
Afin de construire une série de variations discrètes, vous devez effectuer les étapes suivantes : 1) classer les unités d'observation par ordre croissant de la valeur étudiée de la caractéristique,
2) déterminer toutes les valeurs possibles de l'attribut x i , les classer par ordre croissant,
la valeur de l'attribut, je .
fréquence de la valeur de l'attribut et désigne f je . La somme de toutes les fréquences d’une série est égale au nombre d’éléments de la population étudiée.
Exemple 1 .
Liste des notes obtenues par les étudiants aux examens : 3 ; 4 ; 3 ; 5 ; 4 ; 2 ; 2 ; 4 ; 4 ; 3 ; 5 ; 2 ; 4 ; 5 ; 4 ; 3 ; 4 ; 3 ; 3 ; 4 ; 4 ; 2 ; 2 ; 5 ; 5 ; 4 ; 5 ; 2 ; 3 ; 4 ; 4 ; 3 ; 4 ; 5 ; 2 ; 5 ; 5 ; 4 ; 3 ; 3 ; 4 ; 2 ; 4 ; 4 ; 5 ; 4 ; 3 ; 5 ; 3 ; 5 ; 4 ; 4 ; 5 ; 4 ; 4 ; 5 ; 4 ; 5 ; 5 ; 5.
Voici le numéro X - gradeest une variable aléatoire discrète, et la liste d'estimations résultante estdonnées statistiques (observables) .
classer les unités d'observation par ordre croissant de la valeur caractéristique étudiée :
2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.
2) déterminer toutes les valeurs possibles de l'attribut x i, les classer par ordre croissant :
Dans cet exemple, toutes les estimations peuvent être divisées en quatre groupes avec les valeurs suivantes : 2 ; 3 ; 4 ; 5.
La valeur d'une variable aléatoire correspondant à un groupe particulier de données observées est appelée la valeur de l'attribut, option (option) et désigner x je .
Un nombre qui montre combien de fois la valeur correspondante d'une caractéristique apparaît dans un certain nombre d'observations est appelé fréquence de la valeur de l'attribut et désigne f je .
Pour notre exemple
le score 2 se produit - 8 fois,
le score 3 apparaît - 12 fois,
le score 4 apparaît - 23 fois,
la note 5 se produit - 17 fois.
Il y a 60 notes au total.
4) écrire les données reçues dans un tableau de deux lignes (colonnes) - x i et f i.
Sur la base de ces données, il est possible de construire une série de variations discrètes
Série à variation discrète – il s'agit d'un tableau dans lequel les valeurs apparaissant de la caractéristique étudiée sont indiquées sous forme de valeurs individuelles par ordre croissant et leurs fréquences
Construction d'une série de variations d'intervalles
En plus des séries de variations discrètes, une méthode de regroupement de données telle qu'une série de variations d'intervalle est souvent rencontrée.
Une série d'intervalles est construite si :
le signe a un caractère continu de changement ;
Il y avait beaucoup de valeurs discrètes (plus de 10)
les fréquences des valeurs discrètes sont très petites (ne dépassent pas 1-3 avec un nombre relativement grand d'unités d'observation) ;
de nombreuses valeurs discrètes d'une caractéristique avec les mêmes fréquences.
Une série de variations d'intervalles est un moyen de regrouper des données sous la forme d'un tableau comportant deux colonnes (les valeurs d'une caractéristique sous la forme d'un intervalle de valeurs et la fréquence de chaque intervalle).
Contrairement à une série discrète, les valeurs d'attribut d'une série d'intervalles ne sont pas présentées valeurs distinctes, mais un intervalle de valeurs (« de - à »).
Le nombre qui montre combien d'unités d'observation sont tombées dans chaque intervalle sélectionné est appelé fréquence de la valeur de l'attribut et désigne f je . La somme de toutes les fréquences d'une série est égale au nombre d'éléments (unités d'observation) dans la population étudiée.
Si une unité a une valeur caractéristique égale à la limite supérieure de l'intervalle, elle doit alors être affectée à l'intervalle suivant.
Par exemple, un enfant mesurant 100 cm tombera dans le 2ème intervalle, et non dans le premier ; et un enfant mesurant 130 cm tombera dans le dernier intervalle, et non dans le troisième.
Sur la base de ces données, il est possible de construire une série de variations d'intervalles.
Chaque intervalle a une limite inférieure (xn), une limite supérieure (xv) et une largeur d'intervalle ( je).
La limite d'intervalle est la valeur de l'attribut qui se trouve à la frontière de deux intervalles.
taille des enfants (cm) |
taille des enfants (cm) |
nombre d'enfants |
||
plus de 130 | ||||
Si un intervalle a une limite supérieure et inférieure, alors il est appelé intervalle fermé. Si un intervalle n'a qu'une limite inférieure ou supérieure, alors c'est - intervalle ouvert. Seul le tout premier ou le tout dernier intervalle peut être ouvert. Dans l'exemple ci-dessus, le dernier intervalle est ouvert.
Largeur d'intervalle (je) – la différence entre les limites supérieure et inférieure.
je = x n - x dans
La largeur de l’intervalle ouvert est supposée être la même que la largeur de l’intervalle fermé adjacent.
taille des enfants (cm) |
nombre d'enfants |
Largeur d'intervalle (i) |
|
pour les calculs 130+20=150 |
20 (car la largeur de l'intervalle fermé adjacent est de 20) |
||
Toutes les séries d'intervalles sont divisées en séries d'intervalles à intervalles égaux et en séries d'intervalles à intervalles inégaux. . Dans les lignes espacées à intervalles égaux, la largeur de tous les intervalles est la même. Dans les séries d'intervalles à intervalles inégaux, la largeur des intervalles est différente.
Dans l'exemple considéré, une série d'intervalles avec des intervalles inégaux.
2. Le concept de série de distribution. Séries de distribution discrète et par intervalles
Lignes de distribution sont appelés groupes type spécial, dans lequel pour chaque caractéristique, groupe de caractéristiques ou classe de caractéristiques, le nombre d'unités du groupe est connu ou densité spécifique ce nombre au total. Ceux. série de distribution– un ensemble ordonné de valeurs d'attribut, classées par ordre croissant ou décroissant avec leurs pondérations correspondantes. Les séries de distribution peuvent être construites soit par des caractéristiques quantitatives, soit par des caractéristiques d'attribut.
Les séries de distribution construites sur une base quantitative sont appelées séries de variation. Ils arrivent discret et intervalle. Une série de distribution peut être construite sur la base d'une caractéristique variant continuellement (lorsque la caractéristique peut prendre n'importe quelle valeur dans n'importe quel intervalle) et sur une caractéristique variant discrètement (elle prend des valeurs entières strictement définies).
Discret Une série de variations d'une distribution est un ensemble classé d'options avec leurs fréquences ou particularités correspondantes. Les variantes d'une série discrète sont des valeurs discrètement changeantes d'une caractéristique, généralement le résultat d'un décompte.
Discret
Les séries de variations sont généralement construites si les valeurs de la caractéristique étudiée peuvent différer les unes des autres d'au moins un certain montant fini. Dans les séries discrètes, les valeurs ponctuelles de la caractéristique sont spécifiées. Exemple : Répartition des costumes pour hommes vendus par les magasins par mois par taille.Intervalle
Une série de variations est un ensemble ordonné d'intervalles de variation des valeurs d'une variable aléatoire avec les fréquences ou fréquences correspondantes des valeurs de la variable tombant dans chacune d'elles. Les séries d'intervalles sont conçues pour analyser la distribution d'une caractéristique en constante évolution, dont la valeur est le plus souvent enregistrée par mesure ou pesée. Les variantes d'une telle série sont des groupements.Exemple : Répartition des achats en épicerie par montant.
Si dans les séries à variations discrètes, la réponse en fréquence se rapporte directement à une variante de la série, alors dans les séries à intervalles, elle fait référence à un groupe de variantes.
Il est pratique d'analyser les séries de distribution à l'aide de leur représentation graphique, ce qui permet de juger de la forme de la distribution et des modèles. Série discrète représenté sur le graphique par une ligne brisée – polygone de distribution. Pour le construire, dans un système de coordonnées rectangulaires, les valeurs classées (ordonnées) de la caractéristique variable sont tracées le long de l'axe des abscisses sur la même échelle, et une échelle d'expression des fréquences est tracée le long de l'axe des ordonnées.
Les séries d'intervalles sont représentées par histogrammes de distribution(c'est-à-dire des graphiques à barres).
Lors de la construction d'un histogramme, les valeurs des intervalles sont tracées sur l'axe des abscisses et les fréquences sont représentées par des rectangles construits sur les intervalles correspondants. La hauteur des colonnes, en cas d'intervalles égaux, doit être proportionnelle aux fréquences.
N'importe quel histogramme peut être converti en polygone de distribution ; pour ce faire, il faut relier les sommets de ses rectangles par des segments droits.
2. Méthode d'indexation pour analyser l'influence de la production moyenne et de l'effectif moyen sur l'évolution du volume de production
Méthode d'indexation utilisé pour analyser la dynamique et comparer les indicateurs généraux, ainsi que les facteurs influençant l'évolution des niveaux de ces indicateurs. À l'aide d'indices, il est possible d'identifier l'influence de la production moyenne et de l'effectif moyen sur l'évolution du volume de production. Ce problème est résolu en construisant un système d'indices analytiques.
L'indice de volume de production est lié au nombre moyen d'employés et l'indice de production moyen de la même manière que le volume de production (Q) est lié à la production ( w) et des chiffres ( r) .
On peut conclure que le volume de production sera égal au produit de la production moyenne par l'effectif moyen :
Q = w r, où Q est le volume de production,
w - rendement moyen,
r – nombre moyen d'employés.
Comme vous pouvez le voir, nous parlons de sur la relation des phénomènes en statique : le produit de deux facteurs donne le volume total du phénomène résultant. Il est également évident que cette connexion est fonctionnelle ; c'est pourquoi la dynamique de cette connexion est étudiée à l'aide d'indices. Pour l'exemple donné, il s'agit du système suivant :
Jw × Jr = Jwr.
Par exemple, l'indice de volume de production Jwr, en tant qu'indice d'un phénomène productif, peut être décomposé en deux indices factoriels : l'indice de production moyenne (Jw) et l'indice d'effectif moyen (Jr) :
Indice Indice Indice
volume de la masse salariale moyenne
numéro de production
Où J. w- indice de productivité du travail calculé selon la formule de Laspeyres ;
Jr.- indice du nombre d'employés, calculé selon la formule Paasche.
Les systèmes d'indices permettent de déterminer l'influence de facteurs individuels sur la formation du niveau d'un indicateur de performance ; ils permettent de déterminer la valeur d'une inconnue à partir de 2 valeurs d'indice connues.
Sur la base du système d'indices ci-dessus, on peut également trouver l'augmentation absolue du volume de production, décomposée en influence de facteurs.
1. Augmentation générale du volume de production :
∆wr = ∑w 1 r 1 - ∑w 0 r 0 .
2. Augmentation due à l'action de l'indicateur de production moyenne :
∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .
3. Augmentation due à l'action de l'indicateur d'effectif moyen :
∆wr/r = ∑w 0 r 1 - ∑w 0 r 0
∆wr = ∆wr/w + ∆wr/r.
Exemple. Les données suivantes sont connues
Nous pouvons déterminer comment le volume de production a changé en termes relatifs et absolus et comment des facteurs individuels ont influencé ce changement.
Le volume de production était de :
dans la période de base
w 0 * r 0 = 2000 * 90 = 180 000,
et dans les rapports
w 1 * r 1 = 2100 * 100 = 210 000.
Par conséquent, le volume de production a augmenté de 30 000 ou 1,16 %.
∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000
ou (210 000 : 180 000)*100 %=1,16 %.
Cette évolution du volume de production est due à :
1) une augmentation de l'effectif moyen de 10 personnes soit 111,1%
r 1 / r 0 = 100 / 90 = 1,11 ou 111,1 %.
En termes absolus, grâce à ce facteur, le volume de production a augmenté de 20 000 :
w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20000.
2) une augmentation de la production moyenne de 105 % ou 10 000 :
w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1,05 ou 105 %.
En termes absolus, l'augmentation est de :
w 1 r 1 – w 0 r 1 = (w 1 -w 0)r 1 = (2100-2000)*100 = 10000.
Ainsi, l’influence combinée des facteurs était la suivante :
1. En termes absolus
10000 + 20000 = 30000
2. En termes relatifs
1,11 * 1,05 = 1,16 (116%)
L'augmentation est donc de 1,16 %. Les deux résultats ont été obtenus précédemment.
Le mot «index» en traduction signifie pointeur, indicateur. En statistique, un indice est interprété comme un indicateur relatif qui caractérise l'évolution d'un phénomène dans le temps, dans l'espace ou par rapport à un plan. Puisque l'index est une valeur relative, les noms des indices correspondent aux noms des valeurs relatives.
Dans les cas où nous analysons les évolutions au fil du temps de produits comparables, nous pouvons nous demander comment conditions différentes(sur divers domaines) les composantes de l'évolution de l'indice (prix, volume physique, structure de production ou de ventes espèce individuelle produits). À cet égard, des indices de composition constante, de composition variable et de changements structurels sont construits.
Index de composition permanente (fixe) – c'est un indice qui caractérise la dynamique taille moyenne avec la même structure de population fixe.
Le principe de construction d'un indice à composition constante est d'éliminer l'impact des changements de structure des poids sur la valeur indexée en calculant le niveau moyen pondéré de l'indicateur indexé avec les mêmes poids.
L'indice à composition constante est de forme identique à l'indice agrégé. La forme globale est la plus courante.
L'indice à composition constante est calculé avec des poids fixés au niveau d'une période et montre uniquement l'évolution de la valeur indexée. L'indice à composition constante élimine l'impact des changements de structure des poids sur la valeur indexée en calculant le niveau moyen pondéré de l'indicateur indexé avec les mêmes poids. Les indices de composition constante comparent des indicateurs calculés sur la base d'une structure constante de phénomènes.