Dispersion til grupperede data bestemmes af formlen. Dispersion diskret tilfældig variabel
Dispersion i statistik Placeret som individuelle tegn på pladsen fra. Afhængigt af de oprindelige data bestemmes det af formlerne af enkle og suspenderede dispersioner:
1. (For ikke-grænse-data) beregnes med formlen:
2. Vægtet dispersion (for variationsserier):
hvor n er frekvensen (repeterbarhed af faktor X)
Et eksempel på at finde dispersion
Denne side beskriver et standard eksempel på en dispersion, du kan også se andre opgaver for at finde den.
Eksempel 1. Der er følgende data om en gruppe på 20 studerende i korrespondanceafdelingen. Det er nødvendigt at opbygge en intervallrække af funktionsfordelingen, beregne den gennemsnitlige karakteristiske værdi og udforske dens dispersion
Build Interval Grouping. Vi definerer omfanget af intervallet med formlen:
hvor X Max er den maksimale værdi af grupperingsfunktionen;
X min-minimumsværdi af en grupperingsfunktion;
n - Antal intervaller:
Tag n \u003d 5. Trin er: H \u003d (192 - 159) / 5 \u003d 6.6
Lav en intervallgruppe
For yderligere beregninger opbygger vi et datterselskab:
X'i-melleminterval. (for eksempel midten af \u200b\u200bintervallet 159 - 165,6 \u003d 162,3)
Den gennemsnitlige vækststørrelse af eleverne bestemmer formlen for den gennemsnitlige aritmetiske vægtning:
Bestem dispersionen med formlen:
Dispersionsformel kan omdannes så:
Fra denne formel følger det det dispersion er ligning Forskellen mellem kvadraterne fra firkanterne af muligheder og firkantet og medium.
Dispersion i variations rækker Ved lige intervaller kan det ifølge metoden af \u200b\u200bøjeblikke beregnes ved den følgende fremgangsmåde under anvendelse af de anden egenskab af dispersionen (opdeling af alle varianterne ved størrelsen af \u200b\u200bintervallet). BeslutningsdefinitionBeregnet ved metoden for øjeblikke, ifølge følgende formel mindre tidskrævende:
hvor jeg er størrelsen af \u200b\u200bintervallet;
A - betinget nul, som er bekvemt at bruge midten af \u200b\u200bintervallet, der har størst frekvens;
M1 - firkanten af \u200b\u200bden første rækkefølge
M2 - øjeblikket af den anden rækkefølge
(Hvis i et statistisk sæt ændres tegnene på en sådan måde, at der kun er to gensidigt eksklusive valgmuligheder, så kaldes en sådan variabilitet alternativ) kan beregnes ved formlen:
At erstatte denne formel dispersion q \u003d 1- P, vi får:
Typer af dispersion
Total dispersion Måler variationen af \u200b\u200bfunktionen langs hele totaliteten som helhed under påvirkning af alle faktorer, der bestemmer denne variation. Det er lig med den gennemsnitlige firkant af afvigelser af individuelle værdier af funktionen af \u200b\u200bX fra den samlede middelværdi af X og kan defineres som en simpel dispersion eller suspenderet dispersion.
karakteriserer en tilfældig variation, dvs. En del af variationen, hvilket skyldes påvirkning af uaccounted faktorer og uafhængige af tegnfaktoren, der ligger i bunden af \u200b\u200bgrupperingen. En sådan dispersion er lig med den gennemsnitlige firkant af afvigelser af individuelle værdier af funktionen inde i gruppen X fra den midterste aritmetiske gruppe og kan beregnes som en simpel dispersion eller som en vægtet dispersion.
På denne måde, undergroup dispersionsforanstaltninger. Variation af en funktion inde i gruppen og bestemmes af formlen:
hvor XI er et gruppe gennemsnit
Ni - antallet af enheder i gruppen.
For eksempel er koncerninterne dispersioner, der skal bestemmes i forbindelse med at studere virkningen af \u200b\u200barbejdskvalifikationer for arbejdsproduktivitet i værkstedet, viser variationer af produktion i hver gruppe forårsaget af alle mulige faktorer (teknisk tilstand af udstyr, sikkerhedsværktøjer og materialer, den ALDRIG ARBEJDSTAGER, ARBEJDSINSTRUKTION mv.) Ud over forskellene i den kvalificerede udledning (inde i gruppen har alle arbejdstagere de samme kvalifikationer).
Gennemsnittet af indvendige gruppedispersioner afspejler tilfældige, dvs. den del af den variation, der opstod under påvirkning af alle andre faktorer, med undtagelse af grupperingsfaktoren. Det beregnes ved formlen:
Det karakteriserer den systematiske variation af en effektiv funktion, som skyldes indflydelsen af \u200b\u200ben tegnfaktor, der er lagt i bunden af \u200b\u200bgrupperingen. Det er lig med den gennemsnitlige firkant af afvigelser i gruppens gennemsnit fra det samlede gennemsnit. Intergruppedispersion beregnes ved formlen:
Tilsætningsregel af dispersion i statistik
Ifølge additionsregel dispersioner Den samlede dispersion er lig med summen af \u200b\u200bgennemsnittet af koncerninterne og intergruppedispersioner:
Betydningen af \u200b\u200bdenne regel Det er, at den samlede dispersion, der opstår under påvirkning af alle faktorer, er lig med mængden af \u200b\u200bdispersioner, der opstår under påvirkning af alle andre faktorer og dispersion, der opstår fra grupperingsfaktoren.
Ved anvendelse af formlen til tilsætning af dispersioner kan man bestemme ved to kendte dispersioner af det tredje ukendte, såvel som at bedømme styrken af \u200b\u200bindflydelsen af \u200b\u200ben grupperingsfunktion.
Egenskaber ved dispersion
1. Hvis alle tegnværdierne reduceres (forstørre) på samme konstantværdi, ændres dispersionen ikke.
2. Hvis alle funktionerne er reduceret (zoom) til samme antal gange n, vil dispersionen falde i overensstemmelse hermed (stigning) i N ^ 2 gange.
Trin.
Beregning af prøvedispersion
-
Skriv ned prøveværdierne. I de fleste tilfælde er kun prøver af visse generelle aggregater tilgængelige for statistikker. For eksempel analyserer statistikker ikke omkostningerne ved indholdet af totaliteten af \u200b\u200balle biler i Rusland - de analyserer den stikprøve på flere tusinde biler. En sådan prøve vil hjælpe med at bestemme de gennemsnitlige udgifter til bilen, men sandsynligvis vil den opnåede værdi være langt fra ægte.
- For eksempel analyserer vi antallet af boller, der sælges i en café i 6 dage taget i tilfældig rækkefølge. Prøven har følgende formular: 17, 15, 23, 7, 9, 13. Dette er en prøve, ikke en totalitet, fordi vi ikke har nogen data om Bun solgt til hver dag i cafe.
- Hvis du får en totalitet, og ikke en prøve af værdier, skal du gå til næste afsnit.
-
Optag formlen for at beregne prøvedispersionen. Dispersionen er et mål for spredning af visse værdier. Jo tættere værdien af \u200b\u200bdispersionen til nul, jo tættere er værdien grupperet sammen til hinanden. Arbejde med en prøve af værdier, brug følgende formel til at beregne dispersionen:
- S 2 (\\ DisplayStyle S ^ (2)) = ∑[( X i (\\ displaystyle x_ (i)) - x) 2 (\\ displayStyle ^ (2))] / (n - 1)
- S 2 (\\ DisplayStyle S ^ (2)) - Dette er en dispersion. Dispersionen måles i firkantede måleenheder.
- X i (\\ displaystyle x_ (i)) - Hver værdi i prøven.
- X i (\\ displaystyle x_ (i)) Det er nødvendigt at trække X̅, bygge en firkant og derefter folde de opnåede resultater.
- x̅ - selektiv gennemsnit (gennemsnitlig prøveværdi).
- n - antallet af værdier i prøven.
-
Beregn den gennemsnitlige prøveværdi. Det er angivet som x̅. Den gennemsnitlige prøveudtagningsværdi beregnes som det sædvanlige aritmetiske gennemsnit: Fold alle værdierne i prøven, og resultatet er derefter divideret med antallet af værdier i prøven.
- I vores eksempel skal du folde værdierne i prøven: 15 + 17 + 23 + 7 + 9 + 13 \u003d 84
Nu er resultatet divideret med antallet af værdier i prøven (i vores eksempel, de er 6): 84 ÷ 6 \u003d 14.
Selektiv gennemsnit X̅ \u003d 14. - Selektivt gennemsnit er en central værdi omkring hvilke værdier der distribueres i prøven. Hvis værdierne i prøven er grupperet omkring prøvemediet, er dispersionen lille; Ellers er dispersionen stor.
- I vores eksempel skal du folde værdierne i prøven: 15 + 17 + 23 + 7 + 9 + 13 \u003d 84
-
Slet det valgte gennemsnit af hver værdi i prøven. Nu beregne forskellen X i (\\ displaystyle x_ (i)) - X̅, hvor X i (\\ displaystyle x_ (i)) - Hver værdi i prøven. Hvert resultat opnået vidner om afvigelsen af \u200b\u200ben bestemt værdi fra prøvemediet, det vil sige, hvor langt denne værdi er fra den gennemsnitlige prøveværdi.
- I vores eksempel:
X 1 (\\ displayStyle x_ (1)) - x̅ \u003d 17 - 14 \u003d 3
x 2 (\\ displayStyle x_ (2)) - X̅ \u003d 15 - 14 \u003d 1
x 3 (\\ displayStyle x_ (3)) - x̅ \u003d 23-14 \u003d 9
x 4 (\\ displayStyle x_ (4)) - X̅ \u003d 7 - 14 \u003d -7
x 5 (\\ displayStyle x_ (5)) - X̅ \u003d 9 - 14 \u003d -5
X 6 (\\ DISPLAYSTYLE X_ (6)) - X̅ \u003d 13 - 14 \u003d -1 - Korrektheden af \u200b\u200bde opnåede resultater er let at kontrollere, da deres sum skal være nul. Dette skyldes definitionen af \u200b\u200bmiddelværdien, da negative værdier (afstande fra gennemsnitsværdien til mindre værdier) fuldt ud kompenseres af positive værdier (afstande fra gennemsnitsværdien til store værdier).
- I vores eksempel:
-
Som nævnt ovenfor, mængden af \u200b\u200bforskelle X i (\\ displaystyle x_ (i)) - X̅ skal være nul. Det betyder, at den gennemsnitlige dispersion altid er lig med nul, hvilket ikke giver nogen ide om at sprede værdierne af en vis mængde. For at løse dette problem, tag hver forskel til pladsen X i (\\ displaystyle x_ (i)) - X. Dette vil føre til, at du kun vil modtage positive tal, der, når du tilføjer, aldrig give 0.
- I vores eksempel:
( X 1 (\\ displayStyle x_ (1)) - x) 2 \u003d 3 2 \u003d 9 (\\ displayStyle ^ (2) \u003d 3 ^ (2) \u003d 9)
(x 2 (\\ displayStyle (x_ (2)) - x) 2 \u003d 1 2 \u003d 1 (\\ displayStyle ^ (2) \u003d 1 ^ (2) \u003d 1)
9 2 = 81
(-7) 2 = 49
(-5) 2 = 25
(-1) 2 = 1 - Du fandt en firkant af forskellen - x̅) 2 (\\ displayStyle ^ (2)) For hver værdi i prøven.
- I vores eksempel:
-
Beregn summen af \u200b\u200bkvadraterne af forskelle. Det vil sige, find den del af formlen, der er skrevet som følger: Σ [( X i (\\ displaystyle x_ (i)) - x) 2 (\\ displayStyle ^ (2))]. Her betyder tegnet σ summen af \u200b\u200bkvadraterne af forskellene for hver værdi X i (\\ displaystyle x_ (i)) I prøven. Du har allerede fundet kvadrater af forskelle (X i (\\ displayStyle (x_ (i)) - x) 2 (\\ displayStyle ^ (2)) For hver værdi. X i (\\ displaystyle x_ (i)) i prøven; Nu bare folde disse firkanter.
- I vores eksempel: 9 + 1 + 81 + 49 + 25 + 1 \u003d 166 .
-
Det resulterende resultat er opdelt i N-1, hvor n er antallet af værdier i prøven. For nogen tid siden, for at beregne dispersionen af \u200b\u200bstatistikken, var resultatet simpelthen på n; I dette tilfælde vil du modtage den gennemsnitlige størrelse af dispersionsfirkanten, som er ideel til at beskrive dispersionen af \u200b\u200bdenne prøve. Men husk at enhver prøve kun er en lille del af det generelle sæt værdier. Hvis du tager en anden prøve og udfører de samme beregninger, vil du modtage et andet resultat. Som det viste sig, giver opdeling på n - 1 (og ikke bare på n) en mere præcis vurdering af dispersionen af \u200b\u200bden generelle befolkning, som du er interesseret i. Opdelingen på N - 1 blev generelt accepteret, så den er inkluderet i formlen til beregning af prøvedispersionen.
- I vores eksempel omfatter prøven 6 værdier, det vil sige n \u003d 6.
Prøveudtagning Dispersion \u003d. S2 \u003d 166 6 - 1 \u003d (\\ DisplayStyle S ^ (2) \u003d (\\ frac (166) (6-1)) \u003d) 33,2
- I vores eksempel omfatter prøven 6 værdier, det vil sige n \u003d 6.
-
Forskelsdispersion fra standardafvigelse. Bemærk, at formlen er til stede i formlen, så dispersionen måles i firkantede enheder til måling af den analyserede værdi. Nogle gange er en sådan størrelse ret vanskelig at betjene; I sådanne tilfælde skal du bruge standardafvigelsen, som er lige så kvadratisk rod fra dispersionen. Derfor er prøvedispersionen angivet som S 2 (\\ DisplayStyle S ^ (2)), og standardafvigelsen af \u200b\u200bprøven - som S (\\ displaystyle s).
- I vores eksempel er standardafvigelsen af \u200b\u200bprøven: S \u003d √33,2 \u003d 5,76.
Beregning af spredning af aggregat
-
Analysere nogle totalitet af værdier. Aggregationen omfatter alle værdier af den pågældende værdi. For eksempel, hvis du studerer alder af beboere i Leningrad-regionen, omfatter aggregatet alderen af \u200b\u200balle beboere i dette område. I tilfælde af at arbejde med et sæt anbefales det at oprette et bord og lave et sæt totalitet. Overvej følgende eksempel:
- Der er 6 akvarier i et værelse. I hvert akvarium lever følgende antal fisk:
X 1 \u003d 5 (\\ DISPLAYSTYLE X_ (1) \u003d 5)
x 2 \u003d 5 (\\ displayStyle x_ (2) \u003d 5)
x 3 \u003d 8 (\\ displayStyle x_ (3) \u003d 8)
x 4 \u003d 12 (\\ displayStyle x_ (4) \u003d 12)
X 5 \u003d 15 (\\ DISPLAYSTYLE X_ (5) \u003d 15)
x 6 \u003d 18 (\\ displayStyle x_ (6) \u003d 18)
- Der er 6 akvarier i et værelse. I hvert akvarium lever følgende antal fisk:
-
Skriv ned formlen for at beregne dispersionen af \u200b\u200bden generelle befolkning. Da kombinationen indeholder alle værdier af en vis værdi, giver formlen nedenfor dig mulighed for at opnå den nøjagtige værdi af dispersionen af \u200b\u200bsættet. For at skelne dispersionen af \u200b\u200bet sæt prøveudtagningsdispersion (hvis værdi kun estimeres), bruger statistikken forskellige variabler:
- σ 2 (\\ displayStyle ^ (2)) = (∑( X i (\\ displaystyle x_ (i)) - μ) 2 (\\ displayStyle ^ (2))) / N.
- σ 2 (\\ displayStyle ^ (2)) - Dispersion af aggregatet (læs som "Sigma i en firkant"). Dispersionen måles i firkantede måleenheder.
- X i (\\ displaystyle x_ (i)) - Hver værdi på aggregatet.
- Σ - tegn på beløbet. Det vil sige fra hver værdi X i (\\ displaystyle x_ (i)) Det er nødvendigt at trække μ, bygge en firkant og derefter folde de opnåede resultater.
- μ er den gennemsnitlige indstillede værdi.
- n - antallet af værdier i den generelle befolkning.
-
Beregn den gennemsnitlige værdi af totaliteten. Når du arbejder med det generelle sæt, er dets gennemsnitlige værdi angivet som μ (MJ). Den gennemsnitlige indstillede værdi beregnes som den sædvanlige gennemsnitlige aritmetik: Fold alle værdierne i den generelle befolkning, og derefter er resultatet divideret med antallet af værdier i det generelle sæt.
- Husk på, at gennemsnitsværdierne ikke altid beregnes som det aritmetiske gennemsnit.
- I vores eksempel er middelværdien af \u200b\u200btotaliteten: μ \u003d 5 + 5 + 8 + 12 + 15 + 18 6 (\\ displayStyle (\\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
-
Slet den gennemsnitlige indstillede værdi fra hver værdi i den generelle befolkning. Jo tættere værdien af \u200b\u200bforskellen til nul, jo tættere den specifikke værdi til den gennemsnitlige værdi af totaliteten. Find forskellen mellem hver værdi i aggregeret og dens gennemsnitlige værdi, og du vil modtage den første ide om distribution af værdier.
- I vores eksempel:
X 1 (\\ displayStyle x_ (1)) - μ \u003d 5 - 10,5 \u003d -5,5
x 2 (\\ displayStyle x_ (2)) - μ \u003d 5 - 10,5 \u003d -5,5
x 3 (\\ displayStyle x_ (3)) - μ \u003d 8 - 10,5 \u003d -2,5
x 4 (\\ displayStyle x_ (4)) - μ \u003d 12 - 10,5 \u003d 1,5
x 5 (\\ displayStyle x_ (5)) - μ \u003d 15 - 10,5 \u003d 4,5
X 6 (\\ DISPLAYSTYLE X_ (6)) - μ \u003d 18 - 10,5 \u003d 7,5
- I vores eksempel:
-
Ørepladsen hvert resultat. Forskellenværdierne vil være både positive og negative; Hvis du anvender disse værdier til den numeriske lige, vil de ligge til højre og til venstre for den gennemsnitlige værdi af sættet. Dette er ikke egnet til beregning af dispersionen, da positive og negative tal kompenserer hinanden. Derfor tage en firkant hver forskel for at få usædvanligt positive tal.
- I vores eksempel:
( X i (\\ displaystyle x_ (i)) - μ) 2 (\\ displayStyle ^ (2)) For hver værdi af sættet (fra I \u003d 1 til I \u003d 6):
(-5,5) 2 (\\ displayStyle ^ (2)) = 30,25
(-5,5) 2 (\\ displayStyle ^ (2))hvor x n (\\ displaystyle x_ (n)) - sidste værdi i den generelle befolkning. - For at beregne gennemsnitsværdien af \u200b\u200bresultaterne skal du finde deres sum og opdele den på n: ((( X 1 (\\ displayStyle x_ (1)) - μ) 2 (\\ displayStyle ^ (2)) + ( x 2 (\\ displayStyle x_ (2)) - μ) 2 (\\ displayStyle ^ (2)) + ... + ( x n (\\ displaystyle x_ (n)) - μ) 2 (\\ displayStyle ^ (2))) / N.
- Skriv nu ned forklaringen ved hjælp af variabler: (Σ ( X i (\\ displaystyle x_ (i)) - μ) 2 (\\ displayStyle ^ (2))) / N, og vi får en formel til beregning af spredningen af \u200b\u200btotaliteten.
- I vores eksempel:
Ifølge den selektive undersøgelse var indskydere grupperet i form af depositum i Sberbank af byen:
Bestemme:
1) Variation Variation;
2) den gennemsnitlige indlånsstørrelse
3) den gennemsnitlige lineære afvigelse
4) Dispersion;
5) Sekundær kvadratisk afvigelse;
6) Variationskoefficienten.
Afgørelse:
Dette distributionsområde indeholder åbne intervaller. I sådanne rækker er størrelsen af \u200b\u200bintervallet af den første gruppe betinget af værdien af \u200b\u200bdet efterfølgende interval, og størrelsen af \u200b\u200bintervallet af den sidste gruppe er lig med størrelsen af \u200b\u200bintervallet af den foregående.
Størrelsen af \u200b\u200bgruppens anden gruppe er 200, derfor er mængden af \u200b\u200bden første gruppe også lig med 200. Størrelsen af \u200b\u200bintervallet af den næstsidste gruppe er 200, hvilket betyder, at det sidste interval vil have en værdi svarende til 200 .
1) Vi vil definere variationsomfanget som en forskel mellem det største og det mindste tegn på funktionen:
Omfanget af variationen af \u200b\u200bbidragsstørrelsen er 1000 rubler.
2) Den gennemsnitlige indlånsstørrelse bestemmes af formlen for den gennemsnitlige aritmetiske vægtning.
Tidligere bestemmer den diskrete værdi af træk i hvert interval. For at gøre dette, ifølge den midterste aritmetiske formel, vil vi finde midten af \u200b\u200bintervallerne.
Den gennemsnitlige værdi af det første interval vil være:
andet - 500 osv.
Lad os indtaste resultaterne af beregningerne i tabellen:
Depositumstørrelse, gnid. | Antallet af indskydere, f | Melleminterval, X | xf. |
---|---|---|---|
200-400 | 32 | 300 | 9600 |
400-600 | 56 | 500 | 28000 |
600-800 | 120 | 700 | 84000 |
800-1000 | 104 | 900 | 93600 |
1000-1200 | 88 | 1100 | 96800 |
TOTAL | 400 | - | 312000 |
Den gennemsnitlige depositum i byens sberbank vil være 780 rubler:
3) Den gennemsnitlige lineære afvigelse er det gennemsnitlige aritmetiske af absolutte afvigelser af individuelle værdier af funktionen i det samlede gennemsnit:
Fremgangsmåden til beregning af den gennemsnitlige afbøjningslinongo i fordelingsområdet for fordelingen er som følger:
1. Den gennemsnitlige aritmetiske vægtning beregnes som vist i stk. 2).
2. De absolutte afvigelser bestemmes ud fra gennemsnittet:
3. De opnåede afvigelser multipliceres med frekvenser:
4. Der er en sum af vejede afvigelser uden at tage hensyn til tegnet:
5. Mængden af \u200b\u200bvægtede afvigelser er opdelt i frekvenser:
Det er praktisk at bruge den beregnede datatabel:
Depositumstørrelse, gnid. | Antallet af indskydere, f | Melleminterval, X | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 480 | 15360 |
400-600 | 56 | 500 | -280 | 280 | 15680 |
600-800 | 120 | 700 | -80 | 80 | 9600 |
800-1000 | 104 | 900 | 120 | 120 | 12480 |
1000-1200 | 88 | 1100 | 320 | 320 | 28160 |
TOTAL | 400 | - | - | - | 81280 |
Den gennemsnitlige lineære afvigelse af Sberbanks kunders bidrag er 203.2 rubler.
4) Dispersion er de gennemsnitlige aritmetiske firkanter af afvigelser af hver tegnværdi fra den midterste aritmetik.
Beregningen af \u200b\u200bdispersionen i intervalfordeling rækkerne er lavet af formlen:
Proceduren for beregning af dispersionen i dette tilfælde er følgende:
1. Bestem den gennemsnitlige aritmetiske vægtede, som vist i stk. 2).
2. Find afvigelsesmulighed fra gennemsnittet:
3. Tidligt afvigelser af hver valgmulighed fra gennemsnittet:
4. Flere kvadrater til vægtafvigelser (frekvenser):
5. Slankende de opnåede værker:
6. Den resulterende mængde er opdelt i summation (frekvenser):
Beregninger, der skal udstedes i tabellen:
Depositumstørrelse, gnid. | Antallet af indskydere, f | Melleminterval, X | |||
---|---|---|---|---|---|
200-400 | 32 | 300 | -480 | 230400 | 7372800 |
400-600 | 56 | 500 | -280 | 78400 | 4390400 |
600-800 | 120 | 700 | -80 | 6400 | 768000 |
800-1000 | 104 | 900 | 120 | 14400 | 1497600 |
1000-1200 | 88 | 1100 | 320 | 102400 | 9011200 |
TOTAL | 400 | - | - | - | 23040000 |
Variationsomfang (eller variationsvariation) - Dette er forskellen mellem de maksimale og minimale funktionsværdier:
I vores eksempel er variationen af \u200b\u200budskiftningsarbejderes produktion: i den første brigade r \u003d 105-95 \u003d 10 børn, i den anden brigade r \u003d 125-75 \u003d 50 børn. (5 gange mere). Dette tyder på, at udviklingen af \u200b\u200bden 1. brigade er mere "stabil", men reserverne af produktionsvækst mere ved den anden brigade, fordi Hvis alle arbejdstagere opnås af alle arbejdere for denne brigade, kan den fremstilles 3 * 125 \u003d 375 dele, og i 1. brigade kun 105 * 3 \u003d 315 dele.
Hvis de ekstreme tegn på attributten ikke er typiske for aggregatet, anvendes derefter lejligheden eller decile gynger. Lejligheden RQ \u003d Q3-Q1 dækker 50% af det samlede volumen, den afgørende spænding er den første RD1 \u003d D9-D1) på 80% af dataene, den anden decile Raman RD2 \u003d D8-D2 er 60%.
Ulempen ved indikatoren for variationsskalaen er, men at dens værdi ikke afspejler alle oscillationerne i funktionen.
Den enkleste opsummerende indikator, der afspejler alle tegn på funktionen, er medium lineær afvigelse, der repræsenterer de gennemsnitlige aritmetiske absolutte afvigelser i den enkelte mulighed fra deres gennemsnitlige størrelse:
,
For grupperede data
,
hvor XI er værdien af \u200b\u200btegnet i den diskrete række eller midten af \u200b\u200bintervallet i intervalfordelingen.
I de ovennævnte formler af forskellen i tælleren er modulet taget, ellers ifølge egenskaben af \u200b\u200bden midterste aritmetik, vil tælleren altid være nul. Derfor anvendes den gennemsnitlige lineære afbøjning i statistisk praksis sjældent, kun i tilfælde, hvor opsummeringen af \u200b\u200bindikatorerne uden hensyntagen til tegnet har en økonomisk betydning. Med sin hjælp analyseres sammensætningen af \u200b\u200barbejdet, produktionens rentabilitet, omsætning af udenrigshandel.
Dispersion funktion - Dette er gennemsnittet af afvigelsesmuligheden fra deres gennemsnitlige størrelse:
Enkel dispersion
,
Vægtet dispersion
.
Formlen til beregning af dispersionen kan forenkles:
Således er dispersionen lig med forskellen i midten af \u200b\u200bkvadratmuligheden og kvadratet af gennemsnittet af kombinationen:
.
På grund af summen af \u200b\u200bfirkanterne af afvigelser giver dispersionen imidlertid en forvrænget forståelse af afvigelserne, derfor beregnes den på grundlag af gennemsnittet kvadratisk afvigelse.som viser, hvor mange i gennemsnitlige specifikke muligheder for en funktion fra deres gennemsnitlige værdi afvises. Det beregnes ved at udvinde kvadratrot fra dispersionen:
For ikke-store data
,
For variationsserie
Jo mindre værdien af \u200b\u200bdispersionen og den gennemsnitlige kvadratiske afvigelse, jo mere ensartet totaliteten, jo mere pålidelige (typiske) vil der være en gennemsnitsværdi.
Den gennemsnitlige lineære og sekundære kvadratiske afvigelse er de navngivne numre, dvs. er udtrykt i tegn på tegnene, identiske i indhold og tæt på værdi.
Beregn den absolutte variationsindikatorer anbefales ved hjælp af tabeller.
Tabel 3 - Beregning af variationens egenskaber (på eksemplet på dataene dvisching af erstatningsværkstedet af arbejdstagernes brigader)
Antal arbejdstagere. |
Melleminterval |
Beregnede værdier |
|||||
TOTAL: |
Medium minedriftarbejdere:
Medium lineær afvigelse:
Dispersion af produktion:
Den gennemsnitlige kvadratiske afvigelse af produktionen af \u200b\u200bindividuelle arbejdstagere fra den gennemsnitlige produktion:
.
1 Beregning af dispersion ved metoden af \u200b\u200bøjeblikke
Beregningen af \u200b\u200bdispersioner er forbundet med omfangsrige beregninger (især hvis gennemsnitsværdien udtrykkes i et stort antal med flere decimaler). Beregninger kan forenkles, hvis der anvendes en forenklet formel og dispersionsegenskaber.
Dispersionen har følgende egenskaber:
- hvis alle tegnværdier reduceres eller øges med samme værdi A, vil dispersionen ikke falde fra dette:
,
, derefter Or.
Ved anvendelse af spredningens egenskaber og reducer først alle varianterne af sættet med værdien af \u200b\u200bA, og derefter opdeler værdien af \u200b\u200bintervallet H, opnår vi formlen til beregning af dispersionen i variationsrækker med lige intervaller moment af øjeblikke:
,
hvor - dispersionen beregnet ved metoden for øjeblikke
H - størrelsen af \u200b\u200bintervallet af variationsserien;
- nye (transformerede) værdier
En-permanent værdi, som bruger midten af \u200b\u200bintervallet med den højeste frekvens; enten muligheden med den højeste frekvens;
- firkanten af \u200b\u200bden første rækkefølge
- Moment af anden ordre.
Udfør beregningen af \u200b\u200bdispersionen ved metode til øjeblikke baseret på data på erstatningsværkets værksted for arbejdstagernes brigader.
Tabel 4 - Beregning af dispersionen ved metode til øjeblikke
Arbejdsmoderingsgrupper, stykker. |
Antal arbejdstagere. |
Melleminterval |
Beregnede værdier |
||
Beregningsprocedure:
- beregn dispersion:
2 Beregning af dispersionen af \u200b\u200ben alternativ funktion
Blandt de tegn, der studeres af statistikker, er der også dem, der er særegne for kun to gensidigt eksklusive betydninger. Disse er alternative tegn. Det er vedhæftet henholdsvis to kvantitative værdier: Valgmuligheder 1 og 0. Valgmets frekvens 1, som betegnes med P, er andelen af \u200b\u200benheder med denne funktion. Forskellen 1-p \u003d q er hyppigheden af \u200b\u200bmuligheder 0. Således,
Xi. |
|
Gennemsnitlig aritmetisk alternativ funktion
, T. K. P + q \u003d 1.
Dispersion af en alternativ funktion
fordi 1-p \u003d q
Således er dispersionen af \u200b\u200ben alternativ funktion lig med arbejdet i andelen af \u200b\u200benheder med denne funktion, og aktierne i enheder, der ikke har denne funktion.
Hvis 1 og 0 værdier er lige forskellige, når det er p \u003d q, når dispersionen sin maksimale PQ \u003d 0,25.
Dispersionen af \u200b\u200ben alternativ funktion anvendes i selektive undersøgelser, for eksempel produktkvalitet.
3 intergruppedispersion. Lov om tilsætning af dispersioner
Dispersion, i modsætning til andre karakteristika for variationen, er en additiv værdi. Det er i aggregatet, som er opdelt i grupper efter faktor h. , dispersion af produktiv funktion y.det kan dekomponeres på dispersionen i hver gruppe (koncernen) og dispersion mellem grupper (intergroup). Så sammen med undersøgelsen af \u200b\u200bvariationen af \u200b\u200bfunktionen langs hele helheden som helhed bliver det muligt at studere variationen i hver gruppe såvel som mellem disse grupper.
Total dispersionmåler variationen af \u200b\u200bfunktionen w. Langs hele kombinationen under påvirkning af alle faktorer, der forårsagede denne variation (afvigelser). Det er lig med den gennemsnitlige firkant af afvigelser af individuelle værdier af funktionen w. Fra det samlede gennemsnit og kan beregnes som en simpel eller suspenderet dispersion.
Intergruppedispersion karakteriserer variationen af \u200b\u200bpræstationen w.forårsaget af indflydelse af en tegnfaktor h.baseret på gruppering. Det karakteriserer variationen af \u200b\u200bgruppens gennemsnit og svarer til gennemsnittet af gruppens gennemsnitlige afvigelser fra det samlede gennemsnit:
,
hvor er den gennemsnitlige aritmetiske I-den gruppe;
- antallet af enheder i I-den pågældende gruppe (Frekvens af I-Thit Group)
- Samlet gennemsnitligt aggregat.
Undergroup Dispersion Afspejler den tilfældige variation, dvs. den del af variationen, som skyldes påvirkning af uaccounted faktorer og ikke afhænger af tegnfaktoren baseret på grupperingen. Det karakteriserer variationen af \u200b\u200bindividuelle værdier i forhold til gruppens gennemsnit, er lig med den gennemsnitlige firkant af afvigelser af individuelle karakteristiske værdier w. Inde i gruppen fra den midterste aritmetik af denne gruppe (gruppe gennemsnit) og beregnes som en simpel eller suspenderet dispersion for hver gruppe:
eller ,
Hvor er antallet af enheder i gruppen.
Baseret på koncernens dispersioner for hver gruppe kan du bestemme generelt midten af \u200b\u200bkoncerninterne dispersioner:
.
Forholdet mellem den tre dispersion blev kaldt regler for additionsdispersionerIfølge hvilken den samlede dispersion er lig med summen af \u200b\u200bintergruppedispersionen og gennemsnittet af koncernens dispersioner:
Eksempel. Ved undersøgelse af indflydelsen af \u200b\u200btariferingen (kvalifikationer) for arbejdstagere blev følgende data opnået til udførelsen af \u200b\u200bderes arbejdskraft.
Tabel 5 - Distribution af arbejdstagere i midten af \u200b\u200bhourgenerering.
№ P / P. |
Drift 4. kategorier |
5. kategori |
|||||
Udvikle. |
Udvikle. |
||||||
1 |
7 |
7-10=-3 |
9 |
1 |
14 |
14-15=-1 |
1 |
I dette eksempel er arbejdere opdelt i to grupper på faktoren h.- Kvalifikationer, som er kendetegnet ved deres udledning. Executive-funktion - Udvikling - varierer både under dens indflydelse (intergruppevariation) og på bekostning af andre tilfældige faktorer (koncernen variation). Opgaven er at måle disse variationer ved hjælp af tre dispersioner: Generelt, Intergroup og UNTAGROUP. Den empiriske bestemmelseskoefficient viser andelen af \u200b\u200bvariationen af \u200b\u200bproduktet w.under påvirkning af en faktor h.. Resten af \u200b\u200bden samlede variation w.forårsaget af at ændre andre faktorer.
I eksemplet er den empiriske bestemmelseskoefficient:
eller 66,7%,
Det betyder, at 66,7% variation af arbejdsproduktivitetsarbejdere skyldes forskelle i kvalifikationer og med 33,3% - indflydelsen af \u200b\u200bandre faktorer.
Empirisk korrelation Viser tætheden af \u200b\u200bforholdet mellem gruppering og effektive funktioner. Beregnet som rodpladsen fra den empiriske bestemmelseskoefficient:
Empirisk korrelationsindstilling, som kan tage værdier fra 0 til 1.
Hvis der ikke er nogen forbindelse, så \u003d 0. I dette tilfælde, \u003d 0, det vil sige, er gruppens gennemsnit svarende til hinanden, og intergruppevariationen er ikke. Det betyder et grupperingsskilt - faktoren påvirker ikke dannelsen af \u200b\u200ben fælles variation.
Hvis forbindelsen er funktionel, så \u003d 1. I dette tilfælde er dispersionen af \u200b\u200bgruppemiddel gennemsnitlig lig med den generelle dispersion (), det vil sige, at der ikke er nogen koncernagen variation. Det betyder, at grupperingsfunktionen helt bestemmer variationen af \u200b\u200bden studerede karakteristiske funktion.
Jo tættere værdien af \u200b\u200bkorrelationsforholdet til en, jo mere tættere, tættere på funktionalitetsforholdet mellem tegnene.
For en kvalitativ vurdering af stramt af forholdet mellem tegn anvendes rotter af CADDOKA.
I eksemplet. Hvad vidner om den tætte forbindelse mellem arbejdskapaciteten hos arbejdstagere og deres kvalifikationer.
Spredning Tilfældig variabel - Foranstaltning af spredningen af \u200b\u200bdette tilfældig variabel, det er hende afvigelse fra matematisk forventning. I statistikker til udpegning af dispersionen anvendes betegnelsen (Sigma på pladsen) ofte. Kvadratisk rod af dispersion, lige hedder standardafvigelse eller standard scatter. Standardafvigelsen måles i de samme enheder som den tilfældige variabel selv, og dispersionen måles i kvadraterne af denne måleenhed.
Selv om det er meget bekvemt at bruge kun en værdi til at vurdere hele prøven (f.eks. Den gennemsnitlige værdi eller mode og median), kan denne tilgang nemt føre til forkerte udgange. Årsagen til denne stilling er ikke i størst grad, men i det faktum, at en værdi ikke afspejler spredning af dataværdier.
For eksempel i prøven:
den gennemsnitlige værdi er 5.
Men i selve prøven er der ikke et enkelt element med en værdi 5. Du skal muligvis kende graden af \u200b\u200bnærhed af hvert element i prøven til dens gennemsnitlige værdi. Eller med andre ord skal du kende variansdispersionen. At kende graden af \u200b\u200bdataændringer, kan du blive bedre fortolket betyde, median. og mode. Graden af \u200b\u200bændring af prøveudtagningsværdier bestemmes ved beregning af deres dispersion og standardafvigelse.
Dispersion og firkantet rod fra en dispersion kaldet standardafvigelse, karakteriserer den gennemsnitlige afvigelse fra den gennemsnitlige prøveværdi. Blandt disse to størrelser er den største værdi standardafvigelse. Denne værdi kan repræsenteres som den gennemsnitlige afstand, på hvilke elementer fra det gennemsnitlige prøveelement er placeret.
Dispersionen er vanskelig at fortolke meningsfuldt. Dog er kvadratroden af \u200b\u200bdenne værdi en standardafvigelse og er velegnet til fortolkning.
Standardafvigelsen beregnes ved først at bestemme dispersionen og derefter beregne kvadratroden fra dispersionen.
For eksempel, for arrayet af de data, der er vist i figuren, vil følgende værdier blive opnået:
Billede 1
Her er gennemsnitsværdien af \u200b\u200bkvadraterne af forskelle 717,43. For at opnå en standardafvigelse forbliver det kun at tage en firkantet rod af dette nummer.
Resultatet vil være ca. 26,78.
Det skal huskes, at standardafvigelsen fortolkes som den gennemsnitlige afstand, som genstande fra den gennemsnitlige prøveværdi er placeret.
Standardafvigelse viser, hvor godt den gennemsnitlige værdi beskriver hele prøven.
Antag at du er leder af fremstillingsafdelingen for forsamlingen af \u200b\u200bpc. Kvartalsrapporten fastslår, at frigivelsen for sidste kvartal udgjorde 2500 stk. Er det dårligt eller godt? Du spurgte (eller allerede i rapporten der er denne graf) i rapporten for at vise standardafvigelsen i henhold til disse data. Cifferet i standardafvigelsen er for eksempel 2000. Det bliver klart for dig som leder af afdelingen, at produktionslinjen kræver bedre kontrol (for store afvigelser i antallet af pc indsamlet).
Husk: Med en stor standardafvigelse er dataene bredt spredt i forhold til middelværdien og med små - de grupperes tæt på gennemsnitsværdien.
Fire statistiske funktioner af displayet (), en tvist (), Standotclone () og StandotClick () - er designet til at beregne dispersionen og standardafvigelsen af \u200b\u200btallene i celleintervallerne. Før du beregner dispersionen og standardafvigelsen for datasættet, er det nødvendigt at afgøre, om disse data repræsenterer det generelle sæt eller prøve fra den generelle befolkning. I tilfælde af en prøve fra den generelle befolkning skal funktionerne på displayet () og standotonclone () anvendes, og i tilfælde af det generelle sæt - Dispensens funktion () og Standoteloup ():
Generelt Aggregate. | Fungere |
| Dispen () |
| Stadothotlip () |
Prøve | |
| DIS () |
| Standotclone () |
Dispersionen (såvel som standardafvigelsen), som vi noterede, angiver, i hvilket omfang det beløb, der indgår i sæt af data, er spredt omkring den gennemsnitlige aritmetik.
En lille værdi af dispersionen eller standardafvigelsen angiver, at alle data er koncentreret omkring den gennemsnitlige aritmetik, og den store værdi af disse værdier er, at dataene er spredt i en bred vifte af værdier.
Dispersionen er ret vanskelig at fortolke meningsfuldt (hvad betyder det en lille værdi, stor værdi?). Ydeevne Opgaver 3.tillader visuelt på diagrammet, vis betydningen af \u200b\u200bdispersionen for et datasæt.
Opgaver.
· Øvelse 1.
· 2.1. Skrivning: Dispersion og standardafvigelse; Deres symbolske betegnelse med statistisk databehandling.
· 2.2. Arranger arbejdsarket i overensstemmelse med figur 1 og foretag de nødvendige beregninger.
· 2.3. Opret de grundlæggende formler, der anvendes i beregningerne
· 2.4. Forklar alle symbolerne (,,)
· 2.5. Beregn den praktiske betydning af begrebet dispersion og standardafvigelse.
Opgave 2.
1.1. Giv konceptet: Generelt Aggregate and Prøve; Matematisk forventning og aritmetisk gennemsnit af deres symbolske betegnelse med statistisk databehandling.
1.2. I overensstemmelse med figur 2, arranger et arbejdsark og foretag beregninger.
1.3. Opret de grundlæggende formler, der anvendes i beregningerne (for den generelle befolkning og prøve).
Figur 2.
1.4. Forklar hvorfor de gennemsnitlige aritmetiske værdier er mulige i prøver som 46,43 og 48,78 (se ansøgningsfilen). Drage konklusioner.
Opgave 3.
Der er to prøver med et andet datasæt, men gennemsnittet for dem vil være de samme:
Figur 3.
3.1. Arranger arbejdsarket i overensstemmelse med figur 3 og frembring de nødvendige beregninger.
3.2. Giv grundlæggende formler til beregning.
3.3. Byggrafik i overensstemmelse med figur 4, 5.
3.4. Forklar de opnåede afhængigheder.
3.5. Angiv lignende beregninger for to prøver.
Kildeprøve 11119999.
Værdierne for den anden prøve er valgt, således at det aritmetiske gennemsnit for den anden prøve var det samme, for eksempel:
Pick up værdierne for den anden prøve selv. Abonner og bygg grafer som figur 3, 4, 5. Vis de grundlæggende formler, der blev brugt ved beregning.
Træffe passende konklusioner.
Alle opgaver, der skal udstede i form af en rapport med alle nødvendige tegninger, grafer, formler og korte forklaringer.
Bemærk: Bygningsgrafer skal afklares med tegninger og korte forklaringer.