Statistisk Språk-Spredningsmål

Hva er spredningsmål?
Spredningsmål beskriver hvor like eller varierte settet av observerte verdier er for en bestemt variabel (dataelement). Spredningsmål inkluderer rekkevidde, kvartil og interkvartilområde, varians og standardavvik.
Når kan vi måle spredning?spredningen av verdiene kan måles for kvantitative data, da variablene er numeriske og kan ordnes i en logisk rekkefølge med en lav endeverdi og en høy endeverdi.
Hvorfor måler vi spredning?Oppsummering av datasettet kan hjelpe oss med å forstå dataene, spesielt når datasettet er stort. Som omtalt i Mål På Sentral Tendens side, modus, median, og mener oppsummerer dataene i en enkelt verdi som er typisk eller representativ for alle verdiene i datasettet, men dette er bare en del av ‘bildet’ som oppsummerer et datasett. Spredningsmålinger oppsummerer dataene på en måte som viser hvor spredt verdiene er og hvor mye de skiller seg fra middelverdien.

for eksempel:

Datasett A
Datasett B
4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11

modusen (hyppigste verdi), median (mellomverdi*) og gjennomsnittlig (aritmetisk gjennomsnitt) for begge datasettene er 6.
(*merk, medianen for et jevnt nummerert datasett beregnes ved å ta gjennomsnittet av de to midterste observasjonene).hvis vi bare så på tiltakene av sentral tendens, kan vi anta at datasettene er de samme.
Men hvis vi ser på spredningen av verdiene i følgende graf, kan vi se At Datasett B er mer spredt enn Datasett A. Brukt sammen, tiltakene av sentrale tendens og tiltak for spredning hjelpe oss til å bedre forstå dataene

hva gjør hver måling av spredning fortelle oss?
området er forskjellen mellom den minste verdien og den største verdien i et datasett.

Beregning Av Området

Datasett A

4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8

området er 4, forskjellen mellom den høyeste verdien (8) og den laveste verdien (4).

Datasett B

1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11

området er 10, forskjellen mellom den høyeste verdien (11) og den laveste verdien (1).

Dataset A
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Dataset B
0 1 2 3 4 5 6 7 8 9 10 11 12 13

På en tallinje kan du se at verdiområdet For Datasett B er større Enn Datasett A.

Kvartiler deler et ordnet datasett i fire like deler, og refererer til verdiene til punktet mellom kvartalene. Et datasett kan også deles inn i kvintiler (fem like deler) eller desiler (ti like deler).

Quartiles
25% of values
Q1
25% of values
Q2
25% of values
Q3
25% of values

The lower quartile (Q1) is the point between the lowest 25% of values and the highest 75% of verdier. Det kalles også den 25. persentilen.

den andre kvartilen (Q2) er midten av datasettet. Det kalles også den 50.persentilen, eller medianen.
øvre kvartil (Q3) er punktet mellom laveste 75% og høyeste 25% av verdiene. Det kalles også den 75. persentilen.

Calculating Quartiles

7

Dataset A
4 5 5
Q1
5 6 6
Q2
6 6 7
Q3
7 8

som kvartilpunktet faller mellom to verdier, er gjennomsnittet (gjennomsnittet) av disse verdiene kvartilverdien:
Q1 = (5+5) / 2 = 5
Q2 = (6+6) / 2 = 6
Q3 = (7+7) / 2 = 7

Dataset B
1 2 3
Q1
4 5 6
Q2
6 7 8
Q3
9 11

Som Kvartilpunktet faller mellom to verdier, er gjennomsnittet (gjennomsnittet) av disse verdiene kvartilverdien:
q1 = (3+4) / 2 = 3.5
Q2 = (6+6) / 2 = 6
Q3 = (8+9) / 2 = 8.5

interkvartilområdet (IQR) er forskjellen mellom øvre (Q3) og nedre (q1) kvartiler, og beskriver de midterste 50% av verdiene når de bestilles fra laveste til høyeste. IQR er ofte sett på som et bedre mål på spredning enn området som det ikke påvirkes av uteliggere.

Interquartile Range
25% of values
Q1
25% of values
Q2
25% of values
Q3
25% of values

Calculating the Interquartile Range

The IQR for Dataset A is = 2
IQR = Q3-Q1
= 7-5
= 2
IQR for Datasett B er = 5
IQR = Q3-Q1
= 8,5-3,5
= 5
variansen og standardavviket er mål for spredning av dataene rundt gjennomsnittet. De oppsummerer hvor nær hver observerte dataverdi er til middelverdien.
i datasett med liten spredning er alle verdier svært nær gjennomsnittet, noe som resulterer i en liten varians og standardavvik. Når et datasett er mer spredt, spres verdiene lenger bort fra gjennomsnittet, noe som fører til større varians og standardavvik.
jo mindre variansen og standardavviket er, desto mer er gjennomsnittsverdien indikativ for hele datasettet. Derfor, hvis alle verdier i et datasett er de samme, er standardavviket og variansen null.
standardavviket for en normalfordeling gjør det mulig for oss å beregne konfidensintervaller. I en normalfordeling er omtrent 68% av verdiene innenfor en standardavvik hver side av gjennomsnittet og omtrent 95% av poengene er innenfor to standardavvik av gjennomsnittet.
populasjonsvariansen σ2 (uttalt sigma kvadrert) av et diskret sett med tall uttrykkes med følgende formel:
Bilde: Ligning
Hvor:
Xi representerer ith-enheten, fra den første observasjonen til den siste
μ representerer populasjonsgjennomsnittet
N representerer antall enheter i befolkningen
Variansen av et utvalg s2 (uttalt s kvadrert) uttrykkes med en litt annen formel:
bilde; ligning
hvor: x representerer prøven gjennomsnittet n representerer antall enheter i prøven
standardavviket er kvadratroten av variansen. Standardavviket for en populasjon er representert ved σ, og standardavviket for et utvalg er representert ved s.

Calculating the Population Variance σ2 and Standard Deviation σ
Dataset A

Calculate the population mean (μ) of Dataset A.
(4 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 7 + 7 + 7 + 8) / 12
gjennomsnitt (μ) = 6
Beregn avviket fra de enkelte verdiene fra gjennomsnittet ved å trekke gjennomsnittet fra hver verdi i datasettet
= -2, -1, -1, -1, 0, 0, 0, 0, 1, 1, 1, 2
Kvadrat hver enkelt avvik verdi
= 4, 1, 1, 1, 0, 0, 0, 0, 1,1,1, 4
Beregn gjennomsnittet av de kvadrerte avviksverdiene
=
(4 + 1 +1 +1 + 0 + 0 + 0 + 0 +1 +1 +1 + 4) / 12
varians σ2= 1.17
Beregn kvadratroten av variansen
Standardavvik σ = 1.08

Datasett B

Beregn populasjonsgjennomsnittet (μ) Av Datasett B.
(1 + 2 + 3 + 4 + 5 + 6 + 6 + 7 + 8 + 9 + 10 + 11) / 12
gjennomsnitt (μ) = 6
Beregn avviket fra de enkelte verdiene fra gjennomsnittet ved å trekke gjennomsnittet fra hver verdi i datasettet
= -5, -4, -3, -2, -1, 0, 0, 1, 2, 3, 4, 5,
Kvadrat hver enkelt avvik verdi
= 25, 16, 9, 4, 1, 0, 0, 1, 4, 9, 16, 25
Beregn gjennomsnittet av de kvadrerte avviksverdiene
=
(25 + 16 + 9 + 4 + 1 + 0 + 0 + 1 + 4 + 9 + 16 + 25) / 12
varians σ2 = 9.17
Beregn kvadratroten av variansen
Standardavvik σ = 3.03

den større Variansen Og Standardavviket I Datasett b viser videre at Datasett B er mer spredt enn Datasett A.
Gå tilbake Til Statistisk Språk Hjemmeside



Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.