Linguagem estatística-medidas de propagação

Quais são as medidas de propagação?as medidas de spread descrevem como o conjunto de valores observados é semelhante ou variado para uma variável particular (item de dados). As medidas de propagação incluem a gama, quartis e a gama interquartil, variância e desvio-padrão.quando podemos medir a propagação?
O spread dos valores pode ser medido para dados quantitativos, como as variáveis são numéricas e podem ser organizadas em uma ordem lógica com um valor final baixo e um valor final elevado.por que medimos a propagação?resumir o conjunto de dados pode ajudar-nos a compreender os dados, especialmente quando o conjunto de dados é grande. Como discutido nas medidas da Página de tendência Central, o modo, a mediana e a média resumem os dados num único valor que é típico ou representativo de todos os valores do conjunto de dados, mas esta é apenas uma parte da “imagem” que resume um conjunto de dados. As medidas de divulgação resumem os dados de forma a mostrar a dispersão dos valores e a sua diferença em relação ao valor médio.

Por exemplo:

Um conjunto de dados
conjunto de dados B
4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11

O modo mais freqüente de valor), mediana (valor médio*) e a média (média aritmética) de ambos os conjuntos de dados é 6.
(*note, the median of an even numered data set is calculated by taking the mean of the middle two observations).If we just looked at the measures of central tendency, we may assum that the datasets are the same.
no Entanto, se olharmos para a propagação dos valores no gráfico a seguir, podemos ver que o conjunto de dados B é mais disperso do que o conjunto de dados A. Usadas em conjunto, as medidas de tendência central e medidas de dispersão nos ajuda a entender melhor os dados

o Que faz cada medida do spread nos dizer?
a gama é a diferença entre o menor valor e o maior valor em um conjunto de dados.

Calcular o Intervalo

Um conjunto de dados

4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8

O intervalo é de 4, a diferença entre o valor mais alto (8 ) e o valor mais baixo (4).

Dataset B

1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11

a gama é 10, a diferença entre o valor mais alto (11 ) e o valor mais baixo (1).

Dataset A
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Dataset B
0 1 2 3 4 5 6 7 8 9 10 11 12 13

Em uma linha de número, você pode ver que o intervalo de valores para o conjunto B é maior do que o conjunto de dados A.

Quartis dividem um conjunto de dados ordenados em quatro partes iguais, e referem-se aos valores de ponto entre os trimestres. Um conjunto de dados também pode ser dividido em quintis (cinco partes iguais) ou deciles (dez partes iguais).

Quartiles
25% of values
Q1
25% of values
Q2
25% of values
Q3
25% of values

The lower quartile (Q1) is the point between the lowest 25% of values and the highest 75% of valores. É também chamado de percentil 25. o segundo quartil (Q2) É o meio do conjunto de dados. É também chamado de percentil 50, ou mediana.o quartil superior (Q3) é o ponto entre o mais baixo 75% e o mais alto 25% dos valores. Também é chamado de percentil 75.

Calculating Quartiles

Dataset A
4 5 5
Q1
5 6 6
Q2
6 6 7
Q3
7 7 8

Como o quartil ponto de cair entre dois valores, o valor médio (média) dos valores é o valor quartil:
Q1 = (5+5) / 2 = 5
Q2 = (6+6) / 2 = 6
Q3 = (7+7) / 2 = 7

Dataset B
1 2 3
Q1
4 5 6
Q2
6 7 8
Q3
9 10 11

Como o quartil ponto de cair entre dois valores, o valor médio (média) dos valores é o valor quartil:
Q1 = (3+4) / 2 = 3.5
Q2 = (6+6) / 2 = 6
Q3 = (8+9) / 2 = 8.5

O intervalo interquartil (IQR) é a diferença entre a parte superior (Q3) e inferior (Q1) quartis, e descreve a média de 50% dos valores ordenados do menor para o maior. O QI é muitas vezes visto como uma melhor medida de propagação do que a gama, uma vez que não é afetado por valores anómalos.

Interquartile Range
25% of values
Q1
25% of values
Q2
25% of values
Q3
25% of values

Calculating the Interquartile Range

The IQR for Dataset A is = 2
IQR = Q3-Q1
= 7-5
= 2
The IQR for Dataset B is = 5
IQR = Q3 – Q1
= 8.5-3.5
= 5
The variance and the standard deviation are measures of the spread of the data around the mean. Resumem a proximidade entre cada valor observado e o valor médio. em conjuntos de dados com um pequeno spread todos os valores estão muito próximos da média, resultando em uma pequena variância e desvio padrão. Quando um conjunto de dados é mais disperso, os valores são distribuídos mais longe da média, levando a uma maior variância e desvio padrão.
quanto menor a variância e o desvio padrão, mais o valor médio é indicativo de todo o conjunto de dados. Portanto, se todos os valores de um conjunto de dados são os mesmos, o desvio padrão e a variância são zero.o desvio padrão de uma distribuição normal permite-nos calcular os intervalos de confiança. Em uma distribuição normal, cerca de 68% dos valores estão dentro de um desvio padrão de cada lado da média, e cerca de 95% das pontuações estão dentro de dois desvios-padrão da média.
A população Variância σ2 (pronuncia-sigma quadrado) de um conjunto discreto de números é expresso pela seguinte fórmula:
Imagem: Equação
em que:
Xi representa o i-ésima unidade, a partir da primeira observação para a última
µ representa a média da população
N representa o número de unidades na população
A Variância de uma amostra s2 (pronuncia-se s ao quadrado) é expresso por uma fórmula ligeiramente diferente:
Imagens; Equação
onde: o desvio padrão é a raiz quadrada da variância. O desvio-padrão para uma população é representado por σ, e o desvio-padrão para uma amostra é representado por S.

Calculating the Population Variance σ2 and Standard Deviation σ
Dataset A

Calculate the population mean (μ) of Dataset A.
(4 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 7 + 7 + 7 + 8) / 12
média (μ) = 6
Calcular o desvio dos valores individuais da média subtraindo-se a média de cada valor no conjunto de dados
= -2, -1, -1, -1, 0, 0, 0, 0, 1, 1, 1, 2
Quadrado de cada desvio individual valor
= 4, 1, 1, 1, 0, 0, 0, 0, 1,1,1, 4
Calcule a média dos quadrados do desvio de valores
=
(4 + 1 +1 +1 + 0 + 0 + 0 + 0 +1 +1 +1 + 4) / 12
Variância σ2= 1.17
Calcule the square root of the variance
Standard deviation σ = 1,08

Dataset B

Calcule the population mean (μ) of Dataset B.
(1 + 2 + 3 + 4 + 5 + 6 + 6 + 7 + 8 + 9 + 10 + 11) / 12
média (μ) = 6
Calcular o desvio dos valores individuais da média subtraindo-se a média de cada valor no conjunto de dados
= -5, -4, -3, -2, -1, 0, 0, 1, 2, 3, 4, 5,
Quadrado de cada desvio individual valor
= 25, 16, 9, 4, 1, 0, 0, 1, 4, 9, 16, 25
Calcule a média dos quadrados do desvio de valores
=
(25 + 16 + 9 + 4 + 1 + 0 + 0 + 1 + 4 + 9 + 16 + 25) / 12
Variância σ2 = 9.17
Calculate the square root of the variance
Standard deviation σ = 3.03

The larger Variance and Standard Deviation in Dataset B further demonstrates that Dataset B is more dispersed than Dataset A.
Return to Statistical Language Homepage



Deixe uma resposta

O seu endereço de email não será publicado.