Linguagem estatística-medidas de propagação
Quais são as medidas de propagação?as medidas de spread descrevem como o conjunto de valores observados é semelhante ou variado para uma variável particular (item de dados). As medidas de propagação incluem a gama, quartis e a gama interquartil, variância e desvio-padrão.quando podemos medir a propagação?
O spread dos valores pode ser medido para dados quantitativos, como as variáveis são numéricas e podem ser organizadas em uma ordem lógica com um valor final baixo e um valor final elevado.por que medimos a propagação?resumir o conjunto de dados pode ajudar-nos a compreender os dados, especialmente quando o conjunto de dados é grande. Como discutido nas medidas da Página de tendência Central, o modo, a mediana e a média resumem os dados num único valor que é típico ou representativo de todos os valores do conjunto de dados, mas esta é apenas uma parte da “imagem” que resume um conjunto de dados. As medidas de divulgação resumem os dados de forma a mostrar a dispersão dos valores e a sua diferença em relação ao valor médio.
Por exemplo:
O modo mais freqüente de valor), mediana (valor médio*) e a média (média aritmética) de ambos os conjuntos de dados é 6. |
o Que faz cada medida do spread nos dizer?
a gama é a diferença entre o menor valor e o maior valor em um conjunto de dados.
Calcular o Intervalo
Um conjunto de dados
4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
O intervalo é de 4, a diferença entre o valor mais alto (8 ) e o valor mais baixo (4). Dataset B
1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11
a gama é 10, a diferença entre o valor mais alto (11 ) e o valor mais baixo (1).
Em uma linha de número, você pode ver que o intervalo de valores para o conjunto B é maior do que o conjunto de dados A. |
Quartis dividem um conjunto de dados ordenados em quatro partes iguais, e referem-se aos valores de ponto entre os trimestres. Um conjunto de dados também pode ser dividido em quintis (cinco partes iguais) ou deciles (dez partes iguais).
Quartiles
|
||||||||||||||
25% of values
|
Q1
|
25% of values
|
Q2
|
25% of values
|
Q3
|
25% of values
|
The lower quartile (Q1) is the point between the lowest 25% of values and the highest 75% of valores. É também chamado de percentil 25. o segundo quartil (Q2) É o meio do conjunto de dados. É também chamado de percentil 50, ou mediana.o quartil superior (Q3) é o ponto entre o mais baixo 75% e o mais alto 25% dos valores. Também é chamado de percentil 75.
Calculating Quartiles
Como o quartil ponto de cair entre dois valores, o valor médio (média) dos valores é o valor quartil:
Como o quartil ponto de cair entre dois valores, o valor médio (média) dos valores é o valor quartil: |
O intervalo interquartil (IQR) é a diferença entre a parte superior (Q3) e inferior (Q1) quartis, e descreve a média de 50% dos valores ordenados do menor para o maior. O QI é muitas vezes visto como uma melhor medida de propagação do que a gama, uma vez que não é afetado por valores anómalos.
Interquartile Range
|
||||||||||||||
25% of values
|
Q1
|
25% of values
|
Q2
|
25% of values
|
Q3
|
25% of values
|
The IQR for Dataset A is = 2
IQR = Q3-Q1
= 7-5
= 2
The IQR for Dataset B is = 5
IQR = Q3 – Q1
= 8.5-3.5
= 5
The variance and the standard deviation are measures of the spread of the data around the mean. Resumem a proximidade entre cada valor observado e o valor médio. em conjuntos de dados com um pequeno spread todos os valores estão muito próximos da média, resultando em uma pequena variância e desvio padrão. Quando um conjunto de dados é mais disperso, os valores são distribuídos mais longe da média, levando a uma maior variância e desvio padrão.
quanto menor a variância e o desvio padrão, mais o valor médio é indicativo de todo o conjunto de dados. Portanto, se todos os valores de um conjunto de dados são os mesmos, o desvio padrão e a variância são zero.o desvio padrão de uma distribuição normal permite-nos calcular os intervalos de confiança. Em uma distribuição normal, cerca de 68% dos valores estão dentro de um desvio padrão de cada lado da média, e cerca de 95% das pontuações estão dentro de dois desvios-padrão da média.
A população Variância σ2 (pronuncia-sigma quadrado) de um conjunto discreto de números é expresso pela seguinte fórmula:
em que:
Xi representa o i-ésima unidade, a partir da primeira observação para a última
µ representa a média da população
N representa o número de unidades na população
A Variância de uma amostra s2 (pronuncia-se s ao quadrado) é expresso por uma fórmula ligeiramente diferente:
onde: o desvio padrão é a raiz quadrada da variância. O desvio-padrão para uma população é representado por σ, e o desvio-padrão para uma amostra é representado por S.
Calculating the Population Variance σ2 and Standard Deviation σ
|
|
Dataset A
Calculate the population mean (μ) of Dataset A. |
Dataset B
Calcule the population mean (μ) of Dataset B. |
The larger Variance and Standard Deviation in Dataset B further demonstrates that Dataset B is more dispersed than Dataset A.
Return to Statistical Language Homepage