lecture1
Lecture1
Tipos de escalas & niveles de medición
Variables discretas y continuas
El texto de Daniel distingue entre variables discretas y continuas. Se trata de distinciones técnicas que no serán tan importantes para nosotros en esta clase. Según el texto, las variables discretas son variables en las que no hay valores intermedios posibles. Por ejemplo, el número de llamadas telefónicas que recibe por día. No puede recibir llamadas telefónicas 6.3. Las variables continuas son todo lo demás; cualquier variable que teóricamente pueda tener valores en puntos intermedios (por ejemplo, entre 153 y 154 libras). por ejemplo). Resulta que esto no es una distinción tan útil para nuestros propósitos. Lo que realmente es más importante para las consideraciones estadísticas es el nivel de medición utilizado. Cuando digo que es más importante, realmente he subestimado esto.Comprender el nivel de medición de una variable (o escala o medida) es la primera y más importante distinción que se debe hacer sobre una variable cuando se realizan estadísticas.
Niveles de medición
Los estadísticos a menudo se refieren a los «niveles de medición» de una variable, una medida o una escala para distinguir entre variables medidas que tienen propiedades diferentes. Hay cuatro niveles básicos: nominal, ordinal,intervalo y relación.
Nominal
Una variable medida en una escala «nominal» es una variable que no tiene realmente ninguna distinción evaluativa. Un valor no es realmente mayor que otro. Un buen ejemplo de una variable nominal issex (o género). La información en un conjunto de datos sobre el sexo generalmente se codifica como 0 o 1, 1indicando al hombre y 0 indicando a la mujer (o al revés 0 0 para el hombre, 1 para la mujer). 1 en este caso es un valor arbitrario y no es mayor que 0. Solo hay una diferencia nominal entre 0 y 1. Con variables nominales, hay una diferencia cualitativa entre los valores, no una cuantitativa.
Ordinal
Algo medido en una escala» ordinal » tiene una connotación evaluativa. Un valor es mayor o mayor o mejor que el otro. El producto A es preferido sobre el producto B, y por lo tanto A recibe un valor de 1 y B recibe un valor de 2. Otro ejemplo podría ser calificar la satisfacción de su trabajo en una escala de 1 a 10, con 10 que representa satisfacción completa. Con las escalas ordinales, solo sabemos que 2 es mejor que 1 o 10 es mejor que 9; no sabemos por cuánto. Puede variar. La distancia entre 1 y 2 puede ser más corta que entre 9 y 10.
Intervalo
Una variable medida en una escala de intervalos proporciona información sobre más o mejor calidad como lo hacen las escalas ordinarias, pero las variables de intervalo tienen una distancia igual entre cada valor.La distancia entre 1 y 2 es igual a la distancia entre 9 y 10.La temperatura usando Celsius o Fahrenheit es un buen ejemplo, existe la misma diferencia exacta entre 100 grados y 90, ya que hay entre 42 y 32.
Ratio
Algo medido en una escala de ratio tiene las mismas propiedades que una escala de intervalo, excepto que, con una escala de ratio, hay un punto cero absoluto. La temperatura medida en Kelvin es un ejemplo. Hay novalue posible por debajo de 0 grados Kelvin, es cero absoluto. El peso es otro ejemplo, 0 libras. es una ausencia significativa de peso. El saldo de su cuenta bancaria es otro. Aunque puede tener un saldo de cuenta negativo o positivo, existe un significado definido y no bitrario de un saldo de cuenta de 0.
Uno puede pensar en nominal, ordinal, intervalo y relación como si se clasificaran en su relación entre sí. La relación es más sofisticada que el intervalo, el intervalo es más sofisticado que el ordinal y el ordinal es más sofisticado que el nominal. No se si las filas son iguales o no, probablemente no. Entonces, ¿qué tipo de nivel de medición es este rango de niveles de medición?? Diría ordinal. En estadísticas, es mejor ser un poco conservador cuando hay dudas.
Dos Clases de Variables generalistas (¿A quién le importa?)
Ok, ¿recuerdas que dije que esta es la primera y más importante distinción cuando se usan estadísticas? He aquí por qué. En su mayor parte, los estadígrafos o investigadores terminan preocupándose solo por la diferencia entre lo nominal y lo demás. Generalmente hay dos clases de estadísticas: las que tratan con variables dependientes nominales y las que tratan con variables ordinales, de intervalo o de razón. (Ahora mismo nos centraremos en la variable dependiente y más tarde discutiremos la variable independiente). Cuando describo estos tipos de dos clases generales de variables, yo (y muchas otras) generalmente me refiero a ellas como» categóricas «y » continuas».»(A veces utilizo «dicotómico» en lugar de «categórico»). Tenga en cuenta también que»continuo» en este sentido no es exactamente lo mismo que»continuo» utilizado en el capítulo 1 del texto cuando se distingue entre discreto y continuo. Es un término mucho más flexible. Categórico ydicotómico generalmente significa que una escala es nominal. Las variables «continuas» suelen ser aquellas que son ordinales o mejores.
Las escalas ordinales con pocas categorías (2,3, o posiblemente 4) y las medidas nominales a menudo se clasifican como categóricas y se analizan utilizando la clase binomial de pruebas estadísticas, mientras que las escalas ordinales con muchas categorías (5 o más), intervalo y razón, generalmente se analizan con la clase teórica normal de pruebas estadísticas. Aunque la distinción es un tanto difusa, a menudo es una distinción muy útil para elegir la prueba estadística correcta. Hay una serie de estadísticas especiales que se han desarrollado para tratar variables ordinales con solo unos pocos valores posibles, pero no las vamos a cubrir en esta clase (ver Agresti, 1984, 1990; O’Connell, 2006; Wickens,1989 para más información sobre el análisis de variables ordinales).
Clases generales de Estadística (Oh, Supongo que me importa)
Bien, así que tenemos estas dos categorías generales (es decir,continua y categórica), ¿qué sigue next? Bueno, esta distinción (por difusa que suene) tiene implicaciones muy importantes para el tipo de procedimiento estadístico utilizado y tomaremos decisiones basadas en esta distinción durante todo el curso. Hay dos clases generales de estadística: las basadas en teoría binomial y las basadas en teoría normal. El Chi-cuadrado y la regresión logística se ocupan de la teoría binomial o de las distribuciones binomiales, y las pruebas t,ANOVA, correlación y regresión se ocupan de la teoría normal. Así que aquí hay una tabla para resumir.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Algunos ejemplos comunes En la práctica real, los investigadores y los problemas de investigación de la vida real no le dicen cómo se deben categorizar las variables dependientes, por lo que describiré algunos tipos de preguntas de encuesta u otras medidas que se usan comúnmente.
Sí/NoQuestions
Cualquier pregunta de una encuesta que tenga un sí o un no como posible respuesta es nominal, por lo que se aplicarán estadísticas binomiales siempre que una sola pregunta de sí/no sirva como variable dependiente o una de las variables dependientes en un análisis.
Escalas Likert
Un tipo especial de pregunta de encuesta utiliza un conjunto de respuestas que se ordenan de modo que una respuesta sea mayor que otra. La escala Term Likert lleva el nombre del inventor Rensis Likert, cuyo nombre se pronuncia «Lickert».»Generalmente, el cardo se usa para cualquier pregunta que tenga aproximadamente 5 o más opciones posibles. Un ejemplo podría ser: «¿Cómo calificaría a su administrador de departamento?»1 = muy incompetente, 2 = algo incompetente, 3=no competente, 4=algo competente, o 5 = muy competente. Las escalas de Likert son ordinales o de intervalo, y muchos psicómetras podrían argumentar que son escalas de intervalo porque, cuando están bien construidas, hay una distancia igual entre cada valor. Por lo tanto, si se utiliza una escala Likert como variable dependiente en un análisis, se utilizan estadísticas de teoría normal, como ANOVA o regresión.
Medidas físicas
La mayoría de las medidas físicas, como la altura, el peso,la presión arterial sistólica, la distancia, etc., son intervalos o ratioscales, por lo que entran en la categoría general «continua». Por lo tanto, las estadísticas de tipo teórico normal también se utilizan cuando una medida de este tipo sirve como variable dependiente en un análisis.
Los recuentos
son complicados. Si una variable se mide por conteo, como en el caso de que un investigador esté contando el número de días que un paciente hospitalario ha sido hospitalizado, la variable se encuentra en una escala de proporción y se trata como variable continua. Sin embargo, a menudo se recomiendan estadísticas especiales, porque las variables contables a menudo tienen una distribución muy sesgada con un gran número de casos con un recuento cero (véase Agresti, 1990, p. 125; Cohen, Cohen, West, & Aiken, 2003, capítulo 13). Si un investigador está contando el número de sujetos en un experimento (o el número de casos en el conjunto de datos), no se está utilizando realmente una medida de tipo continuo. Contar en este caso es realmente examinar la frecuencia en la que se produce algún valor de una variable. Por ejemplo,contar el número de sujetos en el conjunto de datos que informan haber sido hospitalizados en el último año, se basa en una variable dicotómica en el conjunto de datos que significa estar hospitalizado o no hospitalizado (p. ej., de preguntas como » ¿ha sido hospitalizado en el último año?»).Incluso si uno tuviera que contar el número de casos basándose en la pregunta «cuántos días en el último año ha estado hospitalizado», que es una medida continua, la variable que se utiliza en el análisis no es realmente esta variable continua. En su lugar, el investigador estaría analizando una variable micotómica contando el número de personas que no habían sido hospitalizadas en el último año (0 días) frente a las que lo habían sido (1 o más días).