vorlesung1
Vorlesung1
Arten von Skalen & Messniveaus
Diskrete undkontinuierliche Variablen
Daniels Text unterscheidet zwischen diskreten und kontinuierlichen Variablen. Dies sind technische Unterschiede, die uns in dieser Klasse nicht so wichtig sein werden. Diskrete Variablen sind laut Text Variablen, in denen es keine Zwischenwerte gibt. Zum Beispiel die Anzahl der Anrufe, die Sie pro Tag erhalten. Sie können keine 6.3-Telefonanrufe empfangen. Kontinuierliche Variablensind alles andere; jede Variable, die theoretisch Werte in betweenpoints (z. B. zwischen 153 und 154) haben kann. beispielsweise). Es stellt sich heraus, dass dies für unsere Zwecke keine so nützliche Unterscheidung ist. Was für statistische Betrachtungenwirklichwichtiger ist, ist das Maß der verwendeten Messungen. Wenn ich sage, dass es wichtiger ist, habe ich das wirklich unterschätzt.Das Verständnis der Ebene der Messung einer Variablen (oder Skala oder Maßnahme) ist die erste und wichtigste Unterscheidung, die man über eine Variable machen muss, wenn man Statistiken macht!
Messniveaus
Statistiker beziehen sich häufig auf die „Messniveaus“ einer Variablen, eines Maßes oder einer Skala, um zwischen Messvariablen mit unterschiedlichen Eigenschaften zu unterscheiden. Es gibt vier grundlegende Ebenen: Nominal, Ordinal, Intervall und Verhältnis.
Nominal
Eine Variable, die auf einer „Nominal“ -Skala gemessen wird, ist eine Variable, die eigentlich keine bewertende Unterscheidung hat. Ein Wert isreally nicht größer als ein anderer. Ein gutes Beispiel für eine nominale Variable istSex (oder Geschlecht). Informationen in einem Datensatz zum Geschlecht werden normalerweise als 0 oder 1 codiert, wobei 1 männlich und 0 weiblich anzeigt (oder umgekehrt – 0 für männlich, 1 für weiblich). 1 ist in diesem Fall ein beliebiger Wert und nicht größer oderbesser als 0. Es gibt nur einen nominalen Unterschied zwischen 0 und 1. Bei Nominalvariablen gibt es einen qualitativen Unterschied zwischen Werten, keinen quantitativen.
Ordinal
Etwas, das auf einer „Ordinal“ -Skala gemessen wird, hat eine bewertende Konnotation. Ein Wert ist größer oder größer oder besser als der andere. Produkt A wird gegenüber Produkt B bevorzugt, und daher erhält Aein Wert von 1 und B erhält einen Wert von 2. Ein anderes Beispiel könnte die Bewertung Ihrer Arbeitszufriedenheit auf einer Skala von 1 bis 10 sein, wobei 10 die vollständige Zufriedenheit darstellt. Mit Ordinalskalen wissen wir nur, dass 2 istbesser als 1 oder 10 ist besser als 9; Wir wissen nicht, um wie viel. Es kann variieren. Der Abstand zwischen 1 und 2 kann kürzer sein als zwischen 9 und 10.
Intervall
Eine auf einer Intervallskala gemessene Variable gibt Informationen über mehr oder bessere Werte als gewöhnliche Skalen, aber Intervallvariablen haben einen gleichen Abstand zwischen den einzelnen Werten.Der Abstand zwischen 1 und 2 ist gleich dem Abstand zwischen 9 und 10.Temperatur mit Celsius oder Fahrenheit ist ein gutes beispiel, es ist die exactsame unterschied zwischen 100 grad und 90 wie es ist zwischen 42 und 32.
Verhältnis
Etwas, das auf einer Verhältnisskala gemessen wird, hat die gleichen Eigenschaften wie eine Intervallskala, außer dass es bei einer Verhältnisskala einen absoluten Nullpunkt gibt. Die in Kelvin gemessene Temperatur ist ein Beispiel. Unterhalb von 0 Grad Kelvin ist kein Wert möglich, es ist der absolute Nullpunkt. Gewicht ist anotherexample, 0 lbs. ist eine sinnvolle Abwesenheit von Gewicht. Ihr Bankkontostand isanother. Obwohl Sie einen negativen oder positiven Kontostand haben können, gibt es eine definitive und nicht arbiträre Bedeutung eines Kontostands von 0.
Man kann sich nominal, ordinal, Intervall und Ratio in ihrer Beziehung zueinander vorstellen. Ratio ist anspruchsvoller als Intervall, Intervall ist anspruchsvoller als ordinal und ordinal ist anspruchsvoller als nominal. Ich weiß nicht, ob die Ränge gleich weit voneinander entfernt sind oder nicht, wahrscheinlich nicht. Also, welche Art von Messebene ist das?Ranking der Messebenen?? Ich würde sagen ordinal. In der Statistik ist es am besten zu seinein wenig konservativ im Zweifelsfall.
zweiallgemeine Variablenklassen (Wen interessiert das?)
Ok, denken Sie daran, ich sagte, dass dies die erste und wichtigste Unterscheidungbei der Verwendung von Statistiken? Hier ist der Grund. In den meisten Fällen kümmern sich Statistiker oder Forscher nur um den Unterschied zwischen nominal und allen anderen. Es gibt im Allgemeinen zwei Klassen von Statistiken: diejenigen, die sich mit abhängigen Variablen befassen, und diejenigen, die sich mit Ordinal-, Intervall- oder Verhältnisvariablen befassen. (Im Moment konzentrieren wir uns auf die abhängige Variable undspäter werden wir die unabhängige Variable diskutieren). Wenn ich diese Typen beschreibezwei allgemeine Variablenklassen, ich (und viele andere) bezeichnen sie normalerweise als“kategorisch“ und „kontinuierlich“.“ (Manchmal verwende ich „dichotom“anstelle von „kategorisch“). Beachten Sie auch, dass“kontinuierlich“ in diesem Sinne nicht genau dasselbe ist wie“kontinuierlich“, das in Kapitel 1 des Textes verwendet wird, wenn zwischen diskret und kontinuierlich unterschieden wird. Es ist ein viel lockererer Begriff. Kategorisch unddichotomisch bedeutet normalerweise, dass eine Skala nominal ist. „Kontinuierliche“Variablen sind normalerweise solche, die ordinal oder besser sind.
Ordinalskalen mit wenigen Kategorien (2,3 oder möglicherweise 4) und nominale Maßnahmen werden oft als kategoriale klassifiziert und werden mit binomial Klasse von statistischen Tests analysiert, während Ordinalskalen mit vielen Kategorien (5 oder mehr), Intervall und Verhältnis, werden in der Regel mit der normalen Theorie Klasse von statistischen Tests analysiert. Obwohl die Unterscheidung etwas unscharf ist, Es ist oft eine sehr nützliche Unterscheidung für die Auswahl des richtigen statistischen Tests. Es gibt eine Reihe von Spezialstatistiken, die entwickelt wurden, um mit Ordinalvariablen mit nur wenigen möglichen Werten umzugehen, aber wir werden sie in dieser Klasse nicht behandeln (siehe Agresti, 1984, 1990; O’Connell, 2006; Wickens, 1989 für weitere Informationen zur Analyse von Ordinalvariablen).
Allgemeine Klassen ofStatistics (Oh, ich glaube, ich pflege)
Ok, so haben wir diese beiden allgemeinen Kategorien (dh kontinuierliche und kategorische), was als nächstes …? Nun, diese Unterscheidung (so unscharf sie auch klingen mag) hat sehr wichtige Auswirkungen auf die Art des verwendeten statistischen Verfahrens, und wir werden während des gesamten Kurses Entscheidungen auf der Grundlage dieser Unterscheidung treffen. Es gibt zwei allgemeine Klassen von Statistiken: solche, die auf der Binomialtheorie basieren, und solche, die auf der Normaltheorie basieren. Chi-Quadrat und logistische Regression befassen sich mit Binomialtheorie oder Binomialverteilungen, und T-Tests, ANOVA, Korrelation und Regression befassen sich mit normaler Theorie. Also hier ist eine Tabelle zum Zusammenfassen.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Einige gängige Beispiele
In der Praxis, researchersand wirklichen Leben Forschungsprobleme nicht sagen, wie die abhängige variableshould kategorisiert werden, so werde ich ein paar Arten von Umfrage Fragen orother Maßnahmen, die häufig verwendet werden, zu skizzieren.
Yes/NoQuestions
Jede Frage zu einer Umfrage, die Ja oder Nein als mögliche Antwort hat, ist nominal, und daher werden Binomialstatistiken immer dann angewendet, wenn eine einzelne Ja / Nein-Frage als abhängige Variable oder eine der abhängigen Variablen in einer Analyse dient.
Likert-Skalen
Eine spezielle Art von Umfragefrage verwendet eine Reihe vonantworten, die so angeordnet sind, dass eine Antwort größer ist als die andere. Theterm Likert skala ist benannt nach dem erfinder, Rensis Likert, deren nameis ausgesprochen „Lickert.“ Im Allgemeinen wird dieser Begriff für jede Frage verwendet, die etwa 5 oder mehr mögliche Optionen hat. Ein Beispiel könnte sein: „Wie würden Sie Ihren Abteilungsadministrator bewerten?“1 = sehr inkompetent, 2 = etwas inkompetent, 3 = weder kompetent, 4 = irgendwie kompetent oder 5 = sehr kompetent. Likert-Skalen areeither ordinal oder Intervall, und viele psychometricianswould argumentieren, dass sie Intervall-Skalen sind, weil, wenn gut konstruiert, thereis gleichen Abstand zwischen jedem Wert. Wenn also eine Likertscale als abhängige Variable in einer Analyse verwendet wird, werden normale theoretische Statistiken wie ANOVA oder Regression verwendet.
PhysicalMeasures
Die meisten physikalischen Maßnahmen, wie Höhe, Gewicht, systolischer Blutdruck, Entfernung usw., sind Intervall- oder Verhältnisskalen und fallen daher in die allgemeine Kategorie „kontinuierlich „. Daher werden normale Theorietypstatistiken auch verwendet, wenn ein solches Maß als abhängige Variable in einer Analyse dient.
Zählungen
Zählungen sind schwierig. Wenn eine Variable durch Zählen gemessen wird, z. B. wenn ein Forscher die Anzahl der Tage zählt, an denen ein Krankenhauspatient stationär behandelt wurde, befindet sich die Variable auf einer Verhältnisskala und wird als kontinuierliche Variable behandelt. Spezielle Statistiken werden jedoch häufig empfohlen, da Countvariables oft eine sehr verzerrte Verteilung mit einer alarmierenden Anzahl von Fällen mit einer Anzahl von Null aufweisen (siehe Agresti, 1990, S. 125; Cohen, Cohen, West, & Aiken, 2003, Kapitel 13). Wenn ein Forscher die Anzahl der Objekte in einem Experiment (oder die Anzahl der Fälle im Datensatz) zählt, wird kein kontinuierliches Maß verwendet. Zählen in diesem Fall ist wirklichuntersuchung der Häufigkeit, mit der ein Wert einer Variablen auftritt. Beispielsweise beruht die Zählung der Anzahl der Probanden im Datensatz, die angeben, im letzten Jahr im Krankenhaus gewesen zu sein, auf einer dichotomen Variablen im Datensatz, die für Krankenhausaufenthalt oder Nicht-Krankenhausaufenthalt steht (z., von der Frage wie „sind Sie im letzten Jahr hospitalisiert worden?“).Selbst wenn man die Anzahl der Fälle anhand der Frage „Wie viele Tage im vergangenen Jahr waren Sie im Krankenhaus“ zählen würde, was ein kontinuierliches Maß ist, ist die Variable, die in der Analyse verwendet wird, wirklich nicht diese kontinuierliche Variable. Stattdessen analysierte der Forscher tatsächlich eine adichotome Variable, indem er die Anzahl der Personen zählte, die im vergangenen Jahr (0 Tage) nicht hospitalisiert worden waren, im Vergleich zu denen, die es gewesen waren (1 oder mehrtage).