lectuur1
Lectuur1
soorten schalen & meetniveaus
Discrete en continue variabelen
Daniel ‘ s tekst maakt onderscheid tussen discrete en continue variabelen. Dit zijn technische verschillen die voor ons in deze klasse niet zo belangrijk zullen zijn. Volgens de tekst zijn discrete variabelen variabelen waarin geen tussenliggende waarden mogelijk zijn. Bijvoorbeeld het aantal telefoontjes dat u per dag ontvangt. U kunt geen 6,3 telefoontjes ontvangen. Continue variabelenzijn al het andere; elke variabele die theoretisch waarden tussen punten kan hebben (bijvoorbeeld tussen 153 en 154 lbs. bijvoorbeeld). Het blijkt dat dit niet zo nuttig is van een onderscheid voor onze doeleinden. Wat voor statistische overwegingen echt belangrijker is, is het gebruikte meetniveau. Als ik zeg dat het belangrijker is, heb ik dit echt onderschat.Het begrijpen van het meetniveau van een variabele (of schaal of maat) is het eerste en belangrijkste onderscheid dat men moet maken over een variabele wanneer men statistieken!
meetniveaus
statistici verwijzen vaak naar de” meetniveaus ” van een variabele, een maat of een schaal om een onderscheid te maken tussen gemeten variabelen die verschillende eigenschappen hebben. Er zijn vier basisniveaus: nominaal, ordinaal, interval en ratio.
Nominaal
Een variabele gemeten op een” nominale ” schaal is een variabele die niet echt een evaluatief onderscheid heeft. De ene waarde is werkelijk niet groter dan de andere. Een goed voorbeeld van een nominale variabele isseks (of geslacht). Informatie in een dataset over geslacht wordt meestal gecodeerd als 0 of 1, 1indicerend man en 0 indicerend vrouw (of omgekeerd–0 voor man, 1 Voor Vrouw). 1 is in dit geval een willekeurige waarde en is niet groter dan 0. Er is slechts een nominaal verschil tussen 0 en 1. Bij nominaalvariabelen is er een kwalitatief verschil tussen waarden, niet een kwantitatief verschil.
ordinaal
iets gemeten op een” ordinaal ” schaal heeft een evaluatieve connotatie. De ene waarde is groter of groter of beter dan de andere. Product A heeft de voorkeur boven product B, en daarom krijgt A een waarde van 1 en B een waarde van 2. Een ander voorbeeld is het beoordelen van uw jobtevredenheid op een schaal van 1 tot 10, waarbij 10 volledige tevredenheid vertegenwoordigt. Bij ordinale schalen weten we alleen dat 2 beter is dan 1 of 10 beter is dan 9; we weten niet door hoeveel. Het kan variëren. De afstand tussen 1 en 2 is misschien korter dan tussen 9 en 10.
Interval
Een variabele die op een intervalschaal wordt gemeten, geeft informatie over meer of betere waarden zoals ordinalscales dat doen, maar intervalvariabelen hebben een gelijke afstand tussen elke waarde.De afstand tussen 1 en 2 is gelijk aan de afstand tussen 9 en 10.Temperatuur met behulp van Celsius of Fahrenheit is een goed voorbeeld, Er is precies hetzelfde verschil tussen 100 graden en 90 als er tussen 42 en 32.
Ratio
iets gemeten op een ratio schaal heeft dezelfde eigenschappen als een interval schaal behalve, bij een ratio schaling, is er anabsolute nulpunt. Temperatuur gemeten in Kelvin is een voorbeeld. Er is novalue mogelijk onder 0 graden Kelvin, het is absoluut NUL. Gewicht is een ander voorbeeld, 0 Pond. is een betekenisvolle afwezigheid van gewicht. Je bankrekening saldo is een ander. Hoewel je een negatief of positief rekeningsaldo kunt hebben, is er een definitieve en niet-arbitrary betekenis van een rekeningsaldo van 0.
men kan denken aan nominaal, ordinaal, interval en ratio als gerangschikt in hun relatie tot elkaar. Ratio is verfijnder dan interval, interval is verfijnder dan ordinaal,en ordinaal is verfijnder dan nominaal. Ik weet niet of de gelederen gelijk zijn of niet, waarschijnlijk niet. Wat voor soort meetniveau is dit rangschikken van meetniveaus?? Ik zou zeggen ordinaal. In de statistieken is het het beste om weinig conservatief te zijn als je twijfelt.
Tweegenerale klassen van variabelen (Wat maakt het uit?)
Ok, Weet je nog dat ik zei dat dit het eerste en belangrijkste onderscheid is bij het gebruik van statistieken? Dit is waarom. Voor het grootste deel, statistici ofonderzoekers uiteindelijk alleen de zorg over het verschil tussen nominaal en alle anderen. Er zijn over het algemeen twee klassen van statistieken: die die betrekking hebben opnominale afhankelijke variabelen en die betrekking hebben op ordinale, interval,of ratio variabelen. (Op dit moment zullen we ons richten op de afhankelijke variabele enlater zullen we de onafhankelijke variabele bespreken). Wanneer ik deze types beschrijf van twee algemene klassen van variabelen, ik (en vele anderen) meestal verwijzen naar hen als”categorisch” en “continu.”(Soms gebruik ik”dichotoom “in plaats van” categorisch”). Merk ook op dat” continu”in deze zin niet precies hetzelfde is als” continu ” in Hoofdstuk 1 van de tekst wanneer het onderscheid wordt gemaakt tussen discrete en continu. Het is een veel lossere term. Categorisch anddichotoom betekent meestal dat een schaal nominaal is. “Continue” variabelen zijn meestal degenen die ordinaal of beter zijn.
ordinale schalen met weinig categorieën(2,3, of mogelijk 4) en nominale maten worden vaak geclassificeerd als categorisch en worden geanalyseerd met behulp van binomiale klasse van statistische tests, terwijl ordinale schalen met veel categorieën (5 of meer), interval en ratio, gewoonlijk worden geanalyseerd met de normale theorie klasse van statistische tests. Hoewel het onderscheid is een beetje fuzzyone, het is vaak een zeer nuttig onderscheid voor het kiezen van de juiste statistische test. Er zijn een aantal specialstatistics ontwikkeld om ordinale variabelen met slechts enkele mogelijke waarden te behandelen, maar we gaan ze in deze klasse niet behandelen (zie Agresti, 1984, 1990; O ‘ Connell,2006; Wickens, 1989 voor meer informatie over de analyse van ordinale variabelen).
General Classes ofStatistics (Oh, I Guess I Do Care)
Ok, dus we hebben deze twee algemene categorieën (dwz, continu en categorisch), wat nu…? Dit onderscheid (hoe vaag het ook mag klinken) heeft zeer belangrijke vereenvoudigingen voor het soort statistische procedure dat wordt gebruikt en we zullen gedurende de hele cursus op dit onderscheid gebaseerde beslissingen nemen. Er zijn twee algemene klassen van statistiek: die gebaseerd op binomiale theorie en die gebaseerd op normale theorie. Chi-kwadraat en logistieke regressie gaan over binomiale theorie of binomiale distributies, en t-tests, ANOVA, correlatie en regressie gaan over normale theorie. Hier is een tabel om samen te vatten.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Enkele veelvoorkomende voorbeelden
in de praktijk vertellen onderzoekers en echte onderzoeksproblemen u niet hoe de afhankelijke variabel moet worden gecategoriseerd, dus zal ik een paar soorten enquêtevragen of andere maatregelen die vaak worden gebruikt schetsen.
Yes/NoQuestions
elke vraag in een enquãate met Ja of nee als mogelijke respons is nominaal,en dus zullen binomiale statistieken worden toegepast wanneer een enkele ja/nee-vraag als afhankelijke variabele of een van de afhankelijke variabelen in een analyse voorkomt.
Likert schalen
Een speciaal soort enquêtevraag maakt gebruik van een reeks antwoorden die zo geordend zijn dat een antwoord groter is dan een ander. De term Likert-schaal is vernoemd naar de uitvinder,Rensis Likert, wiens naam wordt uitgesproken als “Lickert.”Over het algemeen wordt thisterm gebruikt voor elke vraag die ongeveer 5 of meer mogelijke opties heeft. Een voorbeeld zou kunnen zijn: “hoe zou u uw afdelingsbeheerder beoordelen?”1 = zeer incompetent, 2 = enigszins incompetent, 3 = niet competent, 4=enigszins competent, of 5 = zeer competent. Likert-schalen zijn ordinaal of interval, en veel psychometricien zouden kunnen beweren dat ze intervalschalen zijn omdat, wanneer goed geconstrueerd, er een gelijke afstand is tussen elke waarde. Dus als een Likertscale wordt gebruikt als een afhankelijke variabele in een analyse, normale theorie statistieken worden gebruikt, zoals ANOVA of regressie zou worden gebruikt.
fysieke metingen
De meeste fysieke metingen, zoals gewicht, systolische bloeddruk, afstand enz., zijn interval of ratioscales, zodat ze vallen in de Algemene “continue” categorie. Daarom worden normale theorie-typestatistieken ook gebruikt wanneer een dergelijke maat dient als de afhankelijke variabele in ananalyse.
tellingen
tellingen zijn lastig. Als een variabele wordt gemeten door te tellen, zoals het geval als een onderzoeker het aantal dagen telt dat een ziekenhuispatiënt is gehospitaliseerd, is de variabele op een ratio schaal en wordt behandeld als een continu variabel. Speciale statistieken worden echter vaak aanbevolen, omdat de telvariabelen vaak een zeer scheef verdeelde verdeling hebben met een groot aantal gevallen met een nultelling (zie Agresti, 1990, blz. 125; Cohen, Cohen, West, & Aiken, 2003, hoofdstuk 13). Als een onderzoeker het aantal onderwerpen in een experiment telt (of het aantal gevallen in de dataset), wordt een continuoustype-maat niet echt gebruikt. Tellen in dit geval is echt het onderzoeken van de frequentie dat een bepaalde waarde van een variabele optreedt. Bijvoorbeeld, het tellen van het aantal proefpersonen in de dataset dat meldt te zijn gehospitaliseerd in het afgelopen jaar, is gebaseerd op een dichotome variabele in de datasetdie staat voor gehospitaliseerd of niet gehospitaliseerd worden (bijv., van aquestion zoals ” bent u opgenomen in het ziekenhuis in het afgelopen jaar?”).Zelfs als men het aantal gevallen zou tellen op basis van de vraag “hoeveel dagen in het afgelopen jaar bent u in het ziekenhuis opgenomen”, wat een continue maat is, is de variabele die in de analyse wordt gebruikt niet echt deze continue variabele. In plaats daarvan zou de onderzoeker eigenlijk eendichotome variabele analyseren door het aantal mensen te tellen die het afgelopen jaar niet waren opgenomen in het ziekenhuis (0 dagen) versus degenen die waren geweest (1 of meerdagen).