lecture1

Lecture1
typer skalaer & målenivåer

Diskrete ogkontinuerlige variabler
Daniels tekst skiller mellom diskrete og kontinuerlige variabler. Disse er tekniske forskjeller som ikke vil være så viktige for oss i detteklassen. Ifølge teksten er diskrete variabler variabler der deter ingen mellomverdier mulige. For eksempel antall telefonsamtaler du mottar per dag. Du kan ikke motta 6,3 telefonsamtaler. Kontinuerlige variablerer alt annet; enhver variabel som teoretisk kan ha verdier i mellompunkter (f.eks. mellom 153 og 154 lbs. eksempelvis). Det viser seg at dette erikke alt som er nyttig for et skille for våre formål. Hva er egentlig merviktig for statistiske hensyn er målingsnivåetbrukt. Når jeg sier det er viktigere, har jeg virkelig undervurdert dette.Å forstå målingsnivået for en variabel (eller skala eller mål) er det første og viktigste skillet man må gjøre om en variabel når man gjør statistikk!

Nivåer av måling
Statistikere refererer ofte til «målenivåer» av avariable, et mål eller en skala for å skille mellom målte variabler somhar forskjellige egenskaper. Det er fire grunnleggende nivåer: nominell, ordinær, intervall og forhold.

Nominell
en variabel målt på en «nominell» skala eren variabel som egentlig ikke har noen evaluerende forskjell. En verdi ervirkelig ikke noe større enn en annen. Et godt eksempel på en nominell variabel ersex (eller kjønn). Informasjon i et datasett om sex er vanligvis kodet som 0 eller 1, 1 indikerer mann og 0 indikerer kvinne (eller omvendt-0 for mann, 1 for kvinne). 1 i dette tilfellet er en vilkårlig verdi og det er ikke noe større ellerbedre enn 0. Det er bare en nominell forskjell mellom 0 og 1. Med nominalvariables er det en kvalitativ forskjell mellom verdier, ikke en kvantitativen.

Ordinal
noe målt på en «ordinal» skalaer har en evaluerende konnotasjon. En verdi er større eller større eller bedreenn den andre. Produkt A foretrekkes fremfor Produkt B, og derfor mottar a en verdi på 1 og B mottar en verdi på 2. Et annet eksempel kan være vurdering din jobb tilfredshet på en skala fra 1 til 10, med 10 representerer completesatisfaction. Med ordinære skalaer vet vi bare at 2 erbedre enn 1 eller 10 er bedre enn 9; vi vet ikke hvor mye. Det kan variere. Avstanden mellom 1 og 2 er kanskje kortere enn mellom 9 og 10.

Intervall
en variabel målt på en intervallskala gir informasjon om mer eller bedre som ordinalskalaer gjør, men intervallvariabler har lik avstand mellom hver verdi.Avstanden mellom 1 og 2 er lik avstanden mellom 9 og 10.Temperatur Ved Hjelp Av Celsius eller Fahrenheit er et godt eksempel, det er exactsame forskjellen mellom 100 grader og 90 som det er mellom 42 og 32.

Ratio
noe målt på en ratio skala har det sammeegenskaper som en intervallskala har unntatt, med en ratio skalering, er det anabsolutt nullpunkt. Temperatur målt I Kelvin er et eksempel. Det er novalue mulig under 0 grader Kelvin, det er absolutt null. Vekt er en anneneksempel, 0 lbs. er et meningsfylt fravær av vekt. Din bankkontosaldo eren annen. Selv om du kan ha en negativ eller positiv kontosaldo, er deten bestemt og ikke-betinget betydning av en kontobalanse på 0.man kan tenke på nominell, ordinær, intervall og forhold som rangert i forhold til hverandre. Forholdet er mer sofistikert enn intervall, intervall er mer sofistikert enn ordinært,og ordinært er mer sofistikert enn nominelt. Jeg vet ikke om rekkene er like langt eller ikke, sannsynligvis ikke. Så hva slags målenivå er detterangering av målenivåer?? Jeg vil si ordinær. I statistikk er det best å værelitt konservativ når du er i tvil.

Togenerelle Klasser Av Variabler (Hvem Bryr seg?)
Ok, husk jeg uttalte at dette er den første og viktigste distinksjonennår du bruker statistikk? Her er hvorfor. For det meste, statistikere ellerforskere ender opp med å bare bry seg om forskjellen mellom nominell og allede andre. Det er vanligvis to klasser av statistikk: de som omhandler nominale avhengige variabler og de som omhandler ordinal, intervall eller forholdsvariabler. (Akkurat nå vil vi fokusere på den avhengige variabelen ogsenere vil vi diskutere den uavhengige variabelen). Når jeg beskriver disse typerto generelle klasser av variabler, jeg (og mange andre) refererer vanligvis til dem som «kategorisk» og » kontinuerlig.»(Noen ganger bruker jeg «dikotom» i stedet for «kategorisk» ). Merk også at «kontinuerlig»i denne forstand ikke er nøyaktig det samme som» kontinuerlig » brukt I Kapittel 1 i teksten når man skiller mellom diskret og kontinuerlig. Det er et mye løsere begrep. Kategorisk ogdichotomous betyr vanligvis at en skala er nominell. «Kontinuerlige» variabler er vanligvis de som er ordinære eller bedre. Ordinalskalaer med få kategorier (2,3 eller muligens 4) og nominelle mål klassifiseres ofte som kategoriske og analyseres ved hjelp av binomial klasse av statistiske tester, mens ordinalskalaer med mange kategorier (5 eller flere), intervall og forhold, vanligvis analyseres med normal teoriklasse av statistiske tester. Selv om skillet er en noe fuzzyone, er det ofte et veldig nyttig skille for å velge riktig statisticaltest. Det finnes en rekke spesialstatistikk som er utviklet for å håndtere ordinære variabler med bare noen få mulige verdier, men vi skal ikke dekke dem i denne klassen (se Agresti, 1984, 1990; O ‘ Connell, 2006; Wickens,1989 for mer informasjon om analyse av ordinære variabler).

Generelle Klasser avstatistikk (Oh, Jeg Antar Jeg Bryr Meg)
Ok, Så Vi har disse to generelle kategoriene (dvs. kontinuerlig og kategorisk), hva neste…? Vel dette skillet (så uklar som det kan høres) har svært importantimplications for typen statistisk prosedyre som brukes, og vi vil gjøre beslutninger basert på dette skillet gjennom hele kurset. Det erto generelle klasser av statistikk: de som er basert på binomial teori ogde basert på normal teori. Chi-square og logistisk regresjon avtale med binomial teori eller binomial fordelinger,og t-tester, anova, korrelasjon og regresjon avtale med normal teori. Så her er en tabell for å oppsummere.

Type of Dependent Variable (or Scale)

Level of Measurement

General Class of Statistic
(Binomial or Normal Theory)

Examples of Statistical Procedures

Categorical (or dichotomous)

nominal, ordinal with 2, 3, or 4 levels

binomial

chi-square, logistic regression

Continuous

ordinal with more than 4 categories

normal

ANOVA, regression, correlation, t-tests

SurveyQuestions and Measures: Noen Vanlige Eksempler
i praksis, forskere og virkelige forskningsproblemer forteller deg ikke hvordan den avhengige variablebør kategoriseres, så jeg vil skissere noen typer undersøkelsesspørsmål eller andre tiltak som ofte brukes.

Ja / NoQuestions
Ethvert spørsmål på en undersøkelse som har ja eller nei som et mulig svar er nominelt, og så binomial statistikk vil bli brukt når et enkelt ja / nei spørsmål fungerer som den avhengige variabelen eller en av de avhengige variablene i ananalyse.

Likert-Skalaer
en spesiell type undersøkelsesspørsmål bruker et sett avsvar som er ordnet slik at ett svar er større enn et annet. Begrepet Likert skala er oppkalt etter oppfinneren, Rensis Likert, hvis navner uttalt » Lickert.»Vanligvis dettesikt brukes til spørsmål som har omtrent 5 eller flere mulige alternativer. Et eksempel kan være: «Hvordan vil du vurdere avdelingsadministratoren din ?»1 = svært inkompetent, 2 = noe inkompetent,3 = verken kompetent, 4=somewhatcompetent, eller 5 = svært kompetent. Likert skalaer erenten ordinal eller intervall, og mange psykometrikere vil hevde at de er intervallskalaer fordi det er like stor avstand mellom hver verdi når de er godt konstruert. Så hvis En Likertscale brukes som en avhengig variabel i en analyse, vil normal teori statisticsare brukt SOM ANOVA eller regresjon bli brukt.

Fysisktiltak
De fleste fysiske tiltak, for eksempelhøyde, vekt, systolisk blodtrykk, avstand etc., er intervall eller forholdskalaer, så de faller inn i den generelle «kontinuerlige» kategorien. Derfor brukes også normal teoritypestatistikk når et slikt tiltak tjener som den avhengige variabelen i ananalyse.

Teller
Teller er vanskelig. Hvis en variabel måles ved å telle, for eksempel hvis aresearcher teller antall dager en sykehuspasient har blitt innlagt på sykehus, er variabelen på en forholdsskala og behandles som en kontinuerligvariabel. Spesiell statistikk er ofte anbefalt, men fordi countvariables ofte har en svært skjev fordeling med et stort antall tilfeller med nulltelling (se Agresti, 1990, s. 125; Cohen, Cohen, West,& Aiken, 2003, Kapittel 13). Hvis en forsker teller antallemner i et eksperiment (eller antall tilfeller i datasettet), brukes ikke en kontinuitetstype. Telling i dette tilfellet er egentligundersøke frekvensen som noen verdi av en variabel oppstår. For eksempel teller antall personer i datasettet som rapporten har blitt innlagt på sykehus i det siste året, avhengig av en dikotom variabel i datasettet som står for å være innlagt på sykehus eller ikke bli innlagt på sykehus (f. eks., fra aquestion som » har du blitt innlagt på sykehus i det siste året ?»).Selv om man skulle telle antall tilfeller basert på spørsmålet «hvordanmange dager i det siste året har du blitt innlagt på sykehus», som er en kontinuerlig måling, er variabelen som brukes i analysen egentlig ikke dettekontinuerlig variabel. I stedet ville forskeren faktisk analysere adichotom variabel ved å telle antall personer som ikke hadde vært innlagt på sykehus i det siste året (0 dager) vs de som hadde vært (1 eller flere dager).



Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.