lecture1

Lecture1
typer av skalor & mätnivåer

diskreta ochkontinuerliga variabler
Daniels text skiljer mellan diskreta och kontinuerliga variabler. Dessa är tekniska skillnader som inte kommer att vara så viktiga för oss i dettaklass. Enligt texten är diskreta variabler variabler därDet finns inga mellanliggande värden möjliga. Till exempel antalet telefonsamtal du får per dag. Du kan inte ta emot 6,3 telefonsamtal. Kontinuerliga variablerär allt annat; varje variabel som teoretiskt kan ha värden i betweenpoints (t.ex. mellan 153 och 154 lbs. bl). Det visar sig att detta ärinte allt som är användbart för en skillnad för våra ändamål. Vad som verkligen är merviktigt för statistiska överväganden är mätnivånanvänds. När jag säger att det är viktigare har jag verkligen underskattat detta.Förstå mätnivån för en variabel (eller skala eller mått) ärDen första och viktigaste skillnaden man måste göra om en variabel närgör statistik!

nivåer avmätning
statistiker hänvisar ofta till” mätnivåer ” av avariable, ett mått eller en skala för att skilja mellan uppmätta variabler somhar olika egenskaper. Det finns fyra grundläggande nivåer: nominell, ordinär, intervall och förhållande.

nominell
en variabel mätt på en” nominell ” skala ären variabel som egentligen inte har någon utvärderingsskillnad. Ett värde ärverkligen inte större än en annan. Ett bra exempel på en nominell variabel ärkön (eller kön). Information i en datamängd om kön är vanligtvis kodad som 0 eller 1, 1indikerar man och 0 indikerar kvinna (eller tvärtom-0 för man, 1för kvinna). 1 i detta fall är ett godtyckligt värde och det är inte något större ellerbättre än 0. Det finns bara en nominell skillnad mellan 0 och 1. Med nominellvariabler finns det en kvalitativ skillnad mellan värden, inte en kvantitativen.

Ordinal
något mätt på en” ordinal ” skalahar en utvärderande konnotation. Ett värde är större eller större eller bättreän den andra. Produkt A föredras framför produkt B, och därför mottar aett värde av 1 och B får ett värde av 2. Ett annat exempel kan vara att betygsätta din jobbtillfredsställelse på en skala från 1 till 10, med 10 som representerar fullständig tillfredsställelse. Med ordinära skalor vet vi bara att 2 ärbättre än 1 eller 10 är bättre än 9; Vi vet inte hur mycket. Det kan variera. Avståndet mellan 1 och 2 kanske kortare än mellan 9 och 10.

intervall
en variabel uppmätt på en intervallskala gerinformation om mer eller bättre som ordinalscales gör, men intervallvariabler har lika avstånd mellan varje värde.Avståndet mellan 1 och 2 är lika med avståndet mellan 9 och 10.Temperatur med Celsius eller Fahrenheit är ett bra exempel, det finns exakt samma skillnad mellan 100 grader och 90 eftersom det finns mellan 42 och 32.

Ratio
något som mäts på en ratio-skala har sammaegenskaper som en intervallskala har förutom, med en ratio-skalning, finns anabsolut nollpunkt. Temperatur uppmätt i Kelvin är ett exempel. Det finns novalue möjligt under 0 grader Kelvin, det är absolut noll. Vikt är anotherexample, 0 kg. är en meningsfull frånvaro av vikt. Ditt bankkonto saldo ären annan. Även om du kan ha en negativ eller positiv kontosaldo finns deten bestämd och icke-arbiträr betydelse av en Kontobalans på 0.

man kan tänka på nominellt, ordinärt, intervall och förhållande som rankat i deras förhållande till varandra. Förhållandet är mer sofistikerat än intervall, intervall är mer sofistikerat än ordinärt och ordinärt är mer sofistikerat än nominellt. Jag vet inte om leden är lika långa eller inte, förmodligen inte. Så vilken typ av mätnivå är dettarankning av mätnivåer?? Jag skulle säga ordinär. I statistiken är det bäst att varalite konservativ när du är osäker.

Tvåallmänna klasser av variabler (vem bryr sig?)
Ok, kom ihåg att jag uppgav att detta är den första och viktigaste distinktionennär du använder statistik? Här är varför. För det mesta, statistiker ellerforskare slutar bara bry sig om skillnaden mellan nominella och allade andra. Det finns i allmänhet två klasser av statistik: de som handlar omnominala beroende variabler och de som handlar om ordinära, intervall eller kvotvariabler. (Just nu kommer vi att fokusera på den beroende variabeln ochsenare kommer vi att diskutera den oberoende variabeln). När jag beskriver dessa typer avtvå allmänna klasser av variabler, jag (och många andra) brukar hänvisa till dem som”kategoriska” och ”kontinuerliga.”(Ibland använder jag”dikotom ”istället för” kategorisk”). Observera också att ”kontinuerlig”i denna mening inte är exakt densamma som” kontinuerlig ” som används i kapitel 1 i texten när man skiljermellan diskret och kontinuerlig. Det är en mycket lösare term. Kategorisk ochdichotom betyder vanligtvis att en skala är nominell. ”Kontinuerliga” variabler är vanligtvis de som är ordinära eller bättre.

Ordinalskalor med få kategorier (2,3 eller möjligen 4) och nominella mått klassificeras ofta som kategoriskaoch analyseras med hjälp av binomialklass av statistiska test, medan ordinalskalor med många kategorier (5 eller mer), intervall och förhållande är vanligtvisanalyseras med den normala teoriklassen för statistiska test. Även om skillnaden är en något fuzzyone, är det ofta en mycket användbar skillnad för att välja rätt statisticaltest. Det finns ett antal specialstatistik som har utvecklats för att hantera ordinära variabler med bara afew möjliga värden, men vi kommer inte att täcka dem i den här klassen (se Agresti, 1984, 1990; O ’ Connell, 2006; Wickens,1989 för mer information om analys av ordinära variabler).

allmänna klasser ofStatistics (Åh, jag antar att jag bryr mig)
Ok, så vi har dessa två allmänna kategorier (dvs kontinuerlig och kategorisk), vad nästa…? Tja denna skillnad (så fuzzy som det kan låta) har mycket importantimplications för den typ av statistisk procedur som används och vi kommer att göra beslut baserade på denna skillnad hela kursen. Det finnstvå allmänna klasser av statistik: de som bygger på binomialteori ochde som bygger på normal teori. Chi-square och logistisk regression dealwith binomial teori eller binomial fördelningar,och t-tester, ANOVA, korrelation, och regression hantera normal teori. Så här är ett bordför att sammanfatta.

Type of Dependent Variable (or Scale)

Level of Measurement

General Class of Statistic
(Binomial or Normal Theory)

Examples of Statistical Procedures

Categorical (or dichotomous)

nominal, ordinal with 2, 3, or 4 levels

binomial

chi-square, logistic regression

Continuous

ordinal with more than 4 categories

normal

ANOVA, regression, correlation, t-tests

SurveyQuestions and Measures: Några vanliga exempel
i praktiken, forskareoch verkliga forskningsproblem inte berätta hur den beroende variabelbör kategoriseras, så jag kommer att beskriva några typer av enkätfrågor ellerAndra åtgärder som vanligen används.

Ja/NoQuestions
alla frågor i en undersökning som har ja eller nej som ett möjligt svar är nominella,och så kommer binomialstatistik att tillämpas när en enda ja/nej-frågafungerar som den beroende variabeln eller en av de beroende variablerna i ananalys.

Likert skalor
en speciell typ av undersökning fråga använder en uppsättning ofresponses som är ordnade så att ett svar är större än en annan. Denterm Likert skala är uppkallad efter uppfinnaren,Rensis Likert, vars namn uttalas ”Lickert.”Generellt är dettatermen används för alla frågor som har cirka 5 eller fler möjliga alternativ. Ett exempel kan vara: ”hur skulle du betygsätta din avdelningsadministratör?”1 = Mycket inkompetent, 2=något inkompetent, 3=varken Kompetent, 4=somewhatcompetent, eller 5=mycket kompetent. Likert skalor areeither ordinära eller intervall, och många psychometricianswould hävda att de är intervall skalor eftersom, när väl konstruerade, thereis lika avstånd mellan varje värde. Så om en Likertscale används som en beroende variabel i en analys, normal teori statistikanvänds såsom ANOVA eller regression skulle användas.

PhysicalMeasures
de flesta fysiska åtgärder, t.ex. höjd, vikt, systoliskt blodtryck, avstånd etc., är intervall eller förhållandeskalor, så de faller i den allmänna ”kontinuerliga ”kategorin. Därför används normal teori typstatistik också när en sådan åtgärd tjänar som den beroende variabeln i ananalys.

räknas
räknas är knepiga. Om en variabel mäts genom att räkna, såsom fallet om enforskare räknar antalet dagar en sjukhuspatient har varit på sjukhus, är variabeln på en förhållandeskala och behandlas som en kontinuerlig varierbar. Särskild statistik rekommenderas dock ofta, eftersom countvariables ofta har en mycket skev fördelning med ett stort antal fall med nollräkning (se Agresti, 1990, s. 125; Cohen, Cohen, väst, & Aiken, 2003, kapitel 13). Om en forskare räknar antalet ämnen i ett experiment (eller antal fall i datamängden) används inte ett kontinuerligt mått. Att räkna i detta fall är verkligenundersöker frekvensen som ett visst värde av en variabel uppstår. Till exempel räknar antalet ämnen i datamängden som rapporterar att de har varit på sjukhus det senaste året, förlitar sig på en dikotom variabel i datamängden som står för att vara på sjukhus eller inte på sjukhus (t. ex., från aquestion som ” har du varit på sjukhus det senaste året?”).Även om man skulle räkna antalet fall baserat på frågan ”hurmånga dagar under det senaste året har du varit på sjukhus”, vilket är enkontinuerlig åtgärd, är variabeln som används i analysen verkligen inte dettakontinuerlig variabel. Istället skulle forskaren faktiskt analysera adichotom variabel genom att räkna antalet personer som inte hade varit på sjukhus under det senaste året (0 dagar) jämfört med de som hade varit (1 eller flerdagar).



Lämna ett svar

Din e-postadress kommer inte publiceras.