lecture1
Lecture1
tipuri de scale & niveluri de măsurare
variabile Discrete și continue
textul lui Daniel face distincția între variabilele discrete și continue. Acestea sunt distincții tehnice care nu vor fi atât de importante pentru noi în această clasă. Conform textului, variabilele discrete sunt variabile în care existănu sunt posibile valori intermediare. De exemplu, numărul de apeluri telefoniceprimiți pe zi. Nu puteți primi 6.3 apeluri telefonice. Variabile continuesunt orice altceva; orice variabilă care poate avea teoretic valori între puncte (de exemplu, între 153 și 154 lbs. de exemplu). Se pare că asta estenu tot ce este util pentru o distincție pentru scopurile noastre. Ceea ce este cu adevărat mai multimportant pentru considerente statistice este nivelul de măsurarefolosit. Când spun că este mai important, am subestimat cu adevărat acest lucru.Înțelegerea nivelului de măsurare a unei variabile (sau scară sau măsură) esteprima și cea mai importantă distincție pe care trebuie să o faci despre o variabilă cândface statistici!
nivelurile măsurării
statisticienii se referă adesea la „nivelurile de măsurare” ale avariabile, o măsură sau o scară pentru a distinge între variabilele măsurate care au proprietăți diferite. Există patru niveluri de bază: nominal, ordinal,interval și raport.
Nominal
O variabilă măsurată pe o scară „nominală” esteo variabilă care nu are într-adevăr nici o distincție evaluativă. O valoare estenu este cu adevărat mai mare decât alta. Un bun exemplu de variabilă nominală estesex (sau sex). Informațiile dintr-un set de date despre sex sunt de obicei codificate ca 0 sau 1, 1indicând masculul și 0 indicând femela (sau invers–0 pentru Mascul, 1 pentru femelă). 1 în acest caz este o valoare arbitrară și nu este mai mare saumai bine decât 0. Există doar o diferență nominală între 0 și 1. Cu nominalvariables, există o diferență calitativă între valori, nu o cantitativăunul.
Ordinal
ceva măsurat pe o scară „ordinală” are o conotație evaluativă. O valoare este mai mare sau mai mare sau mai bunădecât celălalt. Produsul A este preferat față de produsul B și, prin urmare, a primește o valoare de 1 și B primește o valoare de 2. Un alt exemplu ar putea fi evaluarea satisfacției dvs. la locul de muncă pe o scară de la 1 la 10, cu 10 reprezentând completesatisfaction. Cu scale ordinale, știm doar că 2 estemai bine decât 1 sau 10 este mai bun decât 9; nu știm cu cât. Poate varia. Distanța dintre 1 și 2 poate fi mai mică decât între 9 și 10.
Interval
O variabilă măsurată pe o scară de interval dăinformații despre mai mult sau mai bine ca ordinalscales face, dar variabilele de interval au o distanță egală între fiecare valoare.Distanța dintre 1 și 2 este egală cu distanța dintre 9 și 10.Temperatura folosind Celsius sau Fahrenheit este un bun exemplu, există exact aceeași diferență între 100 de grade și 90, deoarece există între 42 și 32.
raport
ceva măsurat pe o scară de raport are aceleași proprietăți pe care le are o scară de interval, cu excepția faptului că, cu o scalare a raportului, există un punct zero anabsolut. Temperatura măsurată în Kelvin este un exemplu. Există novalue posibil sub 0 grade Kelvin, este zero absolut. Greutatea este altaexemplu, 0 lbs. este o absență semnificativă a greutății. Soldul contului dvs. bancar estealtul. Deși puteți avea un sold negativ sau pozitiv al contului, existăo semnificație definită și nonarbitrară a unui echilibru de cont de 0.
se poate gândi la nominal, ordinal,interval și raport ca fiind clasat în relația lor unul cu celălalt. Raportul estemai sofisticat decât intervalul,intervalul este mai sofisticat decât ordinal, iar ordinal este mai sofisticat decât nominal. Nu știu dacă rândurile suntequidistant sau nu, probabil că nu. Deci, ce fel de nivel de măsurare este acest lucruclasarea nivelurilor de măsurare?? Aș spune ordinal. În statistici, este mai bine să fiiun pic conservator atunci când aveți îndoieli.
Douăclase generale de variabile (cui îi pasă?)
OK, amintiți-vă am afirmat că aceasta este prima și cea mai importantă distincțiecând se utilizează statistici? Uite de ce. În cea mai mare parte, statisticienii saucercetătorii se ocupă doar de diferența dintre nominal și toatealte. Există, în general,două clase de statistici: cele care se ocupă de variabilele dependente nominale și cele care se ocupă de variabilele ordinale, de interval sau de raport. (Acum ne vom concentra pe variabila dependentă șimai târziu vom discuta variabila independentă). Când descriu aceste tipuri dedouă clase generale de variabile, eu (și multe altele) se referă de obicei la ele ca fiind”categorice” și „continue”.”(Uneori voi folosi „dihotom” în loc de” categoric”). Rețineți, de asemenea, că”continuu” în acest sens nu este exact același lucru cu”continuu” folosit în Capitolul 1 al textului atunci când se face distincția între discret și continuu. E un termen mult mai slab. Categoric șidichotom înseamnă, de obicei, că o scară este nominală. Variabilele „continue” sunt de obicei cele care sunt ordinale sau mai bune.
scalele ordinale cu câteva categorii(2,3 sau posibil 4) și măsurile nominale sunt adesea clasificate ca categoricaland sunt analizate folosind clasa binomială de teste statistice, în timp ce scalele ordinale cu multe categorii (5 sau mai multe), interval și raport, sunt de obicei analizate cu clasa teoretică normală a testelor statistice. Deși distincția este oarecum fuzzyone, este adesea o distincție foarte utilă pentru alegerea testului statistic corect. Există o serie de statistici speciale care au fost dezvoltate pentru a trata variabilele ordinale cu doar câteva valori posibile, dar nu le vom acoperi în această clasă (vezi Agresti, 1984, 1990; O ‘ Connell, 2006; Wickens,1989 pentru mai multe informații despre analiza variabilelor ordinale).
clase generale ofStatistics (Oh, cred că îmi pasă)
Ok, deci avem aceste două categorii generale (adică, continuă și categorică), ce urmează…? Ei bine, această distincție (oricât de neclară ar părea) are implicații foarte importante pentru tipul de procedură statistică utilizată și vom lua decizii pe baza acestei distincții pe tot parcursul cursului. Existădouă clase generale de statistici: cele bazate pe teoria binomială șicele bazate pe teoria normală. Chi-piața și regresia logistică se ocupă de teoria binomială sau distribuțiile binomiale, iar testele t,ANOVA, corelația și regresia se ocupă de teoria normală. Deci, iată un tabelpentru a rezuma.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Câteva exemple comune
în practica reală, cercetătoriiși probleme de cercetare din viața reală nu vă spun cum variabila dependentăar trebui să fie clasificate,așa că voi sublinia câteva tipuri de întrebări sondaj saualte măsuri care sunt utilizate în mod obișnuit.
Da/Noîntrebări
orice întrebare dintr-un sondaj care are Da sau nu ca răspuns posibil este nominală și astfel Statisticile binomiale vor fi aplicate ori de câte ori o singură întrebare da / nu servește ca variabilă dependentă sau una dintre variabilele dependente în analiză.
Likert Scale
un tip special de întrebare sondaj utilizează un set deresponses care sunt ordonate astfel încât un răspuns este mai mare decât altul. Scara Likert este numită după inventatorul, Rensis Likert, al cărui numeeste pronunțat „Lickert.”În general, acest lucrutermenul este folosit pentru orice întrebare care are aproximativ 5 sau mai multe opțiuni posibile. Un exemplu ar putea fi: „cum ați evalua administratorul Departamentului?”1 = Foarte incompetent, 2 = oarecum incompetent, 3=nici competent, 4=somewhatcompetent, sau 5 = foarte competent. Scalele Likert sunt fie ordinale, fie intervale, iar mulți psihometrici ar susține că sunt scale de interval, deoarece, atunci când sunt bine construite, există o distanță egală între fiecare valoare. Deci, dacă o scară Likertscale este utilizată ca variabilă dependentă într-o analiză, s-ar folosi statistici teoretice normale, cum ar fi ANOVA sau regresie.
măsuri fizice
cele mai multe măsuri fizice, cum ar fiînălțimea, greutatea, tensiunea arterială sistolică, distanța etc., sunt intervale sau raporturiscale, astfel încât acestea se încadrează în categoria generală „continuă”. Prin urmare, statisticile de tip teorie normală sunt de asemenea utilizate atunci când o astfel de măsură servește ca variabilă dependentă în analiză.
contează
contează sunt dificil. Dacă o variabilă este măsurată prin numărare, cum ar fi cazul în care un cercetător numără numărul de zile în care un pacient din spital a fost spitalizat, variabila este pe o scară de raport și este tratată ca o variabilă continuă. Statisticile speciale sunt adesea recomandate, totuși, deoarece numărul variabil are adesea o distribuție foarte înclinată, cu un număr mare de cazuri cu un număr zero (vezi Agresti, 1990, p. 125; Cohen, Cohen, Vest, & Aiken, 2003, Capitolul 13). Dacă un cercetător numără numărul de subiecți dintr-un experiment (sau numărul de cazuri din setul de date), nu se utilizează cu adevărat o măsură de tip continuu. Numărarea în acest caz este într-adevărexaminarea frecvenței pe care apare o anumită valoare a unei variabile. De exemplu, numărarea numărului de subiecți din setul de date care raportează că au fost spitalizați în ultimul an, se bazează pe o variabilă dihotomică din setul de datecare înseamnă a fi spitalizat sau a nu fi spitalizat (de ex., de la aquestion, cum ar fi ” ați fost spitalizat în ultimul an?”).Chiar dacă s-ar număra numărul de cazuri pe baza întrebării „cummulte zile în ultimul an ați fost spitalizat”, care este o măsură continuă, variabila utilizată în analiză nu este într-adevăr această variabilă continuă. În schimb, cercetătorul ar analiza de fapt variabila adichotomă prin numărarea numărului de persoane care nu au fost spitalizate în ultimul an (0 zile) față de cele care au fost (1 sau mai multezile).