lecture1
Lecture1
a skálák típusai & mérési szintek
diszkrét ésfolyamatos változók
Daniel szövege megkülönbözteti a diszkrét és folytonos változókat. Ezek olyan technikai megkülönböztetések, amelyek ebben az osztályban nem lesznek olyan fontosak számunkra. A szöveg szerint a diszkrét változók olyan változók, amelyekben vannaknincsenek köztes értékek. Például a telefonhívások számaa napi hívások száma. Nem fogadhat 6.3 telefonhívást. Folyamatos változókminden más; minden olyan változó, amelynek elméletileg lehetnek értékei közöttpontok (pl. 153 és 154 font között. például). Kiderül, hogy eznem annyira hasznos a megkülönböztetés céljaink szempontjából. Ami a statisztikai megfontolások szempontjából valóban fontosabb, az a mérés szintjehasznált. Amikor azt mondom, hogy fontosabb, ezt nagyon alábecsültem.A változó mérési szintjének megértése (vagy skála vagy mérték) az első és legfontosabb különbségtétel, amelyet egy változóval kapcsolatban meg kell tenni, amikora statisztikák folyamatban vannak!
a mérések szintjei
a statisztikusok gyakran utalnak az avariable, a mérték vagy a skála” mérési szintjeire”, hogy megkülönböztessék a különböző tulajdonságokkal rendelkező mért változókat. Négy alapszint van: névleges, sorszám, intervallum és Arány.
névleges
A “Névleges” skálán mért változó olyan változó, amely valójában nem rendelkezik értékelő megkülönböztetéssel. Az egyik érték valójában nem nagyobb, mint a másik. Jó példa egy névleges változóraszex (vagy nem). A nemre vonatkozó adathalmazban szereplő információkat általában 0 vagy 1 kódolják, az 1 a hímet, a 0 pedig a nőt jelöli (vagy fordítva-0 a férfi esetében, 1 a nő esetében). Az 1 ebben az esetben tetszőleges érték, és nem nagyobb vagyjobb, mint 0. Csak névleges különbség van 0 és 1 között. A nominalvariables esetében minőségi különbség van az értékek között, nem pedig kvantitatívegy.
Ordinal
valami, amit egy “ordinal” skálán mérnek, értékelő konnotációval rendelkezik. Az egyik érték nagyobb vagy nagyobb vagy jobbmint a másik. Az A termék előnyösebb a B termékkel szemben, ezért A 1-es értéket kap, B pedig 2-es értéket kap. Egy másik példa lehet a munkahelyi elégedettség értékelése 1-től 10-ig terjedő skálán, 10 pedig a teljes elégedettséget képviseli. A sorszámmal csak azt tudjuk, hogy 2 vanjobb, mint 1 vagy 10 jobb, mint 9; nem tudjuk, mennyi. Ez változhat. Az 1 és 2 közötti távolság talán rövidebb, mint 9 és 10 között.
intervallum
egy intervallumskálán mért változó több vagy jobb információt ad, mint az ordinalscales, de az intervallumváltozók egyenlő távolságra vannak az egyes értékek között.Az 1 és 2 közötti távolság megegyezik a 9 és 10 közötti távolsággal.Hőmérséklet segítségével Celsius vagy Fahrenheit egy jó példa, ott van a pontos különbség 100 fok és 90 között van 42 és 32.
Arány
valami arányskálán mérve ugyanazokkal a tulajdonságokkal rendelkezik, mint egy intervallumskála, kivéve az arány méretezésével, van anabsolute nulla pont. Példa erre a Kelvinben mért hőmérséklet. A Novalue 0 Kelvin fok alatt lehetséges, abszolút nulla. A súly egy másik példa, 0 lbs. a súly értelmes hiánya. A bankszámla egyenlege: egy másik. Annak ellenére, hogy negatív vagy pozitív számlaegyenleged lehet, a 0 számlaegyenlegnek határozott és nem határozott jelentése van.
a nominális, a sorszámos,az intervallum és az arányok egymáshoz való viszonyuk szerint rangsorolhatóak. Az arány kifinomultabb, mint az intervallum,az intervallum kifinomultabb, mint az ordinális, az ordinális pedig kifinomultabb, mint a nominális. Nem tudom, hogy a rangok egyenlőek-e vagy sem, valószínűleg nem. Tehát milyen mérési szint eza mérési szintek rangsorolása?? Azt mondanám, sorszám. A statisztikákban a legjobbegy kicsit konzervatív, ha kétségei vannak.
Kettőváltozók Általános osztályai (kit érdekel?)
Ok, emlékszel, azt állította, hogy ez az első és legfontosabb megkülönböztetésamikor a statisztikák? Itt van miért. A statisztikusok vagy a kutatók többnyire csak a nominális és az összes többi közötti különbséggel foglalkoznak. Általában két statisztikai osztály létezik: azok, amelyek foglalkoznaknominális függő változók,valamint azok, amelyek a sorszám, intervallum vagy Arány változókkal foglalkoznak. (Most a függő változóra összpontosítunk éskésőbb megvitatjuk a független változót). Amikor leírom az ilyen típusú két általános osztályok változók, én (és sokan mások) általában hivatkoznak rájuk, mint”kategorikus” és “folyamatos.”(Néha a “kategorikus”helyett a “dichotóm” – ot használom ). Vegye figyelembe azt is, hogy a” folytonos”ebben az értelemben nem pontosan ugyanaz, mint a” folytonos”, amelyet a szöveg 1.fejezetében használnak, amikor megkülönböztetik a diszkrét és a folytonos között. Ez egy sokkal lazább kifejezés. Kategorikus ésdichotóm általában azt jelenti, hogy a skála névleges. A “folyamatos” változók általában azok, amelyek rendesek vagy jobbak.
a néhány kategóriával(2,3 vagy esetleg 4) és névleges mérésekkel rendelkező Sorszámméréseket gyakran kategorikusként osztályozzák, és a statisztikai tesztek binomiális osztályával elemzik, míg a sok kategóriával (5 vagy több), intervallummal és aránygal rendelkező ordinalskálákat általában a statisztikai tesztek normál elméleti osztályával elemzik. Bár a megkülönböztetés kissé fuzzyone, gyakran nagyon hasznos megkülönböztetés a megfelelő statisztikai teszt kiválasztásához. Számos speciális statisztika létezik, amelyeket csak néhány lehetséges értékkel rendelkező sorszámváltozók kezelésére fejlesztettek ki, de ebben az osztályban nem fogjuk lefedni őket (lásd Agresti, 1984, 1990; O ‘ Connell,2006; Wickens, 1989 a sorszámváltozók elemzésével kapcsolatos további információkért).
Általános Osztályaistatisztika (Ó, azt hiszem, érdekel)
Ok, tehát van ez a két általános kategória (azaz folyamatos és kategorikus), mi a következő…? Nos, ez a megkülönböztetés (bármilyen homályosan is hangzik) nagyon fontos példákkal rendelkezik az alkalmazott statisztikai eljárás típusára vonatkozóan, és ezen a megkülönböztetésen alapuló döntéseket fogunk hozni a tanfolyam során. Két általános statisztikai osztály létezik: a binomiális elméleten és a normál elméleten alapulók. A Chi-négyzet és a logisztikai regresszió binomiális elméletekkel vagy binomiális eloszlásokkal foglalkozik,a T-tesztek, az ANOVA, a korreláció és a regresszió pedig a normál elmélettel foglalkoznak. Tehát itt van egy táblázatösszefoglalni.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Néhány gyakori példa
a tényleges gyakorlatban a kutatókés a valós kutatási problémák nem mondják el, hogy a függő változókatkategóriázni kell, ezért felvázolok néhány típusú felmérési kérdést vagyegyéb gyakran használt intézkedéseket.
Yes/NoQuestions
a felmérés minden olyan kérdése,amely igen vagy nem, mint lehetséges válasz, névleges, ezért binomiális statisztikákat kell alkalmazni, amikor egyetlen igen/nem kérdés szolgál függő változóként vagy az ananalízis egyik függő változójaként.
Likert Scales
egy speciális felmérési kérdés olyan válaszokat használ, amelyek úgy vannak rendezve, hogy az egyik válasz nagyobb, mint a másik. A kifejezés Likert skála a feltaláló, Rensis Likert nevét kapta, akinek a nevea ” Lickert.”Általában eza kifejezést minden olyan kérdésre használják, amelynek körülbelül 5 vagy több lehetséges lehetősége van. Egy példa lehet: “hogyan értékelné az osztály adminisztrátorát?”1 = Nagyon inkompetens, 2=kissé inkompetens, 3=sem Kompetens, 4=somewhatcompetent, vagy 5=nagyon kompetens. A Likert-skálák ordinálisak vagy intervallumok, és sok pszichometrikusazt állítaná, hogy intervallum-skálák, mert ha jól felépítik, akkor egyenlő távolság van az egyes értékek között. Tehát, ha egy Likertscale-t függő változóként használunk egy elemzésben, akkor normál elméleti statisztikákat használunk, például ANOVA vagy regresszió.
PhysicalMeasures
A legtöbb fizikai intézkedés, mint plmagasság, súly, szisztolés vérnyomás, távolság stb., intervallumok vagy arányok, tehát az Általános “folyamatos “kategóriába tartoznak. Ezért a normál elmélet típusú statisztikákat akkor is használják, ha egy ilyen intézkedés függő változóként szolgál ananalízis.
számít
számít trükkös. Ha egy változót számlálással mérünk, például abban az esetben, ha a kutató megszámolja a kórházi beteg kórházi ellátásának napjait, akkor a változó arányskálán van, és folyamatosan változóként kezelik. Speciális statisztikákat azonban gyakran ajánlunk, mert a számváltozók eloszlása gyakran nagyon ferde, sok esetben nulla számmal (lásd Agresti, 1990, P. 125; Cohen, Cohen, West, & Aiken, 2003, 13.fejezet). Ha egy kutató megszámolja a számotegy kísérletben szereplő alanyok (vagy az adatkészletben szereplő esetek száma), akkor a folyamatos típusú mérést valójában nem használják. A számlálás ebben az esetben valóbanmegvizsgálja a változó bizonyos értékének gyakoriságát. Például az adatkészletben azon alanyok számának megszámlálása, akik beszámoltak arról, hogy az elmúlt évben kórházba kerültek, az adatkészlet dichotóm változójára támaszkodik, amely azt jelenti, hogy kórházba kerülnek vagy nem kerülnek kórházba (pl., olyan kérdésektől, mint például: “kórházba került az elmúlt évben?”).Még akkor is, ha az esetek számát A “howmany nap az elmúlt évben kórházba került,” ami afolyamatos intézkedés, az elemzésben használt változó valójában nem ezfolyamatos változó. Ehelyett a kutató valójában elemezné adichotóm változó megszámolva azoknak az embereknek a számát, akik az elmúlt évben nem voltak kórházban (0 nap), szemben azokkal, akik voltak (1 vagy többnap).