wykład1

Wykład1
rodzaje skal& poziomy pomiaru

zmienne dyskretne i ciągłe
tekst Daniela rozróżnia zmienne dyskretne i ciągłe. Są to różnice techniczne, które nie będą dla nas tak ważne w tej klasie. Zgodnie z tekstem zmienne dyskretne są zmiennymi, w których nie ma możliwych wartości pośrednich. Na przykład liczba połączeń telefonicznych otrzymujesz dziennie. 6.3 nie można odbierać połączeń telefonicznych. Zmienne ciągłe to wszystko inne; każda zmienna, która teoretycznie może mieć wartości pomiędzy punktami (np. między 153 A 154 funtami). na przykład). Okazuje się, że nie jest to wszystko, co przydatne z rozróżnienia dla naszych celów. Co jest bardziej istotne dla rozważań statystycznych, to poziom wykorzystanych pomiarów. Kiedy mówię, że jest to ważniejsze, naprawdę to zaniżyłem.Zrozumienie poziomu pomiaru zmiennej (lub skali lub miary) jest pierwszym i najważniejszym rozróżnieniem, które należy zrobić o zmiennej w statystykach!

poziomy pomiaru
statystycy często odnoszą się do „poziomów pomiaru” zmiennej, miary lub skali, aby odróżnić mierzone zmienne, które mają różne właściwości. Istnieją cztery podstawowe poziomy: nominalny, porządkowy,interwał i stosunek.

nominalna
zmienna mierzona w skali „nominalnej” jest zmienną, która tak naprawdę nie ma żadnego rozróżnienia ewaluacyjnego. Jedna wartość nie jest w rzeczywistości większa od drugiej. Dobrym przykładem jest zmienna nominalna issex (lub płeć). Informacje w zbiorze danych na temat płci są zwykle kodowane jako 0 LUB 1, 1 oznaczające mężczyznę i 0 wskazujące kobietę (lub odwrotnie-0 dla mężczyzny, 1 dla kobiety). 1 w tym przypadku jest wartością arbitralną i nie jest większa niż 0. Istnieje tylko nominalna różnica między 0 a 1. W przypadku zmiennych nominalnych Istnieje różnica jakościowa między wartościami,a nie ilościowa.

porządkowy
coś mierzonego w skali „porządkowej” ma konotację ewaluacyjną. Jedna wartość jest większa, większa lub lepsza od drugiej. Produkt a jest preferowany w stosunku do produktu B i dlatego otrzymuje wartość 1, A B otrzymuje wartość 2. Innym przykładem może być Ocena satysfakcji z pracy w skali od 1 do 10, przy czym 10 reprezentuje pełne zadowolenie. W skalach porządkowych wiemy tylko, że 2 jest lepsze od 1 lub 10 jest lepsze od 9; nie wiemy o ile. Może się różnić. Odległość między 1 A 2 może być krótsza niż między 9 a 10.

interwał
zmienna mierzona na skali interwałowej daje informacje o większej lub lepszej wartości, jak zwykłe skaly, ale zmienne interwałowe mają taką samą odległość między każdą wartością.Odległość między 1 A 2 jest równa odległości między 9 a 10.Temperatura za pomocą Celsjusza lub Fahrenheita jest dobrym przykładem, istnieje dokładna różnica między 100 stopniami a 90, ponieważ jest między 42 A 32.

Współczynnik
coś mierzonego na skali proporcji ma takie same kryteria, jakie ma skala interwałowa, z wyjątkiem, że przy skalowaniu proporcji istnieje anabsolutny punkt zerowy. Przykładem jest temperatura mierzona w kelwinach. Istnieje możliwość novalue poniżej 0 stopni Kelvina, jest to ZERO bezwzględne. Waga jest anotherexample, 0 lbs. jest znaczącym brakiem wagi. Saldo Twojego konta bankowego jest inne. Chociaż możesz mieć ujemne lub dodatnie saldo konta, istnieje pewne i niearbitralne znaczenie salda konta wynoszące 0.

można myśleć o nominalnych, porządkowych,interwałach i proporcjach jako uszeregowanych w ich stosunku do siebie. Stosunek jest bardziej wyrafinowany niż interwał, interwał jest bardziej wyrafinowany niż porządkowy,a porządkowy jest bardziej wyrafinowany niż nominalny. Nie wiem, czy stopnie są tak odległe, czy nie, prawdopodobnie nie. Jaki jest więc poziom pomiaru?? Powiedziałbym, że porządkowy. W statystykach najlepiej być trochę konserwatywnym, gdy masz wątpliwości.

dwie klasy zmiennych (kogo to obchodzi?)
ok, pamiętaj, że stwierdziłem, że jest to pierwsze i najważniejsze rozróżnienie, kiedy używam statystyk? Oto dlaczego. W przeważającej części statystycy lub badacze zwracają uwagę tylko na różnicę między nominalnymi a wszystkimi innymi. Istnieją na ogół dwie klasy statystyk: te, które zajmują się zmiennymi zależnymi nieznanymi i te, które zajmują się zmiennymi porządkowymi, interwałowymi lub ratio. (Teraz skupimy się na zmiennej zależnej i omówimy zmienną niezależną). Kiedy opisuję te typy dwóch ogólnych klas zmiennych, ja (i wiele innych) Zwykle określam je jako”kategoryczne” i „ciągłe.”(Czasami użyję „dychotomicznego” zamiast „kategorycznego”). Zauważ również, że”ciągły” w tym sensie nie jest dokładnie tym samym, co”ciągły” używany w rozdziale 1 tekstu przy rozróżnianiu między dyskretnym i ciągłym. To luźniejsze określenie. Kategoryczny idichotomiczny zwykle oznacza, że skala jest nominalna. Zmienne”ciągłe” to zwykle te, które są porządkowe lub lepsze.

Skale porządkowe z kilkoma kategoriami(2,3 lub ewentualnie 4) i miarami nominalnymi są często klasyfikowane jako kategoryczne i są analizowane przy użyciu dwumianowej klasy testów statystycznych, podczas gdy skale porządkowe z wieloma kategoriami (5 lub więcej), interwałem i stosunkiem są zwykle analizowane z normalną klasą teorii testów statystycznych. Chociaż rozróżnienie jest nieco fuzzyone, często jest to bardzo przydatne rozróżnienie przy wyborze właściwej statystyki. Istnieje wiele specjalnych statystyk, które zostały opracowane w celu radzenia sobie ze zmiennymi porządkowymi o zaledwie kilku możliwych wartościach, ale nie będziemy ich obejmować w tej klasie (Zobacz Agresti, 1984, 1990; O ’ Connell, 2006; Wickens,1989, aby uzyskać więcej informacji na temat analizy zmiennych porządkowych).

ogólne klasy statystyki (chyba mnie to obchodzi)
Ok, więc mamy te dwie ogólne kategorie (tj. ciągłe i kategoryczne), co dalej…? Cóż, to rozróżnienie (choć może się wydawać niewyraźne) ma bardzo ważne wnioski dotyczące rodzaju stosowanej procedury statystycznej i będziemy podejmować decyzje w oparciu o to rozróżnienie przez cały kurs. Istnieją dwie ogólne klasy statystyki: te oparte na teorii dwumianowej i te oparte na teorii normalnej. Regresja Chi-kwadratowa i logistyczna zajmuje się teorią dwumianową lub rozkładami dwumianowymi, a testy t, ANOVA, korelacja i regresja zajmują się teorią normalną. Oto podsumowanie tablet.

Type of Dependent Variable (or Scale)

Level of Measurement

General Class of Statistic
(Binomial or Normal Theory)

Examples of Statistical Procedures

Categorical (or dichotomous)

nominal, ordinal with 2, 3, or 4 levels

binomial

chi-square, logistic regression

Continuous

ordinal with more than 4 categories

normal

ANOVA, regression, correlation, t-tests

SurveyQuestions and Measures: Niektóre typowe przykłady
w rzeczywistej praktyce badacze i problemy badawcze w prawdziwym życiu nie mówią, w jaki sposób należy skategoryzować zmienną zależną, więc przedstawię kilka rodzajów pytań ankietowych lub inne środki, które są powszechnie stosowane.

Yes/NoQuestions
każde pytanie dotyczące badania,które ma tak lub nie jako możliwą odpowiedź, jest nominalne, a więc statystyki dwumianowe będą stosowane, gdy pojedyncze pytanie tak / nie zostanie zachowane jako zmienna zależna lub jedna ze zmiennych zależnych w ananalizie.

Skale Likerta
specjalny rodzaj pytania ankietowego wykorzystuje zestaw odpowiedzi, które są uporządkowane tak, że jedna odpowiedź jest większa od drugiej. Skala Likerta została nazwana na cześć wynalazcy, Rensisa Likerta, którego imię wymawia się ” Lickert.”Ogólnie rzecz biorąc, thisterm jest używany do każdego pytania, które ma około 5 lub więcej możliwych opcji. Przykładem może być: „jak oceniłbyś swojego administratora działu?”1=bardzo niekompetentny,2=nieco niekompetentny, 3=ani Kompetentny, 4=jakiś Kompetentny, lub 5 = bardzo kompetentny . Skale Likerta to skale porządkowe lub interwałowe, a wielu psychometrów twierdzi, że są to skale interwałowe, ponieważ, gdy są dobrze skonstruowane, istnieje równa odległość między każdą wartością. Tak więc, jeśli skala Likertscale jest używana jako zmienna zależna w analizie, używane są statystyki teorii normalnej, takie jak ANOVA lub regresja.

pomiary fizyczne
Większość pomiarów fizycznych, takich jak: waga, ciśnienie skurczowe, odległość itp., są interwałami lub ratioscales, więc należą do ogólnej kategorii „ciągłych”. Dlatego też statystyka normalnego typu teorii jest również używana, gdy taka miara służy jako zmienna zależna w ananalizie.

liczenie
Liczenie jest trudne. Jeśli zmienna jest mierzona przez zliczanie, na przykład w przypadku, gdy aresearcher liczy liczbę dni hospitalizacji pacjenta szpitalnego, zmienna jest na skali proporcji i jest traktowana jako zmienna ciągła. Często jednak zalecane są specjalne statystyki, ponieważ zmienne liczbowe często mają bardzo przekrzywiony rozkład z dużą liczbą przypadków z liczbą zerową (patrz Agresti, 1990,str. 125; Cohen, Cohen, West, & Aiken, 2003, Rozdział 13). Jeśli badacz zlicza liczbę przedmiotów w eksperymencie (lub liczbę przypadków w zbiorze danych), miara continuoustype nie jest tak naprawdę używana. Liczenie w tym przypadku jest reallexamining częstotliwość, że niektóre wartości zmiennej występuje. Na przykład,liczenie liczby osób w zbiorze danych, które zgłaszają, że zostały hospitalizowane w ostatnim roku, opiera się na zmiennej dychotomicznej w zbiorze danych, która oznacza bycie hospitalizowanym lub nie hospitalizowanym (np., z pytań takich jak „Czy byłeś hospitalizowany w zeszłym roku?”).Nawet gdyby policzyć liczbę przypadków na podstawie pytania „Ile dni w ubiegłym roku byłeś hospitalizowany”, co jest ciągłą miarą, zmienna używana w analizie nie jest tak naprawdę ciągłą zmienną. Zamiast tego badacz faktycznie analizowałby zmienną adichotomiczną, licząc liczbę osób, które nie zostały spitalizowane w ubiegłym roku (0 dni) w porównaniu z tymi, które były (1 lub więcej dni).



Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.