lecture1
Lecture1
Tipi di scale& livelli di misura
Variabili discrete e continue
Il testo di Daniel distingue tra variabili discrete e continue. Queste distinzioni tecniche non saranno così importanti per noi in questa classe. Secondo il testo, le variabili discrete sono variabili in cui non sono possibili valori intermedi. Ad esempio, il numero di telefonate che ricevi al giorno. Non è possibile ricevere 6.3 telefonate. Variabili continuesono tutto il resto; qualsiasi variabile che può teoricamente avere valori in betweenpoints (ad esempio, tra 153 e 154 lbs. per esempio). Si scopre che questo isnot tutto ciò che utile di una distinzione per i nostri scopi. Ciò che è veramente più importante per le considerazioni statistiche è il livello di misura utilizzato. Quando dico che è più importante, ho davvero sottovalutato questo.Comprendere il livello di misurazione di una variabile (o scala o misura) è la prima e più importante distinzione che si deve fare su una variabile quando si eseguono statistiche!
Livelli di misurazione
Gli statistici spesso si riferiscono ai “livelli di misurazione” di una variabile, una misura o una scala per distinguere tra variabili misurate che hanno proprietà diverse. Ci sono quattro livelli di base: nominale, ordinale, intervallo e rapporto.
Nominale
Una variabile misurata su una scala “nominale” èuna variabile che in realtà non ha alcuna distinzione valutativa. Un valore isreally non più grande di un altro. Un buon esempio di variabile nominale èex (o genere). Le informazioni in un set di dati sul sesso sono solitamente codificate come 0 o 1, 1indicando il maschio e 0 indicando la femmina (o viceversa–0 per il maschio, 1 per la femmina). 1 in questo caso è un valore arbitrario e non è maggiore di orbetter di 0. C’è solo una differenza nominale tra 0 e 1. Con nominalvariables, c’è una differenza qualitativa tra i valori, non un quantitativeone.
Ordinale
Qualcosa misurato su una scala “ordinale” gli oggetti hanno una connotazione valutativa. Un valore è maggiore o maggiore o migliore dell’altro. Il prodotto A è preferito al prodotto B e quindi A riceve un valore di 1 e B riceve un valore di 2. Un altro esempio potrebbe essere la valutazione della soddisfazione del tuo lavoro su una scala da 1 a 10, con 10 che rappresentano la soddisfazione completa. Con le scale ordinali, sappiamo solo che 2 èmeglio di 1 o 10 è meglio di 9; non sappiamo di quanto. Può variare. La distanza tra 1 e 2 forse più breve tra 9 e 10.
Intervallo
Una variabile misurata su una scala di intervalli fornisce informazioni su più o meglio come fanno le scale ordinarie, ma le variabili di intervallo hanno una distanza uguale tra ciascun valore.La distanza tra 1 e 2 è uguale alla distanza tra 9 e 10.Temperatura utilizzando Celsius o Fahrenheit è un buon esempio, c’è la differenza exactsame tra 100 gradi e 90 in quanto vi è tra 42 e 32.
Ratio
Qualcosa misurato su una scala di rapporto ha le stesse proprietà di una scala di intervallo tranne che, con una scala di rapporto, c’è un punto zero assoluto. La temperatura misurata in Kelvin è un esempio. C’è novalue possibile sotto 0 gradi Kelvin, è zero assoluto. Il peso è anotherexample, 0 libbre. è una significativa assenza di peso. Il saldo del tuo conto bancario èun altro. Sebbene tu possa avere un saldo del conto negativo o positivo, c’èun significato definito e non arbitrario di un saldo del conto di 0.
Si può pensare a nominale, ordinale,intervallo e rapporto come classificati nella loro relazione l’uno con l’altro. Il rapporto è più sofisticato dell’intervallo, l’intervallo è più sofisticato dell’ordinale e l’ordinale è più sofisticato del nominale. Non lo so se i ranghi sono equidistanti o no, probabilmente no. Quindi che tipo di livello di misurazione è questoregistrazione dei livelli di misurazione?? Direi ordinale. Nelle statistiche, è meglio essereun po ‘ conservatore in caso di dubbio.
Due classi generali di variabili (a chi importa?)
Ok, ricorda che ho dichiarato che questa è la prima e più importante distinctionwhen usando le statistiche? Ecco perché. Per la maggior parte, gli statistici o i ricercatori finiscono per preoccuparsi solo della differenza tra nominale e tutti gli altri. Ci sono generalmente due classi di statistiche: quelle che si occupano di variabili dipendenti nominali e quelle che si occupano di variabili ordinali, intervalli o rapporti. (In questo momento ci concentreremo sulla variabile dipendente e più tardi discuteremo la variabile indipendente). Quando descrivo questi tipi didue classi generali di variabili, io (e molti altri) di solito mi riferisco a loro come”categorico” e “continuo.”(A volte userò “dicotomico” invece di “categorico”). Si noti inoltre che “continuo”in questo senso non è esattamente lo stesso di” continuo ” usato nel capitolo 1 del testo quando si distingue tra discreto e continuo. È un termine molto più flessibile. Categoriale edichotomous di solito significa che una scala è nominale. Le variabili “continue” sono solitamente quelle che sono ordinali o migliori.
Le scale ordinali con poche categorie(2,3, o forse 4) e le misure nominali sono spesso classificate come categorialand sono analizzate usando la classe binomiale di test statistici, mentre le scale ordinalscales con molte categorie (5 o più), intervallo e rapporto, sono usuallyanalyzed con la normale classe di teoria dei test statistici. Anche se la distinzione è un po ‘ fuzzyone, è spesso una distinzione molto utile per la scelta del corretto statisticaltest. Ci sono un certo numero di statistiche speciali che sono state sviluppate per trattare le variabili ordinali con solo alcuni valori possibili, ma non le copriremo in questa classe (vedi Agresti, 1984, 1990; O’Connell, 2006; Wickens,1989 per ulteriori informazioni sull’analisi delle variabili ordinali).
Classi generali ofStatistics (Oh, immagino che mi importi)
Ok, quindi abbiamo queste due categorie generali (cioè continue e categoriche), quale sarà il prossimo…? Bene, questa distinzione (per quanto confusa possa sembrare) ha implicazioni molto importanti per il tipo di procedura statistica utilizzata e faremo decisioni basate su questa distinzione per tutto il corso. Esistono due classi generali di statistiche: quelle basate sulla teoria binomiale e quelle basate sulla teoria normale. Il Chi-quadrato e la regressione logistica si occupano di teoria binomiale o distribuzioni binomiali,e t-test, ANOVA, correlazione e regressione trattano la teoria normale. Quindi ecco un tableto riassumere.
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: Alcuni esempi comuni
Nella pratica reale, researchersand problemi di ricerca di vita reale non ti dicono come la variabile dipendentedovrebbe essere classificato, così io delineare alcuni tipi di domande di indagine oaltre misure che sono comunemente usati.
Yes/NoQuestions
Qualsiasi domanda su un sondaggio che ha sì o no come possibile risposta è nominale,e quindi le statistiche binomiali verranno applicate ogni volta che una singola domanda sì / no funge da variabile dipendente o da una delle variabili dipendenti in ananalisi.
Likert Scales
Un tipo speciale di domanda di indagine utilizza un insieme di risposte ordinate in modo che una risposta sia maggiore di un’altra. La scala di Theterm Likert prende il nome dall’inventore,Rensis Likert, il cui nomeè pronunciato “Lickert.”Generalmente, thisterm viene utilizzato per qualsiasi domanda che abbia circa 5 o più opzioni possibili. Un esempio potrebbe essere: “Come valuteresti il tuo amministratore di reparto?”1 = molto incompetente, 2 = un po’ incompetente, 3 = né competente, 4=somewhatcompetent, o 5 = molto competente. Likert scale areeither ordinale o intervallo, e molti psicometricianswould sostengono che essi sono scale di intervallo perché, quando ben costruito, thereis uguale distanza tra ogni valore. Quindi, se un Likertscale viene utilizzato come variabile dipendente in un’analisi, verranno utilizzate statistiche di teoria normale come ANOVA o regressione.
Misure fisiche
La maggior parte delle misure fisiche, come altezza, peso,pressione sistolica, distanza ecc., sono intervallo o rapportoscale, quindi rientrano nella categoria generale “continua”. Pertanto, le statistiche di tipo teoria normale vengono utilizzate anche quando una tale misura funge da variabile dipendente in ananalisi.
Conteggi
I conteggi sono complicati. Se una variabile viene misurata contando, ad esempio se aresearcher sta contando il numero di giorni in cui un paziente ospedaliero è stato ricoverato, la variabile si trova su una scala di rapporto e viene trattata come una variabile continua. Le statistiche speciali sono spesso raccomandate, tuttavia, perché le variabili di conteggio hanno spesso una distribuzione molto distorta con un numero elevato di casi con un conteggio zero (vedi Agresti,1990, p. 125; Cohen, Cohen, West, & Aiken, 2003, Capitolo 13). Se un ricercatore sta contando il numero di soggetti in un esperimento (o il numero di casi nel set di dati), una misura di tipo continuo non viene realmente utilizzata. Il conteggio in questo caso è davveroesaminando la frequenza in cui si verifica un valore di una variabile. Ad esempio, contando il numero di soggetti nel set di dati che riferiscono di essere stati ricoverati nell’ultimo anno, si basa su una variabile dicotomica nel set di dati che sta per essere ricoverato o non ricoverato (ad es., da aquestion come ” è stato ricoverato nell’anno scorso?”).Anche se si dovesse contare il numero di casi in base alla domanda “comemolti giorni nell’ultimo anno sei stato ricoverato in ospedale”, che è una misura continua, la variabile utilizzata nell’analisi non è in realtà questovariabile continua. Invece, il ricercatore starebbe effettivamente analizzando una variabile adichotomous contando il numero di persone che non erano state ricoverate nell’ultimo anno (0 giorni) rispetto a quelli che erano stati (1 o più giorni).