lecture1

Lecture1
Types d’échelles &niveaux de mesure

Variables discrètes et continues
Le texte de Daniel distingue les variables discrètes et continues. Ce sont des distinctions techniques qui ne seront pas si importantes pour nous dans cette classe. Selon le texte, les variables discrètes sont des variables dans lesquelles il n’y a pas de valeurs intermédiaires possibles. Par exemple, le nombre d’appels téléphoniques que vous recevez par jour. Vous ne pouvez pas recevoir d’appels téléphoniques 6.3. Variablessont tout le reste; toute variable qui peut théoriquement avoir des valeurs entre les points (par exemple, entre 153 et 154 lb. par exemple). Il s’avère que ce n’est pas si utile d’une distinction à nos fins. Ce qui est vraiment plus important pour des considérations statistiques, c’est le niveau de mesure utilisé. Quand je dis que c’est plus important, j’ai vraiment sous-estimé cela.Comprendre le niveau de mesure d’une variable (ou échelle ou mesure) est la première et la plus importante distinction qu’il faut faire à propos d’une variable lors de la réalisation de statistiques!

Niveaux de mesure
Les statisticiens se réfèrent souvent aux « niveaux de mesure » d’une variable, d’une mesure ou d’une échelle pour distinguer les variables mesurées qui ont des propriétés différentes. Il existe quatre niveaux de base: nominal, ordinal, intervalle et rapport.

Nominale
Une variable mesurée sur une échelle « nominale » estune variable qui n’a pas vraiment de distinction évaluative. Une valeur n’est vraiment pas plus grande qu’une autre. Un bon exemple de variable nominale estex (ou sexe). Les informations d’un ensemble de données sur le sexe sont généralement codées comme 0 ou 1, 1 indiquant un homme et 0 indiquant une femme (ou l’inverse–0 pour un homme, 1 pour une femme). 1 dans ce cas est une valeur arbitraire et elle n’est pas supérieure à 0. Il n’y a qu’une différence nominale entre 0 et 1. Avec les variables nominales, il existe une différence qualitative entre les valeurs, pas une différence quantitative.

Ordinal
Quelque chose mesuré sur une échelle « ordinale » a une connotation évaluative. Une valeur est plus grande ou plus grande ou mieux que l’autre. Le produit A est préféré au produit B, et donc A reçoit une valeur de 1 et B reçoit une valeur de 2. Un autre exemple pourrait être d’évaluer la satisfaction de votre travail sur une échelle de 1 à 10, avec 10 représentant une satisfaction complète. Avec les échelles ordinales, nous savons seulement que 2 est meilleur que 1 ou 10 vaut mieux que 9; nous ne savons pas de combien. Cela peut varier. La distance entre 1 et 2 peut-être plus courte qu’entre 9 et 10.

Intervalle
Une variable mesurée sur une échelle d’intervalles donne des informations sur plus ou mieux que les échelles ordinaires, mais les variables d’intervalle ont une distance égale entre chaque valeur.La distance entre 1 et 2 est égale à la distance entre 9 et 10.Température en utilisant Celsius ou Fahrenheit est un bon exemple, il y a la même différence entre 100 degrés et 90 car il y a entre 42 et 32.

Ratio
Quelque chose mesuré sur une échelle de rapport a les mêmes propriétés qu’une échelle d’intervalles sauf que, avec une échelle de rapport, il y a un point zéro absolu. La température mesurée en Kelvin en est un exemple. Il y a novalue possible en dessous de 0 degrés Kelvin, c’est le zéro absolu. Le poids est un autreéchantillon, 0 lb. est une absence significative de poids. Le solde de votre compte bancaire estautre. Bien que vous puissiez avoir un solde de compte négatif ou positif, il existe une signification définie et non arbitraire d’un solde de compte de 0.

On peut penser que le nominal, l’ordinal, l’intervalle et le rapport sont classés dans leur relation l’un à l’autre. Le rapport est plus sophistiqué que l’intervalle, l’intervalle est plus sophistiqué que l’ordinal et l’ordinal est plus sophistiqué que le nominal. Je ne sais pas si les rangs sont équidistants ou non, probablement pas. Alors, quel type de niveau de mesure est-ceenregistrement des niveaux de mesure?? Je dirais ordinal. En statistiques, il est préférable d’êtreun peu conservateur en cas de doute.

Deux Classes générales de variables (Qui s’en soucie?)
Ok, rappelez-vous que j’ai déclaré que c’est la première et la plus importante distinction lors de l’utilisation des statistiques? Voici pourquoi. Pour la plupart, les statisticiens ou les chercheurs ne se soucient que de la différence entre le nominal et tous les autres. Il existe généralement deux classes de statistiques: celles qui traitent des variables dépendantes nominales et celles qui traitent des variables ordinales, d’intervalle ou de rapport. (À l’heure actuelle, nous allons nous concentrer sur la variable dépendante etplus tard, nous discuterons de la variable indépendante). Lorsque je décris ces types dedeux classes générales de variables, je (et beaucoup d’autres) les qualifient généralement de « catégorielles » et de « continues ». »(Parfois, j’utiliserai « dichotomique » au lieu de « catégorique »). Notez également que « continu » dans ce sens n’est pas exactement le même que « continu » utilisé au chapitre 1 du texte pour distinguer entre discret et continu. C’est un terme beaucoup plus lâche. Catégorique etdichotomique signifie généralement qu’une échelle est nominale. Les variables « continues » sont généralement celles qui sont ordinales ou meilleures.

Les échelles ordinales avec peu de catégories (2,3, ou peut-être 4) et les mesures nominales sont souvent classées comme catégoriques et sont analysées en utilisant une classe binomiale de tests statistiques, tandis que les échelles ordinales avec de nombreuses catégories (5 ou plus), intervalle et rapport, sont généralement analysées avec la classe théorique normale des tests statistiques. Bien que la distinction soit quelque peu floue, c’est souvent une distinction très utile pour choisir le test statistique correct. Il y a un certain nombre de statistiques spéciales qui ont été développées pour traiter des variables ordinales avec juste quelques valeurs possibles, mais nous n’allons pas les couvrir dans cette classe (voir Agresti, 1984, 1990; O’Connell, 2006; Wickens, 1989 pour plus d’informations sur l’analyse des variables ordinales).

Classes générales de statistiques (Oh, Je suppose Que je m’en soucie)
Ok, nous avons donc ces deux catégories générales (c’est-à-dire continues et catégoriques), et ensuite…? Eh bien, cette distinction (aussi floue que cela puisse paraître) a des explications très importantes pour le type de procédure statistique utilisée et nous prendrons des décisions basées sur cette distinction tout au long du cours. Il existe deux classes générales de statistiques: celles basées sur la théorie binomiale et celles basées sur la théorie normale. Le Chi carré et la régression logistique traitent de la théorie binomiale ou des distributions binomiales, et les tests t, l’ANOVA, la corrélation et la régression traitent de la théorie normale. Voici donc un tablepour résumer.

Type of Dependent Variable (or Scale)

Level of Measurement

General Class of Statistic
(Binomial or Normal Theory)

Examples of Statistical Procedures

Categorical (or dichotomous)

nominal, ordinal with 2, 3, or 4 levels

binomial

chi-square, logistic regression

Continuous

ordinal with more than 4 categories

normal

ANOVA, regression, correlation, t-tests

SurveyQuestions and Measures: Quelques exemples courants
Dans la pratique réelle, les chercheurset les problèmes de recherche réels ne vous disent pas comment les variables dépendantes doivent être catégorisées, je vais donc décrire quelques types de questions d’enquête ou d’autres mesures couramment utilisées.

Oui /Nonquestions
Toute question d’une enquête qui a oui ou non comme réponse possible est nominale, et donc des statistiques binomiales seront appliquées chaque fois qu’une seule question oui / non sert de variable dépendante ou l’une des variables dépendantes dans l’ananalyse.

Échelles de Likert
Un type particulier de question d’enquête utilise un ensemble deréponses qui sont ordonnées de sorte qu’une réponse soit supérieure à une autre. L’échelle de Theterm Likert porte le nom de l’inventeur, Rensis Likert, dont le nom se prononce « Lickert. »En général, ce terme est utilisé pour toute question qui a environ 5 options possibles ou plus. Un exemple pourrait être: « Comment évalueriez-vous l’administrateur de votre département? »1 = très incompétent, 2 = quelque peu incompétent, 3 = ni compétent, 4 = quelque peu compétent, ou 5 = très compétent. Les échelles de Likert sont soit des ordinaux, soit des intervalles, et de nombreux psychométriciens soutiennent qu’il s’agit d’échelles d’intervalles car, lorsqu’elles sont bien construites, il y a une distance égale entre chaque valeur. Donc, si une échelle de Likert est utilisée comme variable dépendante dans une analyse, des statistiques théoriques normales telles que l’ANOVA ou la régression seraient utilisées.

Mesures physiques
La plupart des mesures physiques, telles que la hauteur, le poids, la pression artérielle systolique, la distance, etc., sont des intervalles ou des ratioscales, de sorte qu’ils tombent dans la catégorie générale « continue ». Par conséquent, les statistiques de type théorie normale sont également utilisées lorsqu’une telle mesure sert de variable dépendante dans l’ananalyse.

Compte
Les comptes sont difficiles. Si une variable est mesurée par comptage, comme dans le cas où un chercheur compte le nombre de jours où un patient hospitalisé a été hospitalisé, la variable est sur une échelle de ratio et est traitée comme une variable continue. Cependant, des statistiques spéciales sont souvent recommandées, car les variables dénombrables ont souvent une distribution très biaisée avec un nombre élevé de cas avec un nombre nul (voir Agresti, 1990, p. 125; Cohen, Cohen, West, &Aiken, 2003, chapitre 13). Si un chercheur compte le nombre de sujets dans une expérience (ou le nombre de cas dans l’ensemble de données), une mesure de type continu n’est pas vraiment utilisée. Le comptage dans ce cas est vraimentexamen de la fréquence à laquelle une valeur d’une variable se produit. Par exemple, le comptage du nombre de sujets de l’ensemble de données qui déclarent avoir été hospitalisés au cours de la dernière année repose sur une variable dichotomique de l’ensemble de données qui signifie être hospitalisé ou ne pas être hospitalisé (p. ex., d’une question telle que « avez-vous été hospitalisé au cours de la dernière année? »).Même si l’on devait compter le nombre de cas en fonction de la question « combien de jours au cours de l’année écoulée avez-vous été hospitalisé », qui est une mesure continue, la variable utilisée dans l’analyse n’est vraiment pas cette variable continue. Au lieu de cela, le chercheur analyserait en fait la variable adichotomique en comptant le nombre de personnes qui n’avaient pas été hospitalisées au cours de la dernière année (0 jour) par rapport à celles qui l’avaient été (1 jour ou plus).



Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.