lecture1
Lecture1
スケールの種類&測定レベル
離散変数と連続変数
ダニエルのテキストは、離散変数と連続変数 これらの技術的な区別は、このクラスで私たちにとってそれほど重要ではありません。 テキストによると、離散変数は、中間値は可能ではありません。 たとえば、電話の数あなたは一日あたりに受け取ります。 お電話でのお問い合わせはお受けできません。 連続変数は他のすべてです; 理論的には153から154ポンドの間の値を持つことができる任意の変数。 例えば)。 これは私たちの目的のために区別するのにそれほど有用ではありません。 統計的考慮のために本当に重要なのは、測定のレベルです使用されています。 私はそれがより重要であると言うとき、私は本当にこれを控えめにしました。変数(または尺度または尺度)の測定レベルを理解することは、統計を行うときに変数について作らなければならない最初の最も重要な区別です!
Levels ofmeasurement
統計学者は、多くの場合、異なる特性を有する測定された変数を区別するために、avariable、メジャー、またはスケールの”測定レベル”を参照します。 4つの基本的なレベルがあります:公称、順序、間隔、および比率。
Nominal
“nominal”スケールで測定された変数は、実際には評価的な区別がない変数です。 ある値は実際には別の値よりも大きくありません。 名目変数の良い例は、性別(または性別)。 性別に関するデータセット内の情報は、通常、0または1、男性を示す1、女性を示す0(または男性の場合は0、女性の場合は1)としてコード化されます。 この場合の1は任意の値であり、0よりも大きいまたはより大きい値ではありません。 0と1の間にはわずかな違いしかありません。 Nominalvariablesでは、quantitativeoneではなく、値の間に定性的な違いがあります。
序数
“序数”スケールで測定されたものは、評価的な意味合いを持っています。 一つの値が大きいか大きいかより良い他の値よりも。 製品Aは製品Bよりも優先されるため、aは1の値を受け取り、Bは2の値を受け取ります。 別の例として、ジョブの満足度を1から10までのスケールで評価し、10はcompletesatisfactionを表します。 序数スケールでは、2が1よりも優れているか、10が9よりも優れていることしかわかりません。 それは異なる場合があります。 1と2の間の距離は、9と10の間よりも短いかもしれません。
Interval
intervalスケールで測定された変数は、ordinalscalesのように多かれ少なかれに関する情報を与えますが、interval変数は各値の間に等しい距離を持1と2の間の距離は、9と10の間の距離に等しくなります。摂氏または華氏を使用した温度は良い例ですが、100度と90度の間には42と32の間にあるように正確な同じ違いがあります。
比率
比率スケールで測定されたものは、比率スケールでは絶対零点があることを除いて、間隔スケールと同じ特性を持っています。 ケルビンで測定された温度は一例である。 0度ケルビン以下に可能な値があり、絶対零度です。 重量は別のサンプル、0ポンドです。 体重の意味のある欠如です。 あなたの銀行口座の残高は別の。 あなたは負または正の口座残高を持つことができますが、0の口座残高の明確かつ非arbitrary意味があります。nominal、ordinal、interval、およびratioは、互いに関係してランク付けされていると考えることができます。
比率は区間よりも洗練されており、区間は序数よりも洗練されており、序数は公称よりも洗練されています。 ランクが等しいかどうかはわかりませんが、おそらくそうではありません。 では、これはどのような測定レベルなのでしょうか?? 私は序数と言うでしょう。 統計では、疑問があるときは少し保守的です。
変数の二つの一般的なクラス(誰が気に?)
さて、私はこれが最初で最も重要な区別であると述べたことを覚えています統計を使用するとき? ここに理由があります。 ほとんどの場合、統計学者または研究者は、名目上のものと他のものとの違いを気にするだけです。 一般に、統計には2つのクラスがあります:非零従属変数を扱うものと、順序変数、間隔変数、または比率変数を扱うものです。 (今、私たちは従属変数に焦点を当て、後で独立変数について説明します)。 私がこれらのタイプの変数の2つの一般的なクラスを記述するとき、私(および他の多く)は通常、それらを”カテゴリカル”および”連続的”と呼びます。”(時々私は”categorical”の代わりに”dichotomous”を使用します)。 また、この意味での「連続」は、離散と連続の間で区別するときにテキストの第1章で使用されている「連続」とまったく同じではないことに注意してくださ それははるかに緩い用語です。 カテゴリとdichotomousは、通常、スケールが名目であることを意味します。 「連続的な」変数は、通常、序数以上の変数です。
いくつかのカテゴリ(2,3、またはおそらく4)と名目尺度を持つ順序尺度は、多くの場合、カテゴリとして分類され、統計的検定の二項クラスを使用して分析されますが、多くのカテゴリ(5以上)、間隔、および比率を持つordinalscalesは、通常、統計的検定の通常の理論クラスで分析されます。 この区別はややあいまいですが、正しいstatisticaltestを選択するための非常に有用な区別です。 可能な値だけを持つ順序変数を扱うために開発された多くの特殊統計がありますが、このクラスではそれらをカバーしません(順序変数の分析の詳細はAgresti,1984,1990;O’Connell,2006;Wickens,1989を参照してください)。 統計学の一般的なクラス(ああ、私は気にしていると思います)
Ok、これらの2つの一般的なカテゴリ(つまり、連続的かつカテゴリ的)があります。 まあ、この区別は(それが聞こえるかもしれないようにファジー)使用される統計的手順のタイプのための非常にimportantimplicationsを持っており、我々はすべてのコースを通 統計には2つの一般的なクラスがあります:二項理論に基づくものと通常の理論に基づくもの。 カイ二乗回帰とロジスティック回帰は二項理論または二項分布を扱い、t検定、ANOVA、相関、回帰は正規理論を扱います。 だからここに要約するtabletoです。
Type of Dependent Variable (or Scale) |
Level of Measurement |
General Class of Statistic |
Examples of Statistical Procedures |
Categorical (or dichotomous) |
nominal, ordinal with 2, 3, or 4 levels |
binomial |
chi-square, logistic regression |
Continuous |
ordinal with more than 4 categories |
normal |
ANOVA, regression, correlation, t-tests |
SurveyQuestions and Measures: いくつかの一般的な例
実際の実践では、研究者と実際の研究問題は、従属変数がどのように分類されるべきかを教えてくれないので、私は一般的に使
Yes/NoQuestions
可能な応答としてyesまたはnoを持っている調査上の任意の質問は公称であるため、単一のyes/no questionservesが従属変数または分析の従属変数のいずれかとして適用されるたびに二項統計が適用されます。
Likert Scales
特別な種類の調査質問は、ある回答が別の回答よりも大きくなるように順序付けられた一連の回答を使用します。 Teterm Likertスケールは、発明者のRensis Likertにちなんで命名され、その名前は「Lickert」と発音されます。”一般的に、thistermは約5つ以上の可能なオプションを持っている任意の質問に使用されます。 たとえば、”部門管理者をどのように評価しますか?”1=非常に無能、2=やや無能、3=どちらも有能、4=somewhatcompetent、または5=非常に有能。 Likertスケールareeither順序または間隔,多くの心理学者は、彼らが間隔スケールであることを主張するだろう,よく構築されたとき,各値の間に等しい距離をthereis. したがって、Likertscaleが分析で従属変数として使用される場合、ANOVAや回帰などの通常の理論統計が使用されます。P>
PhysicalMeasures
高さ、体重、収縮期血圧、距離などのほとんどの物理的な尺度。,は区間または比であるので、一般的な”連続”カテゴリに分類されます。 したがって、正規理論型統計は、そのような測度が分析の従属変数として機能する場合にも使用されます。
カウント
カウントはトリッキーです。 Aresearcherが病院の患者が入院した日数をカウントしている場合など、変数をカウントして測定する場合、変数は比率スケールであり、continuousvariableとして扱われます。 ただし、countvariablesは、カウントがゼロのケース数が多い非常に歪んだ分布を持つことが多いため、特別な統計が推奨されることがよくあります(Agresti,1990,p.125を参照; Cohen,Cohen,West,&Aiken,2003,Chapter13)。 研究者が実験内のサブジェクトの数(またはデータセット内のケースの数)を数えている場合、continuoustypeメジャーは実際には使用されていません。 このインスタンスでのカウントは本当に変数のある値が発生する頻度を調べます。 たとえば、昨年に入院したと報告されたデータセット内の被験者の数を数えることは、入院しているか入院していないことを表すデータセット内の二”去年入院したことがある?”などの質問から、”).たとえ連続的な尺度である「過去1年間に何日入院したのか」という質問に基づいて症例数を数えたとしても、分析で使用されている変数は実際には 代わりに、研究者は実際に過去1年間に入院していなかった人(0日)と入院していた人(1日以上)の数を数えることによって、adichotomous変数を分析しています。