調査およびコンセンサスグループの最大変動サンプリング
最大変動サンプリングとは何ですか?
等しい確率によって代表性を求める代わりに、最大変動サンプリングは、極端な広い範囲を含めることによってそれを求めます。 原理は、あなたが意図的に人々の非常に異なる選択にインタビューしようとすると、彼らの集計回答は、全人口のに近いことができるということです。 言い換えれば、人々のグループがいくつかの異なる方法で極端である場合、それは他の方法で平均である人々を含むことになります。 だから、あなたが平均的だと思った人のタイプをカバーしようとするだけで”最小変動”サンプルを求めた場合、人口のかなり高い割合を占める多くの異 しかし、最大の変動を求めることによって、平均的な人々が自動的に含まれています。
最大変動サンプル(最大多様性サンプルまたは最大異質性サンプルと呼ばれることもあります)は、特別な種類の目的のあるサンプルです。
通常、目的のあるサンプルは代表的なものではなく、そうであると主張しません。 ただし、最大変動サンプルは、慎重に描画された場合、ランダムサンプルと同じくらい代表的である可能性があります。 多くの人が(統計の知識が少ない)と信じているにもかかわらず、特にサンプルサイズが小さい場合、ランダムサンプルは必ずしも最も代表的ではあ
最大変動サンプリングを使用する場合
最大変動サンプリングを使用するには、主に二つの機会があります。
- サンプルサイズが非常に小さい場合、または
- 母集団情報が利用できない場合(選択した特性を持つ母集団メンバーを見つけることは困難ではありません)
2.1。 小さなサンプルサイズの最大変動サンプリング
ここで”小さい”ということは、約30未満を意味します。 (「約3 0」は、約2 0から約5 0までの任意のものを意味し、サンプルサイズが大きくなるにつれて急激な変化はない。)実際の数にかかわらず、ランダムサンプリングは、これらの小さなサンプルのためにうまく動作しません:それは無作為に選択されたにもかかわらず、代表的ではないサンプルを取得する可能性が高いです。 サンプルが3(コンセンサスグループのセットの場合)と同じくらい小さい場合、無作為抽出はあまりにも危険です。 代わりに、クォータサンプリングまたは最大変動サンプリングを使用できます。 母集団に関する十分なデータがある場合は、クォータサンプリングで問題ありません。 たとえば、町の人口から20人をサンプリングしている場合、クォータサンプリングの簡単な形式は、10人の男性と10人の女性を選択することです。 しかし、クォータサンプリングは、公表された人口データや推測された人口データから、常に関連性があるとは限りません。 これは、最大変動サンプリングが最も有用なときです。 たとえば、コンセンサスグループのセットのサンプルを選択するときは、通常、研究されている問題についてできるだけ異なる3種類の人々を取ります。
2.2. 母集団データがない場合の最大変動サンプリング
無作為抽出は理想的なサンプリング方法と考えられていますが、無作為抽出を取ることが いくつかの国では、国勢調査情報は利用できないか、それは役に立たないことを古くなっているので、多くの年のいずれかです。 最近の詳細な国勢調査データが存在する場合でも、データが適用される地域の境界を示すマップがない場合があります。 また、良好な国勢調査データと関連する地図の両方が存在する場合でも、サンプリングフレームが存在しない可能性があります。
良いニュースは、(サンプリングの観点から)これらの条件は、通常、大きな農村人口を持つ非常に貧しいと未開発の国に適用されるということです。 私の経験では、これらの集団には広範囲の変動はありません。 国が発展すればするほど、市民の間にはより多くの違いがあるようです。 したがって、無作為抽出が不可能な場合、おそらくそれはそれほど必要ではありません。 しかし、サンプルフレームが存在しない貧しい国では、以下で説明する多段法を使用して、最大変動サンプリングが非常に効果的です。
最大変動サンプルに最適なサンプルサイズは何ですか?
シングルステージのサンプルの場合、またはサンプリングの草の根レベルでは、最大変動サンプルを約50単位以下に制限することをお勧めします。
その数を超えると、面接者は混乱し、クォータサンプリングやラジアルサンプリングなどの他の方法は、より簡単で、しばしばより包括的です。 多段サンプルで50以下のサブサンプルを組み合わせることで、合計サンプルは数千人になる可能性がありますが、追加の努力が必要なため、代替手段がない限り、それを行うことはできません。 私が試した最大のものは約200で、12のクラスターでした-しかし、クォータサンプル(例えば、職業タイプ別の性別別の年齢層)が代表的であったかもしれず、インタビュアーの監督をはるかに少なくする必要があったでしょう。
最大変動サンプルを選択する方法
最大変動サンプリングでは、母集団にすべての極値を含めるようにします。 たとえば、小さな村では、ラジオの視聴者の調査のために、あなたはインタビューを求めることができます。..
- ラジオを聴く村で最も古い人
- ラジオを聞いていない最古の人
- ラジオを聞いていない最年少
- ラジオを聞く人一日中ラジオを聴く人
- 多くの場合、彼または彼女が聞いたラジオ番組について話している人
- 夜中にラジオを聴く人
- 彼または彼女の人生でラジオを聞いたことがない人
- li>
- 最もラジオを持つ人(おそらく修理士)
- 最大の空中を持つ人
- すべての点で完全に平均的であると考えられている人
- 通りや公共の場所で多くの時間を過ごす人
- ほぼすべての時間を働く人
。..というように-両性の平等な表現を確保するために、交互に”男”または”女”に”人”を変更します。 もちろん、これは他の人に関するそのような情報が広く知られている場合にのみ機能します。 人々の上記のリストは、多くの人々が他の多くを知っている村で生産することができますが、大都市でははるかに困難になります。
多くの場合、地元の情報提供者の最初のグループ(最終的な回答者であってはならない)との予備的なブレーンストーミングセッションを持つことは有用で 上記と同様ですが、あなたの研究の目的のために適切に変更された個人的なタイプの最初のリストを提示してください。 人のいくつかのより多くのタイプを思い付くし、あなたが発明したタイプのいくつかは、その分野で意味をなさないかどうかを伝えるためにそれら しかし、あなたが例で始まらない限り、私は人々があなたが求めていることを理解するのが難しいと感じていることを発見しました。上記のようにサンプルを描画する際の1つの問題は、それらの特性を持つ人々を識別するために使用する情報提供者です。
それは魅力的です-それは簡単ですので-地方自治体のオフィスに行き、役人にそれらのタイプの人々に名前を付けるように頼むのは魅力的です。 あなたはすぐにそれらのリストを取得することができますが、一つの重要な方法で最大の変化はありません:提案された回答者はすべて地方政府関係者
あなたのネットは、各ソースからいくつかの提案された回答者だけを取得し、順次サンプリング(スノーボールサンプリング)によって、より広くキャス 言い換えれば、情報提供者Aはあなたの特性のリストから回答者BとCを示唆し、BはDとEを示唆し、CはFとGを示唆します。 “六度の分離”の原則と、回答者が友人を提案するように求められていないが、特定の特性を持つ人々であるという事実を考えると、最大変動法は、調査地域のあなたはその議論の欠陥に気付きましたか?
問題は、潜在的な回答者がより多くの人々に知られているほど、その人が調査のために選択される可能性が高くなることです。 したがって、個人タイプのリストには、次のような基準を追加することによって、社会的に孤立した人々を明示的に含める必要があります。..
- 非常に少数の訪問者を持っている年上の男
- あまり話をしない若い男
- 一人で住んでいて、近くに住んでいる家族がいない年上の女性
- 未婚で、家を出ることはほとんどない若い女性
。..というように-文化に合わせて上記の説明を変化させます。 (世界のいくつかの地域では、あなたは一人で住んでいる女性を見つけることはありません。)宗教的、言語的、または部族的な線に沿って分離がある場合は、それらの文化的グループのそれぞれに別々のスレッドを開始する必要があります。
特定のタイプの人を求め、情報提供者がそのような人に正確に名前を付けることができない場合は、関連性があると思われる他の基準に基づいて、近似を受け入れることは問題ありません。 これは、あなたが最初に考えていなかった多様性の他の次元を導入することができます。
変動の次元を選択する
上記の例では、ラジオリスニングに影響を与える可能性のある社会的状況を想像することによって、12種類の無線リスナ(プラス別の4種類の社会的分離株)が発見された。 リストは網羅的でも体系的でもありませんでしたが、人々のグループが省略されていないことを確認したい場合は、次元分析を使用してより包括的なリ このようにして行われます。..
ステップ1は、必要なサンプルサイズを決定することです。 たとえば、20だとしましょう。 これにより、次元の数が決まります: 20は何の力に2ですか? 2x2x2x2=16なので、最も近い答えは4です。 したがって、4つの次元を使用して16のケースを取得し、社会的に孤立した人々などのいくつかの要因を追加することができます。 (32のサンプルの場合は5次元を使用し、64の場合は6を使用します。 100かそこらの上で、クォータサンプリングは、通常、より良い作品。)
ステップ2は、それらの次元を決定することです。 (A)あなたが研究している主題に関連して人々の間で広く異なる、および(b)他の人々の広い範囲に知られている人々のいくつかの特性を考えてみてくださ たとえば、人々がラジオを聴くのにどれくらいの時間を費やしているかが主題である場合、ほとんどの国で男性と女性がラジオを聴くのに約同じ時間 しかし、人々が自宅でラジオを持っているかどうかは、彼らのリスニング時間に大きな違いになります。 ラジオのリスニングに影響を与える他の目に見える要因は、人々が自宅でテレビを持っているかどうか、そして人々がラジオのない場所で家から離れて もう一つの要因は、彼らが地元の番組を聞くのが好きかどうかですが、それは簡単には観察できないので、ラジオ番組について話す頻度など、プロキシ変 今度は4つの変数があり、それぞれに2つの極端な答えがあります。 このように、可能なそれぞれの答えにaから始まる文字コードを与えます。..p>
- 自宅でラジオを持っている:はい(a)またはいいえ(B)
- 自宅でテレビを持っている:はい(C)またはいいえ(D)
- ほとんどの時間家に滞在(E)または家から離れてほとんどの時間(F)
- ラジオ番組について他の人と話す頻度: “ほとんどの日”(G)または”ほとんどない”(H)
4つの変数のそれぞれを順番に取ると、16の可能なカテゴリ(2x2x2x2)があります。 これらは
ACEG、ACEH、ACFG、ACFH
BCEG、BCEH、BCFG、BCFH
ADEG、ADEH、ADFG、ADFH
BDEG、BDEH、BDFG、BDFH
例えば、BDGH=自宅でラジオを持っていない人、自宅でテレビを持っていない人は、ほとんどの時間家から離れて
ステップ3。 あなたが今しなければならないのは、その説明に一致する誰かを見つけて、15人の他のタイプの人々のためにそのタスクを繰り返すことです。 これらの説明のいくつかを満たす人を見つけることができない場合はどうなりますか? これは起こる可能性があります-たとえば、ほとんどの時間家にいて、家にラジオを持っていない人を見つけるのは難しいかもしれませんが、それにつ この場合、あなたは16のカテゴリのいくつかで複数の人で終わるでしょう。 大きな問題はありません:同じカテゴリの人々があなたの研究に関連すると思われる他の方法で非常に異なっていることを確認してください。
ステップ4。 最後に、めったに他の人と通信しない4人を追加することを忘れないでください。 それはあなたのサンプルを20まで持って来ます。 あなたは20以上をしたいですか? 彼らはいくつかの関連する方法で互いに可能な限り異なっている限り、ちょうどいくつかのより多くの人々を追加します。
回答者を選択するこの体系的な方法は、面接者を名簿するときに簡単ですが、私はそれが上記のセクション4で説明されているよりランダムな方
多段最大変動サンプリング
多段サンプルを選択する場合、最初の段階は全国の地区のサンプルを描画することがあります。 この数が約30未満の場合、サンプルはいくつかの点で真剣に表現されない可能性があります。 これに対する2つの解決策は、層別化と最大変動サンプリングです。 これらの両方のために、いくつかの地元の知識が必要です。
大きな地理的領域を測量する場合、最大変動サンプルをいくつかの段階で描画することができます。
大きな地理的領域を測量する場合、最大変動 第一段階は、人口地域のどの部分を調査するかを決定することです。 たとえば、調査が州全体を表すものであり、州のすべての部分を調査することは不可能である場合、州のどの部分(郡と呼びましょう)を含めるかを決 それらを選択すると、このように行われます。..
6.1. ステージ1
1. 調査の対象に関連する特別な方法-郡が全体として州と異なる可能性があるすべての方法を考えてください。 FMラジオについての調査であり、一部の地域が丘陵地である場合、受信が悪い可能性があります。 調査がマラリアに関するものであり、いくつかの郡には蚊が多い大きな沼地がある場合は、そのような郡とその反対の郡を含めてください。 トピックが富や教育レベルに関連している場合(多くの研究トピックがそうであるように)、どの郡が最も裕福で最高の教育を受けた人々を持ち、最も貧 調査に関連している5から10の要因について考えることを試みなさい。
2. 次に、これらの要因に関する客観的なデータを収集してみてください。 それに失敗した場合は、トピックに関する専門家、または州全体を旅した人を見つけようとします。 この情報を使用して、各因子について、因子のレベルが高い郡(例えば、多くの山、多くの沼、または裕福)と、因子のレベルが低い郡(例えば、すべての平らな、沼
3. これらの極端なリストで最も頻繁に言及されている郡は、調査に含める必要があります。 州の地図上にこれらの郡をマークします。 大規模で人口の多い地域は省略されていますか? もしそうなら、言及された他のすべてのものから可能な限り別の郡を追加してください。6.2.
ステージ2
郡(または地域が呼び出されているものは何でも)が選択されたとき、次の段階は、各郡のクラスターを選択する必要があります。 選択した各郡内で同じ原則を使用して、最大変動の原則を続行します。 郡は、その沼地と平坦性のために選択された場合は、国で最も平坦でswampiestエリアを選択します。 それが山と富のために選ばれたならば、裕福な山岳地帯を選んでください。 これらの地域がどこにあるかを調べるには、各郡に旅行し、地元の専門家に話す必要があるかもしれません。6.3.
ステージ3
町と農村の地域を選択したら、最大変動サンプリングを使用し続けるか、クォータサンプリング、航空写真からのブロックリスト、ラジアルサンプリングなどの別の方法を選択することができます。 最終段階で最大変動サンプリングを使用する場合は、通常、いくつかのクラスター(通りまたは近所)を選択し、上記のセクション4または5で説明した原則を使用して各クラスター内の回答者を選択します。
最大変動サンプリングについての詳細を読みたいですか? 申し訳ありませんが、あなたはできません! このページはあまり詳細ではありませんが、それでも、これまでに書かれた最大変動サンプリングの最も詳細な説明のようです。 次に最も詳細な(そして最も広く引用されている)のは、2001年版の234-235ページのMichael Quinn Pattonの本Quatial Research and Evaluation Methodsにあるようです(合計で1ページ未満)。 また、このページでは、調査の最大変動サンプリングに焦点を当てています。 このような詳細なインタビューやケーススタディなどの質的な研究のためにそれを使用すると、わずかな変化が必要になります。 必要が生じたときに、私はそれについて別のページを書きます。
このページの推奨引用:リスト、デニス(2004)。 調査および一致のグループのための最高の変化の見本抽出。 アデレード:観客の対話。 で利用可能www.audiencedialogue.org/maxvar.html2004年9月12日。
上記のサンプリングの他の原則(ランダムサンプリング、クォータサンプリング、層別サンプリング、およびスノーボールサンプリング)は、”Know Your Audience”の第2章