Maximale Variationsstichprobe für Umfragen und Konsensgruppen
Was ist maximale Variationsstichprobe?
Anstatt Repräsentativität durch gleiche Wahrscheinlichkeiten zu suchen, sucht Maximum Variation Sampling sie, indem es eine breite Palette von Extremen einschließt. Das Prinzip ist, dass, wenn Sie absichtlich versuchen, eine sehr unterschiedliche Auswahl von Personen zu interviewen, ihre aggregierten Antworten der gesamten Bevölkerung nahe kommen können. Die Methode klingt seltsam, funktioniert aber gut an Orten, an denen keine Zufallsstichprobe gezogen werden kann. Dies ist eine Erweiterung des statistischen Prinzips der Regression zum Mittelwert – mit anderen Worten, wenn eine Gruppe von Menschen auf verschiedene Arten extrem ist, enthält sie Menschen, die auf andere Weise durchschnittlich sind. Wenn Sie also eine Stichprobe mit „minimaler Variation“ anstreben, indem Sie nur versuchen, die Arten von Menschen abzudecken, von denen Sie dachten, dass sie durchschnittlich sind, werden Sie wahrscheinlich eine Reihe verschiedener Gruppen verpassen, die einen recht hohen Anteil der Bevölkerung ausmachen. Aber durch die Suche nach maximaler Variation werden durchschnittliche Menschen automatisch einbezogen.
Eine Stichprobe mit maximaler Variation (manchmal auch als Stichprobe mit maximaler Diversität oder Stichprobe mit maximaler Heterogenität bezeichnet) ist eine spezielle Art von Zweckstichprobe. Normalerweise ist eine zweckmäßige Stichprobe nicht repräsentativ und erhebt keinen Anspruch darauf. Eine Stichprobe mit maximaler Variation kann jedoch, wenn sie sorgfältig gezogen wird, genauso repräsentativ sein wie eine Zufallsstichprobe. Trotz allem, was viele Leute (mit ein wenig Wissen über Statistiken) glauben, ist eine Zufallsstichprobe nicht unbedingt die repräsentativste, besonders wenn die Stichprobengröße klein ist.
Verwendung der maximalen Variationsstichprobe
Es gibt zwei Hauptanlässe für die Verwendung der maximalen Variationsstichprobe:
- Wenn die Stichprobengröße sehr klein ist, oder
- Wenn keine Populationsinformationen verfügbar sind (und es nicht schwierig ist, Populationsmitglieder mit den ausgewählten Merkmalen zu finden)
2.1. Maximale Variationsstichprobe für kleine Stichprobengröße
Mit „klein“ meine ich hier weniger als etwa 30. („Ungefähr 30“ bedeutet alles von ungefähr 20 bis ungefähr 50 – es gibt keine plötzliche Änderung, wenn die Stichprobengröße zunimmt.) Unabhängig von der tatsächlichen Anzahl funktioniert die Zufallsstichprobe für diese kleinen Stichproben nicht gut: Es besteht eine hohe Wahrscheinlichkeit, dass eine Stichprobe erhalten wird, die nicht repräsentativ ist, obwohl sie zufällig ausgewählt wurde. Wenn die Stichprobe so klein wie 3 ist (für eine Reihe von Konsensgruppen), ist die Zufallsstichprobe viel zu gefährlich. Stattdessen können Sie Quotenstichproben oder maximale Variationsstichproben verwenden. Wenn Sie über genügend Daten zur Grundgesamtheit verfügen, ist eine Quotenstichprobe in Ordnung. Wenn Sie beispielsweise 20 Personen aus der Bevölkerung einer Stadt auswählen, besteht eine einfache Form der Quotenstichprobe darin, 10 Männer und 10 Frauen auszuwählen. Quotenstichproben – aus veröffentlichten oder vermuteten Bevölkerungsdaten – sind jedoch nicht immer relevant. Das ist, wenn maximale Variation Probenahme am nützlichsten ist. Wenn Sie beispielsweise eine Stichprobe für eine Reihe von Konsensgruppen auswählen, nehmen Sie normalerweise drei Arten von Personen, die sich in Bezug auf das zu untersuchende Thema so unterschiedlich wie möglich unterscheiden.
2.2. Maximale Variationsstichprobe in Abwesenheit von Populationsdaten
Obwohl die Zufallsstichprobe als ideale Stichprobenmethode angesehen wird, ist es manchmal nicht möglich, eine Zufallsstichprobe zu entnehmen. In einigen Ländern sind Volkszählungsinformationen entweder nicht verfügbar oder so viele Jahre veraltet, dass sie nutzlos sind. Selbst wenn aktuelle und detaillierte Volkszählungsdaten vorliegen, gibt es möglicherweise keine Karten mit den Grenzen der Gebiete, für die die Daten gelten. Und selbst wenn es sowohl gute Volkszählungsdaten als auch verwandte Karten gibt, Es kann keine Stichprobenrahmen geben.
Die gute Nachricht (aus Sicht der Stichproben) ist, dass diese Bedingungen normalerweise in sehr armen und unentwickelten Ländern mit großer ländlicher Bevölkerung gelten. Nach meiner Erfahrung gibt es in diesen Populationen keine große Variationsbreite. Je entwickelter ein Land ist, desto mehr Unterschiede gibt es zwischen seinen Bürgern. Daher, wo Stichproben nicht möglich sind, ist es vielleicht nicht so notwendig. In armen Ländern, in denen keine Sample-Frames vorhanden sind, kann das Sampling mit maximaler Variation mit der unten erläuterten mehrstufigen Methode sehr effektiv sein.
Was ist die beste Stichprobengröße für die maximale Variationsstichprobe?
Für eine einstufige Stichprobe oder an der Basis der Stichprobe ist es am besten, eine Stichprobe mit maximaler Variation auf nicht mehr als etwa 50 Einheiten zu begrenzen. Oberhalb dieser Zahl werden die Interviewer verwirrt, und andere Methoden wie Quotenstichproben und radiale Stichproben sind einfacher und oft umfassender. Durch die Kombination dieser Unterstichproben von 50 oder weniger in einer mehrstufigen Stichprobe kann die Gesamtstichprobe Tausende von Personen umfassen – aber aufgrund des zusätzlichen Aufwands würden Sie dies nicht tun, es sei denn, es gäbe keine Alternative. Die größte, die ich ausprobiert habe, war ungefähr 200 in Clustern von 12 – aber eine Quotenstichprobe (z. B. Altersgruppe nach Geschlecht nach Berufstyp) wäre möglicherweise genauso repräsentativ gewesen und hätte viel weniger Aufsicht über die Interviewer benötigt.
So wählen Sie eine Stichprobe mit maximaler Variation aus
Bei der Stichprobe mit maximaler Variation versuchen Sie, alle Extreme in die Grundgesamtheit einzubeziehen. Zum Beispiel könnten Sie in einem kleinen Dorf für eine Radiopublikumsbefragung um ein Interview bitten…
- die älteste Person im Dorf, die Radio hört
- die älteste, die kein Radio hört
- die jüngste, die Radio hört
- eine Person, die den ganzen Tag Radio hört
- eine Person, die oft über Radioprogramme spricht, die sie gehört hat
- eine Person, die mitten in der Nacht Radio hört
- eine Person, die in ihrem Leben noch nie Radio gehört hat
- die Person mit den meisten Radios (vielleicht ein Mechaniker)
- die Person mit der größten Antenne
- eine Person, von der angenommen wird, dass sie in jeder Hinsicht völlig durchschnittlich ist
- eine Person, die viel Zeit auf der Straße und an öffentlichen Orten verbringt
- eine Person, die fast die ganze Zeit arbeitet
…und so weiter – Wechsel von „Person“ zu „Mann“ oder „Frau“ abwechselnd, um eine gleichberechtigte Vertretung beider Geschlechter zu gewährleisten. Dies funktioniert natürlich nur, wenn solche Informationen über andere Personen allgemein bekannt sind. Die obige Liste von Personen könnte in einem Dorf erstellt werden, in dem viele Menschen viele andere kennen, wäre aber in einer Großstadt viel schwieriger.Oft ist es nützlich, eine vorläufige Brainstorming-Sitzung mit einer ersten Gruppe von lokalen Informanten zu haben (die keine eventuellen Befragten sein sollten). Präsentieren Sie ihnen eine erste Liste persönlicher Typen, ähnlich wie oben, aber für den Zweck Ihrer Studie geeignet modifiziert. Bitten Sie sie, sich weitere Personentypen auszudenken, und Ihnen zu sagen, ob einige der von Ihnen erfundenen Typen in diesem Bereich keinen Sinn ergeben. Aber wenn Sie nicht mit einem Beispiel beginnen, habe ich festgestellt, dass es den Leuten schwer fällt zu verstehen, was Sie fragen.
Ein Problem beim Zeichnen einer Stichprobe wie oben sind die Informanten, mit denen Sie die Personen mit diesen Merkmalen identifizieren. Es ist verlockend – weil es einfach ist – zum örtlichen Regierungsbüro zu gehen und die Beamten zu bitten, Personen dieser Art zu benennen. Sie können schnell eine Liste von ihnen erhalten, aber in einer wichtigen Hinsicht wird es keine maximale Variation geben: Vorgeschlagene Befragte werden alle den lokalen Regierungsbeamten bekannt sein.
Ihr Netz kann durch sequentielles Sampling (Schneeball-Sampling) weiter gefasst werden, wobei nur wenige vorgeschlagene Antworten aus jeder Quelle abgerufen werden. Mit anderen Worten, Informant A schlägt die Befragten B und C aus Ihrer Merkmalsliste vor, B schlägt D und E vor, C schlägt F und G vor – und so weiter. Angesichts des Prinzips der „sechs Trennungsgrade“ und der Tatsache, dass die Befragten nicht aufgefordert werden, ihre Freunde vorzuschlagen, sondern Personen mit bestimmten Merkmalen, sollte die Methode der maximalen Variation den meisten Personen im Umfragegebiet die Chance geben, in die Stichprobe aufgenommen zu werden.
Haben Sie den Fehler in diesem Argument bemerkt? Das Problem ist, dass je mehr Personen ein potenzieller Befragter bekannt ist, desto wahrscheinlicher ist es, dass diese Person für die Umfrage ausgewählt wird. Deshalb, Die Liste der persönlichen Typen muss explizit sozial isolierte Personen einschließen, durch Hinzufügen von Kriterien wie…
- ein älterer Mann, der nur sehr wenige Besucher hat
- ein jüngerer Mann, der nicht viel redet
- eine ältere Frau, die alleine lebt und keine Familienmitglieder in der Nähe hat
- eine junge Frau, die unverheiratet ist und kaum das Haus verlässt
…und so weiter – Variation der obigen Beschreibungen, um der Kultur zu entsprechen. (In einigen Teilen der Welt werden Sie nie eine Frau finden, die alleine lebt.) Wo es Segregation entlang religiöser, sprachlicher oder stammesbezogener Linien gibt, müssen Sie in jeder dieser kulturellen Gruppen separate Untersuchungsfäden starten.
Wenn Sie nach einem bestimmten Personentyp fragen und der Informant jemanden nicht genau so benennen kann, ist es in Ordnung, eine Annäherung zu akzeptieren, die auf einem anderen Kriterium basiert, das relevant erscheint. Dies kann andere Dimensionen der Vielfalt einführen, an die Sie ursprünglich nicht gedacht haben.
Auswählen der Variationsdimensionen
Im obigen Beispiel wurden die 12 verschiedenen Arten von Radiohörern (plus weitere 4 Arten von sozialen Isolaten) gefunden, indem man sich die sozialen Umstände vorstellte, die das Radiohören beeinflussen könnten. Die Liste war nicht erschöpfend oder systematisch, aber wenn Sie sicher sein möchten, dass keine Gruppe von Personen ausgelassen wurde, können Sie die Dimensionsanalyse verwenden, um eine umfassendere Liste zu erstellen. Es ist so gemacht…
Schritt 1 ist entscheiden, welche Stichprobengröße Sie wollen. Nehmen wir zum Beispiel an, es sind 20. Dies bestimmt die Anzahl der Dimensionen: 20 ist 2 zur Macht von was? Die nächste Antwort ist 4, weil 2 x 2 x 2 x 2 = 16. Sie können also 4 Dimensionen verwenden, um 16 Fälle zu erhalten, und dann einige weitere Faktoren hinzufügen, z. B. sozial isolierte Personen. (Verwenden Sie für eine Stichprobe von 32 5 Dimensionen und für 64 6 Dimensionen. Über 100 oder so funktioniert Quotenstichprobe normalerweise besser.)
Schritt 2 ist die Entscheidung über diese Dimensionen. Stellen Sie sich einige Merkmale von Personen vor, die (a) sich in Bezug auf das von Ihnen untersuchte Thema stark unterscheiden und (b) einer Vielzahl anderer Personen bekannt sind. Wenn es zum Beispiel darum geht, wie viel Zeit die Menschen damit verbringen, Radio zu hören, ist es möglicherweise nicht sinnvoll, das Geschlecht als Dimension zu wählen, da Männer und Frauen in den meisten Ländern ungefähr die gleiche Zeit damit verbringen, Radio zu hören. Ob die Leute zu Hause ein Radio haben oder nicht, macht jedoch einen großen Unterschied in ihrer Hörzeit. Andere sichtbare Faktoren, die sich auf das Radiohören auswirken, sind, ob die Menschen zu Hause fernsehen und wie viel Zeit die Menschen an Orten ohne Radio von zu Hause weg verbringen. Ein weiterer Faktor ist, wie sehr sie gerne die lokalen Programme hören, aber das ist nicht leicht zu beobachten, so dass Sie möglicherweise eine Proxy-Variable verwenden müssen, z. B. wie oft sie sagen, dass sie über Radioprogramme sprechen. Jetzt haben wir die 4 Variablen mit jeweils zwei extremen Antworten. Geben Sie jeder möglichen Antwort einen Buchstabencode, beginnend mit A, wie folgt…
- Haben Sie ein Radio zu Hause: ja (A) oder nein (B)
- Haben Sie TV zu Hause: Ja (C) oder nein (D)
- Bleiben Sie die meiste Zeit zu Hause (E) oder die meiste Zeit von zu Hause weg (F)
- Wie oft sprechen sie mit anderen über: „die meisten Tage“ (G) oder „so gut wie nie“ (H)
Wenn man jede der 4 Variablen der Reihe nach nimmt, gibt es 16 mögliche Kategorien (2 x 2 x 2 x 2). Dies sind
ACEG, ACEH, ACFG, ACFH
BCEG, BCEH, BCFG, BCFH
ADEG, ADEH, ADFG, ADFH
BDEG, BDEH, BDFG, BDFH
Zum Beispiel BDGH = jemand, der kein Radio zu Hause hat, keinen Fernseher zu Hause hat, die meiste Zeit von zu Hause weg ist und kaum über Radio spricht.
Schritt 3. Alles, was Sie jetzt tun müssen, ist, jemanden zu finden, der dieser Beschreibung entspricht – und diese Aufgabe für die 15 anderen Arten von Menschen zu wiederholen. Was ist, wenn Sie keine Personen finden können, die einige dieser Beschreibungen erfüllen? Dies kann passieren – zum Beispiel kann es schwierig sein, jemanden zu finden, der die meiste Zeit zu Hause bleibt und kein Radio zu Hause hat, aber viel darüber spricht. In diesem Fall haben Sie in einigen der 16 Kategorien mehr als eine Person. Kein großes Problem: Stellen Sie einfach sicher, dass sich Personen in derselben Kategorie auf andere Weise stark unterscheiden, die für Ihre Studie relevant erscheint.
Schritt 4. Vergessen Sie nicht, die 4 Personen hinzuzufügen, die selten mit anderen kommunizieren. Das bringt Ihre Probe auf 20. Sie wollen mehr als 20? Fügen Sie einfach einige weitere Personen hinzu, solange sie sich auf relevante Weise so unterschiedlich wie möglich voneinander unterscheiden.
Obwohl diese systematische Methode zur Auswahl der Befragten bei der Auswahl der Interviewer einfacher ist, habe ich nicht festgestellt, dass sie eine vielfältigere Stichprobe erzeugt als die in Abschnitt 4 oben beschriebene Zufallsmethode.
Mehrstufige maximale Variationsstichprobe
Wenn Sie eine mehrstufige Stichprobe auswählen, besteht die erste Stufe möglicherweise darin, eine Stichprobe von Distrikten im ganzen Land zu ziehen. Wenn diese Zahl weniger als etwa 30 beträgt, ist es wahrscheinlich, dass die Stichprobe in gewisser Weise ernsthaft nicht repräsentativ ist. Zwei Lösungen hierfür sind Stratifizierung und Maximum Variation Sampling. Für beides sind einige lokale Kenntnisse erforderlich.
Wenn Sie ein großes geografisches Gebiet vermessen, kann eine Stichprobe mit maximaler Variation in mehreren Stufen gezogen werden. In der ersten Phase wird entschieden, welche Teile des Bevölkerungsbereichs vermessen werden. Wenn eine Umfrage beispielsweise eine ganze Provinz repräsentieren soll und es nicht möglich ist, jeden Teil der Provinz zu untersuchen, müssen Sie entscheiden, welche Teile der Provinz (nennen wir sie Landkreise) einbezogen werden. Die Auswahl erfolgt so…
6.1. Stufe 1
1. Denken Sie an alle Möglichkeiten, wie sich die Landkreise von der Provinz als Ganzes unterscheiden können – insbesondere in Bezug auf das Thema der Umfrage. Wenn es sich bei einer Umfrage um UKW-Radio handelt und einige Gebiete hügelig sind, kann der Empfang dort schlechter sein. Wenn es in der Umfrage um Malaria geht und einige Landkreise große Sümpfe mit vielen Moskitos haben, schließen Sie eine solche Grafschaft ein und eine, die das Gegenteil ist. Wenn das Thema mit Wohlstand oder Bildungsniveau zusammenhängt (wie viele Forschungsthemen), finden Sie heraus, in welchen Landkreisen die reichsten und am besten ausgebildeten Menschen leben und in welchen die ärmsten und am wenigsten Ausgebildeten. Denken Sie an 5 bis 10 Faktoren, die für die Studie relevant sind.
2. Versuchen Sie dann, objektive Daten zu diesen Faktoren zu sammeln. Versuchen Sie andernfalls, Experten zu den Themen oder Personen zu finden, die durch die gesamte Provinz gereist sind. Anhand dieser Informationen erstellen Sie für jeden Faktor eine Liste der Landkreise, die einen hohen Faktor aufweisen (z. B. viele Berge, viele Sümpfe oder wohlhabend), und der Landkreise, die einen niedrigen Faktor aufweisen (z. B. alle flach, keine Sümpfe oder arm).
3. Die in diesen Listen der Extreme am häufigsten genannten Landkreise sollten in die Umfrage einbezogen werden. Markieren Sie diese Landkreise auf einer Karte der Provinz. Wurde ein großes und gut besiedeltes Gebiet ausgelassen? Wenn ja, fügen Sie eine weitere Grafschaft hinzu, die so weit wie möglich von allen anderen genannten entfernt ist.
6.2. Stufe 2
Wenn die Grafschaften (oder wie auch immer die Gebiete genannt werden) ausgewählt wurden, besteht die nächste Stufe darin, herauszufinden, wo in jedem Landkreis der Cluster ausgewählt werden soll. Setzen Sie das Prinzip der maximalen Variation fort, indem Sie in jedem ausgewählten Kreis dasselbe Prinzip anwenden. Wenn eine Grafschaft wegen ihrer Sumpfigkeit und Ebenheit ausgewählt wurde, wählen Sie das flachste und sumpfigste Gebiet des Landes. Wenn es wegen seiner Berge und seines Reichtums ausgewählt wurde, wählen Sie eine wohlhabende Bergregion. Um herauszufinden, wo sich diese Gebiete befinden, müssen Sie möglicherweise in jedes Land reisen und mit lokalen Experten sprechen.
6.3. Stufe 3
Wenn Sie die Städte und ländlichen Gebiete ausgewählt haben, können Sie entweder weiterhin die maximale Variationsstichprobe verwenden oder eine andere Methode wählen, z. B. Quotenstichprobe, Blockliste aus Luftbildern oder radiale Stichprobe. Wenn Sie die maximale Variationsstichprobe für die Endphase verwenden, wählen Sie normalerweise eine Reihe von Clustern (Straßen oder Nachbarschaften) aus und wählen dann die Befragten in jedem Cluster anhand der in Abschnitt 4 oder 5 oben erläuterten Prinzipien aus.
Möchten Sie mehr über Maximum Variation Sampling erfahren? Sorry, aber du kannst nicht! Diese Seite ist nicht sehr detailliert, aber trotzdem scheint es die detaillierteste Erklärung der maximalen Variationsabtastung zu sein, die jemals geschrieben wurde. Die nächste detaillierteste (und am häufigsten zitierte) scheint in Michael Quinn Pattons Buch Qualitative Forschungs- und Bewertungsmethoden auf den Seiten 234-235 in der Ausgabe 2001 zu sein (insgesamt weniger als eine Seite). Außerdem konzentriert sich diese Seite auf die maximale Variationsstichprobe für Umfragen. Die Verwendung für qualitative Forschung wie eingehende Interviews und Fallstudien würde geringfügige Abweichungen erfordern. Ich werde eine separate Seite darüber schreiben, wenn die Notwendigkeit entsteht.
Zitationsvorschlag für diese Seite:
List, Dennis (2004). Maximale Variationsstichprobe für Umfragen und Konsensgruppen. Adelaide: Publikumsdialog. Erhältlich bei www.audiencedialogue.org/maxvar.html , 12. September 2004.
Andere oben erwähnte Prinzipien der Stichprobenerhebung (Stichproben, Quotenstichproben, stratifizierte Stichproben und Schneeballstichproben) werden in Kapitel 2 von Know Your Audience beschrieben.