maximale variatiebemonstering voor enquêtes en consensusgroepen
Wat is maximale variatiebemonstering?
in plaats van te zoeken naar representativiteit door middel van gelijke kansen, zoekt maximale variatiebemonstering naar representativiteit door een breed scala aan extremen op te nemen. Het principe is dat als je opzettelijk een heel andere selectie van mensen probeert te interviewen, hun geaggregeerde antwoorden dicht bij die van de hele populatie kunnen liggen. de methode klinkt vreemd, maar werkt goed op plaatsen waar geen willekeurige steekproef kan worden getrokken. Dit is een uitbreiding van het statistische principe van regressie naar het gemiddelde – met andere woorden, als een groep mensen op verschillende manieren extreem is, zal het mensen bevatten die op andere manieren gemiddeld zijn. Dus als je een “minimale variatie” steekproef zocht door alleen te proberen de soorten mensen te dekken waarvan je dacht dat ze gemiddeld waren, zou je waarschijnlijk een aantal verschillende groepen missen die een vrij groot deel van de bevolking uitmaken. Maar door maximale variatie te zoeken, worden Gemiddelde mensen automatisch opgenomen.
een maximale variatiesteekproef (ook wel een maximale diversiteitsteekproef of een maximale heterogeniteitsteekproef genoemd) is een speciaal soort doelgerichte steekproef. Normaal, een doelgerichte steekproef is niet representatief, en beweert niet te zijn. Een steekproef voor maximale variatie kan echter, indien zorgvuldig genomen, even representatief zijn als een willekeurige steekproef. Ondanks wat veel mensen (met een beetje kennis van statistieken) geloven, is een willekeurige steekproef niet noodzakelijk de meest representatieve, vooral wanneer de steekproefgrootte klein is.
wanneer maximale variatiebemonstering wordt gebruikt
Er zijn twee belangrijke gelegenheden om maximale variatiebemonstering te gebruiken:
- wanneer de steekproefgrootte zeer klein is, of
- wanneer geen populatiegegevens beschikbaar zijn (en het is niet moeilijk om populatieleden met de geselecteerde kenmerken te vinden)
2.1. Maximale variatie bemonstering voor kleine steekproefgrootte
met “klein” bedoel ik hier minder dan ongeveer 30. (“Ongeveer 30” betekent iets van ongeveer 20 tot ongeveer 50 – er is geen plotselinge verandering als de steekproefgrootte toeneemt.) Ongeacht het werkelijke aantal, willekeurige bemonstering werkt niet goed voor deze kleine monsters: er is een grote kans op het krijgen van een monster dat niet representatief is, hoewel het willekeurig werd gekozen. Wanneer de steekproef zo klein is als 3 (voor een reeks consensusgroepen) is willekeurige bemonstering veel te gevaarlijk. In plaats daarvan kunt u quota sampling of maximale variatie sampling gebruiken. Als je genoeg gegevens over de bevolking hebt, is quotasteekproef prima. Bijvoorbeeld, als je 20 mensen uit de bevolking van een stad, een eenvoudige vorm van quota bemonstering is het kiezen van 10 mannen en 10 vrouwen. Maar quota bemonstering – van gepubliceerde of geraden bevolkingsgegevens-is niet altijd relevant. Dat is wanneer maximale variatie sampling is het meest nuttig. Als je bijvoorbeeld een voorbeeld kiest voor een reeks consensusgroepen, neem je normaal gesproken drie soorten mensen die zo verschillend mogelijk zijn over het onderwerp dat wordt onderzocht.
2.2. Maximale variatie bemonstering bij afwezigheid van populatiegegevens
hoewel aselecte bemonstering als de ideale bemonsteringsmethode wordt beschouwd, is het soms niet mogelijk een aselecte steekproef te nemen. In sommige landen, census informatie is ofwel niet beschikbaar, of zo vele jaren verouderd dat het nutteloos is. Zelfs wanneer er recente en gedetailleerde tellingsgegevens bestaan, is het mogelijk dat er geen kaarten zijn waarop de grenzen van de gebieden waarop de gegevens van toepassing zijn, zijn aangegeven. En zelfs als er zowel goede tellingsgegevens als gerelateerde kaarten bestaan, kunnen er geen steekproefframes zijn.het goede nieuws (vanuit een steekproefstandpunt) is dat deze voorwaarden gewoonlijk van toepassing zijn in zeer arme en onontwikkelde landen met grote plattelandsbevolking. In mijn ervaring is er geen grote variatie in deze populaties. Hoe verder een land ontwikkeld lijkt, hoe meer verschillen er zijn tussen de burgers. Daarom, waar willekeurige bemonstering niet mogelijk is, is het misschien niet zo nodig. Maar in arme landen waar monsterframes niet bestaan, kan maximale variatie bemonstering zeer effectief zijn, met behulp van de meertraps methode hieronder uitgelegd.
Wat is de beste steekproefgrootte voor maximale variatie?
voor een monofasenmonster of op basisniveau kan het beste een maximale variatiesteekproef worden beperkt tot maximaal ongeveer 50 eenheden. Boven dat aantal raken interviewers in de war en andere methoden, zoals quota-bemonstering en radiale bemonstering, zijn eenvoudiger en vaak uitgebreider. Door het combineren van deze sub-monsters van 50 of minder in een meertraps monster, de totale steekproef kan duizenden mensen – maar vanwege de extra inspanning betrokken, zou je dat niet doen, tenzij er geen alternatief. De grootste die ik heb geprobeerd was ongeveer 200, in clusters van 12 – maar een quotumsteekproef (bijvoorbeeld leeftijdsgroep per geslacht per beroepstype) zou zo representatief kunnen zijn geweest, en zou veel minder toezicht van interviewers nodig hebben gehad.
hoe selecteert u een maximale variatiesteekproef
met maximale variatiesteekproef probeert u alle extremen in de populatie op te nemen. Bijvoorbeeld, in een klein dorp, voor een radio Publiek enquête, je zou kunnen vragen om een interview…
- de oudste persoon in het dorp die luistert naar radio
- de oudste die niet naar de radio luisteren
- de jongste die luistert naar de radio
- een persoon die luistert naar radio de hele dag
- een persoon die praat vaak over de radio-programma ‘ s hij of zij heeft gehoord
- een persoon die luistert naar de radio, in het midden van de nacht
- een persoon die nooit heeft geluisterd naar de radio in zijn of haar leven
- de persoon met de meeste radio ‘ s (een reparateur, misschien)
- de persoon met de grootste antenne
- een persoon die gedachte volledig worden gemiddeld in alle opzichten
- een persoon die veel tijd op straat en op openbare plaatsen doorbrengt
- een persoon die bijna de hele tijd werkt
…en zo verder-afwisselend “persoon” veranderen in “man” of “vrouw”, om een gelijke vertegenwoordiging van beide geslachten te garanderen. Natuurlijk werkt dit alleen als dergelijke informatie over andere mensen algemeen bekend is. De bovenstaande lijst van mensen zou kunnen worden geproduceerd in een dorp, waar veel mensen kennen vele anderen, maar zou veel moeilijker zijn in een grote stad.
vaak is het nuttig om een eerste brainstormsessie te houden met een eerste groep lokale informanten (die geen eventuele respondenten zouden moeten zijn). Presenteer een eerste lijst van persoonlijke types aan hen, vergelijkbaar met de bovenstaande, maar op passende wijze aangepast voor het doel van uw studie. Vraag hen om met wat meer soorten mensen te komen, en om je te vertellen of sommige van de soorten die je hebt uitgevonden geen zin hebben in dat gebied. Maar tenzij je met een voorbeeld begint, heb ik ontdekt dat mensen het moeilijk vinden om te begrijpen wat je vraagt.
een probleem met het tekenen van een voorbeeld zoals hierboven is de informanten die u gebruikt om de mensen met deze kenmerken te identificeren. Het is verleidelijk-omdat het makkelijk is – om naar het lokale overheidskantoor te gaan en de ambtenaren te vragen om mensen van dat soort te benoemen. U kunt snel een lijst van hen krijgen, maar op een belangrijke manier zal er geen maximale variatie zijn: voorgestelde respondenten zullen allemaal bekend zijn bij de lokale overheidsfunctionarissen.
uw net kan breder worden gegoten door sequentiële sampling (sneeuwbal sampling), waarbij slechts een paar voorgestelde respondenten uit elke bron. Met andere woorden, informant a suggereert respondenten B en C uit uw lijst van kenmerken, B suggereert D en E, C suggereert F en G – en ga zo maar door. Gezien het principe van “zes graden van scheiding” en het feit dat respondenten niet worden gevraagd om hun vrienden voor te stellen, maar mensen met specifieke kenmerken, zou de maximale variatiemethode de meeste mensen in het onderzoeksgebied een kans moeten geven om in de steekproef te worden opgenomen.
heeft u de fout in dat argument opgemerkt? Het probleem is dat hoe meer mensen een potentiële respondent bekend is, hoe groter de kans is dat die persoon wordt geselecteerd voor de enquête. Daarom moet de lijst van persoonlijke types expliciet sociaal geïsoleerde mensen, door het toevoegen van criteria zoals…
- een oudere man die zeer weinig bezoekers heeft
- een jongere man die niet veel praat
- een oudere vrouw die alleen woont en geen familieleden heeft die in de buurt wonen
- een jonge vrouw die ongehuwd is en bijna nooit het huis verlaat
…en ga zo maar door-het variëren van de bovenstaande beschrijvingen aan de cultuur aan te passen. (In sommige delen van de wereld zul je nooit een vrouw vinden die alleen leeft.) Waar er segregatie langs religieuze, linguïstische of tribale lijnen, moet u afzonderlijke draden van onderzoek in elk van die culturele groepen te beginnen.
als je naar een bepaald type persoon vraagt, en de informant kan iemand niet precies zo noemen, is het prima om een benadering te accepteren, gebaseerd op een ander criterium dat relevant lijkt. Dit kan andere dimensies van diversiteit introduceren waar je in eerste instantie niet aan dacht.
het selecteren van de dimensies van variatie
in het bovenstaande voorbeeld werden de 12 verschillende soorten radio luisteraar (plus nog eens 4 soorten sociale isolaten) gevonden door zich de sociale omstandigheden voor te stellen die het radio luisteren zouden kunnen beïnvloeden. De lijst was niet uitputtend of systematisch, maar als je er zeker van wilt zijn dat er geen groep mensen is weggelaten, kun je dimensionale analyse gebruiken om een uitgebreidere lijst te maken. Het wordt zo gedaan…
Stap 1 is bepalen welke steekproefgrootte u wilt. Bijvoorbeeld, laten we zeggen 20. Dit bepaalt het aantal dimensies: 20 is 2 tot de macht van wat? Het dichtstbijzijnde antwoord is 4, omdat 2 x 2 x 2 x 2 = 16. Dus je kunt 4 dimensies gebruiken om 16 gevallen te krijgen, voeg dan een paar factoren toe, zoals sociaal geïsoleerde mensen. (Voor een monster van 32, gebruik 5 afmetingen, en voor 64 gebruik 6. Boven de 100 of zo, quota bemonstering werkt meestal beter.)
Stap 2 is het bepalen van die afmetingen. Denk aan een aantal kenmerken van mensen die (a) sterk verschillen tussen mensen in relatie tot het onderwerp dat u onderzoekt, en (b) bekend zijn bij een breed scala van andere mensen. Bijvoorbeeld, als het onderwerp is hoeveel tijd mensen besteden aan het luisteren naar radio, is het misschien niet nuttig om geslacht als een dimensie te kiezen, omdat in de meeste landen mannen en vrouwen ongeveer evenveel tijd besteden aan het luisteren naar radio. Echter, of mensen thuis een radio hebben of niet, maakt een groot verschil in hun luistertijd. Andere zichtbare factoren die radio luisteren beïnvloeden zijn of mensen thuis TV hebben, en hoeveel tijd mensen weg van huis doorbrengen, op plaatsen zonder radio. Een andere factor is hoe graag ze luisteren naar de lokale programma ‘s, maar dat is niet gemakkelijk waarneembaar, dus moet je misschien een proxy variabele gebruiken, zoals hoe vaak ze zeggen dat ze praten over radioprogramma’ s. Nu hebben we de 4 variabelen, elk met twee extreme antwoorden. Geef elk mogelijk antwoord een lettercode, beginnend bij A, zoals dit…
- Radio thuis hebben: Ja (A) of nee (B)
- TV thuis hebben: ja (C) of nee (D)
- meestal thuis blijven (E) of meestal weg van huis (F)
- Hoe vaak praten ze met anderen over radioprogramma ‘ s: “most days” (G) or “neverly ever” (H)
elk van de vier variabelen op zijn beurt, zijn er 16 mogelijke categorieën (2 x 2 x 2 x 2). Dit zijn
ACEG, ACEH, ACFG, ACFH
BCEG, BCEH, BCFG, BCFH
ADEG, ADEH, ADFG, ADFH
BDEG, BDEH, BDFG, BDFH
bijvoorbeeld, bdgh = iemand die thuis geen radio heeft, thuis geen TV heeft, meestal van huis weg is en nauwelijks over radio praat.
Stap 3. Het enige wat je nu moet doen is iemand vinden die aan die beschrijving voldoet – en die taak herhalen voor de 15 andere soorten mensen. Wat als je geen mensen kunt vinden die aan die beschrijvingen voldoen? Dit kan gebeuren-het kan bijvoorbeeld moeilijk zijn om iemand te vinden die het grootste deel van de tijd thuis blijft, en thuis geen radio heeft, maar er veel over praat. In dit geval eindig je met meer dan één persoon in een aantal van de 16 categorieën. Geen groot probleem: zorg ervoor dat mensen in dezelfde categorie heel anders zijn op een andere manier die relevant lijkt voor je studie.
Stap 4. Tot slot, vergeet niet om de 4 mensen die zelden communiceren met anderen toe te voegen. Dat brengt je monster op 20. Wil je meer dan 20? Voeg gewoon wat meer mensen toe, zolang ze maar zo verschillend mogelijk van elkaar zijn op een relevante manier.
hoewel deze systematische methode van het selecteren van respondenten gemakkelijker is wanneer interviewers roosteren, heb ik niet gevonden dat het een meer gevarieerde steekproef oplevert dan de meer willekeurige methode beschreven in sectie 4 hierboven.
meertraps maximale variatie bemonstering
wanneer u een meertraps steekproef selecteert, kan de eerste fase zijn om een steekproef van districten in het hele land te trekken. Als dit aantal minder dan ongeveer 30 is, is het waarschijnlijk dat de steekproef op sommige manieren ernstig niet-representatief zal zijn. Twee oplossingen hiervoor zijn stratificatie en maximale variatie bemonstering. Voor beide is wat lokale kennis nodig.
wanneer u een groot geografisch gebied bekijkt, kan een steekproef voor maximale variatie in verschillende fasen worden getrokken. In de eerste fase wordt bepaald welke delen van het bevolkingsgebied zullen worden onderzocht. Als een enquête bijvoorbeeld een hele provincie moet vertegenwoordigen, en het niet haalbaar is om elk deel van de provincie te onderzoeken, moet u beslissen welke delen van de provincie (laten we ze graafschappen noemen) zullen worden opgenomen. Het selecteren van hen gebeurt als volgt…
6.1. Fase 1
1. Denk aan alle manieren waarop de provincies kunnen verschillen van de provincie als geheel – vooral manieren die gerelateerd zijn aan het onderwerp van de enquête. Als een enquête gaat over FM-radio, en sommige gebieden zijn heuvelachtig, kan de ontvangst er armer zijn. Als het onderzoek over malaria gaat, en sommige provincies hebben grote moerassen met veel muggen, neem dan een van die provincies en een dat is het tegenovergestelde. Als het onderwerp gerelateerd is aan rijkdom of opleidingsniveau (zoals veel onderzoeksthema ‘ s zijn), zoek dan uit welke provincies de rijkste en best opgeleide mensen hebben, en welke de armste en minst opgeleide mensen hebben. Probeer 5 tot 10 factoren te bedenken die relevant zijn voor de studie.
2. Probeer dan objectieve gegevens over deze factoren te verzamelen. Als dat niet lukt, probeer dan experts te vinden over de onderwerpen, of mensen die door de hele provincie hebben gereisd. Met behulp van deze informatie, maak voor elke factor een lijst van de provincies die een hoog niveau van de factor hebben (bijvoorbeeld veel bergen, veel moerassen, of rijke) en provincies die een laag niveau van de factor hebben (bijvoorbeeld alle vlakke, geen moerassen, of arme).
3. De provincies die het vaakst in deze lijsten van uitersten worden genoemd, moeten in het onderzoek worden opgenomen. Markeer deze provincies op een kaart van de provincie. Is er een groot en dichtbevolkt gebied weggelaten? Zo ja, voeg een andere provincie toe, die zoveel mogelijk van alle andere genoemde.
6.2. Fase 2
wanneer de provincies (of wat de gebieden ook worden genoemd) zijn gekozen, is de volgende fase om uit te zoeken waar in elk district de cluster moet worden gekozen. Ga door met het principe van maximale variatie door hetzelfde principe te gebruiken binnen elk geselecteerd land. Als een provincie werd gekozen om zijn moerassigheid en vlakheid, kies dan de vlakste en moerassigste gebied in het land. Als het werd gekozen voor zijn bergen en rijkdom, kies een rijke bergachtige gebied. Om erachter te komen waar deze gebieden zijn, moet u mogelijk naar elke provincie reizen en met lokale experts spreken.
6.3. Fase 3
wanneer u de steden en landelijke plaatsen hebt gekozen, kunt u doorgaan met het gebruik van maximale variatie bemonstering, of u kunt een andere methode kiezen, zoals quota bemonstering, blokkeren lijst van luchtfoto ‘ s, of radiale bemonstering. Als u maximum variation sampling gebruikt voor de laatste fase, kiest u normaal gesproken een aantal clusters (straten of buurten) en kiest u vervolgens respondenten in elk cluster volgens de principes die worden uitgelegd in sectie 4 of 5 hierboven.
wilt u meer lezen over maximale variatie sampling? Sorry, maar dat kan je niet! Deze pagina is niet erg gedetailleerd, maar toch lijkt het de meest gedetailleerde uitleg van maximale variatie sampling ooit geschreven. De volgende meest gedetailleerde (en meest geciteerde) lijkt te zijn in Michael Quinn Patton ’s boek Qualitative Research and Evaluation Methods, op pagina’ s 234-235 in de 2001 editie (minder dan een pagina in totaal). Ook, deze pagina richt zich op maximale variatie bemonstering voor enquãates. Het gebruik ervan voor kwalitatief onderzoek, zoals diepte-interviews en casestudy ‘ s, zou kleine variaties vereisen. Ik zal er een aparte pagina over schrijven, als het nodig is.
Suggested citation for this page:
List, Dennis (2004). Maximale variatiebemonstering voor enquêtes en consensusgroepen. Adelaide: Publieksdialoog. Beschikbaar op www.audiencedialogue.org/maxvar.html, 12 September 2004.
andere hierboven genoemde bemonsteringsprincipes (aselecte bemonstering, quotumbemonstering, gestratificeerde bemonstering en sneeuwbalbemonstering) worden beschreven in hoofdstuk 2 van Ken uw publiek.