maximal variationsprovtagning för undersökningar och konsensusgrupper

Vad är maximal variationsprovtagning?

istället för att söka representativitet genom lika sannolikheter söker maximal variationsprovtagning det genom att inkludera ett brett spektrum av ytterligheter. Principen är att om du medvetet försöker intervjua ett helt annat urval av människor, kan deras sammanlagda svar vara nära hela befolkningen. metoden låter udda, men fungerar bra på platser där ett slumpmässigt urval inte kan dras. Detta är en förlängning av den statistiska regressionsprincipen mot medelvärdet – med andra ord, om en grupp människor är extrema på flera olika sätt, kommer den att innehålla människor som är genomsnittliga på andra sätt. Så om du sökte ett ”minsta variation” – prov genom att bara försöka täcka de typer av människor som du trodde var genomsnittliga, skulle du sannolikt missa ett antal olika grupper som utgör en ganska hög andel av befolkningen. Men genom att söka maximal variation, genomsnittliga människor ingår automatiskt.

ett maximalt variationsprov (ibland kallat ett maximalt mångfaldsprov eller ett maximalt heterogenitetsprov) är en speciell typ av målmedvetet prov. Normalt är ett målmedvetet prov inte representativt och hävdar inte att det är. Ett maximalt variationsprov, om det är noggrant ritat, kan dock vara lika representativt som ett slumpmässigt urval. Trots vad många människor (med lite kunskap om statistik) tror är ett slumpmässigt urval inte nödvändigtvis det mest representativa, speciellt när provstorleken är liten.

när man ska använda maximal variationsprovtagning

det finns två huvudsakliga tillfällen för att använda maximal variationsprovtagning:

  • när provstorleken är mycket liten, eller
  • när ingen befolkningsinformation finns tillgänglig (och det är inte svårt att hitta populationsmedlemmar med de valda egenskaperna)

2.1. Maximal variationsprovtagning för liten provstorlek

med ”liten” här menar jag mindre än ca 30. (”Cirka 30” betyder allt från cirka 20 till cirka 50 – det sker ingen plötslig förändring när provstorleken ökar.) Oavsett det faktiska antalet fungerar slumpmässigt urval inte bra för dessa små prover: Det finns en stor chans att få ett prov som inte är representativt, även om det valdes slumpmässigt. När provet är så litet som 3 (för en uppsättning konsensusgrupper) är slumpmässigt urval alldeles för farligt. Istället kan du använda kvotprovtagning eller maximal variationsprovtagning. Om du har tillräckligt med uppgifter om befolkningen är kvotprovtagning bra. Till exempel, om du provtagning 20 personer från befolkningen i en stad, en enkel form av kvot provtagning är att välja 10 män och 10 kvinnor. Men kvotprovtagning – från publicerade eller gissade befolkningsdata – är inte alltid relevant. Det är då maximal variationsprovtagning är mest användbar. När du till exempel väljer ett prov för en uppsättning konsensusgrupper tar du normalt tre typer av människor som kommer att vara så olika som möjligt i frågan som undersöks.

2.2. Maximal variationsprovtagning i frånvaro av befolkningsdata

även om slumpmässigt urval anses vara den ideala provtagningsmetoden, är det ibland inte möjligt att ta ett slumpmässigt urval. I vissa länder är folkräkningsinformation antingen inte tillgänglig, eller så många år föråldrad att den är värdelös. Även när det finns nya och detaljerade folkräkningsdata kan det inte finnas några kartor som visar gränserna för de områden som uppgifterna gäller. Och även när det finns både bra folkräkningsdata och relaterade kartor kan det inte finnas några provtagningsramar.

den goda nyheten (ur provtagningssynpunkt) är att dessa villkor vanligtvis gäller i mycket fattiga och outvecklade länder med stora landsbygdsbefolkningar. Enligt min erfarenhet finns det inte ett stort antal variationer i dessa populationer. Ju mer utvecklat ett land, det verkar, desto fler skillnader finns det mellan medborgarna. Därför, där slumpmässigt urval inte är möjligt, kanske det inte är så nödvändigt. Men i fattiga länder där provramar är obefintliga kan maximal variationsprovtagning vara mycket effektiv, med hjälp av flerstegsmetoden som förklaras nedan.

Vad är den bästa provstorleken för maximal variationsprov?

För ett enstegsprov eller på gräsrotsnivå för provtagning är det bäst att begränsa ett maximalt variationsprov till högst cirka 50 enheter. Ovanför det numret blir intervjuare förvirrade och andra metoder, såsom kvotprovtagning och radiell provtagning, är enklare och ofta mer omfattande. Genom att kombinera dessa delprover på 50 eller mindre i ett flerstegsprov kan det totala provet vara tusentals människor – men på grund av den extra ansträngningen skulle du inte göra det om det inte fanns något alternativ. Den största jag har försökt var ungefär 200, i kluster av 12 – men ett kvotprov (t.ex. åldersgrupp efter kön efter yrkestyp) kan ha varit som representativt och skulle ha behövt mycket mindre övervakning av intervjuare.

hur man väljer ett maximalt variationsprov

Med Maximal variationsprovtagning försöker du inkludera alla ytterligheter i populationen. Till exempel, i en liten by, för en radio publik undersökning, kan du be att intervjua…

  • den äldsta personen i byn som lyssnar på radio
  • den äldsta som inte lyssnar på radio
  • den yngsta som lyssnar på radio
  • en person som lyssnar på radio hela dagen
  • en person som ofta pratar om radioprogram han eller hon har hört
  • en person som lyssnar på radio mitt på natten
  • en person som aldrig har lyssnat på radio i sitt liv
  • personen med flest radioapparater (kanske en reparatör)
  • personen med den största antennen
  • en person som anses vara helt Genomsnittlig på alla sätt
  • en person som tillbringar mycket tid på gatan och på offentliga platser
  • en person som arbetar nästan hela tiden

…och så vidare – ändra” person ”till” man ”eller” kvinna ” växelvis, för att säkerställa lika representation av båda könen. Naturligtvis fungerar detta bara när sådan information om andra människor är allmänt känd. Ovanstående lista över människor kan produceras i en by, där många människor känner till många andra, men skulle vara mycket svårare i en stor stad.

ofta är det bra att ha en preliminär brainstorming med en första grupp lokala informanter (som inte borde vara eventuella respondenter). Presentera en första lista över personliga typer för dem, liknande ovanstående, men lämpligt modifierade för syftet med din studie. Be dem att komma med några fler typer av personer och berätta om några av de typer du uppfann inte har någon mening i det området. Men om du inte börjar med ett exempel har jag funnit att människor har svårt att förstå vad du frågar.

ett problem med att rita ett prov som ovan är de informanter du använder för att identifiera personer med dessa egenskaper. Det är frestande – för det är lätt-att gå till kommunkontoret och be tjänstemännen att namnge personer av dessa typer. Du kan få en lista över dem snabbt, men på ett viktigt sätt kommer det inte att finnas maximal variation: föreslagna respondenter kommer alla att vara kända för de lokala regeringstjänstemännen.

ditt nät kan kastas i större utsträckning genom sekventiell provtagning( snöbollsprovtagning) och får bara några få föreslagna respondenter från varje källa. Med andra ord, informant a föreslår respondenter B och C från din lista över egenskaper, B föreslår D och E, C föreslår F och G – och så vidare. Med tanke på principen om ”sex grader av separation” och det faktum att respondenterna inte uppmanas att föreslå sina vänner, men personer med specificerade egenskaper, bör den maximala variationsmetoden ge de flesta i undersökningsområdet en chans att ingå i urvalet.

märkte du felet i det argumentet? Problemet är att ju fler människor en potentiell respondent är känd för, desto mer sannolikt att personen är att väljas för undersökningen. Därför måste listan över personliga typer uttryckligen inkludera socialt isolerade människor genom att lägga till kriterier som…

  • en äldre man som har väldigt få besökare
  • en yngre man som inte pratar mycket
  • en äldre kvinna som bor själv och har inga familjemedlemmar som bor i närheten
  • en ung kvinna som är ogift och nästan aldrig lämnar hemmet

…och så vidare-variera ovanstående beskrivningar för att passa kulturen. (I vissa delar av världen hittar du aldrig en kvinna som bor ensam.) Där det finns segregation längs religiösa, språkliga eller stamlinjer, måste du starta separata frågeställningar i var och en av dessa kulturella grupper.

om du ber om en viss typ av person, och informanten inte kan namnge någon exakt så, är det bra att acceptera en approximation, baserat på något annat kriterium som verkar relevant. Detta kan introducera andra dimensioner av mångfald som du inte ursprungligen tänkte på.

välja variationsmått

i exemplet ovan hittades de 12 olika typerna av radiolyssnare (plus ytterligare 4 typer av sociala isolat) genom att föreställa sig de sociala omständigheter som kan påverka radiolyssning. Listan var inte uttömmande eller systematisk, men om du vill vara säker på att ingen grupp människor har utelämnats kan du använda dimensionell analys för att skapa en mer omfattande lista. Det är gjort så här…

Steg 1 är bestäm vilken provstorlek du vill ha. Till exempel, låt oss säga att det är 20. Detta bestämmer antalet dimensioner: 20 är 2 till kraften i vad? Det närmaste svaret är 4, Eftersom 2 x 2 x 2 x 2 = 16. Så du kan använda 4 dimensioner för att få 16 fall, lägg sedan till några fler faktorer, till exempel socialt isolerade människor. (För ett prov på 32, använd 5 dimensioner och för 64 använd 6. Över 100 eller så fungerar kvotprovtagning vanligtvis bättre.)

steg 2 är att bestämma dessa dimensioner. Tänk på några egenskaper hos människor som (A) skiljer sig mycket mellan människor i förhållande till ämnet du forskar, och (b) är kända för ett brett spektrum av andra människor. Till exempel, om ämnet är hur mycket tid människor spenderar på att lyssna på radio, kanske det inte är användbart att välja kön som en dimension, för i de flesta länder spenderar män och kvinnor ungefär lika mycket tid på att lyssna på radio. Men huruvida människor har en radio hemma gör en stor skillnad för deras lyssningstid. Andra synliga faktorer som påverkar radiolyssning är om människor har TV hemma och hur mycket tid människor spenderar hemifrån, på platser utan radio. En annan faktor är hur mycket de gillar att lyssna på de lokala programmen, men det är inte lätt observerbart, så du kan behöva använda en proxyvariabel, till exempel hur ofta de säger att de pratar om radioprogram. Nu har vi de 4 variablerna, var och en med två extrema svar. Ge varje möjligt svar en bokstavskod, från A, så här…

  • ha en radio hemma: Ja (A) eller nej (B)
  • ha TV hemma: Ja (C) eller nej (D)
  • Stanna hemma för det mesta (E) eller hemifrån för det mesta (F)
  • hur ofta de pratar med andra om radioprogram: ”de flesta dagar ”(G) eller” knappast någonsin ” (H)

Med var och en av de 4 variablerna i sin tur finns det 16 möjliga kategorier (2 x 2 x 2 x 2). Dessa är

ACEG, ACEH, ACFG, ACFH
BCEG, BCEH, BCFG,BCFH
ADEG, ADEH, ADFG,ADFH
BDEG, BDEH, BDFG, BDFH

till exempel, BDGH = någon som inte har någon radio hemma, ingen TV hemma, är borta från hemmet för det mesta, och knappast någonsin talar om radio.

steg 3. Allt du behöver göra nu är att hitta någon som matchar den beskrivningen – och upprepa den uppgiften för 15 andra typer av människor. Vad händer om du inte kan hitta människor som uppfyller några av dessa beskrivningar? Detta kan hända-till exempel, det kan vara svårt att hitta någon som stannar hemma för det mesta, och inte har radio hemma, men talar om det en hel del. I det här fallet kommer du att sluta med mer än en person i några av de 16 kategorierna. Inget stort problem: se bara till att människor i samma kategori är väldigt olika på något annat sätt som verkar relevanta för din studie.

steg 4. Slutligen glöm inte att lägga till 4 personer som sällan kommunicerar med andra. Det ger ditt prov upp till 20. Vill du ha mer än 20? Lägg bara till några fler människor, så länge de är så olika som möjligt från varandra på något relevant sätt.

Även om denna systematiska metod för att välja respondenter är lättare när man rostar intervjuare, har jag inte funnit att det ger ett mer varierat urval än den mer slumpmässiga metoden som beskrivs i Avsnitt 4 ovan.

flerstegs maximal variationsprovtagning

När du väljer ett flerstegsprov kan det första steget vara att rita ett urval av distrikt i hela landet. Om detta nummer är mindre än cirka 30 är det troligt att provet kommer att vara allvarligt representativt på vissa sätt. Två lösningar på detta är stratifiering och maximal variationsprovtagning. För båda dessa behövs viss lokal kunskap.

När du kartlägger ett stort geografiskt område kan ett maximalt variationsprov dras i flera steg. Det första steget är att bestämma vilka delar av befolkningsområdet som ska undersökas. Till exempel, om en undersökning ska representera en hel provins, och det inte är möjligt att undersöka alla delar av provinsen, måste du bestämma vilka delar av provinsen (låt oss kalla dem län) som ska ingå. Att välja dem görs så här…

6.1. Steg 1

1. Tänk på alla sätt på vilka länen kan skilja sig från provinsen som helhet – speciellt sätt som är relaterade till ämnet för undersökningen. Om en undersökning handlar om FM-radio, och vissa områden är kuperade, kan mottagningen vara sämre där. Om undersökningen handlar om malaria, och vissa län har stora träsk med mycket myggor, inkludera ett sådant län och ett som är motsatt. Om ämnet är relaterat till rikedom eller utbildningsnivåer (som många forskningsämnen är), ta reda på vilka län som har de rikaste och bäst utbildade människorna och vilka som har de fattigaste och minst utbildade. Försök att tänka på 5 till 10 faktorer som är relevanta för studien.

2. Försök sedan samla objektiva data om dessa faktorer. Misslyckas det, försök hitta experter på ämnena, eller personer som har rest runt hela provinsen. Med hjälp av denna information gör du för varje faktor en lista över de län som har en hög nivå av faktorn (t.ex. massor av berg, massor av träsk eller rika) och län som har en låg nivå av faktorn (t. ex. alla platta, inga träsk eller fattiga).

3. De län som nämns oftast i dessa extremlistor bör ingå i undersökningen. Markera dessa län på en karta över provinsen. Har något stort och välbefolkat område utelämnats? Om så är fallet, lägg till ett annat län, vilket är så långt som möjligt från alla andra nämnda.

6.2. Steg 2

När länen (eller vad områdena kallas) har valts är nästa steg att ta reda på var i varje län klustret ska väljas. Fortsätt principen om maximal variation genom att använda samma princip inom varje valt län. Om ett län valdes för sin träsk och planhet, välj det plattaste och träskaste området i landet. Om det valdes för sina berg och rikedom, välj ett rikt bergsområde. För att ta reda på var dessa områden är, du kan behöva resa till varje län och prata med lokala experter.

6.3. Steg 3

När du har valt städer och landsbygdsområden kan du antingen fortsätta använda maximal variationsprovtagning, eller så kan du välja en annan metod, till exempel kvotprovtagning, blocklista från flygfoton eller radiell provtagning. Om du använder maximal variationsprovtagning för det sista steget väljer du normalt ett antal kluster (gator eller stadsdelar) och väljer sedan respondenter i varje kluster med hjälp av principerna som förklaras i Avsnitt 4 eller 5 ovan.

vill du läsa mer om maximal variation sampling? Tyvärr, men du kan inte! Denna sida är inte särskilt detaljerad, men ändå verkar det vara den mest detaljerade förklaringen av maximal variationsprovtagning som någonsin skrivits. Den näst mest detaljerade (och mest citerade) verkar vara i Michael Quinn Pattons bok kvalitativa forsknings-och utvärderingsmetoder, på sidorna 234-235 i 2001-upplagan (mindre än en sida totalt). Också, denna sida fokuserar på maximal variation provtagning för undersökningar. Att använda den för kvalitativ forskning, såsom djupintervjuer och fallstudier, skulle kräva små variationer. Jag skriver en separat sida om det, när behovet uppstår.

föreslagen citat för denna sida:
List, Dennis (2004). Maximal variation provtagning för undersökningar och konsensusgrupper. Adelaide: Publik Dialog. Finns på www.audiencedialogue.org/maxvar.html den 12 September 2004.

andra principer för provtagning som nämns ovan (slumpmässigt urval, kvotprovtagning, stratifierad provtagning och snöbollsprovtagning) beskrivs i kapitel 2 I Know Your Audience.



Lämna ett svar

Din e-postadress kommer inte publiceras.