eșantionarea variației maxime pentru sondaje și grupuri de consens
ce este eșantionarea variației maxime?
în loc să caute reprezentativitatea prin probabilități egale, eșantionarea maximă a variației o caută prin includerea unei game largi de extreme. Principiul este că, dacă încercați în mod deliberat să intervievați o selecție foarte diferită de oameni, răspunsurile lor agregate pot fi apropiate de întreaga populație. metoda sună ciudat, dar funcționează bine în locuri în care nu se poate extrage un eșantion aleatoriu. Aceasta este o extensie a principiului statistic al regresiei către medie – cu alte cuvinte, dacă un grup de oameni este extrem în mai multe moduri diferite, acesta va conține oameni care sunt medii în alte moduri. Deci, dacă ați căutat un eșantion de” variație minimă ” încercând doar să acoperiți tipurile de oameni despre care ați crezut că sunt medii, este posibil să pierdeți un număr de grupuri diferite care alcătuiesc o proporție destul de mare a populației. Dar prin căutarea variației maxime, oamenii obișnuiți sunt incluși automat.
un eșantion de variație maximă (uneori numit eșantion de diversitate maximă sau eșantion de eterogenitate maximă) este un tip special de eșantion intenționat. În mod normal, un eșantion intenționat nu este reprezentativ și nu pretinde că este. Cu toate acestea, un eșantion de variație maximă, dacă este desenat cu atenție, poate fi la fel de reprezentativ ca un eșantion aleatoriu. În ciuda a ceea ce cred mulți oameni (cu puțină cunoaștere a statisticilor), un eșantion aleatoriu nu este neapărat cel mai reprezentativ, mai ales atunci când dimensiunea eșantionului este mică.
când se utilizează eșantionarea cu variație maximă
există două ocazii principale pentru utilizarea eșantionării cu variație maximă:
- când dimensiunea eșantionului este foarte mică sau
- când nu sunt disponibile informații despre populație (și nu este dificil să se găsească membri ai populației cu caracteristicile selectate)
2.1. Eșantionarea maximă a variației pentru dimensiunea eșantionului mic
prin „Mic” aici, vreau să spun mai puțin de aproximativ 30. („Aproximativ 30” înseamnă ceva de la aproximativ 20 la aproximativ 50 – nu există nicio schimbare bruscă pe măsură ce mărimea eșantionului crește.) Indiferent de numărul real, eșantionarea aleatorie nu funcționează bine pentru aceste eșantioane mici: există șanse mari de a obține un eșantion care nu este reprezentativ, chiar dacă a fost ales la întâmplare. Când eșantionul este la fel de mic ca 3 (pentru un set de grupuri de consens) eșantionarea aleatorie este mult prea periculoasă. În schimb, puteți utiliza eșantionarea cotelor sau eșantionarea variației maxime. Dacă aveți suficiente date despre populație, eșantionarea cotelor este în regulă. De exemplu, dacă eșantionați 20 de persoane din populația unui oraș, o formă simplă de eșantionare a cotelor este să alegeți 10 bărbați și 10 femei. Dar eșantionarea cotelor – din datele publicate sau ghicite ale populației – nu este întotdeauna relevantă. Atunci eșantionarea maximă a variației este cea mai utilă. De exemplu, atunci când alegeți un eșantion pentru un set de grupuri de consens, luați în mod normal trei tipuri de persoane care vor fi cât mai diferite cu privire la problema cercetată.
2.2. Eșantionare cu variație maximă în absența datelor populației
deși eșantionarea aleatorie este considerată metoda ideală de eșantionare, uneori nu este posibilă prelevarea unui eșantion aleatoriu. În unele țări, informațiile despre recensământ fie nu sunt disponibile, fie sunt depășite de atâția ani încât sunt inutile. Chiar și atunci când există date recente și detaliate ale recensământului, este posibil să nu existe hărți care să arate limitele zonelor cărora li se aplică datele. Și chiar și atunci când există atât date bune de recensământ, cât și hărți conexe, este posibil să nu existe cadre de eșantionare.vestea bună (din punct de vedere al eșantionării) este că aceste condiții se aplică de obicei în țările foarte sărace și nedezvoltate, cu populații rurale mari. Din experiența mea, nu există o gamă largă de variații în aceste populații. Cu cât o țară este mai dezvoltată, cu atât există mai multe diferențe între cetățenii săi. Prin urmare, în cazul în care eșantionarea aleatorie nu este posibilă, poate că nu este atât de necesară. Dar în țările sărace în care cadrele de eșantionare sunt inexistente, eșantionarea cu variație maximă poate fi foarte eficientă, folosind metoda multietajată explicată mai jos.
care este cea mai bună dimensiune a eșantionului pentru proba de variație maximă?
pentru un eșantion cu o singură etapă sau la nivelul de bază al eșantionării, cel mai bine este să limitați un eșantion de variație maximă la cel mult 50 de unități. Peste acest număr, intervievatorii se confundă, iar alte metode, cum ar fi eșantionarea cotelor și eșantionarea radială, sunt mai simple și adesea mai cuprinzătoare. Prin combinarea acestor sub-eșantioane de 50 sau mai puțin într – un eșantion în mai multe etape, eșantionul total poate fi de mii de oameni-dar din cauza efortului suplimentar implicat, nu ați face asta decât dacă nu ar exista nicio alternativă. Cel mai mare pe care l – am încercat a fost de aproximativ 200, în grupuri de 12-dar un eșantion de cotă (de exemplu, grupa de vârstă după sex după tipul de ocupație) ar fi putut fi reprezentativ și ar fi avut nevoie de mult mai puțină supraveghere a intervievatorilor.
cum se selectează un eșantion de variație maximă
cu eșantionarea de variație maximă, încercați să includeți toate extremele din populație. De exemplu, într-un sat mic, pentru un sondaj de audiență radio, ați putea cere un interviu…
- cea mai în vârstă persoană din sat care ascultă radio
- cea mai în vârstă persoană care nu ascultă radio
- cea mai tânără persoană care ascultă radio
- o persoană care Ascultă radio toată ziua
- o persoană care vorbește adesea despre programe radio pe care le-a auzit
- o persoană care ascultă radio în toiul nopții
- o persoană care nu a ascultat niciodată radio în viața sa
- persoana cu cele mai multe radiouri (un reparator, probabil)
- persoana cu cea mai mare antenă
- o persoană despre care se crede că este complet medie în toate privințele
- o persoană care petrece mult timp pe stradă și în locuri publice
- o persoană care lucrează aproape tot timpul
…și așa mai departe-schimbarea „persoanei” în „bărbat” sau „femeie” alternativ, pentru a asigura reprezentarea egală a ambelor sexe. Desigur, acest lucru funcționează numai atunci când astfel de informații despre alte persoane sunt cunoscute pe scară largă. Lista de mai sus a oamenilor ar putea fi produsă într-un sat, unde mulți oameni cunosc multe altele, dar ar fi mult mai dificilă într-un oraș mare.de multe ori este util să avem o sesiune preliminară de brainstorming cu un grup inițial de informatori locali (care nu ar trebui să fie potențiali respondenți). Prezentați – le o listă inițială de tipuri personale, similare cu cele de mai sus, dar modificate corespunzător în scopul studiului dvs. Cereți-le să vină cu mai multe tipuri de persoane și să vă spună dacă unele dintre tipurile pe care le-ați inventat nu au sens în acea zonă. Dar dacă nu începeți cu un exemplu, am descoperit că oamenilor le este greu să înțeleagă ceea ce cereți.
o problemă cu desenarea unui eșantion ca mai sus este informatorii pe care îi utilizați pentru a identifica persoanele cu aceste caracteristici. Este tentant – pentru că este ușor – să mergi la biroul administrației locale și să ceri oficialilor să numească oameni de acest tip. Puteți obține rapid o listă a acestora, dar într-un mod important nu va exista o variație maximă: respondenții sugerați vor fi cunoscuți de oficialii administrației locale.
plasa dvs. poate fi distribuită mai larg prin eșantionare secvențială (eșantionare cu bulgăre de zăpadă), obținând doar câțiva respondenți sugerați din fiecare sursă. Cu alte cuvinte, informatorul a sugerează respondenților B și C din lista dvs. de caracteristici, b sugerează D și E, C sugerează F și G – și așa mai departe. Având în vedere principiul „șase grade de separare” și faptul că respondenților nu li se cere să-și sugereze prietenii, ci persoanele cu caracteristici specificate, metoda de variație maximă ar trebui să ofere majorității oamenilor din zona sondajului șansa de a fi incluși în eșantion.
ai observat defectul în acest argument? Problema este că, cu cât este cunoscut un potențial respondent, cu atât este mai probabil ca persoana respectivă să fie selectată pentru sondaj. Prin urmare, lista tipurilor personale trebuie să includă în mod explicit persoane izolate social, adăugând criterii precum…
- un bărbat mai în vârstă care are foarte puțini vizitatori
- un bărbat mai tânăr care nu vorbește prea mult
- o femeie mai în vârstă care trăiește singură și nu are membri ai familiei care locuiesc în apropiere
- o tânără care este necăsătorită și nu pleacă niciodată acasă
…și așa mai departe-variind descrierile de mai sus pentru a se potrivi culturii. (În unele părți ale lumii nu veți găsi niciodată o femeie care să trăiască singură. Acolo unde există segregare de-a lungul liniilor religioase, lingvistice sau tribale, va trebui să începeți fire separate de anchetă în fiecare dintre aceste grupuri culturale.dacă cereți un anumit tip de persoană, iar informatorul nu poate numi pe cineva exact așa, este bine să acceptați o aproximare, bazată pe un alt criteriu care pare relevant. Acest lucru poate introduce alte dimensiuni ale diversității la care nu v-ați gândit inițial.
selectarea dimensiunilor variației
în exemplul de mai sus, cele 12 tipuri diferite de ascultători radio (plus alte 4 tipuri de izolate sociale) au fost găsite prin imaginarea circumstanțelor sociale care ar putea afecta ascultarea radio. Lista nu a fost exhaustivă sau sistematică, dar dacă doriți să vă asigurați că niciun grup de persoane nu a fost omis, puteți utiliza analiza dimensională pentru a crea o listă mai cuprinzătoare. Se face așa…
Pasul 1 este să decideți ce dimensiune a eșantionului doriți. De exemplu, să spunem că este 20. Aceasta determină numărul de dimensiuni: 20 este 2 la puterea a ceea ce? Cel mai apropiat răspuns este 4, deoarece 2 x 2 x 2 x 2 = 16. Deci, puteți utiliza 4 dimensiuni pentru a obține 16 cazuri, apoi adăugați câțiva factori, cum ar fi persoanele izolate social. (Pentru un eșantion de 32, utilizați 5 dimensiuni, iar pentru 64 utilizați 6. Peste 100 sau cam asa ceva, eșantionarea cotelor funcționează de obicei mai bine.)
Pasul 2 este de a decide cu privire la aceste dimensiuni. Gândiți-vă la unele caracteristici ale oamenilor care (a) diferă foarte mult între oameni în raport cu subiectul pe care îl cercetați și (B) sunt cunoscute de o gamă largă de alte persoane. De exemplu, dacă subiectul este cât timp petrec oamenii ascultând radio, este posibil să nu fie util să alegeți genul ca dimensiune, deoarece în majoritatea țărilor bărbații și femeile petrec aproximativ același timp ascultând radio. Cu toate acestea, dacă oamenii au sau nu un radio acasă face o mare diferență în timpul lor de ascultare. Alți factori vizibili care afectează ascultarea radio sunt dacă oamenii au televizor acasă și cât timp petrec oamenii departe de casă, în locuri fără radio. Un alt factor este cât de mult le place să asculte programele locale, dar acest lucru nu este ușor de observat, deci este posibil să fie nevoie să utilizați o variabilă proxy, cum ar fi cât de des spun că vorbesc despre programe radio. Acum avem cele 4 variabile, fiecare cu două răspunsuri extreme. Dați fiecărui răspuns posibil un cod de literă, pornind de la A, ca acesta…
- aveți un radio acasă: Da (A) sau nu (B)
- aveți TV acasă: da (C) sau nu (D)
- stați acasă de cele mai multe ori (e) sau departe de casă de cele mai multe ori (F)
- cât de des vorbesc cu alții despre programele radio: „cele mai multe zile „(G) sau” aproape niciodată ” (H)
luând fiecare dintre cele 4 variabile la rândul său, există 16 categorii posibile (2 x 2 x 2 x 2). Acestea sunt
ACEG, ACEH, ACFG, ACFH
BCEG, BCEH, BCFG, BCFH
ADEG, ADEH, ADFG, ADFH
BDEG, BDEH, BDFG, BDFH
de exemplu, BDGH = cineva care nu are radio acasă, nici televizor acasă, este departe de casă de cele mai multe ori și aproape niciodată nu vorbește despre radio.
Pasul 3. Tot ce trebuie să faceți acum este să găsiți pe cineva care să corespundă descrierii – și să repetați această sarcină pentru celelalte 15 tipuri de oameni. Ce se întâmplă dacă nu puteți găsi oameni care îndeplinesc unele dintre aceste descrieri? Acest lucru se poate întâmpla – de exemplu, ar putea fi greu să găsești pe cineva care să stea acasă de cele mai multe ori și să nu aibă radio acasă, dar vorbește mult despre asta. În acest caz, veți ajunge cu mai mult de o persoană în unele dintre cele 16 categorii. Nicio problemă mare: asigurați-vă că persoanele din aceeași categorie sunt foarte diferite într-un alt mod care pare relevant pentru studiul dvs.
Pasul 4. În cele din urmă, nu uitați să adăugați cele 4 persoane care comunică rar cu ceilalți. Asta aduce eșantionul dvs. până la 20. Vrei mai mult de 20? Doar adăugați mai mulți oameni, atâta timp cât sunt cât mai diferiți unul de celălalt într-un mod relevant.
deși această metodă sistematică de selectare a respondenților este mai ușoară atunci când se apelează la intervievatori, nu am constatat că produce un eșantion mai divers decât metoda mai aleatorie descrisă în secțiunea 4 de mai sus.
eșantionare cu variație maximă în mai multe etape
când selectați un eșantion în mai multe etape, prima etapă ar putea fi extragerea unui eșantion de districte din întreaga țară. Dacă acest număr este mai mic de aproximativ 30, este probabil ca eșantionul să fie serios nereprezentativ în anumite privințe. Două soluții la aceasta sunt stratificarea și eșantionarea maximă a variației. Pentru ambele, este nevoie de cunoștințe locale.
atunci când sunt topografie o zonă geografică mare, un eșantion de variație maximă pot fi trase în mai multe etape. Prima etapă este de a decide ce părți ale zonei populației vor fi chestionate. De exemplu, dacă un sondaj trebuie să reprezinte o întreagă provincie și nu este fezabil să cercetați fiecare parte a provinciei, trebuie să decideți ce părți ale provinciei (să le numim județe) vor fi incluse. Selectarea lor se face astfel…
6.1. Etapa 1
1. Gândiți – vă la toate modurile în care județele pot diferi de provincie în ansamblu-în special moduri care sunt legate de subiectul sondajului. Dacă un sondaj se referă la radio FM, iar unele zone sunt deluroase, recepția poate fi mai săracă acolo. Dacă sondajul este despre malarie, iar unele județe au mlaștini mari cu mulți țânțari, includeți un astfel de județ și unul care este opusul. Dacă subiectul este legat de bogăție sau niveluri de educație (așa cum sunt multe subiecte de cercetare), aflați care județe au cei mai bogați și mai bine educați oameni și care au cei mai săraci și mai puțin educați. Încercați să vă gândiți la 5 până la 10 factori relevanți pentru studiu.
2. Apoi încercați să adunați date obiective despre acești factori. În caz contrar, încercați să găsiți experți pe teme sau oameni care au călătorit în întreaga provincie. Folosind aceste informații, pentru fiecare factor faceți o listă a județelor care au un nivel ridicat al factorului (de exemplu, o mulțime de munți, o mulțime de mlaștini sau bogați) și județele care au un nivel scăzut al factorului (de exemplu, toate plate, fără mlaștini sau sărace).
3. Județele menționate cel mai des în aceste liste de extreme ar trebui incluse în sondaj. Marcați aceste județe pe o hartă a provinciei. A fost omisă vreo zonă mare și bine populată? Dacă da, adăugați un alt județ, care este pe cât posibil de toate celelalte menționate.
6.2. Etapa 2
când au fost alese județele (sau oricare ar fi zonele numite), următoarea etapă este de a stabili unde ar trebui ales clusterul în fiecare județ. Continuați principiul variației maxime folosind același principiu în fiecare județ selectat. Dacă un județ a fost ales pentru mlaștina și planeitatea sa, alegeți cea mai plată și mai mlăștinoasă zonă din țară. Dacă a fost ales pentru munții și bogăția sa, alegeți o zonă montană bogată. Pentru a afla unde sunt aceste zone, poate fi necesar să călătoriți în fiecare județ și să discutați cu experții locali.
6.3. Etapa 3
când ați ales orașele și localitățile rurale, puteți continua să utilizați eșantionarea cu variație maximă sau puteți alege o altă metodă, cum ar fi eșantionarea cotelor, listarea blocurilor din fotografii aeriene sau eșantionarea radială. Dacă utilizați eșantionarea variației maxime pentru etapa finală, veți alege în mod normal un număr de clustere (străzi sau cartiere), apoi alegeți respondenții din fiecare cluster folosind principiile explicate în secțiunea 4 sau 5 de mai sus.
doriți să citiți mai multe despre eșantionarea variației maxime? Îmi pare rău, dar nu poți! Această pagină nu este foarte detaliată, dar chiar și așa, pare a fi cea mai detaliată explicație a eșantionării maxime de variație scrisă vreodată. Următoarea cea mai detaliată (și cea mai larg citată) pare să fie în Cartea lui Michael Quinn Patton metode de cercetare și evaluare calitativă, la paginile 234-235 din ediția din 2001 (mai puțin de o pagină în total). De asemenea, această pagină se concentrează pe eșantionarea maximă a variațiilor pentru sondaje. Utilizarea acestuia pentru cercetări calitative, cum ar fi interviuri aprofundate și studii de caz, ar necesita ușoare variații. Voi scrie o pagină separată despre asta, când va fi nevoie.
Citat sugerat pentru această pagină:
listă, Dennis (2004). Eșantionare maximă de variație pentru sondaje și grupuri de consens. Adelaide: Dialogul Publicului. Disponibil la www.audiencedialogue.org/maxvar.html, 12 septembrie 2004.
alte principii de eșantionare menționate mai sus (eșantionarea aleatorie, eșantionarea cotelor, eșantionarea stratificată și eșantionarea bulgărelor de zăpadă) sunt descrise în Capitolul 2 din cunoaște-ți publicul.