maksymalne pobieranie próbek zmienności dla badań i grup konsensusu

co to jest maksymalne pobieranie próbek zmienności?

zamiast szukać reprezentatywności poprzez równe prawdopodobieństwa, maksymalne próbkowanie zmienności szuka go poprzez włączenie szerokiego zakresu skrajności. Zasada jest taka, że jeśli celowo spróbujesz przeprowadzić wywiad z bardzo różnymi osobami, ich zagregowane odpowiedzi mogą być zbliżone do całej populacji. metoda brzmi dziwnie, ale działa dobrze w miejscach, w których nie można narysować losowej próbki. Jest to rozszerzenie statystycznej Zasady regresji w kierunku średniej – innymi słowy, jeśli grupa ludzi jest ekstremalna na kilka różnych sposobów, będzie zawierać ludzi, którzy są średni w inny sposób. Więc jeśli szukałeś próbki „minimalnej zmienności”, próbując tylko pokryć typy ludzi, którzy uważałeś za przeciętnych, prawdopodobnie przegapisz wiele różnych grup, które tworzą dość wysoki odsetek populacji. Ale szukając maksymalnej zmienności, przeciętni ludzie są automatycznie włączani.

maksymalna próbka zmienności (czasami nazywany próbki maksymalnej różnorodności lub Próbki maksymalnej heterogeniczności) jest specjalnym rodzajem celowej próbki. Zwykle celowa próbka nie jest reprezentatywna i nie twierdzi, że jest. Jednak maksymalna próbka zmienności, jeśli starannie dobrane, może być tak reprezentatywna jak próbka losowa. Pomimo tego, co Wiele osób (z odrobiną wiedzy o statystykach) uważa, losowa próbka niekoniecznie jest najbardziej reprezentatywna, szczególnie gdy wielkość próby jest niewielka.

kiedy używać maksymalnego próbkowania zmienności

istnieją dwie główne okazje do korzystania z maksymalnego próbkowania zmienności:

  • , gdy wielkość próby jest bardzo mała, lub
  • , gdy brak informacji o populacji jest dostępny (i nie jest trudno znaleźć członków populacji o wybranych cechach)

2.1. Maksymalna zmienność próbkowania dla małej wielkości próbki

przez „mały” tutaj, mam na myśli mniej niż około 30. („Około 30” oznacza coś od około 20 do około 50 – nie ma nagłej zmiany, ponieważ wielkość próby wzrasta.) Niezależnie od rzeczywistej liczby, losowe pobieranie próbek nie działa dobrze dla tych małych próbek: istnieje duża szansa na uzyskanie próbki, która nie jest reprezentatywna, mimo że została wybrana losowo. Gdy próbka jest tak mała, jak 3 (dla zestawu grup konsensusu) losowe pobieranie próbek jest zbyt niebezpieczne. Zamiast tego można użyć próbkowania kwot lub próbkowania maksymalnej zmienności. Jeśli masz wystarczająco dużo danych na temat populacji, pobieranie próbek kwot jest w porządku. Na przykład, jeśli są pobierania próbek 20 osób z populacji miasta, prosta forma pobierania próbek kwoty jest do wyboru 10 mężczyzn i 10 kobiet. Ale pobieranie próbek kwot-z opublikowanych lub odgadniętych danych o populacji – nie zawsze jest istotne. To jest, gdy maksymalne próbkowanie zmienności jest najbardziej przydatne. Na przykład, gdy wybierasz próbkę dla zestawu grup konsensusu, Zwykle bierzesz trzy typy osób, które będą tak różne, jak to możliwe w badanym problemie.

2.2. Maksymalne próbkowanie zmienności w przypadku braku danych populacji

chociaż losowe pobieranie próbek jest uważane za idealną metodę pobierania próbek, czasami nie jest możliwe, aby pobrać próbkę losową. W niektórych krajach informacje o spisach są albo niedostępne, albo tak dawno nieaktualne, że są bezużyteczne. Nawet jeśli istnieją najnowsze i szczegółowe dane ze spisu powszechnego, nie mogą istnieć mapy przedstawiające granice obszarów, do których dane dotyczą. I nawet jeśli istnieją zarówno dobre dane spisowe, jak i powiązane mapy, mogą nie istnieć ramy próbkowania.

dobrą wiadomością (z punktu widzenia próbkowania) jest to, że Warunki te mają zwykle zastosowanie w bardzo biednych i nierozwiniętych krajach o dużej populacji wiejskiej. Z mojego doświadczenia wynika, że nie ma dużego zróżnicowania w tych populacjach. Wydaje się, że im bardziej rozwinięty kraj, tym więcej różnic jest między jego obywatelami. Dlatego tam, gdzie losowe pobieranie próbek nie jest możliwe, być może nie jest to tak konieczne. Ale w biednych krajach, w których ramki próbki nie istnieją, maksymalne próbkowanie zmienności może być bardzo skuteczne, przy użyciu metody wieloetapowej wyjaśnionej poniżej.

jaki jest najlepszy rozmiar próbki dla maksymalnej próbki zmienności?

w przypadku próbki jednostopniowej lub na poziomie próbkowania, najlepiej jest ograniczyć maksymalną próbkę zmienności do nie więcej niż około 50 jednostek. Powyżej tej liczby ankieterzy się mylić, a inne metody, takie jak pobieranie próbek kwotowych i promieniowe pobieranie próbek, są prostsze, a często bardziej kompleksowe. Łącząc te podpróbki 50 lub mniej w próbce wielostopniowej, całkowita próbka może być tysiącami ludzi – ale ze względu na dodatkowy wysiłek związany z tym, nie zrobiłbyś tego, gdyby nie było alternatywy. Największy próbowałem było około 200, w klastrach 12 – ale próba kwotowa (np. grupa wiekowa według płci według rodzaju zawodu) może być jako reprezentatywna i wymagałaby dużo mniej nadzoru ankieterów.

jak wybrać maksymalną próbkę zmienności

przy maksymalnym próbkowaniu zmienności próbujesz uwzględnić wszystkie skrajności w populacji. Na przykład, w małej wiosce, do badania słuchalności radia, można poprosić o wywiad…

  • najstarsza osoba w wiosce, która słucha radia
  • najstarsza, która nie słucha radia
  • najmłodsza, która słucha radia
  • osoba, która słucha radia cały dzień
  • osoba, która często mówi o programach radiowych, którą słyszał
  • osoba, która słucha radia w środku nocy
  • osoba, która nigdy w życiu nie słuchała radia
  • osoba z największą liczbą radiotelefonów (być może serwisant)
  • osoba z największą anteną
  • osoba, która jest uważana za całkowicie przeciętną pod każdym względem
  • osoba, która spędza dużo czasu na ulicy i w miejscach publicznych
  • osoba, która pracuje prawie cały czas

…i tak dalej – zmieniając” osobę „na” mężczyznę „lub” kobietę ” na przemian, aby zapewnić równą reprezentację obu płci. OczywiĹ „cie dziaĹ’ a to tylko kiedy takie informacje o innych ludziach sÄ … szeroko znane. Powyższa lista ludzi mogłaby być wyprodukowana w wiosce, gdzie wielu ludzi zna wielu innych, ale w dużym mieście byłaby znacznie trudniejsza.

często warto mieć wstępną sesję burzy mózgów z początkową grupą lokalnych informatorów (którzy nie powinni być ewentualnymi respondentami). Przedstaw im wstępną listę typów osobistych, podobną do powyższej, ale odpowiednio zmodyfikowaną do celów badania. Poproś ich, aby wymyślili więcej typów osób i powiedzieli, Czy niektóre z typów, które wymyśliłeś, nie mają sensu w tej dziedzinie. Ale jeśli nie zaczniesz od przykładu, odkryłem, że ludziom trudno jest zrozumieć, o co pytasz.

jednym z problemów z rysowaniem próbki, jak powyżej, są informatory, których używasz do identyfikacji osób o tych cechach. Kuszące-bo proste-jest pójście do urzędu gminy i poproszenie urzędników o wymienienie osób tego typu. Możesz szybko uzyskać ich listę, ale w jeden ważny sposób nie będzie maksymalnej zmienności: sugerowani respondenci będą wszyscy znani samorządowcom.

Twoja sieć może być szerzej oddana przez sekwencyjne próbkowanie (próbkowanie śnieżki), uzyskując tylko kilku sugerowanych respondentów z każdego źródła. Innymi słowy, informator a sugeruje respondentów B I C z listy cech, B sugeruje D I E, C sugeruje F I G – i tak dalej. Biorąc pod uwagę zasadę „sześciu stopni separacji” oraz fakt, że respondenci nie są proszeni o sugerowanie swoich przyjaciół, ale ludzi o określonych cechach, maksymalna metoda zmienności powinna dać większości osób w obszarze badania szansę na włączenie do próby.

zauważyłeś wadę tego argumentu? Problem polega na tym, że im więcej osób zna potencjalny respondent, tym większe prawdopodobieństwo, że dana osoba zostanie wybrana do badania. Dlatego lista typów osobistych musi wyraźnie obejmować osoby izolowane społecznie, dodając kryteria takie jak…

  • starszy mężczyzna, który ma niewielu gości
  • młodszy mężczyzna, który niewiele mówi
  • starsza kobieta, która mieszka sama i nie ma członków rodziny mieszkających w pobliżu
  • młoda kobieta, która jest niezamężna i prawie nigdy nie opuszcza domu

…i tak dalej-zmieniając powyższe opisy w zależności od kultury. (W niektórych częściach świata nigdy nie znajdziesz kobiety żyjącej samotnie.) Tam, gdzie istnieje segregacja Religijna, językowa lub plemienna, będziesz musiał rozpocząć oddzielne wątki poszukiwań w każdej z tych grup kulturowych.

Jeśli pytasz o konkretny typ osoby, a informator nie może nazwać kogoś dokładnie w ten sposób, dobrze jest zaakceptować przybliżenie, oparte na jakimś innym kryterium, które wydaje się istotne. Może to wprowadzić inne wymiary różnorodności, o których początkowo nie pomyślałeś.

wybór wymiarów zmienności

w powyższym przykładzie 12 różnych rodzajów słuchaczy radiowych (plus kolejne 4 rodzaje izolatów społecznych) znaleziono poprzez wyobrażenie warunków społecznych, które mogą wpływać na słuchanie radia. Lista nie była wyczerpująca ani systematyczna, ale jeśli chcesz mieć pewność, że żadna grupa osób nie została pominięta, możesz użyć analizy wymiarowej, aby utworzyć bardziej kompleksową listę. Robi się to w ten sposób…

Krok 1 to zdecydować, jaki rozmiar próbki chcesz. Na przykład, powiedzmy, że jest to 20. Określa to liczbę wymiarów: 20 to 2 do potęgi czego? Najbliższa odpowiedź to 4, Ponieważ 2 x 2 x 2 x 2 = 16. Więc można użyć 4 wymiarów, aby uzyskać 16 przypadków, a następnie dodać kilka innych czynników, takich jak ludzie odizolowani społecznie. (Dla próbki 32 użyj 5 wymiarów, a dla 64 użyj 6. Powyżej 100 lub więcej, próbkowanie kwot zwykle działa lepiej.)

Krok 2 to decyzja o tych wymiarach. Pomyśl o pewnych cechach ludzi, które (A) różnią się znacznie między ludźmi w odniesieniu do przedmiotu, który badasz, i (b) są znane szerokiej gamie innych osób. Na przykład, jeśli tematem jest to, ile czasu ludzie spędzają słuchając radia, może nie być użyteczne wybranie płci jako wymiaru, ponieważ w większości krajów mężczyźni i kobiety spędzają mniej więcej tyle samo czasu słuchając radia. Jednak to, czy ludzie mają radio w domu, czy nie, ma duże znaczenie dla ich czasu słuchania. Inne widoczne czynniki, które wpływają na słuchanie radia, to to, czy ludzie mają telewizor w domu, i ile czasu ludzie spędzają z dala od domu, w miejscach bez radia. Innym czynnikiem jest to, jak bardzo lubią słuchać programów lokalnych, ale nie jest to łatwe do zaobserwowania, więc może być konieczne użycie zmiennej proxy, takiej jak to, jak często mówią, że mówią o programach radiowych. Teraz mamy 4 zmienne, każda z dwoma skrajnymi odpowiedziami. Nadaj każdej możliwej odpowiedzi kod literowy, zaczynając od A, w ten sposób…

  • mieć radio w domu: tak (a) lub nie (b)
  • mieć telewizor w domu: tak (c) lub nie (D)
  • pozostać w domu przez większość czasu (E) lub z dala od domu przez większość czasu (F)
  • jak często rozmawiają z innymi o programach radiowych: „większość dni „(g) lub” prawie nigdy ” (h)

biorąc po kolei każdą z 4 zmiennych, istnieje 16 możliwych kategorii (2 x 2 x 2 x 2). Są to
ACEG, ACEH, ACFG, ACFH
BCEG, BCEH, BCFG, BCFH
ADEG, ADEH, ADFG, ADFH
BDEG, BDEH, BDFG, BDFH

na przykład, bdgh = ktoś, kto nie ma radia w domu, telewizji w domu, jest z dala od domu przez większość czasu i prawie nigdy nie mówi o radiu.

Krok 3. Wszystko, co musisz teraz zrobić, to znaleźć kogoś pasującego do tego opisu-i powtórzyć to zadanie dla 15 innych typów ludzi. Co, jeśli nie możesz znaleźć ludzi, którzy spełniają niektóre z tych opisów? Może się tak zdarzyć-na przykład trudno znaleźć kogoś, kto przez większość czasu pozostaje w domu i nie ma radia w domu, ale dużo o tym mówi. W takim przypadku w niektórych z 16 kategorii znajdziesz więcej niż jedną osobę. Nie ma wielkiego problemu: po prostu upewnij się, że osoby z tej samej kategorii są bardzo różne w jakiś inny sposób, który wydaje się istotny dla Twojego badania.

Krok 4. Na koniec nie zapomnij dodać 4 osób, które rzadko komunikują się z innymi. To daje próbkę do 20. Chcesz więcej niż 20? Wystarczy dodać kilka osób, o ile są one jak najbardziej różne od siebie w jakiś odpowiedni sposób.

chociaż ta systematyczna metoda wyboru respondentów jest łatwiejsza podczas Rostów ankieterów, nie odkryłem, że wytwarza bardziej zróżnicowaną próbkę niż bardziej losowa metoda opisana w sekcji 4 powyżej.

wielostopniowe próbkowanie maksymalnej zmienności

podczas wybierania próbki wielostopniowej, pierwszym etapem może być narysowanie próbki okręgów w całym kraju. Jeśli liczba ta jest mniejsza niż około 30, jest prawdopodobne, że próbka będzie poważnie niereprezentatywna w jakiś sposób. Dwa rozwiązania tego są stratyfikacji i maksymalnej zmienności próbkowania. Dla obu z nich potrzebna jest wiedza lokalna.

gdy badasz duży obszar geograficzny, próbkę o maksymalnej zmienności można narysować w kilku etapach. Pierwszym etapem jest decyzja, które części obszaru populacji będą badane. Na przykład, jeśli ankieta ma reprezentować całą prowincję, a nie jest możliwe zbadanie każdej części prowincji, musisz zdecydować, które części prowincji (nazwijmy je hrabstwami) zostaną uwzględnione. Wybór odbywa się w ten sposób…

6.1. Etap 1

1. Pomyśl o wszystkich sposobach, w jakie powiaty mogą się różnić od prowincji jako całości-szczególnie o sposobach, które są związane z przedmiotem badania. Jeśli ankieta dotyczy radia FM, a niektóre obszary są pagórkowate, odbiór może być tam uboższy. Jeśli ankieta dotyczy malarii, a niektóre hrabstwa mają duże bagna z dużą ilością komarów, włącz jeden taki Powiat i jeden, który jest odwrotnie. Jeśli temat jest związany z poziomem zamożności lub wykształcenia (jak wiele tematów badawczych), dowiedz się, które hrabstwa mają najbogatszych i najlepiej wykształconych ludzi, a które mają najbiedniejszych i najmniej wykształconych. Spróbuj pomyśleć o 5 do 10 czynników, które są istotne dla badania.

2. Następnie spróbuj zebrać obiektywne dane na temat tych czynników. W przeciwnym razie spróbuj znaleźć ekspertów na ten temat lub ludzi, którzy podróżowali po całej prowincji. Korzystając z tych informacji, dla każdego czynnika zrób listę hrabstw, które mają wysoki poziom czynnika (np. wiele gór, wiele bagien lub bogatych) i hrabstwa, które mają niski poziom czynnika (np. wszystkie płaskie, bez bagien lub słabe).

3. Do badania należy włączyć powiaty wymienione najczęściej w tych wykazach skrajności. Zaznacz te hrabstwa na mapie województwa. Czy pominięto jakiś duży i dobrze zaludniony obszar? Jeśli tak, należy dodać inne Hrabstwo, które jest w miarę możliwości od wszystkich innych wymienionych.

6.2. Etap 2

Po wybraniu powiatów (lub innych obszarów) następnym etapem jest ustalenie, gdzie w każdym powiecie należy wybrać klaster. Kontynuuj zasadę maksymalnej zmienności, stosując tę samą zasadę wewnątrz każdego wybranego powiatu. Jeśli Hrabstwo zostało wybrane ze względu na jego bagnistość i płaskość, wybierz najbardziej płaski i bagnisty obszar w kraju. Jeśli został wybrany ze względu na swoje góry i bogactwo, wybierz bogaty górzysty obszar. Aby dowiedzieć się, gdzie znajdują się te obszary, być może będziesz musiał udać się do każdego powiatu i porozmawiać z lokalnymi ekspertami.

Etap 3

Po wybraniu miast i miejscowości wiejskich możesz kontynuować pobieranie próbek o maksymalnej zmienności lub wybrać inną metodę, taką jak pobieranie próbek kwot, lista bloków ze zdjęć lotniczych lub pobieranie próbek promieniowych. Jeśli użyjesz maksymalnego próbkowania zmienności na ostatnim etapie, zwykle wybierzesz liczbę klastrów (ulic lub dzielnic), a następnie wybierzesz respondentów w każdym klastrze, korzystając z zasad wyjaśnionych w sekcji 4 lub 5 powyżej.

chcesz dowiedzieć się więcej o próbkowaniu maksymalnej zmienności? Przykro mi,ale nie możesz! Ta strona nie jest bardzo szczegółowe, ale mimo to, wydaje się być najbardziej szczegółowe wyjaśnienie maksymalnej zmienności próbkowania kiedykolwiek napisane. Następna najbardziej szczegółowa (i najczęściej cytowana) wydaje się być w książce Michaela Quinna Pattona Qualitative Research and Evaluation Methods, na stronach 234-235 w wydaniu z 2001 roku (łącznie mniej niż jedna strona). Ponadto, ta strona koncentruje się na maksymalnej zmienności próbkowania dla badań. Wykorzystanie go do badań jakościowych, takich jak pogłębione wywiady i studia przypadków, wymagałoby niewielkich różnic. Napiszę o tym osobną stronę, gdy zajdzie taka potrzeba.

sugerowane cytowanie tej strony:
List, Dennis (2004). Maksymalna zmienność próbkowania dla ankiet i grup konsensusu. Adelaide: Audience Dialogue. Dostępne w www.audiencedialogue.org/maxvar.html / align = „right” / 12 września 2004

inne zasady pobierania próbek wymienione powyżej (losowe pobieranie próbek, pobieranie próbek kontyngentowych, pobieranie warstwowe i pobieranie próbek śnieżek) są opisane w rozdziale 2 Know Your Audience.



Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.