Cochrane Library
dataindsamling og analyse
udvælgelse af forsøg til inkludering
to forfattere (YM og JH) vælger uafhængigt de forsøg, der skal inkluderes i gennemgangen i henhold til de forudbestemte udvælgelseskriterier. Enhver uenighed vil blive løst ved diskussion og høring med LiuJP.
vurdering af metodologisk kvalitet
kvaliteten af de inkluderede forsøg vurderes uafhængigt af to korrekturlæsere. Især vil følgende faktorer blive vurderet:
1. var randomiseringsproceduren tilstrækkelig?
2 . var tildelingen skjult tilstrækkelig?
3. var bedømmerne blinde for indsigelsen?
4. blev tilbagetrækninger og frafald fuldstændigt beskrevet?
5. var analyse ved intention-to-treat?
6. var bedømmerne blinde for interventionen? som vi ved, at forsøg med uklar eller utilstrækkelig metodologisk kvalitet kan være forudindtaget, og sådan bias kan føre til overvurdering af interventionsfordele (Moher 1998; Schuls 1995). De vigtigste kvalitetskomponenter er generering af tildelingssekvensen, tildelingsfortielse og blænding. Nedslidningsforstyrrelse kan også føre til overdrevne skøn over interventionseffekter.
baseret på anbefalingerne i Cochrane Korrekturlæserhåndbog (Alderson 2005) og metodologiske undersøgelser bruger vi følgende definitioner i vurderingen af metodologisk kvalitet.
vi vil bruge følgende definitioner i vurderingen af metodologisk kvalitet.
generering af tildelingssekvensen
proceduren, der bruges til at oprette en tilfældig sekvens, der sikrer, at hver deltager har en kendt, uforudsigelig og normalt lige chance for at blive tildelt interventionsgrupper. Genereringen af tildelingssekvensen kan klassificeres som:
-
“tilstrækkelig, hvis tildelingssekvensen blev genereret af en computer eller et tilfældigt taltabel. Tegning af partier, kaste en mønt, blanding af kort, eller kaste terninger kan også betragtes som tilstrækkelig, hvis en person, der ellers ikke var involveret i rekrutteringen af deltagere, udførte proceduren;
-
“uklart, hvis forsøget blev beskrevet som randomiseret, men metoden anvendt til generering af tildelingssekvens blev ikke beskrevet;
-
“utilstrækkelig, hvis et system, der involverede datoer, navne eller adgangsnumre, blev brugt til tildeling af patienter. Sådanne undersøgelser er kendt som kvasi‐randomiserede undersøgelser og bør normalt udelukkes fra systematiske gennemgange, fordi de er forbundet med en betydelig risiko for bias.
allokering skjul
proceduren anvendt til at skjule tildelingssekvensen fra efterforskerne, der tildeler deltagere til interventionsgrupperne. Tildelingen skjul kan klassificeres som:
-
“tilstrækkelig, hvis tildelingen af patienter involverede en central uafhængig enhed, låst computer på stedet, identisk nummereret, lægemiddelflasker eller containere udarbejdet af en uafhængig farmaceut eller efterforsker eller forseglede konvolutter. Konvolutter skal være serienummer, forseglede og uigennemsigtige. Disse oplysninger gives dog sjældent, hvilket indikerer en øget risiko for bias. I så fald kan forseglede konvolutter udgøre en mellemkategori mellem tilstrækkelig og uklar;
-
“uklart, hvis forsøget blev beskrevet som randomiseret, men metoden anvendt til at skjule tildelingen blev ikke beskrevet;
-
“utilstrækkelig, hvis tildelingssekvensen var kendt af efterforskerne, der tildelte deltagere, eller hvis undersøgelsen var kvasi‐randomiseret.
Blinding
proceduren, der blev brugt til at holde forsøgsdeltagere, sundhedsudbydere og resultatbedømmere uvidende om den intervention, som deltagerne blev tildelt. Retslige bedømmere af resultater, dataanalyse, datasikkerhed, medlemmer af Overvågningsudvalget og manuskriptforfattere kan også blændes. Blinding kan derefter vurderes som tilstrækkelig, hvis deltageren eller resultatvurdereren er blindet.
opfølgning
formålet med randomisering er at generere sammenlignelige interventionsgrupper. Denne baseline-ækvivalens kan forstyrres, hvis deltagerne går tabt for at følge op. For at vurdere risikoen for en sådan nedslidningsforstyrrelse udtrækker vi antallet og årsagerne til Frafald og udbetalinger. Udtrækning af disse oplysninger kan være vanskelig på grund af uklar rapportering. Det kan derfor undertiden være relevant at udtrække tilstrækkeligheden af opfølgningsrapporter. Den rapporterede opfølgning kan klassificeres som:
“tilstrækkelig, hvis antallet og årsagerne til Frafald og tilbagetrækning i alle interventionsgrupper blev beskrevet, eller hvis det blev specificeret, at der ikke var frafald eller tilbagetrækning;
“uklart, hvis rapporten gav indtryk af, at der ikke havde været nogen frafald eller tilbagetrækning, men dette blev ikke specifikt angivet;
“utilstrækkelig, hvis antallet eller årsagerne til Frafald og tilbagetrækning ikke blev beskrevet.
baseret på disse kriterier vil undersøgelser stort set blive opdelt i følgende tre kategorier:
A ‐ alle kvalitetskriterier opfyldt: lav risiko for bias.
B – et eller flere af kvalitetskriterierne er kun delvist opfyldt: moderat risiko for bias.
C-et eller flere kriterier ikke opfyldt: høj risiko for bias.
denne klassificering vil blive brugt i følsomhedsanalysen.
to forfattere (YM og JH) vurderer den metodologiske kvalitet uafhængigt ved hjælp af vurderingskriterier defineret i protokollen. Eventuelle forskelle i kvalitetsvurderingen af forsøg vil blive løst i diskussion og konsultation med LiuJP for at nå til enighed.
DATAEKSTRAKTION
følgende egenskaber og data udvindes af to forfattere (YM og JH) fra hvert inkluderet forsøg: (Sort 2005)
1. Generel information-Titel, primær forfatter, år, land, indstilling, finansieringskilde, offentliggjort/upubliceret, udgivelsessprog, abstrakt / Fuld artikel, duplikatpublikationer.
2 . Forsøgskarakteristika-design, kvalitet efter metode og sikkerhed ved randomisering, blinding, skjult tildeling, årsager og antal patienter, der faldt ud eller tabte under opfølgningen,.
3. Deltagere-alder, køn, race, patient inklusion og eksklusionskriterier, diagnostiske kriterier, indledende sammensatte score, baseline lighed mellem grupper (inklusive co‐morbiditet), vurdering af overholdelse, andre terapier.
4. Interventioner – type plantelægemidler, placebo, glukokortikoider og immunsuppressive midler.
5. Resultater-sammenlignelighed ved baseline, mortalitet og morbiditetsresultater, bivirkninger, patientpræference, livskvalitet, studievarighed, som observeret og med hensigt at behandle.
klassificering af evidens
vi vil bruge et klassificeringssystem baseret på det, der er beskrevet i 2004‐bogen evidensbaseret reumatologi og anbefalet af Muskuloskeletalgruppen:
Platinum: en offentliggjort systematisk gennemgang, der har mindst to individuelle kontrollerede forsøg, der hver opfylder følgende:
·prøvestørrelser på mindst 50 pr.gruppe ‐ hvis disse ikke finder en statistisk signifikant forskel, er de tilstrækkeligt drevet til en relativ forskel på 20% i det relevante resultat. * Blinding af patienter og bedømmere for resultater.
·håndtering af tilbagetrækninger >80% opfølgning (imputationer baseret på metoder som Sidste Observation fremført (LOCF) er acceptable).
·Skjult behandling tildeling.
Guld: mindst et randomiseret klinisk forsøg, der opfylder alle følgende kriterier for de(t) største resultat (er) som rapporteret:
·prøvestørrelser på mindst 50 pr.gruppe ‐ hvis disse ikke finder en statistisk signifikant forskel, er de tilstrækkeligt drevet til en relativ forskel på 20% i det relevante resultat. * Blinding af patienter og bedømmere for resultater.
·håndtering af tilbagetrækninger > 80% opfølgning (imputationer baseret på metoder som LOCF er acceptable).
·Skjult behandling tildeling.
sølv: en systematisk gennemgang eller randomiseret forsøg, der ikke opfylder ovenstående kriterier. Sølvrangering vil også omfatte bevis fra mindst en undersøgelse af ikke‐randomiserede kohorter, der modtog og ikke modtog terapien, eller bevis fra mindst en case‐kontrolundersøgelse af høj kvalitet. Et randomiseret forsøg med en ‘head‐to‐head’ sammenligning af agenser ville blive betragtet som sølvniveaurangering, medmindre der blev henvist til en sammenligning af et af agenterne med placebo, der viste mindst en relativ forskel på 20%.
: Bronsrangeringen gives til bevis, hvis mindst en sagsserie af høj kvalitet uden kontrol (inklusive enkle før/efter undersøgelser, hvor patienter fungerer som deres egen kontrol), eller hvis konklusionen er afledt af ekspertudtalelse baseret på klinisk erfaring uden henvisning til noget af det foregående (for eksempel argument fra fysiologi, bænkforskning eller første principper).
to forfattere (YM og JH) vil udtrække data uafhængigt ved hjælp af en selvudviklet dataekstraktionsform. Uenighed vil blive løst i diskussion og konsultation med LiuJP.
dataanalyser
vi er beregnet til at vise forsøg som sammenligninger af plantelægemidler versus:
-
ingen intervention
-
glukokortikoider
-
immunsuppressive midler
-
forsøg med plantelægemidler plus glukokortikoider og/eller immunsuppressive midler versus glukokortikoider og/eller immunsuppressive midler alene præsenteres også som en sammenligning.
hver type urtemedicin sammenlignes med hver kontrol. Metaanalyse vil blive udført inden for sammenligninger af den samme type urtemedicin versus den lignende kontrolintervention. Dikotom data vil blive præsenteret som relativ risiko (RR) og kontinuerlige resultater som vægtet gennemsnitlig forskel (masseødelæggelsesvåben), begge med 95% konfidensintervaller (CI).
analyser udføres efter intention-to-treat-princip, når det er tilgængeligt. Vi analyserer data ved hjælp af det sidst rapporterede observerede respons og inkluderer alle patienter uanset overholdelse eller opfølgning. Meta‐analyse med faste effekter vil blive brugt til at kombinere undersøgelsesdata, hvis forsøgene vurderes at være tilstrækkeligt ens. Heterogenitet testes for brug af Å score og chi kvadreret statistik med betydning er indstillet til p < 0.1. Hvis dette indikerer et signifikant statistisk niveau af heterogenitet blandt forsøgene inkluderet i en analyse, a tilfældig effekt meta‐analyse foretrækkes til en samlet oversigt. Mulige kilder til heterogenitet vil blive vurderet ved hjælp af undergruppe-og følsomhedsanalyser som beskrevet nedenfor.
undergruppeanalyse
Vi udfører undergruppeanalyse for at undersøge forskelle i effektstørrelse som følger:
1. Forskellige typer af plantelægemidler
2. Baseline sygdom sværhedsgrad (mild, moderat, svær)
3. Race af deltager
følsomhedsanalyser
Hvis det er relevant, udføres følsomhedsanalyser for at udforske randomisering, dobbeltblinding og intention‐to‐treat på effektstørrelse. Vi vil også udføre’ værst tænkelige ‘ scenarieanalyse (tæller patienter med ufuldstændige eller manglende data som behandlingssvigt) for at undersøge den mulige effekt af tab til opfølgning på resultaterne.
kliniske RELEVANSTABELLER
kliniske relevanstabeller vil blive samlet under yderligere tabeller for at forbedre læsbarheden af gennemgangen. For dikotome resultater, som komplikationer, beregnes det antal, der er nødvendigt at behandle, ud fra kontrolgruppens hændelsesfrekvens og den relative risiko ved hjælp af den visuelle rks NNT-lommeregner (Cates 2003). Fortløbende resultattabeller vil også blive præsenteret under yderligere tabeller. Absolut fordel beregnes som forbedringen i interventionsgruppen minus forbedringen i kontrolgruppen i de oprindelige enheder.Relativ forskel i ændringen fra baseline beregnes som den absolutte fordel divideret med baseline-gennemsnittet for kontrolgruppen (Tuggle 2004).