The Cochrane Library
Datensammlung und -analyse
AUSWAHL DER STUDIEN ZUR AUFNAHME
Zwei Autoren (YM und ZH) wählen unabhängig voneinander die Studien aus, die gemäß den vorgegebenen Auswahlkriterien in die Überprüfung aufgenommen werden sollen. Jede Meinungsverschiedenheit wird durch Diskussion und Rücksprache mit LiuJP gelöst.
BEURTEILUNG DER METHODISCHEN QUALITÄT
Die Qualität der eingeschlossenen Studien wird von zwei unabhängigen Gutachtern beurteilt. Insbesondere werden folgende Faktoren bewertet:
1. war das Randomisierungsverfahren angemessen?
2. war die Zuteilungsverschweigerung angemessen?
3. waren die Ergebnisgutachter blind für den Beobachtungseinwand?
4. wurden Austritte und Aussteiger vollständig beschrieben?
5. war die Analyse von Intention-to-Treat?
6. waren Outcome Assessoren blind für die Intervention? Wie wir wissen, können Studien mit unklarer oder unzureichender methodischer Qualität voreingenommen sein, und eine solche Voreingenommenheit kann zu einer Überschätzung des Interventionsnutzens führen (Moher 1998; Schulz 1995). Die wichtigsten Qualitätskomponenten sind Erzeugung der Zuordnungsfolge, Zuordnungsverschleierung und Verblindung. Attrition Bias kann auch zu übertriebenen Schätzungen der Interventionseffekte führen. Basierend auf den Empfehlungen im Cochrane Reviewers‘ Handbook (Alderson 2005) und methodischen Studien verwenden wir die folgenden Definitionen bei der Bewertung der methodischen Qualität.
Wir werden die folgenden Definitionen bei der Bewertung der methodischen Qualität verwenden.
Generierung der Zuordnungssequenz
Das Verfahren zum Erstellen einer Zufallssequenz, das sicherstellt, dass jeder Teilnehmer eine bekannte, unvorhersehbare und normalerweise gleiche Chance hat, Interventionsgruppen zugewiesen zu werden. Die Zuordnungssequenz-Generierung kann klassifiziert werden als:
-
„Adäquat, wenn die Zuordnungssequenz von einem Computer oder einer Zufallszahlentabelle generiert wurde. Das Ziehen von Losen, das Werfen einer Münze, das Mischen von Karten oder das Würfeln können auch als angemessen angesehen werden, wenn eine Person, die nicht anderweitig an der Rekrutierung von Teilnehmern beteiligt war, das Verfahren durchgeführt hat;
-
„Unklar, wenn die Studie als randomisiert beschrieben wurde, die Methode zur Generierung der Zuordnungssequenz jedoch nicht beschrieben wurde;
-
„Unzureichend, wenn ein System mit Daten, Namen oder Zulassungsnummern für die Zuweisung von Patienten verwendet wurde. Solche Studien werden als quasi‐randomisierte Studien bezeichnet und sollten in der Regel von systematischen Reviews ausgeschlossen werden, da sie mit einem erheblichen Risiko für Verzerrungen verbunden sind.
Zuordnungsverschleierung
Das Verfahren, mit dem die Zuordnungssequenz vor den Ermittlern verborgen wird, die die Teilnehmer den Interventionsgruppen zuweisen. Die Zuteilung Verschleierung kann klassifiziert werden als:
-
„Ausreichend, wenn die Zuteilung von Patienten eine zentrale unabhängige Einheit beteiligt, Vor‐Ort-Computer gesperrt, identisch nummeriert erscheinen, Arzneimittelflaschen oder Behälter von einem unabhängigen Apotheker oder Prüfer hergestellt, oder versiegelte Umschläge. Umschläge sollten seriell nummeriert, versiegelt und undurchsichtig sein. Diese Informationen werden jedoch selten bereitgestellt, was auf ein erhöhtes Risiko für Verzerrungen hinweist. In diesem Fall können versiegelte Umschläge eine Zwischenkategorie zwischen adäquat und unklar darstellen;
-
„Unklar, wenn die Studie als randomisiert beschrieben wurde, die Methode zum Verbergen der Zuordnung jedoch nicht beschrieben wurde;
-
„Unzureichend, wenn die Zuordnungssequenz den Ermittlern bekannt war, die die Teilnehmer zugewiesen hatten, oder wenn die Studie quasi randomisiert war.
Verblindung
Das Verfahren, mit dem Studienteilnehmer, Gesundheitsdienstleister und Ergebnisprüfer nicht über die Intervention informiert werden, der die Teilnehmer zugewiesen wurden. Gerichtliche Gutachter der Ergebnisse, Datenanalyse, Datensicherheit, Mitglieder des Überwachungsausschusses und Manuskriptschreiber können ebenfalls geblendet werden. Die Verblindung kann dann als ausreichend bewertet werden, wenn der Teilnehmer oder Ergebnisbeurteiler ist geblendet.
Follow‐up
Der Zweck der Randomisierung besteht darin, vergleichbare Interventionsgruppen zu generieren. Diese Baseline-Äquivalenz kann gestört werden, wenn die Teilnehmer verloren gehen Follow-up. Um das Risiko eines solchen Flution Bias zu bewerten, Wir werden die Anzahl und die Gründe für Aussteiger und Aussteiger extrahieren. Die Extraktion dieser Informationen kann aufgrund unklarer Berichte schwierig sein. Es kann daher manchmal relevant sein, die Angemessenheit von Folgeberichten zu überprüfen. Das gemeldete Follow-up kann wie folgt klassifiziert werden:
„Angemessen, wenn die Anzahl und die Gründe für Abbrüche und Abbrüche in allen Interventionsgruppen beschrieben wurden oder wenn angegeben wurde, dass es keine Abbrüche oder Abbrüche gab;
„Unklar, wenn der Bericht den Eindruck erweckte, dass es keine Abbrecher oder Austritte gegeben hatte, dies aber nicht ausdrücklich angegeben wurde;
„Unzureichend, wenn die Anzahl oder die Gründe für Abbrecher und Austritte nicht beschrieben wurden.
Basierend auf diesen Kriterien werden die Studien grob in die folgenden drei Kategorien unterteilt:
A – alle Qualitätskriterien erfüllt: geringes Risiko für Verzerrungen.
B – eines oder mehrere der Qualitätskriterien nur teilweise erfüllt: moderates Bias-Risiko.
C – ein oder mehrere Kriterien nicht erfüllt: hohes Risiko von Bias.
Diese Klassifizierung wird in der Sensitivitätsanalyse verwendet werden.
Zwei Autoren (YM und ZH) bewerten die methodische Qualität unabhängig anhand der im Protokoll definierten Bewertungskriterien. Etwaige Unterschiede in der Qualitätsbewertung von Studien werden in Diskussion und Konsultation mit LiuJP gelöst, um einen Konsens zu erzielen.
DATENEXTRAKTION
Die folgenden Merkmale und Daten werden von zwei Autoren (YM und ZH) aus jeder eingeschlossenen Studie extrahiert: (Schwarz 2005)
1. Allgemeine Informationen -Titel, primärer Autor, Jahr, Land, Einstellung, Finanzierungsquelle, veröffentlicht / unveröffentlicht, Sprache der Veröffentlichung, Zusammenfassung / vollständiger Artikel, doppelte Publikationen.
2. Studienmerkmale – Design, Qualität nach Methode und Sicherheit der Randomisierung, Verblindung, Zuteilung Verschleierung, Gründe und Anzahl der Patienten, die während der Nachsorge abgebrochen oder verloren haben,.
3. Teilnehmer – Alter, Geschlecht, Rasse, Patientenein‐ und -ausschlusskriterien, diagnostische Kriterien, anfängliche zusammengesetzte Scores, Baseline-Ähnlichkeit der Gruppen (einschließlich Komorbidität), Bewertung der Compliance, andere Therapien.
4. Interventionen – Art der pflanzlichen Arzneimittel, Placebo, Glukokortikoide und Immunsuppressiva.
5. Ergebnisse – Vergleichbarkeit zu Studienbeginn, Mortalitäts- und Morbiditätsergebnisse, Nebenwirkungen, Patientenpräferenz, Lebensqualität, Studiendauer, wie beobachtet und nach Behandlungsabsicht.
EINSTUFUNG DER EVIDENZ
Wir werden ein Bewertungssystem verwenden, das auf dem im Buch Evidence‐based Rheumatology (Tugwell 2004) von 2004 beschriebenen und von der Musculoskeletal Group empfohlenen basiert:
Platinum: Eine veröffentlichte systematische Übersicht mit mindestens zwei kontrollierten Einzelstudien, die jeweils Folgendes erfüllen:
· Stichprobengrößen von mindestens 50 pro Gruppe ‐ wenn diese keinen statistisch signifikanten Unterschied feststellen, sind sie ausreichend für einen relativen Unterschied von 20% im relevanten Ergebnis.
· Verblindung von Patienten und Gutachtern für die Ergebnisse.
*Abwicklung von Abhebungen >80% Follow-up (Imputationen basierend auf Methoden wie Last Observation Carried Forward (LOCF) sind akzeptabel).
· Verschleierung der Behandlung Zuordnung.
Gold: Mindestens eine randomisierte klinische Studie, die alle folgenden Kriterien für die wichtigsten Ergebnisse erfüllt, wie berichtet:
· Stichprobengrößen von mindestens 50 pro Gruppe ‐ wenn diese keinen statistisch signifikanten Unterschied feststellen, sind sie ausreichend für einen relativen Unterschied von 20% im relevanten Ergebnis.
· Verblindung von Patienten und Gutachtern für die Ergebnisse.
*Handhabung von Abhebungen > 80% Follow-up (Imputationen basierend auf Methoden wie LOCF sind akzeptabel).
· Verschleierung der Behandlung Zuordnung.
Silver: Eine systematische Überprüfung oder randomisierte Studie, die die oben genannten Kriterien nicht erfüllt. Das Ranking würde auch Beweise aus mindestens einer Studie mit nicht randomisierten Kohorten enthalten, die die Therapie erhalten haben und nicht, oder Beweise aus mindestens einer hochwertigen Fall‐Kontroll-Studie. Eine randomisierte Studie mit einem direkten Vergleich der Wirkstoffe würde als Silberrang eingestuft, es sei denn, es wurde auf einen Vergleich eines der Wirkstoffe mit Placebo verwiesen, der einen relativen Unterschied von mindestens 20% ergab.
Bronze: Das Bronze-Ranking wird an Evidenz vergeben, wenn mindestens eine hochwertige Fallserie ohne Kontrollen vorliegt (einschließlich einfacher Vorher / Nachher-Studien, in denen Patienten als eigene Kontrolle fungieren) oder wenn die Schlussfolgerung aus Expertenmeinungen auf der Grundlage klinischer Erfahrungen ohne Bezugnahme auf eines der vorstehenden abgeleitet wird (z. B. Argumente aus Physiologie, Laborforschung oder First Principles).
Zwei Autoren (YM und ZH) extrahieren Daten unabhängig voneinander mit einem selbst entwickelten Datenextraktionsformular. Meinungsverschiedenheiten werden in Diskussion und Absprache mit LiuJP gelöst.
DATENANALYSEN
Wir sollen Studien als Vergleiche von pflanzlichen Arzneimitteln im Vergleich anzeigen:
-
keine Intervention
-
Placebo
-
Glukokortikoide
-
Immunsuppressiva
-
Studien mit pflanzlichen Arzneimitteln plus Glukokortikoiden und /oder Immunsuppressiva im Vergleich Glukokortikoide und / oder Immunsuppressiva allein werden ebenfalls als Vergleich dargestellt.
Jede Art von pflanzlichen Arzneimitteln wird mit jeder Kontrolle verglichen. Die Metaanalyse wird im Rahmen von Vergleichen derselben Art von pflanzlichen Arzneimitteln durchgeführt gegen die ähnliche Kontrollintervention. Dichotome Daten werden als relatives Risiko (RR) und kontinuierliche Ergebnisse als gewichtete mittlere Differenz (WMD) dargestellt, beide mit 95% Konfidenzintervallen (CI).
Analysen werden nach dem Intention‐to‐Treat-Prinzip durchgeführt, sofern verfügbar. Wir werden die Daten anhand des zuletzt gemeldeten beobachteten Ansprechens analysieren einschließlich aller Patienten unabhängig von Compliance oder Follow‐up. Die Metaanalyse mit festen Effekten wird zur Kombination von Studiendaten verwendet, wenn die Studien als ausreichend ähnlich beurteilt werden. Die Heterogenität wird anhand des Z-Scores und des Chi-Quadrats getestet Statistik mit Signifikanz auf p <0.1. Wenn dies auf ein signifikantes statistisches Maß an Heterogenität zwischen den in eine Analyse einbezogenen Studien hinweist, wird eine randomisierte Metaanalyse für eine Gesamtübersicht bevorzugt. Mögliche Heterogenitätsquellen werden durch Subgruppen- und Sensitivitätsanalysen wie unten beschrieben bewertet.
SUBGRUPPENANALYSE
Wir werden eine Subgruppenanalyse durchführen, um Effektgrößenunterschiede wie folgt zu untersuchen:
1. Verschiedene Arten von pflanzlichen Arzneimitteln
2. Baseline-Schweregrad der Erkrankung (leicht, mittelschwer, schwer)
3. Rasse des Teilnehmers
SENSITIVITÄTSANALYSEN
Gegebenenfalls werden Sensitivitätsanalysen durchgeführt, um Randomisierung, Doppelblindheit und Intention‐to‐Treat auf Effektgröße zu untersuchen. Wir werden auch eine Analyse des Worst‐Case-Szenarios durchführen (Zählen von Patienten mit unvollständigen oder fehlenden Daten als Behandlungsfehler), um die möglichen Auswirkungen des Verlusts zu untersuchen Follow‐up auf die Ergebnisse.
KLINISCHE RELEVANZTABELLEN
Klinische Relevanztabellen werden unter zusätzlichen Tabellen zusammengestellt, um die Lesbarkeit des Reviews zu verbessern. Bei dichotomen Ergebnissen, wie Komplikationen, wird die zur Behandlung erforderliche Anzahl berechnet aus der Ereignisrate der Kontrollgruppe und dem relativen Risiko mit dem Visual Rx NNT-Rechner (Cates 2003). Kontinuierliche Ergebnistabellen werden ebenfalls unter zusätzliche Tabellen. Der absolute Nutzen wird berechnet als die Verbesserung in der Interventionsgruppe abzüglich der Verbesserung in der Kontrollgruppe in den ursprünglichen Einheiten.Der relative Unterschied in der Änderung gegenüber dem Ausgangswert wird als absoluter Nutzen dividiert durch den Ausgangswert berechnet Mittelwert der Kontrollgruppe (Tugwell 2004).