Methodische und statistische Themen in randomisierten kontrollierten klinischen Studien
Vortrag
Methodische und statistische Themen in randomisierten kontrollierten klinischen Studien
Claudia Caminha Escosteguy
Rio de Janeiro, RJ – Brasilien
Unter den Forschungsmethoden haben randomisierte kontrollierte klinische Studien einen der wichtigsten wissenschaftlichen Fortschritte im 20. Die randomisierte kontrollierte klinische Studie ist eine Art experimentelle Studie, die als Referenzstandard für Forschungsmethoden in der Epidemiologie verwendet wird und als beste Quelle für verfügbare wissenschaftliche Beweise und als beste Quelle für die Bestimmung der Wirksamkeit einer Intervention gilt. Die randomisierte kontrollierte klinische Studie ist eine prospektive Studie, die die Wirkung und den Wert einer Intervention (prophylaktisch oder therapeutisch) mit Kontrollen am Menschen vergleicht. Bei dieser Art von Studie verteilt der Ermittler zufällig den zu analysierenden Interventionsfaktor durch die Technik der Randomisierung; Daher werden die Experimental- und Kontrollgruppen durch einen Zufallsverteilungsprozess gebildet, um Interferenzen durch andere als die untersuchten Variablen zu reduzieren oder zu beseitigen. Die untersuchte Intervention kann Medikamente, Techniken oder Verfahren sein 1,2. Der Begriff „Wirksamkeit“ bezieht sich auf das Ergebnis einer Intervention unter idealen, kontrollierten Bedingungen, wie in der kontrollierten klinischen Studie. Der Begriff „Wirksamkeit“ bezieht sich auf das Ergebnis einer Intervention, die in einer durchschnittlichen klinischen Umgebung durchgeführt wird und die Unvollkommenheiten der Umsetzung einschließt, die die tägliche Welt charakterisieren2.
Nach Feinstein 3 wurde die Idee der Verteilung einer Behandlung durch Randomisierung 1923 von Fisher vorgeschlagen und auf die Agrarforschung angewendet. Im Jahr 1926 wurde diese Idee zum ersten Mal von Amberson und Mitarbeitern für klinische Studien verwendet, die den Wert einer Goldverbindung bei der Behandlung von Tuberkulose testeten. Dies war auch die erste verblindete Studie, über die berichtet wurde, was bedeutet, dass die Patienten nicht über die verabreichte Behandlung informiert wurden. Die Kontrollen erhielten eine Injektion von destilliertem Wasser; Der Begriff „Placebo“ wurde jedoch erstmals 1938 in der Studie von Diehl zum Influenzavirus-Impfstoff 3 verwendet. Allgemein kann der Begriff „klinische Studie“ auf jede Form von geplantem Experiment mit Patienten angewendet werden, um die für zukünftige Patienten mit einer bestimmten Erkrankung am besten geeignete Behandlung aufzuklären. Einige Autoren verwenden auch den Begriff „nicht kontrollierte klinische Studie“, um eine Studie zu beschreiben, in der alle Teilnehmer eine Intervention erhalten. In Wirklichkeit wäre dies nur eine deskriptive Studie über die Auswirkungen einer Intervention in einer Gruppe. Die Mehrheit der Autoren betrachtet diese Art von Studie nicht als klinische Studie und nennt sie ein nicht kontrolliertes Experiment. Die puristischeren Autoren behalten sich den Begriff „klinische Studie“ nur für die randomisierten kontrollierten Studien vor und akzeptieren seine Verwendung nicht für kontrollierte Studien, die nicht randomisiert sind 2.
Die klinischen Studien mit Arzneimitteln werden häufig in vier Hauptphasen des Experimentierens 1 eingeteilt:
Phase I Dies sind Studien zur klinischen Pharmakologie und Toxizität beim Menschen, die sich in erster Linie auf die Sicherheit und nicht auf die Wirksamkeit beziehen und normalerweise an gesunden Freiwilligen durchgeführt werden. Das Hauptziel besteht darin, eine akzeptable Dosis eines Arzneimittels zu bestimmen, die verabreicht werden kann, ohne schwere Nebenwirkungen zu verursachen. Diese Information wird häufig aus Experimenten mit fraktionierten Dosen erhalten, bei denen ein Freiwilliger nach einem vorgegebenen Zeitplan steigende Dosen des Arzneimittels erhält. Phase I umfasst auch Studien zum Arzneimittelstoffwechsel und zur Bioverfügbarkeit. Nach den Studien an gesunden Freiwilligen werden auch die ersten Studien mit Patienten Teil der Phase I sein. Typischerweise können Phase-I-Studien 20 bis 80 Personen und Patienten erfordern. Phase II – Dies sind erste Studien zur klinischen Untersuchung der Auswirkungen der Behandlung, die immer noch eine kleine Untersuchung der Arzneimittelwirksamkeit und -sicherheit mit sorgfältiger Überwachung jedes Patienten umfassen. Manchmal können Phase-II-Studien als ein Prozess von Arzneimitteln durchgeführt werden, der verwendet wird, um diejenigen mit einem wahren Wirkungspotential unter den mehreren inaktiven oder übermäßig toxischen zu unterscheiden, so dass die ausgewählten Arzneimittel in Phase III übergehen können. Selten erfordert Phase II mehr als 100-200 Patienten pro Medikament.
Phase III – Groß Angelegte Bewertung der Behandlung. Nachdem sich das Medikament als einigermaßen wirksam erwiesen hat, ist es notwendig, es in einer kontrollierten klinischen Studie, die eine ausreichend große Anzahl von Patienten umfasst, in großem Maßstab mit den Standardbehandlungen zu vergleichen, die für denselben medizinischen Zustand verfügbar sind. Für einige Autoren wäre der Begriff „klinische Studie“ ein Synonym für diese Phase-III-Studien, die die starrste Form der klinischen Untersuchung einer neuen Behandlung darstellen.
Phase IV – Überwachungsphase nach der Markteinführung. Nach der kommerziellen Zulassung eines Forschungsprogramms gibt es noch einige Fragen in Bezug auf die groß angelegte und langfristige Überwachung von Nebenwirkungen und zusätzliche Studien zur Morbidität und Mortalität. Manchmal wurde der Begriff „Phase-IV-Studie“ verwendet, um Übungen zur Förderung eines neuen Arzneimittels für die medizinische Öffentlichkeit zu beschreiben, die nicht mit der Forschung der klinischen Studie selbst zu verwechseln sind.
Man sollte sich daran erinnern, dass es vor den klinischen Studien ein ebenso wichtiges Programm der präklinischen Forschung geben sollte, einschließlich der Synthese neuer Medikamente und Studien an Tieren in Bezug auf Metabolismus, Wirksamkeit und darüber hinaus potenzielle Toxizität. In Wirklichkeit macht diese vorklinische Phase den größten Teil der geschätzten Kosten für die Arzneimittelforschung aus. Derzeit stehen die meisten klinischen Studien im Zusammenhang mit der Bewertung neuer Arzneimittel und werden hauptsächlich von der Pharmaindustrie finanziert. Es wird geschätzt, dass im Universum der neuen Medikamente, die in Laboratorien synthetisiert werden, nur eines von 10 000 die Phase der klinischen Studien erreicht und nur 20% davon schließlich vermarktet werden. Ein komplettes Forschungsprogramm im Zusammenhang mit einem Medikament dauert 7 bis 10 Jahre, von denen fast die Hälfte der Zeit in klinischen Studien mit Millionen von Dollar 1 verwendet wird, wobei die Rolle der pharmazeutischen Industrie hervorgehoben wird.
Randomisierte kontrollierte klinische Studien haben die folgenden Hauptmerkmale 1-5: a) Sie sind experimentelle Studien und beinhalten daher wichtige ethische Fragen; b) prospektive Architektur: Sie haben die Architektur einer Kohortenstudie, was bedeutet, dass sie prospektiv sind, mit der Besonderheit, dass der Prüfer eine Technik der zufälligen Zuordnung (Randomisierung) verwendet, um Gruppen mit ähnlichen Merkmalen zu bilden, so dass die Individuen einer Gruppe eine bestimmte Art von Behandlung erhalten, während die der anderen Gruppe als Kontrollen bleiben; c) Kontrolle: Es ist notwendig, die Erfahrung einer Gruppe von Patienten, die sich der neuen Behandlung unterziehen, mit einer Gruppe ähnlicher Patienten zu vergleichen, die die konventionelle Behandlung erhalten. Wenn es keine konventionelle Behandlung von echtem Wert gibt, kann es angebracht sein, eine Kontrollgruppe von nicht behandelten Patienten zu verwenden. Die am besten geeignete Technik zur Verteilung der Personen in Studien- und Kontrollgruppen ist die Randomisierung, die die zufällige Zuweisung ermöglicht; d) Randomisierung: ist ein Entscheidungsprozess, bei dem die Studien- und Kontrollgruppen zufällig zugewiesen werden können. Darüber hinaus verringert es die Möglichkeit von Verwechslungsverzerrungen. Die Schönheit der Randomisierung liegt in der Tatsache, dass sie die Verteilung bekannter und unbekannter Ergebnisdeterminanten auf ähnliche Weise zwischen Studien- und Kontrollgruppen ermöglicht, wenn die Stichprobengröße groß genug ist 6.
Es gibt mehrere Techniken der Randomisierung 1,2: einfache Randomisierung – es ist die am häufigsten verwendete Technik; Die Patienten werden direkt Studien- und Kontrollgruppen zugeordnet, ohne Zwischenstufen. Zum Beispiel durch Verwendung einer Tabelle zufällig ausgewählter Zahlen, wobei die ungeraden Zahlen der Behandlungsgruppe und die geraden der Kontrollgruppe zugewiesen werden; block-Randomisierung – Sie ist gekennzeichnet durch die Bildung von Blöcken gleicher Größe mit einer festen Anzahl von Individuen, in denen die betreffende Behandlung Block für Block verteilt wird, bis der Prozess der individuellen Zuordnung in der Forschung abgeschlossen ist. Es besteht der Vorteil, dass die Teilnehmerzahl in der Studien- und Kontrollgruppe gleich ist, auch wenn die Studie vor dem erwarteten Ende unterbrochen wird. Es ist auch nützlich in Studien mit einer reduzierten Anzahl von Patienten, da die einfache Randomisierung, die mit Hilfe einer Tabelle zufällig ausgewählter Zahlen durchgeführt wird, nur die Homogenität zwischen den Gruppen gewährleistet, wenn eine große Anzahl von Teilnehmern randomisiert werden soll; gepaarte Randomisierung – anfänglich werden Teilnehmerpaare gebildet und die zufällige Zuordnung wird innerhalb des Paares durchgeführt, so dass eine Person die Studienbehandlung und die andere die Kontrollbehandlung erhält; geschichtete Randomisierung anfänglich werden Schichten gebildet und die zufällige Zuordnung wird innerhalb jeder Schicht; randomisierung durch Minimierung – Zunächst wird die einfache Randomisierung verwendet, aber nach der Zuordnung einiger Personen werden die Merkmale der Gruppen analysiert und die Berechnung wird neu durchgeführt, wenn einige neue Teilnehmer rekrutiert werden. Diese neuen Teilnehmer werden einer der Gruppen zugeordnet, um die festgestellten Unterschiede zu verringern oder das bereits erreichte Gleichgewicht aufrechtzuerhalten. Es ist eine neue Technik und Computertechnologie ermöglicht es, mehrere Variablen gleichzeitig zu verfolgen, so dass ein Minimum an Unterschieden zwischen den Gruppen erhalten wird.
Zusätzlich zu den bereits beschriebenen Hauptmerkmalen sollten die folgenden methodischen Fragen bei der Durchführung einer randomisierten kontrollierten klinischen Studie berücksichtigt werden:
Stichprobengröße Die Studie sollte eine Anzahl von Patienten rekrutieren, die groß genug ist, um eine einigermaßen genaue Schätzung des Ansprechens auf jede Behandlung zu erhalten. Obwohl es praktische und ethische Überlegungen in Bezug auf die Stichprobengröße gibt, bezieht sich ein statistischer Standardansatz auf die Schätzungen der Aussagekraft der Studie. Es gibt fünf wichtige Fragen in Bezug auf die Stichprobengröße 1,2:1) was ist das Hauptziel der Studie? zum Beispiel, um zu überprüfen, ob Acetylsalicylsäure einen Wert bei der Prävention des Todes nach einem Infarkt hat, was sich von der Überprüfung unterscheidet, ob es einen Infarkt verhindert oder ob es Tod und erneuten Infarkt verhindert; 2) Was ist die Hauptergebnismessung? – zum Beispiel Tod aufgrund einer Ursache innerhalb des ersten Behandlungsmonats, der sich vom Tod aufgrund einer kardiovaskulären Ursache unterscheidet; 3) Wie werden die Daten analysiert, damit ein Unterschied in der Behandlung festgestellt werden kann? die einfachste Form ist der Vergleich von Prozentsätzen, z. B. der Prozentsatz der Todesfälle in der behandelten und der Placebogruppe; Ein Chi-Quadrat-Test wird verwendet und ein Signifikanzniveau von 5% wird als Beweis für einen Unterschied in der Behandlung akzeptiert; 4) Welche Art von Ergebnissen kann mit der Standardbehandlung erwartet werden? – zum Beispiel wird bei Patienten der Kontrollgruppe im ersten Behandlungsmonat eine Mortalität von 10% geschätzt; 5) Was ist der kleinste Unterschied in der Behandlung, der als wichtig erachtet wird, um erkannt zu werden, und mit welcher Genauigkeit? es ist wichtig zu betonen, dass moderate Reduktionen (z. B. 20-25%) des interessierenden Ereignisses die Randomisierung von Tausenden von Patienten erfordern können 7.
Um die Stichprobengröße zu berechnen, sollte man das Alpha-Signifikanzniveau berücksichtigen, das gewünscht wird, um einen Unterschied in der Behandlung und die Stärke der Studie zu erkennen, d. H. den Grad der Sicherheit, dass der Unterschied zwischen den Behandlungen erkannt wird, wenn es wirklich existiert. Ein Alpha-Fehler oder Typ-I-Fehler ist die Wahrscheinlichkeit, einen Unterschied zu erkennen, der in Wirklichkeit nicht existiert, d. H., die Wahrscheinlichkeit eines falsch positiven Ergebnisses; Alpha wird normalerweise als 0,05 festgelegt. Ein Beta-Fehler oder Typ-II-Fehler ist die Wahrscheinlichkeit, einen Unterschied nicht zu erkennen, wenn er wirklich existiert. Die Stärke der Studie ist 1-Beta und wird normalerweise mit 0,90 angegeben.
Wenn die erforderliche Stichprobengröße zu groß ist, kann die Studie in mehreren Zentren durchgeführt werden, was die multizentrische Studie darstellt, die offensichtlich besondere Organisations- und Überwachungsmaßnahmen erfordert.
Versuchsorganisation und planung – Es ist von grundlegender Bedeutung, die: 1) welche Patienten durch genau definierte Einschluss- und Ausschlusskriterien für die Studie in Frage kommen; 2) Welche Behandlung wird bewertet; 3) Welche Ergebnisse oder Endpunkte sind von Interesse zu analysieren; 4) wie das Ansprechen jedes Patienten überprüft wird. Überwachung des Studienprozesses – Es ist notwendig, die Einhaltung des Protokolls, Nebenwirkungen, Datenverarbeitung und die temporären Analysen des Vergleichs zwischen den Behandlungen zu überwachen. Die möglichen Protokollverstöße und -abweichungen sollten sorgfältig analysiert werden, z. B. Nichteinhaltung der Behandlung, Teilnehmerabbruch, unvollständige Beurteilung und Kreuzung zwischen Studien- und Kontrollgruppe nach Randomisierung. Diese letzte Abweichung trat beispielsweise im Nitrat-versus-Kontrollarm der Studie GISSI-3 auf, in der 57% der zur Kontrolle randomisierten Patienten Nitrat erhielten, wodurch die Leistung der Studie verringert wurde, um einen möglichen Unterschied zwischen den beiden Gruppen festzustellen 8.
Analysearten – Die Analyse kann mit zwei Hauptformaten durchgeführt werden 1,2: 1) zwischen denen, die die Behandlung in jeder Gruppe wirklich abgeschlossen haben; 2) entsprechend der Behandlungsabsicht, in die alle eingeschlossen sind, die randomisiert wurden, um Gruppen zu bilden, unabhängig davon, ob sie die Behandlung abgeschlossen oder nicht abgeschlossen haben. Letzteres wurde bevorzugt, da es die Aufrechterhaltung der Zufallsgruppen gewährleistet und die Behandlung in der realen Welt mit ihren Unvollkommenheiten bewertet. Es ist jedoch notwendig zu wissen, was mit denen passiert ist, die die Behandlung nicht abgeschlossen haben, und ob es eine Kreuzung zwischen den Gruppen gab. Die Dimension dieser Fakten sollte auch bekannt sein, denn wenn sie sehr groß ist, kann dies eine Verzerrung darstellen.
Subgruppenanalyse – Das grundlegende Ergebnis einer klinischen Studie ist die Beschreibung des Hauptergebnisses von Interesse in jeder der Hauptgruppen, die sich einer Behandlung unterziehen. Obwohl es verlockend erscheinen mag, die Ergebnisse in bestimmten Untergruppen von Patienten zu analysieren, sind mit dieser Analyse große Risiken verbunden. Die erste ist die unzureichende Anzahl von Patienten, wenn die überwiesene Analyse nicht Teil der Anfangsprobe war. Das zweite ist das Risiko einer Verzerrung, da die nach Merkmalen ausgewählten Untergruppen, die nach der Zuordnung zur Behandlung in Betracht gezogen wurden, möglicherweise nicht vergleichbar sind, obwohl sie aus den ursprünglich randomisierten Gruppen ausgewählt wurden. Drittens, wenn eine große Anzahl von Untergruppen untersucht wird, besteht eine erhöhte Wahrscheinlichkeit, dass einige von ihnen einen statistisch signifikanten Unterschied aufweisen. Ein klassisches Beispiel für diese Möglichkeit einer falschen Assoziation war die Analyse der Wirkung von Tierkreiszeichen in der ISIS-2-Studie, was darauf hindeutet, dass Acetylsalicylsäure für alle Zeichen außer Waage und Zwillinge von Vorteil war, bei denen ein offensichtlicher Schaden auftrat 9,10.
Potentielle Verzerrung Die möglichen Quellen der Verzerrung sind die folgenden: der Prozess der Auswahl der Gruppen, die Zuordnung zur Behandlung, das Erreichen der Intervention in der vorgeschlagenen Form und die Bewertung der Ergebnisse. Die Randomisierung steuert die ersten beiden Schritte.
Eine Störung im Follow-up und die Nichteinhaltung der Teilnehmer kann zu Verzerrungen führen, vor allem, wenn sie zwischen Studien- und Kontrollgruppe unterschiedlich verteilt sind, und sollte immer erwähnt werden.
Die Verzerrung der Bewertung (auch Information, Beobachtung oder Messung genannt) ergibt sich aus systematischen Unterschieden in der Art und Weise, wie Daten über das interessierende Ereignis von den verschiedenen untersuchten Gruppen erhalten werden. Sie werden minimiert, wenn die Doppelblind-Technik mit Placebos verwendet wird; es ist jedoch nicht immer möglich, selbst mit dieser Technik die Gruppen, zu denen diese gehören, vor Beobachtern und vor den Beobachteten zu verbergen.
Ein weiterer interessanter Bias bezieht sich auf die Veröffentlichung von Studien und nicht auf deren Entwicklung; Dies ist der Publishing Bias, dh die Tendenz, die Studien mit positiven Ergebnissen zu veröffentlichen.
Faktorielles Design – In diesem Design werden die Auswirkungen mehrerer Faktoren in einer einzigen Studie verifiziert. Zum Beispiel wird bei der Untersuchung der Arzneimittel A und B ein faktorielles Design vier Behandlungsgruppen bewerten: eine mit Droge A, eine andere mit Droge B, eine andere mit Drogen A und B und eine Kontrollgruppe mit keinem der Drogen. Ein Beispiel ist ISIS-2 9, wo die Wirkungen von Acetylsalicylsäure, Streptokinase und beiden und keiner von ihnen bei Patienten mit Verdacht auf akuten Myokardinfarkt (AMI) bewertet wurden.
Cross-Over-Typ-Studie – In der Regel werden in den Studien Vergleiche zwischen Patienten durchgeführt, und jeder Patient erhält nur eine Art von Behandlung. Manchmal kann es ratsam sein, sequentielle Vergleiche bei demselben Patienten durchzuführen, d. H. Jeder Patient der Studie erhält mehr als eine Behandlung. Ein großes Problem bei den herkömmlichen Parallelgruppen ist die Tatsache, dass die Patienten in Bezug auf ihr Anfangsstadium der Erkrankung und ihr Ansprechen auf die Behandlung sehr unterschiedlich sind. Eine große Anzahl von Patienten in jeder Gruppe ist oft notwendig, um das Ausmaß eines Effektunterschieds zuverlässig abzuschätzen 1,2.
Man sollte das Cross-Over-Design nicht mit den „Vorher-Nachher“ -Studien verwechseln, in denen alle Patienten die gleiche Behandlung erhalten und ihre Bedingungen vor Beginn der Behandlung und in vielen Stadien danach beurteilt werden und es sich in der Tat um nicht kontrollierte Studien handelt 1,2.
Ein Beispiel für die Cross-Over-Studie ist die Studie der GREAT Group zur Sicherheit und Wirksamkeit der domiziliären Thrombolyse 11:
Blind Assessment Auch Blending genannt: Die Rechtfertigung für diese Technik liegt in der möglichen Verzerrung, die auftritt, wenn alle an der Studie beteiligten Personen wissen, welche Behandlung der Patient erhält. In Bezug auf den blinden Zustand sind drei Teilnehmer zu berücksichtigen: der Patient, die Gruppe von Fachleuten, die die Behandlung anwenden, und der Bewerter 1. Der Weißdorn-Effekt bezieht sich auf die Tendenz von Individuen, ihr Verhalten zu ändern, weil sie Ziele von besonderem Interesse und Aufmerksamkeit sind, trotz der spezifischen Art der Intervention, die sie erhalten. Eine Möglichkeit, diesen Effekt zu kontrollieren, besteht in der Verblindung und der Verwendung von Placebo 4.
Das Wissen der Patienten über eine neue Behandlung kann einen positiven psychologischen Effekt auf sie haben, und im Gegensatz dazu kann sich ihr Wissen über eine konventionelle Behandlung oder gar keine Behandlung ungünstig auswirken. Es ist offensichtlich, dass die Auswirkungen von der Art der Erkrankung und der Art der Behandlung abhängen, aber diese Möglichkeit sollte auch bei nicht-psychiatrischen Störungen nicht unterschätzt werden. In Bezug auf die Gruppe der Personen, die die Behandlung anwenden, liegen Entscheidungen in Bezug auf Dosisänderungen, Besonderheiten der Untersuchung des Patienten, Fortsetzung der Versuchsbehandlung und Notwendigkeit zusätzlicher Behandlungen in der Regel in der Verantwortung des Assistenzarztes, der den Behandlungsverlauf auf verschiedene Weise beeinflussen kann. Diese Entscheidungen können abhängig von der Kenntnis, zu welcher Studiengruppe der Patient gehört, beeinflusst werden. Die Aufregung über eine neue Behandlung kann auch auf den Patienten übertragen werden und eine Änderung seiner Einstellung bewirken, wodurch beispielsweise die Einhaltung der Behandlung durch den Patienten erhöht wird.
In Bezug auf die Ermittler, die die Ergebnisse auswerten, wenn sie sich der Behandlung jedes Patienten bewusst sind, besteht beispielsweise ein potenzielles Risiko, günstigere Reaktionen auf die Behandlung zu registrieren, die sie für überlegen halten. Die Unkenntnis der Versuchsgruppen hilft, Verzerrungen zu vermeiden, die auch minimiert werden, wenn das endgültige interessierende Ereignis in der objektivstmöglichen Form definiert wird. Ein Messfehler kann auftreten, wenn die Beurteilung des Ansprechens auf die Behandlung eine klinische Beurteilung erfordert. Selbst bei scheinbar klar definierten Ereignissen wie AMI ist in Grenzfällen häufig eine klinische Beurteilung erforderlich. In solchen Fällen könnte, wenn der Behandlungszustand bekannt wäre, eine Tendenz des Bewerters bestehen, die endgültige Diagnose zugunsten von AMI oder dagegen zu stellen.
Der Begriff „doppelblind“ bezieht sich auf jene Studien, in denen weder die Patienten noch die für ihre Unterstützung und Bewertung verantwortlichen Personen die erhaltene Behandlung kennen. In Wirklichkeit sind in diesen Fällen die drei Arten von Teilnehmern in Bezug auf den Behandlungszustand blind; Da jedoch häufig dieselben Kliniker, die mit Therapeutika arbeiten, den Patienten bewerten, ist der Begriff „doppelblind“ ausreichend (es ist nicht üblich, eine Studie als dreifachblind zu bezeichnen; Normalerweise wird der Begriff Doppelblind verwendet).
Verwendung von Placebo Ein Placebo ist eine Substanz in Aussehen, Form und Verabreichung, die der der zu untersuchenden Behandlung ähnelt, jedoch ohne den Wirkstoff. Der Hauptgrund für die Einführung von Kontrollen mit Placebo besteht darin, die Einstellungen der Patienten in der Studien- und Kontrollgruppe der Studie zu vereinheitlichen. Der Placebo-Effekt ist eine Reaktion auf eine medizinische Intervention, die, obwohl sie ein definitives Ergebnis davon ist, keinen Bezug zum spezifischen Wirkmechanismus hat 4. Ein zu berücksichtigendes Grundprinzip ist, dass Patienten nicht ethisch zugeordnet werden können Placebo erhalten, wenn es eine alternative Standardbehandlung mit nachgewiesener Wirksamkeit gibt. Ethische Fragen – Vielleicht war die große Katastrophe der durch Thalidomid induzierten angeborenen Anomalien in den 60er Jahren ein Meilenstein für die Diskussion und Umsetzung medizinischer und öffentlicher Richtlinien, die die ethischen Aspekte im Zusammenhang mit der Einführung neuer Behandlungen berücksichtigen. Seit 1926 ist es in den USA gesetzlich vorgeschrieben, einen Wirksamkeitstest durchzuführen, bevor neue Medikamente für die Vermarktung zugelassen werden2. Das grundlegende internationale Dokument für die ethische Diskussion klinischer Studien ist die Helsinki-Erklärung von 1964, die 1975 in Tokio überarbeitet wurde2. Zu den national relevanten Dokumenten gehören der Medical Ethics Code 12 und die Forschungsregeln für Menschen vom National Board of Health 13. Auch wenn die Untersuchung durchaus gerechtfertigt ist, Einige Fragen verdienen Berücksichtigung: einer der Hauptpunkte ist der Entzug der Kontrollgruppe von einer neuen Behandlung, bei der es klare Beweise für eine Überlegenheit gegenüber der konventionellen Behandlung gibt. Die Nichtanwendung einer wirksamen Behandlung an Patienten ist nur ethisch akzeptabel, wenn Zweifel an der Wirksamkeit der Behandlung bestehen; Die kleine Stichprobengröße, die durch Berechnungen informiert ist und ausreicht, um die zu untersuchende Frage zu beantworten, sollte verwendet werden. Die Studie sollte sofort unterbrochen werden, wenn während ihrer Durchführung endgültige Hinweise auf einen Nutzen oder einen fehlenden Nutzen der betreffenden Behandlung vorliegen. Die Einverständniserklärung des Patienten sollte immer vorhanden sein.
Alle bisher diskutierten Fragen beziehen sich auf die interne Validität der Studie. Die Verbreitung der randomisierten Studien und ihre Verwendung als Standard zum Nachweis der therapeutischen Wirksamkeit von Arzneimitteln haben dazu geführt, dass vor der Einführung neuer Therapeutika in die klinische Praxis qualitativ hochwertige wissenschaftliche Beweise vorliegen. Ein weiterer grundlegender Aspekt, der jedoch diskutiert werden muss, ist die Möglichkeit der Verallgemeinerung der Studienergebnisse. Die externe Validität einer Studie impliziert die Möglichkeit, die Ergebnisse der untersuchten Stichprobe über die untersuchte Zielpopulation hinaus auf andere Stichproben zu verallgemeinern. Es beinhaltet auch Patienten- und ethnokulturelle Variationen, Schweregradfaktoren sowie Überlegungen zum Kosten-Nutzen-Verhältnis, Risiko, Infrastruktur usw. Diese Überlegungen sind erst nach Feststellung der internen Validität der Studie gerechtfertigt.
1. Pocock SJ. Klinische Studien. Ein praktischer Ansatz. Brisbane: John Wiley & Söhne, 1989.
2. In: Pereira MG. Epidemiologia, Teoria e Prática. Rio de Janeiro: Guanabara Koogan, 1995.
3. Feinstein AR. Klinische Epidemiologie. Die Architektur der klinischen Forschung. Philadelphia: WB Saunders, 1985.
4. Fletcher RH, Fletcher SW, Wagner EH. Epidemiologia Clínica: Bases Científicas da Conduta Médica. Porto Alegre: Artes Médicas, 1989.
5. Sackett DL, Haynes RB, Guyatt GH, Tugwell. Klinische Epidemiologie: Eine Grundlagenwissenschaft für die klinische Medizin. 2. Aufl. Boston: Little Brown, 1991.
6. Arbeitsgruppe evidenzbasierte Medizin. Verwendung eines Artikels über Therapie oder Prävention, 1998.
7. Yusuf S, Wittes J, Friedman L. Überblick über die Ergebnisse randomisierter klinischer Studien bei Herzerkrankungen. JAMA 1988; 260: 2088-93.
8. GISSI-3 – Wirkungen von Lisinopril und transdermalem Glyceril-Trinitrat einzeln und zusammen auf die 6-wöchige Mortalität und ventrikuläre Funktion nach akutem Myokardinfarkt. Lanzette 1994; 343: 1115-221.
9. ISIS-2 Collaborative Group – Randomisierte Studie mit intravenöser Streptokinase, oralem Aspirin, beides oder keines von 17187 Fällen mit Verdacht auf akuten Myokardinfarkt. Lanzette 1988; Ich: 349-60.
10. Yusuf S, Wittes J, Probstfield J, Tyroler H. Analyse und Interpretation von Behandlungseffekten in Untergruppen von Patienten in randomisierten klinischen Studien. JAMA 1991; 266: 93-8.
11. GROßE Gruppe – Machbarkeit, Sicherheit und Wirksamkeit der domiziliären Thrombolyse durch Allgemeinmediziner: die Grampian Region Frühe Anistreplase-Studie. Br Med J 1992; 305: 548-53.
12. Conselho Regional de Medicina do Estado do Rio de Janeiro – Código de Ética Médica. Legislação dos Conselhos de Medicina, 1988.
13. Conselho Nacional de Saúde-Normas de Pesquisa envolvendo Seres Humanos. Rindfleisch. CNS 196/96. Brasília: Ministério da Saúde, 1996.