Methodological and statistical topics in randomized controlled clinical Trials
lezing
Methodological and Statistical Topics in Randomized Controlled Clinical Trials
Claudia Caminha Escosteguy
Rio de Janeiro, RJ – Brazil
onder onderzoeksmethoden hebben gerandomiseerde gecontroleerde klinische trials een van de belangrijkste wetenschappelijke ontwikkelingen gedurende de 20e eeuw gevormd. De gerandomiseerde gecontroleerde klinische proef is een type experimentele studie die wordt gebruikt als referentiestandaard voor onderzoeksmethoden in de epidemiologie en wordt beschouwd als de beste bron van beschikbaar wetenschappelijk bewijs en de beste bron voor het bepalen van de werkzaamheid van een interventie.
de gerandomiseerde gecontroleerde klinische studie is een prospectieve studie die het effect en de waarde van een interventie (profylactisch of therapeutisch) vergelijkt met controles bij mensen. In dit type studie, verdeelt de onderzoeker, door toeval, de factor van interventie die door de techniek van randomisatie moet worden geanalyseerd; daarom, worden de experimentele en controlegroepen gevormd door een kansverdelingsproces om interferentie door andere variabelen dan die te verminderen of te elimineren die worden bestudeerd. De interventie die wordt bestudeerd kan drugs, technieken of procedures 1,2 zijn. De term “werkzaamheid” verwijst naar het resultaat van een interventie onder ideale, gecontroleerde omstandigheden, zoals in de gecontroleerde klinische proef. De term “effectiviteit” verwijst naar het resultaat van een interventie uitgevoerd in een gemiddelde klinische omgeving, die de onvolkomenheden van de implementatie die kenmerkend zijn voor de dagelijkse wereld omvat 2. volgens Feinstein 3 werd het idee van de verdeling van een behandeling door middel van randomisatie door Fisher in 1923 voorgesteld en toegepast op landbouwkundig onderzoek. In 1926 werd dit idee voor het eerst gebruikt voor klinische studies door Amberson en collega ‘ s, die de waarde van een goudverbinding testten bij de behandeling van tuberculose. Dit was ook het eerste geblindeerde onderzoek dat werd gemeld, wat betekent dat de patiënten niet werden geïnformeerd over de toegediende behandeling. De controles kregen een injectie met gedestilleerd water; de term “placebo” werd echter voor het eerst gebruikt in 1938 in de studie van Diehl met influenzavirusvaccin 3.
op generische wijze kan de term “klinische studie” worden toegepast op elke vorm van gepland experiment waarbij patiënten betrokken zijn en ontworpen om de behandeling te verduidelijken die het meest geschikt is voor toekomstige patiënten met een bepaalde medische aandoening. Sommige auteurs gebruiken ook de term “niet-gecontroleerde klinische proef” om een studie te beschrijven waarin alle deelnemers interventie ontvangen. In werkelijkheid zou dit slechts een beschrijvende studie zijn van de effecten van een interventie in een groep. De meerderheid van de auteurs beschouwen dit type studie niet als een klinische proef, ze noemen het een niet-gecontroleerd experiment. De meer puristische auteurs reserveren de term “klinische proef” alleen voor de gerandomiseerde gecontroleerde proeven en accepteren het gebruik ervan niet voor gecontroleerde proeven die niet gerandomiseerd zijn 2.
de klinische proeven met geneesmiddelen worden vaak ingedeeld in vier hoofdfasen van de proef 1:
Fase I Dit zijn proeven op het gebied van klinische farmacologie en toxiciteit bij de mens, voornamelijk gerelateerd aan de veiligheid en niet aan de werkzaamheid, en worden meestal uitgevoerd bij gezonde vrijwilligers. Het belangrijkste doel is om een aanvaardbare dosis van een medicijn te bepalen, degene die kan worden toegediend zonder ernstige bijwerkingen te veroorzaken. Deze informatie wordt vaak verkregen uit experimenten met fractionele doses, waarbij een vrijwilliger toenemende doses van het medicijn ontvangt, volgens een vooraf bepaald schema. Fase I omvat ook studies over geneesmiddelmetabolisme en biologische beschikbaarheid. Na de studies op gezonde vrijwilligers, zullen de eerste studies met patiënten ook een deel van Fase I vormen. typisch, Fase I studies kunnen 20 tot 80 individuen en patiënten vereisen.
Fase II-Dit zijn eerste klinische onderzoeken naar de effecten van de behandeling, die nog steeds bestaan uit een klein onderzoek naar de werkzaamheid en veiligheid van het geneesmiddel, met zorgvuldige controle van elke patiënt. Soms, fase II proeven kunnen worden uitgevoerd als een proces van geneesmiddelen, gebruikt om die met een echt potentieel van effect onder de verschillende inactieve of overdreven toxische te onderscheiden, zodat de geselecteerde geneesmiddelen kunnen overgaan tot fase III. zelden, fase II vereist meer dan 100-200 patiënten per geneesmiddel.
Fase III-grootschalige beoordeling van de behandeling. Nadat het medicijn redelijk effectief blijkt te zijn, is het noodzakelijk om het op grote schaal te vergelijken met de standaardbehandeling(s) die beschikbaar is voor dezelfde medische aandoening, in een gecontroleerde klinische proef met een voldoende groot aantal patiënten. Voor sommige auteurs zou de term “klinische proef” een synoniem zijn voor deze fase III-proeven, die de meest rigide vorm van klinisch onderzoek van een nieuwe behandeling vormen.
Fase IV postmarketing surveillance fase. Na de commerciële goedkeuring van een onderzoeksprogramma, zijn er nog enkele vragen te overwegen met betrekking tot grootschalige en langdurige monitoring van bijwerkingen en aanvullende studies naar morbiditeit en mortaliteit. Soms is de term “fase IV trial” gebruikt om oefeningen van promotie van een nieuw geneesmiddel gericht op het medische publiek te beschrijven, die niet moet worden verward met het onderzoek van de klinische proef zelf.
men dient in gedachten te houden dat er voorafgaand aan de klinische proeven een even belangrijk programma van preklinisch onderzoek moet zijn, met inbegrip van de synthese van nieuwe geneesmiddelen en dierstudies met betrekking tot metabolisme, werkzaamheid en bovendien potentiële toxiciteit. In werkelijkheid is deze pre-klinische fase goed voor het grootste deel van de geschatte kosten van het onderzoek naar geneesmiddelen. Momenteel heeft het merendeel van de klinische proeven betrekking op de beoordeling van nieuwe geneesmiddelen en wordt het voornamelijk gefinancierd door de farmaceutische industrie. Men schat dat in het universum van nieuwe geneesmiddelen die in laboratoria worden gesynthetiseerd, slechts één op de 10.000 de fase van klinische proeven bereikt en slechts 20% daarvan uiteindelijk op de markt wordt gebracht. Een compleet onderzoeksprogramma met betrekking tot een geneesmiddel duurt 7 tot 10 jaar, waarvan bijna de helft van de tijd wordt gebruikt in klinische proeven, waarbij miljoenen dollars 1, met nadruk op de rol die wordt gespeeld door de farmaceutische industrie.
gerandomiseerde gecontroleerde klinische proeven hebben de volgende hoofdkenmerken 1-5: A) het zijn experimentele studies en houden daarom belangrijke ethische vragen in; b) prospectieve architectuur: ze hebben de architectuur van een cohortstudie, wat betekent dat ze prospectief zijn, met de bijzonderheid dat de onderzoeker een techniek van willekeurige allocatie (randomisatie) gebruikt om groepen met vergelijkbare kenmerken te vormen, zodat de individuen van een groep een bepaald type behandeling krijgen terwijl die van de andere groep als controlegroep blijven; C) Controle: Het is noodzakelijk om de ervaring van een groep patiënten die de nieuwe behandeling ondergaan te vergelijken met een groep vergelijkbare patiënten die de conventionele behandeling krijgen. Als er geen conventionele behandeling van echte waarde is, kan het worden toegeëigend om een controlegroep van niet-behandelde patiënten te gebruiken. De meest adequate techniek voor het verdelen van de individuen in behandelde en controlegroepen is randomisatie, die de toewijzing door toeval toelaat; d) randomisatie: is een besluitvormingsproces dat de studie en controlegroepen toestaat om door toeval worden toegewezen, zijnde de beste techniek om selectievooroordeel te vermijden. Bovendien vermindert het de mogelijkheid van verwarring vooringenomenheid. De schoonheid van randomisatie ligt in het feit dat het de verdeling van bekende en onbekende uitkomstdeterminanten op een vergelijkbare manier tussen de studie-en controlegroepen mogelijk maakt, als de steekproefgrootte groot genoeg is 6.
er zijn verschillende technieken van randomisatie 1,2: eenvoudige randomisatie-het is de meest gebruikte techniek; de patiënten worden direct ingedeeld in studie-en controlegroepen, zonder tussenstadia. Bijvoorbeeld door een tabel met willekeurig geselecteerde getallen te gebruiken, waarbij de oneven getallen aan de behandelingsgroep worden toegewezen en de even aan de controlegroep; Block randomization-het wordt gekenmerkt door de vorming van gelijke grootte blokken met een vast aantal individuen, waarbinnen de behandeling in kwestie wordt verdeeld, blok voor blok, totdat het proces van individuele toewijzing in het onderzoek is voltooid. Het voordeel is dat er een gelijk aantal deelnemers in de studie-en controlegroepen is, zelfs als de proef wordt onderbroken voor het verwachte einde. Het is ook nuttig in studies met een verminderd aantal patiënten omdat de eenvoudige randomisatie uitgevoerd met behulp van een tabel van willekeurig geselecteerde getallen alleen homogeniteit tussen de groepen verzekert wanneer er een groot aantal deelnemers te randomiseren; gepaarde randomisatie-in eerste instantie worden paren van deelnemers gevormd en toewijzing door toeval wordt uitgevoerd binnen het paar, zodat één individu de studiebehandeling ontvangt en de andere de controlebehandeling; gestratificeerde randomisatie-in eerste instantie worden strata gevormd en de willekeurige toewijzing wordt uitgevoerd binnen elk stratum; randomisatie door minimalisatie-in eerste instantie wordt de eenvoudige randomisatie gebruikt, maar na de toewijzing van sommige individuen worden de kenmerken van de groepen geanalyseerd en wordt de berekening gereperformeerd als sommige nieuwe deelnemers worden gerekruteerd. Deze nieuwe deelnemers zullen worden toegewezen aan een van de groepen om de geconstateerde verschillen te verminderen of om het reeds bereikte evenwicht te behouden. Het is een nieuwe techniek en computertechnologie maakt het mogelijk meerdere variabelen tegelijkertijd te volgen, zodat een minimum aan verschillen tussen de groepen wordt verkregen.
naast de reeds beschreven hoofdkenmerken moeten de volgende methodologische vragen in overweging worden genomen wanneer een gerandomiseerd gecontroleerd klinisch onderzoek wordt uitgevoerd:
steekproefgrootte het onderzoek moet een aantal patiënten rekruteren die groot genoeg zijn om een redelijk nauwkeurige schatting van de respons op elke betrokken behandeling te verkrijgen. Hoewel er praktische en ethische overwegingen zijn met betrekking tot de steekproefgrootte, heeft een standaard statistische benadering betrekking op de schattingen van het vermogen van het onderzoek. Er zijn vijf belangrijke vragen met betrekking tot steekproefgrootte 1,2:1) Wat is het hoofddoel van het proces? bijvoorbeeld om te controleren of acetylsalicylzuur enige waarde heeft in de preventie van overlijden na een infarct, wat anders is dan te controleren of het een infarct voorkomt of dat het dood en opnieuw een infarct voorkomt; 2) Wat is de belangrijkste uitkomstmeting? – bijvoorbeeld overlijden als gevolg van een oorzaak binnen de eerste maand van de behandeling, die verschilt van overlijden als gevolg van een cardiovasculaire oorzaak; 3) Hoe de gegevens worden geanalyseerd, zodat een verschil in behandeling kan worden gedetecteerd? de meest eenvoudige vorm is de vergelijking van percentages, bijvoorbeeld het percentage sterfgevallen in de behandelde en placebo-groepen; een chi-kwadraat test zal worden gebruikt en een significantieniveau van 5% zal worden aanvaard als bewijs van een verschil in behandeling; 4) wat voor resultaten kunnen worden verwacht met de standaardbehandeling? bijvoorbeeld, een 10% mortaliteit wordt geschat bij patiënten van de controlegroep in de eerste maand van de behandeling; 5) Wat is het kleinste verschil in behandeling belangrijk geacht te worden gedetecteerd en met welke mate van precisie? – het is belangrijk te benadrukken dat matige verminderingen (bijvoorbeeld 20-25%) van de gebeurtenis van belang de randomisatie van duizenden patiënten kan vereisen 7.
om de steekproefgrootte te berekenen, dient men rekening te houden met het Alfa-significantieniveau dat gewenst is om een verschil in de behandeling op te sporen en de kracht van het onderzoek, dat wil zeggen de mate van zekerheid dat het verschil tussen de behandelingen zal worden gedetecteerd, als het werkelijk bestaat. Een alfa-fout of type I-fout is de kans op het detecteren van een verschil dat in werkelijkheid niet bestaat, dat wil zeggen. , de kans op een fout-positieve uitkomst; alfa wordt meestal aangeduid als 0,05. Een beta-fout of type II-fout is de kans dat een verschil niet wordt gedetecteerd wanneer het echt bestaat. De kracht van de studie is 1-beta, en het wordt meestal bepaald als 0.90.
wanneer de vereiste omvang van de steekproef te groot is, kan de studie worden uitgevoerd in verschillende centra, die de multicenter studie vormen, die duidelijk speciale maatregelen van organisatie en monitoring vereist.
Trial organisatie en planning-het is van fundamenteel belang om nauwkeurig te definiëren: 1) welke patiënten in aanmerking komen voor de studie, door middel van goed gedefinieerde inclusie-en uitsluitingscriteria; 2) Welke behandeling wordt beoordeeld; 3) welke resultaten of eindpunten van belang zijn om te worden geanalyseerd; 4) Hoe de respons van elke patiënt zal worden geverifieerd.
Monitoring van het proefproces-het is noodzakelijk om de naleving van het protocol, de bijwerkingen, de gegevensverwerking en de tijdelijke analyses van de vergelijking tussen behandelingen te monitoren. De mogelijke protocolschendingen en afwijkingen moeten zorgvuldig worden geanalyseerd, zoals niet-naleving van de behandeling, deelnemer uitval, onvolledige beoordeling en kruising tussen de studie-en controlegroepen na randomisatie. Deze laatste afwijking trad bijvoorbeeld op in de nitraat-versus-controle-arm van de studie GISSI-3, waarin 57% van de voor controle gerandomiseerde patiënten nitraat kregen, waardoor het vermogen van de studie om een mogelijk verschil tussen de twee groepen op te sporen 8 werd verminderd.
soorten analyse-analyse kan worden uitgevoerd met behulp van twee hoofdformaten 1,2: 1) tussen degenen die werkelijk de behandeling in elke groep hebben voltooid; 2) volgens de intentie om te behandelen, waarin allen die werden gerandomiseerd om groepen te vormen worden opgenomen, onafhankelijk van het hebben voltooid of niet voltooid van de behandeling. Dit laatste heeft de voorkeur, omdat het zorgt voor het behoud van de willekeurige groepen en beoordeelt de behandeling in de echte wereld, met zijn onvolkomenheden. Het is echter noodzakelijk om te weten wat er is gebeurd met degenen die de behandeling niet hebben voltooid, evenals of er sprake was van kruising tussen de groepen. De omvang van deze feiten moet ook bekend zijn, want als het zeer groot is, kan dit vooringenomenheid vertegenwoordigen.
subgroepanalyse-het fundamentele resultaat van een klinische studie is de beschrijving van de belangrijkste relevante uitkomst in elk van de hoofdgroepen die een behandeling ondergaan. Hoewel het verleidelijk lijkt om de resultaten in specifieke subgroepen van patiënten te analyseren, zijn er grote risico ‘ s inherent aan deze analyse. De eerste is het onvoldoende aantal patiënten, als de verwezen analyse geen deel uitmaakte van het eerste monster. De tweede is het risico op bias, omdat de subgroepen die zijn geselecteerd op basis van kenmerken die na toewijzing aan de behandeling worden overwogen, mogelijk niet vergelijkbaar zijn, ook al werden ze geselecteerd uit de aanvankelijk gerandomiseerde groepen. Ten derde, wanneer een groot aantal subgroepen wordt onderzocht, is er een verhoogde kans dat sommige van hen een vals statistisch significant verschil zullen vertonen. Een klassiek voorbeeld van deze mogelijkheid van valse associatie was de analyse van het effect van dierenriemtekens in de ISIS-2-studie, die suggereert dat acetylsalicylzuur gunstig was voor alle tekens behalve weegschaal en Tweelingen waaraan een schijnbare schade was 9,10.
potentiële bias-de Potentiële Bronnen van bias zijn de volgende: het proces van selectie van de groepen, de toewijzing aan de behandeling, het bereiken van de interventie in de voorgestelde vorm en de beoordeling van de resultaten. Randomisatie regelt de eerste twee stappen.
een verstoring in de follow-up en niet-naleving van de deelnemers kan vooringenomenheid veroorzaken, voornamelijk als deze verschillend zijn verdeeld over de studie-en controlegroepen, en moet altijd worden vermeld.
Bias of assessment (ook wel informatie, observatie of meting genoemd) is het resultaat van systematische verschillen in de manier waarop gegevens over het geval van belang worden verkregen uit de verschillende groepen die worden bestudeerd. Ze worden geminimaliseerd wanneer de dubbelblinde techniek wordt gebruikt met placebo ‘ s; het is echter niet altijd mogelijk, zelfs niet met behulp van deze techniek, om zich te verbergen voor waarnemers en voor degenen die geobserveerd worden, de groepen waartoe deze laatste behoren.
een andere interessante vooringenomenheid houdt verband met het publiceren van proeven en niet met de ontwikkeling ervan; Dit is de vooringenomenheid van het publiceren, die de tendens is om de studies met positieve resultaten te publiceren.
Factorieel ontwerp – in dit ontwerp worden de effecten van verschillende factoren in één enkele proef geverifieerd. Bijvoorbeeld, in de studie van geneesmiddelen A en B, zal een factorieel ontwerp vier groepen van behandeling evalueren: een gebruikte drug A, een andere gebruikte drug B, een andere gebruikte drugs A en B, en een controlegroep zonder drugs. Een voorbeeld is ISIS-2 9, waar de effecten van acetylsalicylzuur, streptokinase, beide, en geen van hen bij patiënten verdacht van acuut myocardinfarct (AMI) werden beoordeeld.
Cross over type trial-gewoonlijk maken de trials vergelijkingen tussen patiënten, en elke patiënt krijgt slechts één type behandeling. Soms kan het raadzaam zijn om sequentiële vergelijkingen te maken bij dezelfde patiënt, dat wil zeggen dat elke patiënt van het onderzoek meer dan één behandeling zal krijgen. Een groot probleem met de conventionele parallelle groepen is het feit dat patiënten sterk variëren met betrekking tot hun beginstadium van de ziekte en hun reactie op de behandeling. Een groot aantal patiënten in elke groep is vaak nodig om op een betrouwbare manier de omvang van een verschil in effect 1,2 te schatten.
men mag de cross-over opzet niet verwarren met de “before and after” studies, waarin alle patiënten dezelfde behandeling krijgen en hun aandoeningen worden beoordeeld vóór aanvang van de behandeling en in vele stadia daarna, en in feite niet-gecontroleerde studies 1,2 zijn.
een voorbeeld van de cross-over type trial is de studie van de grote groep over veiligheid en werkzaamheid van de domiciliaire trombolyse 11:
Blind assessment ook wel blinding genoemd: de rechtvaardiging voor deze techniek ligt in de mogelijkheid van bias die optreedt wanneer alle bij het onderzoek betrokken personen weten welke behandeling de patiënt krijgt. Met betrekking tot de blinde aandoening, zijn er drie deelnemers te overwegen: de patiënt, de groep van professionals die de behandeling toe te passen, en de evaluator 1.
Het Meidoorneffect verwijst naar de neiging van individuen om hun gedrag te veranderen omdat ze doelwit zijn van speciale interesse en aandacht, ondanks de specifieke aard van de interventie die ze ontvangen. Een manier om dit effect te beheersen is door verblinden en placebo gebruik 4.
de kennis van de patiënten over het ontvangen van een nieuwe behandeling kan een gunstig psychologisch effect op hen hebben en, in tegenstelling, hun kennis van het ontvangen van een conventionele behandeling of helemaal geen behandeling kan een ongunstig effect hebben. Het is duidelijk dat de impact afhankelijk is van het type ziekte en de aard van de behandeling, maar deze mogelijkheid mag niet worden onderschat, zelfs niet bij niet-psychiatrische stoornissen.
met betrekking tot de groep personen die de behandeling toepassen, zijn beslissingen in verband met veranderingen in doses, bijzonderheden van het onderzoek van de patiënt, voortzetting van de proefbehandeling en de noodzaak van aanvullende behandelingen meestal de verantwoordelijkheid van de assistent-arts, die het verloop van de behandeling op verschillende manieren kan beïnvloeden. Deze beslissingen kunnen worden beïnvloed afhankelijk van de kennis van welke studiegroep de patiënt behoort. De opwinding over een nieuwe behandeling kan ook worden overgedragen aan de patiënt en een verandering in zijn of haar houding veroorzaken, waardoor de therapietrouw van de patiënt bijvoorbeeld toeneemt.
met betrekking tot de onderzoekers die de resultaten evalueren bestaat, indien zij op de hoogte zijn van de behandeling van elke patiënt, een mogelijk risico om bijvoorbeeld gunstiger reacties te registreren voor de behandeling die zij als superieur beschouwen. Het niet kennen van de proefgroepen helpt om te voorkomen dat het meten van bias, die ook wordt geminimaliseerd wanneer de uiteindelijke gebeurtenis van belang wordt gedefinieerd in de meest objectieve vorm mogelijk. Een meetbias kan optreden wanneer de evaluatie van de respons op de behandeling een klinisch oordeel vereist. Zelfs bij schijnbaar welomschreven gebeurtenissen, zoals AMI, is klinisch oordeel vaak nodig in borderline gevallen. In dergelijke gevallen, als de behandelingstoestand bekend was, zou er een tendens van de beoordelaar kunnen zijn om de definitieve diagnose in het voordeel van AMI of tegen te richten.
De term “dubbelblind” verwijst naar die onderzoeken waarbij noch de patiënten, noch de personen die verantwoordelijk zijn voor hun hulp en evaluatie de behandeling kennen die wordt ontvangen. In werkelijkheid zijn in deze gevallen de drie soorten deelnemers blind met betrekking tot de behandelingsvoorwaarde; echter, aangezien dezelfde artsen die met therapeuten werken vaak degenen zijn die de patiënt evalueren, is de term “dubbelblind” voldoende (het is niet gebruikelijk om naar een proef te verwijzen als triple-blind; meestal wordt de term dubbelblind gebruikt).
Placebo – een placebo is een stof qua uiterlijk, vorm en toediening die vergelijkbaar is met die van de onderzochte behandeling, maar zonder de werkzame stof. De belangrijkste reden voor de invoering van de controlegroepen met placebo is om de attitudes van de patiënten in de studie-en controlegroepen van de studie uniform te maken. Het placebo-effect is een reactie op een medische ingreep die, ondanks het feit dat het een definitief resultaat is, geen relatie heeft met het specifieke werkingsmechanisme 4. Een basisprincipe dat moet worden overwogen is dat patiënten niet ethisch kunnen worden toegewezen aan placebo als er een alternatieve standaardbehandeling van vastgestelde werkzaamheid. ethische vragen-misschien is de grote catastrofe van aangeboren afwijkingen veroorzaakt door thalidomide in de jaren `60 een mijlpaal geweest voor discussie en implementatie van medische en openbare beleidsmaatregelen die rekening houden met de ethische aspecten in verband met de introductie van nieuwe behandelingen. Sinds 1926 is in de VS wettelijk vereist dat een werkzaamheidstest wordt uitgevoerd voordat nieuwe geneesmiddelen worden goedgekeurd voor het op de markt brengen 2. het internationale basisdocument voor ethische discussie over klinische proeven is de Verklaring van Helsinki uit 1964, herzien in Tokio in 1975 2. Tot de nationale relevante documenten behoren de medische Ethische Code 12 en de Onderzoeksregels met betrekking tot mensen van de National Board of Health 13. Zelfs wanneer het onderzoek grondig gerechtvaardigd is, verdienen sommige vragen aandacht: een van de belangrijkste punten is het feit dat de controlegroep geen nieuwe behandeling meer krijgt waarvoor duidelijk bewijs bestaat van superioriteit ten opzichte van de conventionele behandeling. Het niet toedienen van een effectieve behandeling aan patiënten is alleen ethisch aanvaardbaar als er twijfels zijn over de doeltreffendheid van de behandeling; de kleine steekproefgrootte, die op basis van berekeningen voldoende is om de onderzochte vraag te beantwoorden, moet worden gebruikt. De studie dient onmiddellijk te worden onderbroken als er tijdens de uitvoering ervan definitief bewijs is dat de behandeling in kwestie al dan niet voordelen oplevert. De geïnformeerde toestemming van de patiënt moet altijd aanwezig zijn.
alle vragen die tot nu toe zijn besproken, houden verband met de interne validiteit van het onderzoek. De verspreiding van de gerandomiseerde proeven en hun gebruik als standaard om therapeutische doeltreffendheid van drugs aan te tonen hebben ervoor gezorgd dat wetenschappelijk bewijsmateriaal van goede kwaliteit beschikbaar is vóór de introductie van nieuwe therapeutische agenten in de klinische praktijk. Een ander fundamenteel aspect dat moet worden besproken, is echter de mogelijkheid van veralgemening van de onderzoeksresultaten. De externe geldigheid van een studie impliceert de mogelijkheid om de resultaten van de bestudeerde steekproef aan andere steekproeven, voorbij de bestudeerde doelpopulatie te veralgemenen. Het gaat ook om patiënt-en etnoculturele variaties, ernstfactoren, naast overwegingen over de kosten: batenverhouding, risico ‘ s, Infrastructuur, enzovoort. Deze overwegingen zijn pas te rechtvaardigen nadat de interne geldigheid van de studie is vastgesteld.
1. Pocock SJ. Klinische Proeven. Een Praktische Aanpak. Brisbane: John Wiley & Sons, 1989.
2. Pereira MG. Epidemiologia, Teoria e Prática. Rio de Janeiro: Guanabara Koogan, 1995.
3. Feinstein AR. Klinische Epidemiologie. De architectuur van klinisch onderzoek. Philadelphia: WB Saunders,1985.
4. Fletcher RH, Fletcher SW, Wagner EH. Epidemiologia Clínica: Bases Científicas da Conduta Médica. Porto Alegre: Artes Médicas, 1989.
5. Sackett DL, Haynes RB, Guyatt GH, Tugwell. Klinische epidemiologie: een basiswetenschap voor Klinische Geneeskunde. 2nd ed. Boston: Little Brown, 1991.
6. De Evidence Based Medicine Working Group. Hoe gebruik je een artikel over therapie of preventie, 1998.
7. Yusuf S, Wittes J, Friedman L. Overview of results of randomized clinical trials in heart disease. JAMA 1988; 260: 2088-93.
8. GISSI-3 – effecten van lisinopril en transdermaal glyceriltrinitraat afzonderlijk en samen op 6 weken mortaliteit en ventriculaire functie na acuut myocardinfarct. Lancet 1994; 343: 1115-221.
9. Isis-2 collaboratieve Groep-gerandomiseerde studie van intraveneuze streptokinase, orale aspirine, beide of geen van beide onder 17187 gevallen van verdacht acuut myocardinfarct. Lancet 1988; I: 349-60.
10. Yusuf S, Wittes J, Probstfield J, Tyroler H. analyse en interpretatie van de effecten van de behandeling in subgroepen van patiënten in gerandomiseerde klinische studies. JAMA 1991; 266: 93-8.
11. Grote groep-haalbaarheid, veiligheid en werkzaamheid van domiciliaire trombolyse door huisartsen: de Grampian Regio Early Anistreplase Trial. Br Med J 1992; 305: 548-53.
12. Conselho Regional de Medicina do Estado do Rio de Janeiro Código de Ética Médica. Legislação dos Conselhos de Medicina, 1988.
13. Conselho Nacional de Saúde-Normas de Pesquisa envolvendo Seres Humanos. Rundvlees. CNS 196/96. Brasília: Ministério da Saúde, 1996.