kumulatív eseményarányok és becsült kockázati számok. (Balra) kumulatív események aránya pitvarfibrillációban szenvedő betegeknél, akik warfarint vagy rivaroxabánt kaptak. (Jobbra) az egyes pontok függőleges elhelyezkedése a warfarin-karban a szóban forgó kockázati készletben becsült veszélyeztetett számot jelenti (vízszintes hely). A számokat az 1. egyenlet alkalmazásával származtattuk az S (t j ) becslésekre, amelyek a vektorkép megjelenítéséhez használt PostScript parancsokból származnak. A gyémántok a 0., (120), 840. napon veszélyeztetett számokat jelentenek, amelyeket a cikk ábrájának alján jelentettek. Nyilvánvaló, hogy még ha nem is szolgáltatták volna őket, csak az egymást követő S(TJ ) becslések alapján nagyon pontosan meg lehetett volna becsülni őket. Az (a) sorozatban a monotonitás enyhe hiánya a kerekítési hibákat tükrözi a PostScript koordinátákban. A (b) sorozatban minden n j azon a (egyértelműen hamis) feltételezésen alapul, hogy a megfelelő d j =1; ezekben a különálló meghibásodási időkben egyértelműen d j =2, tehát minden n j kétszerese a bemutatottnak. Hasonlóképpen, a (c) sorozatban szereplő n j s azon alapul, hogy feltételezzük d j =1, amikor ismét egyértelműen d j =3, és az n j-nek háromszor kell lennie a bemutatottnak.
Ha a szomszédos t-k közötti időközök viszonylag rövidek, vagy ha a veszélyeztetett számok meghatározott időpontokban (pl. évente vagy havonta) jelennek meg a grafikonon, majd a veszélyeztetett számok sorozatának további interpolációjával minimális hibával megállapítható az egyes érdeklődési időintervallumok teljes személyi ideje. A túlélési telkek általában szélesek:magasság képarány nagyobb, mint 1. Így a relatív hibák általában kisebbek lesznek az ‘idő’, mint a személy-idő nevező bemeneteinek ‘személy’ dimenziójában a számított eseményarányokhoz.
a fenti képlet a Kaplan-Meier görbére vonatkozott. Ha a túlélési görbe helyett a grafikon a kumulatív veszélyességi ráta függvény Nelson-Aalen becslőjét mutatja , amelyet H t j = ++ t i ++ t j d t i / n t I ad meg ,akkor az N(t j ) kifejezése
n t j = d t j ++ t j − ++ t j − 1, j=1,2,….
(2)
a függőleges tengely címkéjéből nem mindig egyértelmű, hogy a növekvő ‘Nelson-Aalen’ görbe a H s ezen sorrendjére, azaz az integrált veszélyekre, vagy a kumulatív incidenciára vagy kockázatra utal− e, azaz CI j =R j =1-exp. Ha valóban ez utóbbi, azaz az S komplementere, akkor az N j képlete
n t j = d t j log ++ t j − 1 / ++ T j lesz .
(3)
eddig azt feltételeztük, hogy a csúcsok függőleges és vízszintes koordinátái megfelelő pontossággal mérhetők. Most rátérünk arra, hogy mit lehet elérni a K-M és N-A görbék használatával, amelyeket bittérképes képekből és vektor alapú grafikákból lehet kinyerni a kiadványokban.
Praktikalitások
alig egy-két évtizeddel ezelőtt még gyakori, de időigényes volt a ‘ceruza és vonalzó’ megközelítés használata a túlélési valószínűségek leolvasására egy (esetleg kibővített) nyomtatott grafikonból. Ez a gyakorlat jelentős mérési hibával járhat, különösen akkor, ha a nyomtatás kicsi vagy a felbontás gyenge volt. Ma, mivel a legtöbb grafikon elektronikusan elérhető vagy átalakítható ilyen formátumba, a munkaigényes munka csökkenthető, jobb pontossággal és pontossággal. Weboldalunkon http://www.med.mcgill.ca/epidemiology/hanley/software/DataRecovery összegyűjtöttük az elektronikusan közzétett cikkekben található grafikonokat. Ezek a képek jellemzően két típusból állnak, amelyeket az Adobe Acrobat dokumentációja raszteres képeknek és vektorobjektumoknak nevez.
raszteres képek
A raszteres kép vagy bitkép pixelekből áll (a megjelenítő eszköz legkisebb címezhető képernyőelemei), amelyek kétdimenziós rácsban vannak elrendezve. Minden pixelnek, amelyet egy pont vagy négyzet képvisel, saját koordinátái és színe van. Amikor egyre többet nagyítunk, a kép szemcsésebbé válik, és a grafikonon lévő vonalakat és szimbólumokat alkotó egyes pontok nyilvánvalóbbá válnak.
fekete-fehér vagy szürkeárnyalatos képen a fehéret általában az 1 érték, a feketét 0, a szürkét pedig egy köztes érték képviseli; a színes képek bonyolultabb kódolási sémát használnak, amely több csatornát tartalmaz, például RGB vagy CMYK. Csakúgy, mint a digitális fényképezésnél, minél nagyobb a képpontok száma, annál hűségesebb az eredeti értékek ábrázolása. Egy példa a prosztatarák szűréséről (egy téma, amelyet az alábbiakban tárgyalunk), Lásd az Andriole cikk második és harmadik ábráját .
a raszteres képek számos fájlformátumban tárolhatók; a leggyakoribbak.jpeg,.png,.tiff, és.gif. Számos módon hozhatók létre, például (i) a nyomtatott példány beolvasása és raszteres képként történő tárolása, (ii) (ha az elektronikus dokumentum egyik oldalán található) a grafikont tartalmazó terület nagyítása és Képernyőkép készítése, vagy (iii) (ha már be van ágyazva egy PDF fájlba) az Adobe Acrobat ‘képek exportálása’ funkciójának használatával.
a grafikon kívánt pontjai kétféle módon nyerhetők ki a képfájlból. A technikaibb módszer egy olyan programozási nyelv használata, mint a Basic, A C++ vagy a SAS, hogy a színértékeket 2-D tömbbe olvassa, a pontok színeiből azonosítsa a kulcsfontosságú tereptárgyak pixelhelyeit (például a tengelyek keresztezik egymást, és a legtávolabbi függőleges és vízszintes kullancsjeleket), és végül meghatározza, hogy a pixelhelyek mely szekvenciái tartalmazzák az érdekes görbéket alkotó pontokat. Míg a ReadImages csomag megkönnyíti a tömb R-be olvasását, a tömb feldolgozásának programozása továbbra is jelentős kihívás, különösen azoknál a részeknél, ahol a görbék átfedik egymást.
a könnyebb módszer egy gráf digitalizáló használata, egy számítógépes program, amely (i) importálja és megjeleníti a kiválasztott képet a képernyőn,és (ii) lehetővé teszi a felhasználó számára, hogy a kurzor segítségével azonosítsa a vízszintes és függőleges tereptárgyakat, és kattintson a kívánt helyre a grafikonon, majd konvertálja és tárolja a megfelelő (x, y) értékeket. Számos graph digitalizáló (például Graph click, Engauge digitalizáló és Plot digitalizáló) ingyenesen elérhető az interneten. Guyot et al. jelentse, hogy a digitizeit szoftver (http://www.digitizeit.de/) jól teljesített. Mivel a raszteres képek digitalizálását Guyot et al. , nem adunk példákat, hanem pusztán szembeállítjuk azok pontosságát a vektoros képek pontosságával az alábbi elméleti hibaelemzésben.
vektoros képek
a vektor alapú ábra vagy grafikon geometriai primitívekből vagy elemekből, például pontokból és vonalakból áll; azonosítható azzal a ténnyel, hogy a minőség romlása nélkül korlátlan ideig bővíthető. Egy vonal két végpontját két (x,y) pár, egy pontot pedig nulla hosszúságú vonal képviseli. A PostScript – ben található’ Post ‘ – a gyártásuk leggyakoribb nyelve-az eszközfüggetlenség elvére utal: az elemeket valós időben renderelik az elemek tárolt koordinátáitól, függetlenül attól, hogy milyen helyi hardveren használják a szoftvert. Ez a hordozhatósági elv az Adobe által kifejlesztett portable document format (PDF) alapját képezi; a PDF fájlok a PostScript nyelven alapulnak.
A PDF dokumentum tartalmát általában bináris fájlként tárolják, de mind az Adobe Acrobat Pro alkalmazás, mind a Mac OS-ben biztosított előnézeti alkalmazás képes exportálni egy PDF dokumentumot (vagy annak az oldalát, amely az érdekes grafikont tartalmazza) PostScript fájlként, amely tartalmazza a parancsokat. Az ilyen fájlok általában nagyok és sok technikai információt tartalmaznak, de könnyű (ha unalmas) azonosítani azokat a parancsokat, amelyek a tengelyeket, a kullancsjeleket, valamint a K-M és N-A görbéket alkotó vonalszegmensek vagy pontok sorrendjét eredményezik.
a PostScript-ben az oldal helyeit nyomtatópontokban (72 pont / hüvelyk) mérik az oldal bal felső sarkától. Így egy 2 hüvelykes (144 pont) x tengely, amely T=0-tól és t=5-től, fizikailag pedig 1-től 3-ig terjed az oldal bal oldalán, és 5 hüvelyk (360 pont) található az oldal teteje alatt, a vonalszakasz határozza meg(72, 360) ⇔ (216, 360). Tegyük fel, hogy az 1,5 hüvelykes (108 pont) magas y tengely végei s=0, illetve S=1-nek felelnek meg. Ezután ezekből a PostScript koordinátákból megállapíthatjuk, hogy a vonalszakasz (144 300) (146).88, 300) a lépésfüggvény vízszintes része, amely az S=(360-300)/108=0, 555 értéket veszi fel a T intervallumban=(144-72)/(144/5)=2.5 hogy t=(146.88−72)/(144/5)=2.6 és hogy a szegmens (146.88, 300) ⇔ (146.88, 303) egy függőleges ugrás a T=2,6, Hosszúságúakcl = 3/108=0,028 tól től S=0,555 nak nek S = 0,583.
meglepő módon egyes kiadványok formátumok keverékét tartalmazzák. Valójában az első ábra forrásaként használt kiadványban az eredeti New England Journal of Medicine (NEJM) ábra tengelyeit vektorokként renderelték PostScript, de a két görbe képként van egymásra helyezve. A kompozitot képként elemezte Guyot et al. . Ezzel szemben a NEJM kiadvány másik alakját teljes egészében PostScript-ben tették közzé, bár néhány nagyon összetett útvonallal a vonalszegmensek kialakításához.
Precision
mennyire pontosak az adatok a raszteres és vektoros képekből? Ezt a kérdést több szinten is fel lehet mérni, kezdve maguk a ++ (vagy 1−) mérések pontosságával. Vegyünk egy tipikus 300 pont / hüvelyk (dpi) raszteres képet, amelyben a teljes (0, 1) S tengely 1,6 hüvelyk vagy 480 pixel magas. Ez ad egy állásfoglalást a (Z) 0.002. (Egy ‘lefelé’ görbe, amely mondjuk S=0,9-re végződik, de egy olyan grafikonon, amely a teljes (0,1) skálát használja, jelentős pontosságot pazarol el: sokkal értelmesebb a ‘felfelé’ függvényt ábrázolni, 1−S, egészen 0,1−ig, így az 1-s értékek pontosak a 0,0005-es számú 0,0-ig).
Vegyünk inkább egy vektoros képet, amely ugyanazt a görbét tartalmazza, ugyanazon az 1,6 hüvelykes (=72 ++ 1,6=115,2 pont) függőleges skálán. Mivel az Adobe Acrobat által exportált PostScript fájlban megadott koordinátákat három tizedesjegyre rögzítik, a felbontás=1/(115.2×1,000)≈0.00001, vagy a raszteres kép 200-szorosa.
bár mindkét állásfoglalás megfelelően pontos mértéket ad meg A ++ – ról, és lehetővé teszi annak meghatározását, hogy hány esemény vesz részt az egyes ugrásokban, előfordulhat, hogy nem adnak ilyen pontos mértéket az egyes ugrásoknál veszélyeztetett számról, mivel az 1−Kb t j /Kb T j − 1 reciprokaként mérik . A származtatott mérések pontosságának empirikus értékeléseként a 2. ábra egy raszterképből és egy vektorképből származó becsült számokat, valamint – érvényességi ellenőrzésként – az egyes időintervallumok végén jelentett veszélyeztetett számokat mutatja. Nagyon jól illeszkednek a cikkekben megadottakhoz.
a pontosság elméleti hibaelemzéssel is számszerűsíthető. Vegyünk két szomszédos értéket ugyanazon kumulatív incidenciagörbén, ahol a függőleges tengely 0% – ról 5% – ra megy, és (némi kerekítés után) y0, illetve y5 pontnak számítanak valamilyen mérföldkő felett; tegyük fel, hogy kerekítés nélkül Y0 és Y5 pontok lennének fent. Jelölje meg a gráf két szomszédos pontjának függőleges (hasonlóan lekerekített) helyét y’ és y” – ként, y”>y’ – vel, amely megfelel az Y’ és Y”kerekítetlen értékeinek. Ezután a veszélyeztetett szám becslése a következő:
n t j = 20 y 5 − y 0 − y ‘− Y 0 y “− y ‘ .
a függelékben megadjuk ennek a származtatott mennyiségnek a varianciáját, feltételezve, hogy a négy y S-ban található hibák egyenlőek és függetlenek egymástól. A gyakorlatban a PostScript pontokat három tizedesjegyre kerekítik; így az Y=563,384 pont jelentett helyéhez társított valódi hely 563,3835 és 563,3845 pont között van. Ha a hibák egységesek ezen a 0,001-es tartományon belül, úgy, hogy a 0,001/ 12 =0.0003 pont, akkor a variációs együttható (CV)