Turingův Test
Hranic, v informatice
dosah technologie se rozrostla tak, že příležitost ke zvýšení možnosti nebyly nikdy větší. Například, Mezinárodní Telekomunikační Unie (ITU) uvádí, že více než sedm miliard mobilní-mobilní telefonní předplatné jsou udržovány po celém světě a téměř polovina všech lidí na světě používat internet (ITU, 2014). Vzhledem k rozsahu technologie je v současné době možná příležitost pro široké využití počítačových ošetření.
například, IMBs Watson, původně vyvinutý pro testování hranice výpočetní rychlost a přesnost tím, že soutěží proti Ohrožení game show mistrů, byla upravena do méně honosné, byť více smysluplného, práci, pomáhat lékařům při léčbě pacientů v Memorial Sloan Kettering Cancer Center. Watson je cloud-based computing schopnosti umožňují téměř okamžité zpracování kompletní lékařské záznamy jsou porovnávány celé oblasti lékařského výzkumu informovat diagnostiku a léčbu způsoby, daleko přesahuje možnosti lidské mysli (Zauderer et al., 2014). Watson je jedním z mnoha způsobů, jak technologie revolucionizuje vědu a zdravotnictví.
zatímco současná technologie, jako je IBM Watson, se zdá být tak sofistikovaná, že je téměř neuvěřitelná, otázka, zda počítače někdy dosáhnou nebo překročí úroveň lidí, byla položena před mnoha desítkami let. V klíčové práci Alana Turinga, výpočetní stroje a inteligence, zeptal se, “ mohou stroje myslet?“Turing vytvořil hodnotící cvičení, Turingův test, aby přezkoumala, zda počítač může být inteligentní natolik, že další osoba, interakci s to uvěřit, že by počítač byl člověk (Turing, 1950).
Chcete-li vědět, zda stroje mohou skutečně myslet, Turing zdůrazňuje, že musíme nejprve definovat stroje a definovat myšlení. Rychle se ukáže, že to, co Turing skutečně zpochybnil, bylo, že stroje a stroje, myslel tím počítače, mohou dělat to, co my (jako myslící entity) dokážeme. Zde Turing nakreslil oddělení mezi fyzickými a inteligentními aspekty lidí. Jeho dotaz spočívá v tom, zda jsou počítače schopny provádět tak, aby byly k nerozeznání od lidského výkonu. Nezbytnou nájemce Turingův test je, že počítač nemusí přemýšlet, jak si myslíme; je to spíše počítač musí simulovat inteligenci tak, že je k nerozeznání od naší vlastní inteligence (Harnad, 2006). Turingova výzva připravila půdu pro velká díla ve vědě, filozofie, sci-fi filmy a romány, a stále se vyvíjející cíl učinit počítače lidštějšími.
V Počítači Stroje a Inteligence, a po jeho zveřejnění, Turing navrhuje několik variant Turingova testu, které jsou postupně více pokročilé prostředky pro vyhodnocení, zda počítač může reagovat na lidské způsoby. Za prvé, Turing připravuje scénu zavedením společenské hry, nazývané Imitace hry, kde chlapec a dívka jdou do samostatných místností. Třetí osoba, zkoušející, položí řadu otázek, na které chlapec a dívka odpoví psanými odpověďmi. Chlapec i dívka předstírají opak sex a zkoušející se snaží správně identifikovat pohlaví hráče. V nejjednodušší variantě Turing navrhuje nahradit jednoho z hráčů počítačem. Zde počítač předstírá, že je člověk, stejně jako zbývající lidský hráč. Zkoušející se snaží správně identifikovat lidského hráče. V této variantě, počítač projde testem, pokud to přesvědčí zkoušející nesprávně identifikovat jako lidské srovnatelným tempem jako zkoušející nesprávně označena hráči jako nesprávné pohlaví v předchozí verzi hry. V konečné verzi popsané Turingem v roce 1952 si porota zkoušejících klade za cíl určit člověka a počítačového hráče. Počítač je za to projít testem, zda počítačový program může úspěšně přesvědčit významnou část porotců, že je lidský hráč.
mnozí zvažovali a kritizovali Turingův test od jeho koncepce v roce 1950. Kritiky se pohybují od filozofických zmatky o schopnost stroje k zobrazení emergentní vlastnosti, jako je vědomí, na praktické problémy, například pokud počítač je k nerozeznání od lidské chování je ve skutečnosti určitou míru inteligence. I přes obavy o Turingův test, poskytuje výkonný, jednoduchý, ovladatelný a praktický nástroj k hodnocení schopnosti počítače provádět bez rozlišení od člověka. Turingův test navíc umožňuje široké zkoumání schopností počítačů, aniž by omezoval zkoušku pouze na jednu oblast předmětu. James Moor, v jeho 1976 papír Analýzu Turingův Test, klade důraz na sílu Turingova testu jako způsob, jak vydělat induktivní závěry o tom, zda stroj může myslet (Moor, 1976). Moor napsal: „Turingův test umožňuje přímé a nepřímé testování prakticky všech činností, které by člověk považoval za důkaz myšlení“ (s. 251). Kromě toho, Moor státy, „pokud Turingův test byl přijat, pak by bylo jistě velmi adekvátní důvody pro induktivní vyvozování, že by mohl myslet počítač na úrovni normální, živé, dospělé lidské bytosti“ (str. 251).
první počítačové programy se pokusí projít Turingův test patří ELIZA (Weizenbaum, 1966) a PARRY (Colby, Hilf, Weber, & Kraemerová, 1972). ELIZA poskytla konverzaci v přirozeném jazyce kontrolou zadaného vstupu od zkoušejícího pro klíčová slova. Když bylo nalezeno Klíčové slovo, byl zpřístupněn depozitář pravidel a použit k transformaci vstupu do věty odpovědi. Stylisticky, ELIZA byla modelována podle chování Rogeriana, psycholog zaměřený na člověka. Ta ELIZA program byl schopen přesvědčit některé zkoušející, že jsou v interakci s člověkem a někteří tvrdí, že ELIZA byla první program projít Turingův test. Druhým pozoruhodným programem je PARRY, programově podobná, nicméně pokročilejší verze Elizy. PARRY byl modelován podle chování paranoidního schizofrenika. K vyhodnocení PARRY byla použita adaptace Turingova testu, kde zkušení psychiatři hodnotili přepisy rozhovorů buď s PARRY, nebo s paranoidními schizofrenickými pacienty. 33 psychiatři, které uhodl, který byl lidský, 48% bylo správné, část v souladu s náhodné hádání (Saygin, Cicekli, & Akman, 2003).
Tady, jsme ve stopách raných současníků, že vyvinout technologie, které prošly variace na Turingův test. Konkrétně, naším cílem je odpovědět na otázku, zda počítače mohou poskytnout léčbu užívání návykových látek srovnatelně se, že terapeut-dodáno léčby. Jako taková je zde položena otázka, zda počítač může dělat to, co my (jako poskytovatelé léčby) můžeme udělat. Naším cílem je zjistit, zda počítačová léčba může simulovat tradiční léčbu tak, aby výsledky léčby dodané počítačem byly nerozeznatelné od ošetření tváří v tvář.
úspěšný výkon Turingova testu lze rozdělit do dvou kritérií:
kritérium 1: počítačový kandidát může dosáhnout stejných cílů jako lidský kandidát (empirický).
kritérium 2: počítačový kandidát je k nerozeznání od lidského kandidáta, takže zkoušející není schopen rozeznat rozdíl (intuitivní).
přizpůsobili jsme tato historicky cenná kritéria k posouzení kritické otázky: splnili nebo dokonce překročili léčbu dodanou terapeutem? Upravená kritéria, tzv. Závislost na Technologii Zpracování Testu (Budney, Marsch, & Bickel, 2014), jsou:
Kritérium 1: počítač intervence dělá to, co tváří v tvář intervence. Výkonnostní kapacity se shodují (empiricky).
kritérium 2: počítačový zásah je srovnatelně prožíván jako zásah terapeuta. Pacienti nepreferují jeden k druhému (intuitivní).
pomocí rámce Turingova testu navrhujeme vyhodnotit studie, které porovnávají intervence dodané terapeutem a počítačem. Prostřednictvím srovnávacích hodnocení, naším cílem je určit, zda jsme dosáhli bodu, kdy počítačové léčby užívání návykových látek jsou integrační a dostatečně pokročilá, aby splňovaly standardy terapeut-dodáno léčby.