Turing Test

grenzen in de informatica

het bereik van technologie is zodanig gegroeid dat de mogelijkheid om de toegang te vergroten nooit groter is geweest. Zo meldt de Internationale Telecommunicatie-Unie (ITU) dat wereldwijd meer dan zeven miljard GSM-abonnementen worden onderhouden en dat bijna de helft van alle mensen ter wereld internet gebruikt (ITU, 2014). Gezien de omvang van de technologie is het momenteel mogelijk om op grote schaal gebruik te maken van geautomatiseerde behandelingen.zo is IMBs Watson, oorspronkelijk ontwikkeld om de grenzen van computersnelheid en nauwkeurigheid te testen door te concurreren met de Jeopardy game show champions, aangepast aan de minder opzienbarende, zij het zinvollere taak om artsen te assisteren bij de behandeling van patiënten in het Sloan Kettering Memorial Cancer Center. Watson ‘ s cloud-based computing capaciteiten zorgen voor de buurt onmiddellijke verwerking van volledige medische dossiers verwezen tegen hele gebieden van medisch onderzoek om diagnose en behandeling te informeren op een manier die ver buiten de capaciteit van de menselijke geest (Zauderer et al., 2014). Watson is een van de vele manieren waarop technologie de wetenschap en de gezondheidszorg revolutioneert.hoewel de huidige technologie, zoals Watson van IBM, zo geavanceerd lijkt dat ze bijna niet te geloven is, is de vraag of computers ooit het niveau van de mens zouden bereiken of overschrijden vele decennia geleden gesteld. In het baanbrekende artikel van Alan Turing, Computing Machinery and Intelligence, vroeg hij: “kunnen machines denken?”Turing bedacht een evaluatieoefening, de Turing-test, om te onderzoeken of een computer intelligent genoeg kan zijn dat een andere persoon die ermee interageert zou geloven dat de computer een mens was (Turing, 1950).

om te weten of machines inderdaad kunnen denken, wijst Turing erop dat we eerst machines en denken moeten definiëren. Wat al snel duidelijk wordt, is dat Turing zich echt afvroeg of machines, en daarmee bedoelde hij computers, konden doen wat wij (als denkende entiteiten) kunnen doen. Hier tekende Turing een scheiding tussen de fysieke en de intelligente aspecten van de mens. Zijn vraag ligt bij de vraag of computers in staat zijn om te presteren op een zodanige wijze dat ze niet te onderscheiden zijn van menselijke prestaties. Een noodzakelijke huurder van de Turing-test is dat de computer niet hoeft te denken zoals wij denken; de computer moet intelligentie simuleren zodat deze niet te onderscheiden is van onze eigen intelligentie (Harnad, 2006). Turing ‘ s challenge vormde het podium voor grote werken in wetenschap, filosofie, sciencefiction films en romans, en een steeds voortschrijdend doel om computers meer mensachtig te maken.

op het gebied van computermachines en intelligentie en na de publicatie ervan, stelt Turing verschillende varianten van de Turing-test voor die geleidelijk meer geavanceerde middelen zijn om te beoordelen of een computer op mensachtige manieren kan reageren. Ten eerste zet Turing het podium met de introductie van een partij spel, genaamd de imitatie spel, waarin een jongen en een meisje gaan in aparte kamers. Een derde persoon, de examiner, stelt een reeks vragen waarop de jongen en het meisje antwoorden met schriftelijke antwoorden. De jongen en het meisje doen beiden alsof ze het andere geslacht zijn en de examinator probeert het geslacht van de speler correct te identificeren. In de eenvoudigste variant stelt Turing voor om een van de spelers te vervangen door een computer. Hierin doet de computer zich voor als een mens, net als de resterende menselijke speler. De onderzoeker probeert de menselijke speler correct te identificeren. In deze variatie, de computer slaagt voor de test als het overtuigt de examinator om het onjuist te identificeren als de mens in een vergelijkbaar tempo als de examinator ten onrechte geïdentificeerd spelers als het verkeerde geslacht in de vorige versie van het spel. In de definitieve versie beschreven door Turing in 1952, een jury van examinatoren streeft naar het bepalen van de mens en computer speler. De computer wordt geacht de test te doorstaan als het computerprogramma met succes een aanzienlijk deel van de juryleden kan overtuigen dat het de menselijke speler is.

velen hebben de Turing-test overwogen en bekritiseerd sinds het ontstaan ervan in 1950. Kritiek varieert van filosofische dilemma ‘ s over het vermogen van machines om emergente eigenschappen zoals bewustzijn weer te geven, tot praktische zorgen, zoals of het feit dat een computer niet te onderscheiden is van menselijk gedrag in feite een maat is voor intelligentie. Ondanks zorgen over de Turing-test, biedt het een krachtige, eenvoudige, tractable en pragmatische tool om het vermogen van een computer te evalueren om te presteren zonder onderscheid van een mens. Bovendien maakt de Turing-test een breed onderzoek van de computercapaciteiten mogelijk, waarbij het onderzoek niet beperkt blijft tot slechts één vakgebied. James Moor benadrukt in zijn artikel An Analysis of the Turing Test uit 1976 de kracht van de Turing test als een manier om inductieve gevolgtrekkingen te maken over of een machine kan denken (Moor, 1976). Moor schreef: “de Turing-test maakt directe en indirecte testen mogelijk van vrijwel alle activiteiten die men zou tellen als bewijs voor het denken” (p. 251). Bovendien stelt Moor, “als de Turing-test was geslaagd, dan zou men zeker zeer adequate gronden hebben om inductief te concluderen dat de computer zou kunnen denken op het niveau van een normale, levende, volwassen mens” (p. 251).

vroege computerprogramma ‘ s om te proberen de Turing test te halen zijn ELIZA (Weizenbaum, 1966) en PARRY (Colby, Hilf, Weber, & Kraemer, 1972). ELIZA zorgde voor natuurlijke taal conversatie door het inspecteren van getypte input van de examinator voor zoekwoorden. Wanneer een trefwoord werd gevonden, werd een depot van regels geopend en gebruikt om de invoer om te zetten in een antwoord zin. Stilistisch, ELIZA werd gemodelleerd naar het gedrag van een rogerian, persoonsgerichte, psycholoog. Het ELIZA-programma was in staat om sommige examinatoren te overtuigen dat ze interactie hadden met een mens en sommigen beweren dat ELIZA het eerste programma was dat de Turing-test slaagde. Een tweede Opmerkelijk programma is PARRY, een programmatisch vergelijkbare, maar meer geavanceerde versie van ELIZA. PARRY werd gemodelleerd naar het gedrag van een paranoïde schizofreen. Een aanpassing van de Turing-test werd gebruikt om PARRY te evalueren, waarbij ervaren psychiaters transcripten evalueerden van gesprekken met PARRY of met paranoïde schizofrene patiënten. Van de 33 psychiaters die vermoedden wie de mens was, had 48% gelijk, een deel kwam overeen met willekeurige gissingen (Saygin, Cicekli, & Akman, 2003).

Hier treden we in de voetsporen van vroege tijdgenoten die erop uit waren om technologieën te ontwikkelen die variaties van de Turing-test doorstaan. In het bijzonder willen we een antwoord geven op de vraag of computers een behandeling kunnen bieden voor middelengebruik die vergelijkbaar is met die van door therapeuten aangeleverde behandeling. Als zodanig, de vraag die hier wordt gesteld is of een computer kan doen wat wij (als zorgverleners) kunnen doen. Ons doel is om te bepalen of een geautomatiseerde behandeling traditionele behandeling kan simuleren, zodat de resultaten van computer-geleverde behandeling niet te onderscheiden zijn van face-to-face behandeling.

een succesvolle turingtest kan worden opgesplitst in twee criteria:

criterium 1: Computerkandidaat kan dezelfde doelen bereiken als de menselijke kandidaat (empirisch).

criterium 2: Computerkandidaat is niet te onderscheiden van de menselijke kandidaat, zodat een examinator het verschil niet kan zien (intuïtief).

we hebben deze historisch waardevolle criteria aangepast om de kritische vraag te beoordelen: voldoen computerbehandelingen voor middelengebruik aan behandelingen die door therapeuten zijn gegeven of zijn deze zelfs overschreden? De aangepaste criteria, de zogenaamde Addiction Technology Treatment Test (Budney, Marsch, & Bickel, 2014), zijn:

criterium 1: de computerinterventie doet wat face-to-face interventies doen. De prestatiecapaciteiten komen overeen (empirisch).

criterium 2: de computerinterventie wordt vergelijkbaar ervaren als de therapeutinterventie. Patiënten geven niet de voorkeur aan het ene boven het andere (intuïtief).

aan de hand van het raamwerk van de Turing-test stellen we voor om studies te evalueren die door therapeuten en door computers aangeleverde interventies vergelijken. Door middel van vergelijkende evaluatie, proberen we te bepalen of we een punt hebben bereikt waar geautomatiseerde behandelingen voor middelengebruik integratief en geavanceerd genoeg zijn om te voldoen aan de normen van therapeut-geleverde behandeling.



Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.