Turing Test

gränser i datavetenskap

teknikens räckvidd har vuxit så att möjligheten att öka tillgången aldrig har varit större. Internationella telekommunikationsunionen (ITU) rapporterar till exempel att mer än sju miljarder mobilabonnemang upprätthålls över hela världen och nästan hälften av alla människor i världen använder internet (ITU, 2014). Med tanke på teknikens omfattning är möjligheten till utbredd användning av datoriserade behandlingar för närvarande möjlig.till exempel har IMBs Watson, som ursprungligen utvecklades för att testa gränserna för beräkningshastighet och noggrannhet genom att tävla mot Jeopardy game show champions, anpassats till det mindre prickiga, om än mer meningsfulla jobbet med att hjälpa läkare i behandlingen av patienter vid Sloan Kettering Memorial Cancer Center. Watsons molnbaserade datorförmåga möjliggör nära omedelbar behandling av fullständiga medicinska journaler som refereras mot hela områden av medicinsk forskning för att informera diagnos och behandling på sätt långt bortom det mänskliga sinnets kapacitet (Zauderer et al., 2014). Watson är ett av många sätt att tekniken revolutionerar vetenskap och sjukvård.

medan nuvarande teknik som IBMs Watson verkar så sofistikerad att den är nästan otrolig, ställdes frågan om datorer någonsin skulle nå eller överstiga nivån på människor för många decennier sedan. I den banbrytande artikeln av Alan Turing, Computing Machinery and Intelligence, ifrågasatte han: ”kan maskiner tänka?”Turing myntade en utvärderande övning, Turing-testet, för att undersöka om en dator kan vara intelligent nog att en annan person som interagerar med den skulle tro att datorn var en människa (Turing, 1950).

För att veta om maskiner verkligen kan tänka, påpekar Turing att vi först måste definiera maskiner och definiera tänkande. Det som snabbt blir uppenbart är att det Turing verkligen ifrågasatte var om maskiner, och med maskiner, menade han datorer, kunde göra vad vi (som tänkande enheter) kan göra. Här drog Turing en åtskillnad mellan de fysiska och de intelligenta aspekterna av människor. Hans fråga ligger i huruvida datorer kan utföra på ett sådant sätt att de inte kan skilja sig från mänsklig prestanda. En nödvändig hyresgäst i Turing-testet är att datorn inte behöver tänka som vi tänker; snarare måste datorn simulera intelligens så att den inte kan skilja sig från vår egen intelligens (Harnad, 2006). Turings utmaning satte scenen för stora verk inom vetenskap, filosofi, science fiction-filmer och romaner, och ett ständigt framåtriktat mål att göra datorer mer mänskliga.

i datormaskiner och intelligens och efter publiceringen föreslår Turing flera variationer av Turing-testet som gradvis är mer avancerade sätt att utvärdera om en dator kan svara på människoliknande sätt. Först sätter Turing scenen genom att introducera ett partyspel, kallat Imitationsspelet, där en pojke och en tjej går in i separata rum. En tredje person, examinator, ställer en serie frågor som pojken och flickan svarar med skrivskrivna svar på. Pojken och flickan låtsas båda vara det motsatta könet och granskaren försöker korrekt identifiera spelarens kön. I den enklaste variationen föreslår Turing att ersätta en av spelarna med en dator. Här låtsas datorn vara mänsklig, liksom den återstående mänskliga spelaren. Examinatorn försöker korrekt identifiera den mänskliga spelaren. I denna variant klarar datorn testet om den övertygar examinatorn att felaktigt identifiera den som människa i en jämförbar takt som examinator felaktigt identifierade spelare som felaktigt kön i den tidigare versionen av spelet. I den slutliga versionen som beskrivs av Turing 1952 syftar en jury av examinatorer till att bestämma människa och datorspelare. Datorn anses klara testet om datorprogrammet framgångsrikt kan övertyga en betydande del av jurymedlemmarna att det är den mänskliga spelaren.

många har övervägt och kritiserat Turing-testet sedan dess uppfattning 1950. Kritik sträcker sig från filosofiska problem om maskinernas förmåga att visa framväxande egenskaper, såsom medvetande, till praktiska problem, till exempel om en dator är oskiljbar från mänskligt beteende är faktiskt ett mått på intelligens. Trots oro över Turing-testet ger det ett kraftfullt, enkelt, dragbart och pragmatiskt verktyg för att utvärdera datorns förmåga att utföra oskiljbart från en människa. Dessutom möjliggör Turing-testet en bred undersökning av datorns förmågor, vilket inte begränsar undersökningen till endast ett ämnesområde. James Moor, i sitt 1976-papper en analys av Turing-testet, betonar styrkan i Turing-testet som ett sätt att göra induktiva slutsatser om en maskin kan tänka (Moor, 1976). Moor skrev, ”Turing-testet tillåter direkt och indirekt testning av praktiskt taget alla aktiviteter som man skulle räkna som bevis för att tänka” (s. 251). Dessutom säger Moor,” om Turing-Testet passerade, skulle man säkert ha mycket tillräckliga skäl för att induktivt dra slutsatsen att datorn kunde tänka på nivån av en normal, levande, vuxen människa ” (s. 251).

tidiga datorprogram för att försöka klara Turing-testet inkluderar ELIZA (Weizenbaum, 1966) och PARRY (Colby, Hilf, Weber, & Kraemer, 1972). ELIZA som naturligt språk konversation genom att inspektera skrivit input från examinator för sökord. När ett nyckelord hittades öppnades en depå av regler och användes för att omvandla inmatningen till en svarsmening. Stilistiskt, ELIZA modellerades efter beteenden hos en Rogerian, personcentrerad, psykolog. ELIZA-programmet kunde övertyga vissa examinatorer om att de interagerade med en människa och vissa hävdar att ELIZA var det första programmet som passerade Turing-testet. Ett andra anmärkningsvärt program är PARRY, en programmatiskt liknande, men mer avancerad version av ELIZA. PARRY modellerades efter beteendet hos en paranoid schizofren. En anpassning av Turing-testet användes för att utvärdera PARRY där erfarna psykiatriker utvärderade transkript av samtal antingen med PARRY eller med paranoida schizofrena patienter. Av de 33 psykiatriker som gissade vilken som var människan var 48% korrekta, en del som överensstämde med slumpmässig gissning (Saygin, Cicekli, & Akman, 2003).

Här följer vi i fotspåren av tidiga samtida som bestämde sig för att utveckla tekniker som passerade variationer av Turing-testet. Specifikt strävar vi efter att svara på frågan om datorer kan ge behandling för substansanvändning jämförbart med den för terapeuten levererad behandling. Som sådan är frågan här om en dator kan göra vad vi (som behandlingsleverantörer) kan göra. Vårt mål är att avgöra om en datoriserad behandling kan simulera traditionell behandling så att resultaten av datorlevererad behandling inte kan skiljas från ansikte mot ansikte.

en framgångsrik Turing – testprestanda kan delas in i två kriterier:

kriterium 1: Datorkandidat kan uppnå samma mål som den mänskliga kandidaten (empirisk).

kriterium 2: Datorkandidat kan inte skiljas från den mänskliga kandidaten, så att en examinator inte kan se skillnaden (intuitiv).

Vi har anpassat dessa historiskt värdefulla kriterier för att bedöma den kritiska frågan: har datorlevererade behandlingar för substansanvändning uppfyllt, eller till och med eventuellt överskridit, terapeutlevererade behandlingar? De anpassade kriterierna, benämnt Addiction Technology Treatment Test (Budney, Marsch, & Bickel, 2014), är:

kriterium 1: datorinterventionen gör vad ansikte mot ansikte interventioner gör. Prestandakapaciteterna matchar (empirisk).

kriterium 2: datorinterventionen upplevs jämförbart som terapeutinterventionen. Patienter föredrar inte den ena till den andra (intuitiv).

med hjälp av ramen för Turing-testet föreslår vi att utvärdera studier som jämför terapeutlevererade och datorlevererade ingrepp. Genom jämförande utvärdering strävar vi efter att avgöra om vi har nått en punkt där datoriserade behandlingar för substansanvändning är integrerade och avancerade nog för att uppfylla normerna för terapeutlevererad behandling.



Lämna ett svar

Din e-postadress kommer inte publiceras.