Turing Test

Frontiers in Computer Science

La portata della tecnologia è cresciuta in modo tale che l’opportunità di aumentare l’accesso non è mai stata così grande. Ad esempio, l’International Telecommunications Union (ITU) riferisce che più di sette miliardi di abbonamenti di telefonia mobile-cellulare sono mantenuti in tutto il mondo e quasi la metà di tutte le persone nel mondo utilizza Internet (ITU, 2014). Data la portata della tecnologia, è attualmente possibile l’opportunità di un uso diffuso di trattamenti informatizzati.

Ad esempio, IMBs Watson, originariamente sviluppato per testare i limiti di velocità e precisione di calcolo competendo contro i campioni di Jeopardy game show, è stato adattato al lavoro meno appariscente, anche se più significativo, di assistere i medici nel trattamento dei pazienti presso lo Sloan Kettering Memorial Cancer Center. Le capacità di calcolo basate su cloud di Watson consentono un’elaborazione quasi istantanea di cartelle cliniche complete referenziate a interi campi della ricerca medica per informare diagnosi e trattamento in modi ben oltre la capacità della mente umana (Zauderer et al., 2014). Watson è uno dei tanti modi in cui la tecnologia sta rivoluzionando la scienza e l’assistenza sanitaria.

Mentre la tecnologia attuale come Watson di IBM sembra così sofisticato da essere quasi incredibile, la questione se i computer avrebbero mai raggiungere, o superare, il livello di esseri umani è stata posta molti decenni fa. Nel documento seminale di Alan Turing, Computing Machinery and Intelligence, ha messo in discussione: “le macchine possono pensare?”Turing ha coniato un esercizio valutativo, il test di Turing, per esaminare se un computer può essere abbastanza intelligente che un’altra persona che interagisce con esso crederebbe che il computer fosse un essere umano (Turing, 1950).

Per sapere se le macchine possono davvero pensare, Turing sottolinea che dobbiamo prima definire le macchine e definire il pensiero. Ciò che diventa rapidamente evidente è che ciò che Turing ha davvero messo in discussione era se le macchine, e per macchine, intendeva i computer, potessero fare ciò che noi (come entità pensanti) possiamo fare. Qui, Turing ha disegnato una separazione tra gli aspetti fisici e intelligenti degli esseri umani. La sua domanda sta nel fatto che i computer siano in grado di eseguire in modo tale da essere indistinguibili dalle prestazioni umane. Un inquilino necessario del test di Turing è che il computer non deve pensare come pensiamo noi; piuttosto il computer deve simulare l’intelligenza in modo che sia indistinguibile dalla nostra intelligenza (Harnad, 2006). La sfida di Turing ha posto le basi per grandi opere in scienza, filosofia, film di fantascienza e romanzi, e un obiettivo sempre più avanzato per rendere i computer più umani.

In Computer Machinery and Intelligence e dopo la sua pubblicazione, Turing propone diverse varianti del test di Turing che sono mezzi progressivamente più avanzati per valutare se un computer può rispondere in modi simili a quelli umani. Primo, Turing pone le basi con l’introduzione di un gioco di partito, chiamato il gioco di imitazione, in cui un ragazzo e una ragazza vanno in stanze separate. Una terza persona, l’esaminatore, pone una serie di domande a cui il ragazzo e la ragazza rispondono con risposte scritte. Il ragazzo e la ragazza fingono entrambi di essere il sesso opposto e l’esaminatore cerca di identificare correttamente il sesso del giocatore. Nella variante più semplice, Turing propone di sostituire uno dei giocatori con un computer. Qui, il computer finge di essere umano, così come il giocatore umano rimanente. L’esaminatore cerca di identificare correttamente il giocatore umano. In questa variante, il computer supera il test se convince l’esaminatore a identificarlo erroneamente come l’umano a un tasso paragonabile a quello in cui l’esaminatore ha identificato erroneamente i giocatori come il sesso errato nella versione precedente del gioco. Nella versione finale descritta da Turing nel 1952, una giuria di esaminatori mira a determinare il giocatore umano e computer. Si ritiene che il computer superi il test se il programma per computer può convincere con successo una parte significativa dei giurati che è il giocatore umano.

Molti hanno considerato e criticato il test di Turing sin dalla sua concezione nel 1950. Le critiche vanno dai dilemmi filosofici sulla capacità delle macchine di visualizzare proprietà emergenti, come la coscienza, a preoccupazioni pratiche, come se l’essere indistinguibile dal comportamento umano di un computer fosse in realtà una misura dell’intelligenza. Nonostante le preoccupazioni per il test di Turing, fornisce uno strumento potente, semplice, trattabile e pragmatico per valutare la capacità di un computer di eseguire indistinguibilmente da un essere umano. Inoltre, il test di Turing consente un ampio esame delle capacità dei computer, non limitando l’esame a una sola area tematica. James Moor, nel suo articolo del 1976 An Analysis of the Turing Test, sottolinea la forza del test di Turing come un modo per fare inferenze induttive su se una macchina può pensare (Moor, 1976). Moor ha scritto, “il test di Turing permette test diretti e indiretti di quasi tutte le attività si potrebbe contare come prova per il pensiero” (p. 251). Inoltre, Moor afferma, ” se il test di Turing fosse superato, allora si avrebbero certamente motivi molto adeguati per dedurre induttivamente che il computer potrebbe pensare al livello di un normale, vivente, essere umano adulto” (p. 251).

I primi programmi per computer per tentare di superare il test di Turing includono ELIZA (Weizenbaum, 1966) e PARRY (Colby, Hilf, Weber, & Kraemer, 1972). ELIZA ha fornito una conversazione in linguaggio naturale ispezionando l’input digitato dall’esaminatore per le parole chiave. Quando è stata trovata una parola chiave, è stato effettuato l’accesso a un deposito di regole e utilizzato per trasformare l’input in una frase di risposta. Stilisticamente, ELIZA è stata modellata sui comportamenti di uno psicologo rogeriano, centrato sulla persona. Il programma ELIZA è stato in grado di convincere alcuni esaminatori che stavano interagendo con un essere umano e alcuni sostengono che ELIZA è stato il primo programma a superare il test di Turing. Un secondo programma degno di nota è PARRY, una versione programmaticamente simile, ma più avanzata, di ELIZA. PARRY è stato modellato sul comportamento di uno schizofrenico paranoico. Un adattamento del test di Turing è stato impiegato per valutare PARRY in cui psichiatri esperti hanno valutato le trascrizioni delle conversazioni con PARRY o con pazienti schizofrenici paranoici. Dei 33 psichiatri che hanno indovinato quale fosse l’umano, il 48% era corretto, una parte coerente con l’ipotesi casuale (Saygin, Cicekli, & Akman, 2003).

Qui, seguiamo le orme dei primi contemporanei che si proponevano di sviluppare tecnologie che superavano le variazioni del test di Turing. In particolare, miriamo a rispondere alla domanda se i computer possano fornire un trattamento per l’uso di sostanze in modo comparabile a quello del trattamento consegnato dal terapeuta. Come tale, la domanda posta qui è se un computer può fare quello che noi (come fornitori di trattamento) può fare. Il nostro obiettivo è determinare se un trattamento computerizzato può simulare il trattamento tradizionale in modo tale che i risultati del trattamento consegnato dal computer siano indistinguibili dal trattamento faccia a faccia.

Una performance di test di Turing di successo può essere suddivisa in due criteri:

Criterio 1: il candidato informatico può raggiungere gli stessi fini del candidato umano (empirico).

Criterio 2: Il candidato informatico è indistinguibile dal candidato umano, in modo tale che un esaminatore non sia in grado di distinguere la differenza (Intuitivo).

Abbiamo adattato questi criteri storicamente preziosi per valutare la domanda critica: i trattamenti forniti dal computer per l’uso di sostanze hanno incontrato, o addirittura superato, i trattamenti consegnati dal terapeuta? I criteri adattati, definiti Test di trattamento della tecnologia delle dipendenze (Budney, Marsch, & Bickel, 2014), sono:

Criterio 1: L’intervento informatico fa ciò che fanno gli interventi faccia a faccia. Le capacità di prestazione corrispondono (empiriche).

Criterio 2: L’intervento informatico è comparabilmente sperimentato come l’intervento del terapeuta. I pazienti non preferiscono l’uno all’altro (Intuitivo).

Utilizzando il framework del test di Turing, proponiamo di valutare studi che confrontano interventi consegnati dal terapeuta e dal computer. Attraverso una valutazione comparativa, miriamo a determinare se abbiamo raggiunto un punto in cui i trattamenti computerizzati per l’uso di sostanze sono integrativi e abbastanza avanzati da soddisfare gli standard del trattamento consegnato dal terapeuta.



Lascia un commento

Il tuo indirizzo email non sarà pubblicato.