Prueba de Turing

Fronteras en Informática

El alcance de la tecnología ha crecido de tal manera que la oportunidad de aumentar el acceso nunca ha sido mayor. Por ejemplo, la Unión Internacional de Telecomunicaciones (UIT) informa de que en todo el mundo se mantienen más de siete mil millones de suscripciones a teléfonos móviles y celulares y que casi la mitad de todas las personas del mundo utilizan Internet (UIT, 2014). Dado el alcance de la tecnología, actualmente es posible el uso generalizado de tratamientos informatizados.

Por ejemplo, IMBs Watson, desarrollado originalmente para probar los límites de velocidad y precisión de la computación compitiendo contra los campeones del concurso Jeopardy, se ha adaptado al trabajo menos llamativo, aunque más significativo, de ayudar a los médicos en el tratamiento de pacientes en el Sloan Kettering Memorial Cancer Center. Las habilidades informáticas basadas en la nube de Watson permiten el procesamiento casi instantáneo de registros médicos completos referenciados contra campos enteros de investigación médica para informar el diagnóstico y el tratamiento de maneras mucho más allá de la capacidad de la mente humana (Zauderer et al., 2014). Watson es una de las muchas formas en que la tecnología está revolucionando la ciencia y la atención médica.

Mientras que la tecnología actual, como el Watson de IBM, parece tan sofisticada que es casi increíble, la pregunta de si las computadoras alcanzarían o superarían el nivel de los humanos se planteó hace muchas décadas. En el artículo seminal de Alan Turing, Computing Machinery and Intelligence, se preguntó: «¿pueden pensar las máquinas?»Turing acuñó un ejercicio evaluativo, la prueba de Turing, para examinar si una computadora puede ser lo suficientemente inteligente como para que otra persona que interactúa con ella crea que la computadora es un ser humano (Turing, 1950).

Para saber si las máquinas realmente pueden pensar, Turing señala que primero debemos definir las máquinas y definir el pensamiento. Lo que rápidamente se hace evidente es que lo que Turing realmente cuestionó fue si las máquinas, y por máquinas, se refería a las computadoras, podrían hacer lo que nosotros (como entidades pensantes) podemos hacer. Aquí, Turing dibujó una separación entre los aspectos físicos e inteligentes de los humanos. Su pregunta radica en si las computadoras son capaces de funcionar de tal manera que sean indistinguibles del rendimiento humano. Un inquilino necesario de la prueba de Turing es que la computadora no tiene que pensar como nosotros pensamos; más bien, la computadora debe simular la inteligencia para que sea indistinguible de nuestra propia inteligencia (Harnad, 2006). El desafío de Turing preparó el escenario para grandes obras de ciencia, filosofía, películas y novelas de ciencia ficción, y un objetivo cada vez más avanzado para hacer que las computadoras sean más humanas.

En Computer Machinery and Intelligence y después de su publicación, Turing propone varias variaciones de la prueba de Turing que son medios progresivamente más avanzados para evaluar si una computadora puede responder de manera similar a la humana. En primer lugar, Turing prepara el escenario introduciendo un juego de fiesta, denominado Juego de Imitación, en el que un niño y una niña entran en habitaciones separadas. Una tercera persona, el examinador, hace una serie de preguntas a las que el niño y la niña responden con respuestas escritas de tipo. El niño y la niña fingen ser del sexo opuesto y el examinador trata de identificar correctamente el género del jugador. En la variación más simple, Turing propone reemplazar a uno de los jugadores con una computadora. En este caso, la computadora pretende ser humana, al igual que el jugador humano restante. El examinador intenta identificar correctamente al jugador humano. En esta variación, la computadora pasa la prueba si convence al examinador de identificarlo incorrectamente como el humano a una tasa comparable a la que el examinador identificó incorrectamente a los jugadores como el género incorrecto en la versión anterior del juego. En la versión final descrita por Turing en 1952, un jurado de examinadores tiene como objetivo determinar el jugador humano y de computadora. Se considera que la computadora pasa la prueba si el programa de computadora puede convencer con éxito a una parte significativa de los miembros del jurado de que es el jugador humano.

Muchos han considerado y criticado la prueba de Turing desde su concepción en 1950. Las críticas van desde cuestionamientos filosóficos sobre la capacidad de las máquinas para mostrar propiedades emergentes, como la conciencia, hasta preocupaciones prácticas, como si el hecho de que una computadora sea indistinguible del comportamiento humano es de hecho una medida de inteligencia. A pesar de las preocupaciones sobre la prueba de Turing, proporciona una herramienta poderosa, simple, manejable y pragmática para evaluar la capacidad de una computadora para funcionar indistinguiblemente de un humano. Además, la prueba de Turing permite un examen amplio de las habilidades de las computadoras, sin limitar el examen a una sola área temática. James Moor, en su artículo de 1976 An Analysis of the Turing Test, enfatiza la fuerza de la prueba de Turing como una forma de hacer inferencias inductivas sobre si una máquina puede pensar (Moor, 1976). Moor escribió :» la prueba de Turing permite la prueba directa e indirecta de prácticamente todas las actividades que uno contaría como evidencia para pensar » (p. 251). Además, Moor afirma, «si se aprobara la prueba de Turing, entonces uno ciertamente tendría razones muy adecuadas para inferir inductivamente que la computadora podría pensar al nivel de un ser humano adulto, vivo y normal» (p. 251).

Los primeros programas de computadora para intentar pasar la prueba de Turing incluyen ELIZA (Weizenbaum, 1966) y PARRY (Colby, Hilf, Weber, & Kraemer, 1972). ELIZA proporcionó conversación en lenguaje natural inspeccionando la entrada escrita del examinador para buscar palabras clave. Cuando se encontró una palabra clave, se accedió a un depósito de reglas y se usó para transformar la entrada en una oración de respuesta. Estilísticamente, ELIZA fue modelada a partir de los comportamientos de un psicólogo rogeriano, centrado en la persona. El programa ELIZA fue capaz de convencer a algunos examinadores de que estaban interactuando con un humano y algunos afirman que ELIZA fue el primer programa en pasar la prueba de Turing. Un segundo programa digno de mención es PARRY, una versión programáticamente similar, aunque más avanzada, de ELIZA. PARRY fue modelado según el comportamiento de un esquizofrénico paranoico. Se empleó una adaptación de la prueba de Turing para evaluar PARRY, en la que psiquiatras experimentados evaluaron transcripciones de conversaciones con PARRY o con pacientes esquizofrénicos paranoides. De los 33 psiquiatras que adivinaron cuál era el humano, el 48% eran correctos, una porción consistente con adivinaciones aleatorias (Saygin, Cicekli, & Akman, 2003).

Aquí, seguimos los pasos de los primeros contemporáneos que se propusieron desarrollar tecnologías que pasaran las variaciones de la prueba de Turing. Específicamente, nuestro objetivo es responder a la pregunta de si las computadoras pueden proporcionar un tratamiento para el uso de sustancias de manera comparable al tratamiento administrado por un terapeuta. Como tal, la pregunta que se plantea aquí es si una computadora puede hacer lo que nosotros (como proveedores de tratamiento) podemos hacer. Nuestro objetivo es determinar si un tratamiento computarizado puede simular el tratamiento tradicional de manera que los resultados del tratamiento administrado por computadora sean indistinguibles del tratamiento cara a cara.

Un rendimiento exitoso de la prueba de Turing se puede dividir en dos criterios:

Criterio 1: El candidato informático puede lograr los mismos fines que el candidato humano (Empírico).

Criterio 2: El candidato informático es indistinguible del candidato humano, de modo que un examinador es incapaz de distinguir la diferencia (Intuitivo).

Hemos adaptado estos criterios históricamente valiosos para evaluar la pregunta crítica: ¿han cumplido, o incluso superado, los tratamientos administrados por computadora para el uso de sustancias? Los criterios adaptados, denominados Prueba de Tratamiento de Tecnología de Adicción (Budney, Marsch, & Bickel, 2014), son:

Criterio 1: La intervención informática hace lo que hacen las intervenciones cara a cara. Las capacidades de rendimiento coinciden (Empíricas).

Criterio 2: La intervención informática se experimenta de forma comparable a la intervención del terapeuta. Los pacientes no prefieren el uno al otro (Intuitivo).

Utilizando el marco de la prueba de Turing, proponemos evaluar estudios que comparen intervenciones administradas por terapeutas y por computadora. A través de la evaluación comparativa, nuestro objetivo es determinar si hemos llegado a un punto en el que los tratamientos computarizados para el uso de sustancias sean integradores y lo suficientemente avanzados como para cumplir con los estándares del tratamiento administrado por un terapeuta.



Deja una respuesta

Tu dirección de correo electrónico no será publicada.