Test de Turing
Frontières de l’informatique
La portée de la technologie a augmenté de telle sorte que la possibilité d’accroître l’accès n’a jamais été aussi grande. Par exemple, l’Union internationale des télécommunications (IT) indique que plus de sept milliards d’abonnements aux téléphones mobiles et cellulaires sont maintenus dans le monde et que près de la moitié de la population mondiale utilise Internet (IT, 2014). Compte tenu de l’étendue de la technologie, la possibilité d’une utilisation généralisée des traitements informatisés est actuellement possible.
Par exemple, IMBs Watson, développé à l’origine pour tester les limites de la vitesse et de la précision du calcul en affrontant les champions du jeu télévisé Jeopardy, a été adapté au travail moins flashy, bien que plus significatif, d’aider les médecins dans le traitement des patients au Sloan Kettering Memorial Cancer Center. Les capacités informatiques basées sur le cloud de Watson permettent un traitement quasi instantané de dossiers médicaux complets référencés dans des domaines entiers de la recherche médicale pour éclairer le diagnostic et le traitement de manière bien au-delà de la capacité de l’esprit humain (Zauderer et al., 2014). Watson est l’une des nombreuses façons dont la technologie révolutionne la science et les soins de santé.
Alors que la technologie actuelle telle que Watson d’IBM semble si sophistiquée qu’elle est presque incroyable, la question de savoir si les ordinateurs atteindraient ou dépasseraient un jour le niveau des humains a été posée il y a plusieurs décennies. Dans l’article fondateur d’Alan Turing, Computing Machinery and Intelligence, il s’interrogeait: « les machines peuvent-elles penser? »Turing a inventé un exercice d’évaluation, le test de Turing, pour examiner si un ordinateur peut être suffisamment intelligent pour qu’une autre personne interagissant avec lui croie que l’ordinateur est un humain (Turing, 1950).
Pour savoir si les machines peuvent effectivement penser, Turing souligne qu’il faut d’abord définir les machines et définir la pensée. Ce qui devient rapidement évident, c’est que ce que Turing a vraiment questionné, c’est si les machines, et par machines, il voulait dire les ordinateurs, pouvaient faire ce que nous (en tant qu’entités pensantes) pouvons faire. Turing établit ici une séparation entre l’aspect physique et l’aspect intelligent de l’être humain. Sa question consiste à savoir si les ordinateurs sont capables de fonctionner de telle sorte qu’ils ne peuvent pas être distingués des performances humaines. Un locataire nécessaire du test de Turing est que l’ordinateur n’a pas à penser comme nous le pensons; il doit plutôt simuler l’intelligence pour qu’elle soit indiscernable de notre propre intelligence (Harnad, 2006). Le défi de Turing a ouvert la voie à de grandes œuvres dans les domaines de la science, de la philosophie, des films et des romans de science-fiction, ainsi qu’à un objectif toujours plus avancé visant à rendre les ordinateurs plus humains.
Dans Computer Machinery and Intelligence et à la suite de sa publication, Turing propose plusieurs variantes du test de Turing qui sont des moyens de plus en plus avancés pour évaluer si un ordinateur peut réagir de manière humaine. Tout d’abord, Turing prépare le terrain en introduisant un jeu de société, appelé le Jeu d’imitation, dans lequel un garçon et une fille vont dans des pièces séparées. Une troisième personne, l’examinateur, pose une série de questions auxquelles le garçon et la fille répondent par des réponses écrites de type. Le garçon et la fille prétendent tous deux être du sexe opposé et l’examinateur essaie d’identifier correctement le sexe du joueur. Dans la variante la plus simple, Turing propose de remplacer l’un des lecteurs par un ordinateur. Ici, l’ordinateur prétend être humain, tout comme le joueur humain restant. L’examinateur essaie d’identifier correctement le joueur humain. Dans cette variante, l’ordinateur réussit le test s’il convainc l’examinateur de l’identifier incorrectement comme l’humain à un taux comparable à celui des joueurs incorrectement identifiés par l’examinateur comme le sexe incorrect dans la version précédente du jeu. Dans la version finale décrite par Turing en 1952, un jury d’examinateurs vise à déterminer le joueur humain et informatique. L’ordinateur est réputé réussir le test si le programme informatique parvient à convaincre une partie importante des jurés qu’il s’agit du joueur humain.
Beaucoup ont considéré et critiqué le test de Turing depuis sa conception en 1950. Les critiques vont des dilemmes philosophiques sur la capacité des machines à afficher des propriétés émergentes, telles que la conscience, aux préoccupations pratiques, telles que si le fait qu’un ordinateur soit indiscernable du comportement humain est en fait une mesure de l’intelligence. Malgré les préoccupations concernant le test de Turing, il fournit un outil puissant, simple, traçable et pragmatique pour évaluer la capacité d’un ordinateur à fonctionner de manière indiscernable par rapport à un humain. De plus, le test de Turing permet un examen approfondi des capacités informatiques, sans limiter l’examen à un seul domaine. James Moor, dans son article de 1976 An Analysis of the Turing Test, souligne la force du test de Turing comme un moyen de faire des déductions inductives pour savoir si une machine peut penser (Moor, 1976). Moor a écrit: « le test de Turing permet de tester directement et indirectement pratiquement toutes les activités que l’on compterait comme preuve de la pensée” (p. 251). De plus, déclare Moor, « si le test de Turing était réussi, alors on aurait certainement des motifs très adéquats pour déduire de manière inductive que l’ordinateur pourrait penser au niveau d’un être humain adulte vivant et normal” (p. 251).
Les premiers programmes informatiques pour tenter de réussir le test de Turing incluent ELIZA (Weizenbaum, 1966) et PARRY (Colby, Hilf, Weber, &Kraemer, 1972). ELIZA a fourni une conversation en langage naturel en inspectant les entrées dactylographiées de l’examinateur pour les mots clés. Lorsqu’un mot-clé était trouvé, un dépositaire de règles était accessible et utilisé pour transformer l’entrée en une phrase de réponse. Stylistiquement, ELIZA a été calquée sur les comportements d’un psychologue rogérien, centré sur la personne. Le programme ELIZA a réussi à convaincre certains examinateurs qu’ils interagissaient avec un humain et certains prétendent qu’ELIZA a été le premier programme à réussir le test de Turing. Un deuxième programme remarquable est PARRY, une version d’ELIZA similaire au programme, mais plus avancée. PARRY a été calqué sur le comportement d’un schizophrène paranoïaque. Une adaptation du test de Turing a été utilisée pour évaluer PARRY dans lequel des psychiatres expérimentés ont évalué les transcriptions de conversations avec PARRY ou avec des patients schizophrènes paranoïaques. Sur les 33 psychiatres qui ont deviné quel était l’humain, 48% étaient corrects, une partie compatible avec des devinettes aléatoires (Saygin, Cicekli, & Akman, 2003).
Ici, nous suivons les traces des premiers contemporains qui ont entrepris de développer des technologies qui ont réussi les variations du test de Turing. Plus précisément, nous visons à répondre à la question de savoir si les ordinateurs peuvent fournir un traitement de la consommation de substances comparable à celui du traitement fourni par un thérapeute. En tant que tel, la question posée ici est de savoir si un ordinateur peut faire ce que nous (en tant que fournisseurs de traitement) pouvons faire. Notre objectif est de déterminer si un traitement informatisé peut simuler un traitement traditionnel de sorte que les résultats du traitement par ordinateur ne soient pas distinguables du traitement en face à face.
Une performance de test de Turing réussie peut être divisée en deux critères:
Critère 1: Le candidat informatique peut atteindre les mêmes objectifs que le candidat humain (empirique).
Critère 2: Le candidat informatique est indiscernable du candidat humain, de sorte qu’un examinateur est incapable de faire la différence (intuitif).
Nous avons adapté ces critères historiquement précieux pour évaluer la question critique: les traitements fournis par ordinateur pour la consommation de substances ont-ils atteint, voire dépassé, les traitements fournis par les thérapeutes? Les critères adaptés, appelés Test de traitement de la technologie de la toxicomanie (Budney, Marsch, &Bickel, 2014), sont les suivants:
Critère 1: L’intervention informatique fait ce que font les interventions en face à face. Les capacités de performance correspondent (empiriques).
Critère 2 : L’intervention informatique est comparativement vécue comme l’intervention du thérapeute. Les patients ne préfèrent pas l’un à l’autre (intuitif).
En utilisant le cadre du test de Turing, nous proposons d’évaluer des études qui comparent les interventions délivrées par un thérapeute et par ordinateur. Grâce à une évaluation comparative, nous visons à déterminer si nous sommes arrivés à un point où les traitements informatisés pour la consommation de substances sont intégratifs et suffisamment avancés pour répondre aux normes des traitements fournis par un thérapeute.