Turing-Test
Frontiers in Computer Science
Die Reichweite der Technologie ist so gewachsen, dass die Möglichkeit, den Zugang zu erhöhen, nie größer war. Zum Beispiel berichtet die International Telecommunications Union (ITU), dass weltweit mehr als sieben Milliarden Mobilfunkanschlüsse unterhalten werden und fast die Hälfte aller Menschen auf der Welt das Internet nutzt (ITU, 2014). Angesichts des Umfangs der Technologie ist derzeit die Möglichkeit einer weit verbreiteten Verwendung computergestützter Behandlungen möglich.
Zum Beispiel Watson IMBs, ursprünglich entwickelt, um die Grenzen der Rechengeschwindigkeit und Genauigkeit zu testen, indem sie gegen die Jeopardy Game Show Champions konkurrieren, wurde auf die weniger auffällig angepasst, wenn auch sinnvoller, Job Ärzte bei der Behandlung von Patienten am Sloan Kettering Memorial Cancer Center zu unterstützen. Die Cloud-basierten Computing-Fähigkeiten von Watson ermöglichen die nahezu sofortige Verarbeitung vollständiger medizinischer Aufzeichnungen, auf die in ganzen Bereichen der medizinischen Forschung verwiesen wird, um Diagnose und Behandlung auf eine Weise zu informieren, die weit über die Kapazität des menschlichen Geistes hinausgeht (Zauderer et al., 2014). Watson ist eine von vielen Möglichkeiten, wie Technologie Wissenschaft und Gesundheitswesen revolutioniert.Während aktuelle Technologien wie IBMs Watson so ausgereift erscheinen, dass sie fast unglaublich sind, wurde die Frage, ob Computer jemals das Niveau des Menschen erreichen oder übertreffen würden, vor vielen Jahrzehnten gestellt. In dem bahnbrechenden Artikel von Alan Turing, Computing Machinery and Intelligence, fragte er: „Können Maschinen denken?“ Turing prägte eine evaluative Übung, den Turing-Test, um zu untersuchen, ob ein Computer intelligent genug sein kann, dass eine andere Person, die mit ihm interagiert, glauben würde, dass der Computer ein Mensch ist (Turing, 1950).Um zu wissen, ob Maschinen tatsächlich denken können, weist Turing darauf hin, dass wir zuerst Maschinen definieren und Denken definieren müssen. Was schnell klar wird, ist, dass Turing wirklich in Frage stellte, ob Maschinen, und mit Maschinen meinte er Computer, das tun könnten, was wir (als denkende Wesen) tun können. Hier zog Turing eine Trennung zwischen den physischen und den intelligenten Aspekten des Menschen. Seine Frage ist, ob Computer in der Lage sind, so zu arbeiten, dass sie nicht von der menschlichen Leistung zu unterscheiden sind. Ein notwendiges Merkmal des Turing-Tests ist, dass der Computer nicht so denken muss, wie wir denken; Vielmehr muss der Computer Intelligenz simulieren, so dass sie nicht von unserer eigenen Intelligenz zu unterscheiden ist (Harnad, 2006). Turings Herausforderung bereitete die Bühne für großartige Werke in Wissenschaft, Philosophie, Science-Fiction-Filmen und Romanen und ein immer weiter fortschreitendes Ziel, Computer menschenähnlicher zu machen.In Computer Machinery and Intelligence und nach seiner Veröffentlichung schlägt Turing mehrere Variationen des Turing-Tests vor, die progressiv fortgeschrittenere Mittel sind, um zu bewerten, ob ein Computer auf menschenähnliche Weise reagieren kann. Zuerst bereitet Turing die Bühne, indem er ein Partyspiel vorstellt, das als Nachahmungsspiel bezeichnet wird, bei dem ein Junge und ein Mädchen in getrennte Räume gehen. Eine dritte Person, der Prüfer, stellt eine Reihe von Fragen, auf die der Junge und das Mädchen mit ihren schriftlichen Antworten antworten. Der Junge und das Mädchen geben beide vor, das andere Geschlecht zu sein, und der Prüfer versucht, das Geschlecht des Spielers korrekt zu identifizieren. In der einfachsten Variante schlägt Turing vor, einen der Spieler durch einen Computer zu ersetzen. Hier gibt der Computer vor, ein Mensch zu sein, ebenso wie der verbleibende menschliche Spieler. Der Prüfer versucht, den menschlichen Spieler korrekt zu identifizieren. In dieser Variante besteht der Computer den Test, wenn er den Prüfer davon überzeugt, ihn fälschlicherweise als den Menschen zu identifizieren, und zwar mit einer vergleichbaren Rate, da der Prüfer Spieler in der vorherigen Version des Spiels fälschlicherweise als das falsche Geschlecht identifiziert hat. In der endgültigen Version, die Turing 1952 beschrieb, zielt eine Jury von Prüfern darauf ab, den menschlichen und den Computerspieler zu bestimmen. Der Computer gilt als bestanden, wenn das Computerprogramm einen erheblichen Teil der Juroren erfolgreich davon überzeugen kann, dass es sich um den menschlichen Spieler handelt.
Viele haben den Turing-Test seit seiner Konzeption im Jahr 1950 in Betracht gezogen und kritisiert. Die Kritik reicht von philosophischen Dilemmata über die Fähigkeit von Maschinen, emergente Eigenschaften wie Bewusstsein anzuzeigen, bis hin zu praktischen Bedenken, beispielsweise ob die Ununterscheidbarkeit eines Computers vom menschlichen Verhalten tatsächlich ein Maß für Intelligenz ist. Trotz Bedenken hinsichtlich des Turing-Tests bietet er ein leistungsstarkes, einfaches, handliches und pragmatisches Werkzeug, um die Fähigkeit eines Computers zu bewerten, nicht von einem Menschen zu unterscheiden. Darüber hinaus ermöglicht der Turing-Test eine breite Untersuchung der Computerfähigkeiten, ohne die Prüfung auf nur ein Fachgebiet zu beschränken. James Moor betont in seiner Arbeit An Analysis of the Turing Test von 1976 die Stärke des Turing-Tests als eine Möglichkeit, induktive Rückschlüsse darauf zu ziehen, ob eine Maschine denken kann (Moor, 1976). Moor schrieb: „Der Turing-Test erlaubt direkte und indirekte Tests von praktisch allen Aktivitäten, die man als Beweis für das Denken betrachten würde“ (S. 251). Darüber hinaus stellt Moor fest: „Wenn der Turing-Test bestanden würde, hätte man sicherlich sehr gute Gründe, induktiv zu schließen, dass der Computer auf der Ebene eines normalen, lebenden, erwachsenen Menschen denken könnte“ (S. 251).Zu den frühen Computerprogrammen, die versuchen, den Turing-Test zu bestehen, gehören ELIZA (Weizenbaum, 1966) und PARRY (Colby, Hilf, Weber, & Kraemer, 1972). ELIZA sorgte für Konversation in natürlicher Sprache, indem sie typisierte Eingaben des Prüfers auf Schlüsselwörter untersuchte. Wenn ein Schlüsselwort gefunden wurde, wurde auf ein Regeldepot zugegriffen und die Eingabe in einen Antwortsatz umgewandelt. Stilistisch wurde ELIZA nach dem Verhalten eines rogerischen, personenzentrierten Psychologen modelliert. Das ELIZA-Programm konnte einige Prüfer davon überzeugen, dass sie mit einem Menschen interagierten, und einige behaupten, ELIZA sei das erste Programm gewesen, das den Turing-Test bestanden habe. Ein zweites bemerkenswertes Programm ist PARRY, eine programmatisch ähnliche, jedoch fortgeschrittenere Version von ELIZA. PARRY wurde nach dem Verhalten eines paranoiden Schizophrenen modelliert. Eine Anpassung des Turing-Tests wurde verwendet, um PARRY zu bewerten, wobei erfahrene Psychiater Transkripte von Gesprächen entweder mit PARRY oder mit paranoiden schizophrenen Patienten bewerteten. Von den 33 Psychiatern, die vermuteten, welcher der Mensch war, waren 48% richtig, ein Teil, der mit zufälligen Vermutungen übereinstimmte (Saygin, Cicekli, & Akman, 2003).
Hier treten wir in die Fußstapfen früher Zeitgenossen, die sich daran machten, Technologien zu entwickeln, die Variationen des Turing-Tests bestanden. Insbesondere wollen wir die Frage beantworten, ob Computer eine Behandlung für den Substanzgebrauch vergleichbar mit der von Therapeuten gelieferten Behandlung bieten können. Daher stellt sich hier die Frage, ob ein Computer das kann, was wir (als Behandlungsanbieter) können. Unser Ziel ist es festzustellen, ob eine computergestützte Behandlung die traditionelle Behandlung so simulieren kann, dass die Ergebnisse einer computergestützten Behandlung nicht von einer persönlichen Behandlung zu unterscheiden sind.
Eine erfolgreiche Turing-Testleistung kann in zwei Kriterien unterteilt werden:
Kriterium 1: Der Computerkandidat kann die gleichen Ziele erreichen wie der menschliche Kandidat (empirisch).Kriterium 2: Der Computerkandidat ist nicht vom menschlichen Kandidaten zu unterscheiden, so dass ein Prüfer den Unterschied nicht erkennen kann (intuitiv).
Wir haben diese historisch wertvollen Kriterien angepasst, um die kritische Frage zu beantworten: Haben computergestützte Behandlungen für den Substanzgebrauch die von Therapeuten gelieferten Behandlungen erfüllt oder sogar übertroffen? Die angepassten Kriterien, die als Suchttechnologie-Behandlungstest bezeichnet werden (Budney, Marsch, & Bickel, 2014), sind:
Kriterium 1: Die Computerintervention macht das, was persönliche Interventionen tun. Die Leistungsfähigkeit stimmt überein (empirisch).
Kriterium 2: Die Computerintervention wird vergleichbar erlebt wie die Intervention des Therapeuten. Patienten bevorzugen nicht das eine dem anderen (intuitiv).
Im Rahmen des Turing-Tests schlagen wir vor, Studien zu bewerten, die Therapeuten- und computergestützte Interventionen vergleichen. Durch vergleichende Bewertung, Wir wollen feststellen, ob wir einen Punkt erreicht haben, an dem computergestützte Behandlungen für den Substanzgebrauch integrativ und fortgeschritten genug sind, um die Standards der vom Therapeuten gelieferten Behandlung zu erfüllen.