Turing-teszt
határok a számítástechnikában
a technológia elérhetősége olyan mértékben nőtt, hogy a hozzáférés növelésének lehetősége soha nem volt nagyobb. Például a Nemzetközi Távközlési Unió (ITU) arról számol be, hogy világszerte több mint hét milliárd mobiltelefon-előfizetést tartanak fenn, és a világ összes emberének csaknem fele használja az internetet (ITU, 2014). Tekintettel a technológia terjedelmére, a számítógépes kezelések széles körű alkalmazásának lehetősége jelenleg lehetséges.
például az IMBs Watson, amelyet eredetileg a számítási sebesség és pontosság határainak tesztelésére fejlesztettek ki a Jeopardy game show bajnokaival való versengéssel, a Sloan Kettering Memorial Cancer Center betegeinek kezelésében az orvosok kevésbé feltűnő, bár értelmesebb munkájához igazították. Watson felhőalapú számítástechnikai képességei lehetővé teszik a teljes orvosi feljegyzések szinte azonnali feldolgozását az orvosi kutatás teljes területeivel szemben, hogy a diagnózist és a kezelést az emberi elme kapacitását messze meghaladó módon tájékoztassák (Zauderer et al., 2014). Watson az egyik módja annak, hogy a technológia forradalmasítja a tudományt és az egészségügyet.
míg a jelenlegi technológia, mint az IBM Watson úgy tűnik, olyan kifinomult, hogy szinte hihetetlen, a kérdés, hogy a számítógépek valaha is eléri, vagy meghaladja, az emberek szintje felmerült sok évtizeddel ezelőtt. Alan Turing Computing Machinery and Intelligence című könyvében azt kérdezte: “tudnak-e a gépek gondolkodni?”Turing létrehozott egy értékelő gyakorlatot, a Turing-tesztet, hogy megvizsgálja, lehet-e egy számítógép elég intelligens ahhoz, hogy egy másik személy, aki kapcsolatba lép vele, azt higgye, hogy a számítógép ember (Turing, 1950).
ahhoz, hogy megtudjuk, a gépek valóban képesek-e gondolkodni, Turing rámutat, hogy először meg kell határoznunk a gépeket és meg kell határoznunk a gondolkodást. Ami hamar nyilvánvalóvá válik, az az, hogy Turing valójában azt kérdőjelezte meg, hogy a gépek, és a gépek alatt a számítógépekre gondolt-e, meg tudják-e tenni azt, amit mi (gondolkodó entitások) meg tudunk tenni. Itt Turing elválasztotta az emberek fizikai és intelligens aspektusait. Kérdése abban rejlik, hogy a számítógépek képesek-e olyan módon teljesíteni, hogy megkülönböztethetetlenek legyenek az emberi teljesítménytől. A Turing-teszt szükséges bérlője, hogy a számítógépnek nem kell úgy gondolkodnia, ahogy gondoljuk; inkább a számítógépnek szimulálnia kell az intelligenciát, hogy megkülönböztethetetlen legyen a saját intelligenciánktól (Harnad, 2006). Turing kihívása megteremtette a terepet a tudomány, a filozófia, a tudományos-fantasztikus filmek és regények nagyszerű alkotásainak, valamint egy folyamatosan fejlődő célnak, hogy a számítógépeket emberibbé tegyék.
A Computer Machinery and Intelligence-ben és annak közzétételét követően Turing a Turing-teszt számos változatát javasolja, amelyek fokozatosan fejlettebb eszközök annak értékelésére, hogy a számítógép képes-e emberhez hasonló módon reagálni. Először Turing állítja be a színpadot egy társasjáték bevezetésével, amelyet imitációs játéknak neveznek, ahol egy fiú és egy lány külön helyiségbe kerül. Egy harmadik személy, a vizsgáztató egy sor kérdést tesz fel, amelyekre a fiú és a lány írásban válaszol. A fiú és a lány úgy tesznek, mintha az ellenkező neműek lennének, és a vizsgáztató megpróbálja helyesen azonosítani a játékos nemét. A legegyszerűbb változatban Turing azt javasolja, hogy az egyik játékost számítógéppel helyettesítsék. Itt, a számítógép úgy tesz, mintha ember lenne, akárcsak a megmaradt emberi játékos. A vizsgáztató megpróbálja helyesen azonosítani az emberi játékost. Ebben a változatban, a számítógép átmegy a teszten, ha meggyőzi a vizsgáztatót, hogy tévesen azonosítsa emberként összehasonlítható sebességgel, mivel a vizsgáztató helytelenül azonosította a játékosokat helytelen nemként a játék előző verziójában. A Turing által 1952-ben leírt végleges változatban a vizsgáztatókból álló zsűri célja az emberi és számítógépes játékos meghatározása. A számítógép akkor tekinthető a tesztnek, ha a számítógépes program sikeresen meg tudja győzni az esküdtek jelentős részét arról, hogy ő az emberi játékos.
sokan fontolgatták és kritizálták a Turing-tesztet az 1950-es koncepciója óta. A kritikák a filozófiai dilemmáktól a gépek azon képességétől, hogy megjelenítsék a felmerülő tulajdonságokat, például a tudatot, a gyakorlati aggályokig terjednek, például ha a számítógép megkülönböztethetetlen az emberi viselkedéstől, valójában az intelligencia mértéke. A Turing-teszttel kapcsolatos aggodalmak ellenére hatékony, egyszerű, kezelhető és pragmatikus eszközt kínál a számítógép azon képességének értékelésére, hogy megkülönböztethetetlenül teljesít-e az embertől. Ezenkívül a Turing-teszt lehetővé teszi a számítógépek képességeinek széles körű vizsgálatát, nem korlátozva a vizsgálatot csak egy tárgyterületre. James Moor 1976-os cikkében a Turing-teszt elemzése hangsúlyozza a Turing-teszt erősségét, mint induktív következtetések levonásának módját arról, hogy egy gép képes-e gondolkodni (Moor, 1976). Moor azt írta:” a Turing-teszt lehetővé teszi gyakorlatilag az összes olyan tevékenység közvetlen és közvetett tesztelését, amelyet a gondolkodás bizonyítékának tekinthetünk ” (251. o.). Sőt, Moor kijelenti: “ha a Turing-tesztet átadnák, akkor minden bizonnyal nagyon megfelelő okok lennének arra, hogy induktív módon arra következtessünk, hogy a számítógép normális, élő, felnőtt ember szintjén gondolkodhat” (251. o.).
a Turing-tesztet megkísérlő korai számítógépes programok közé tartozik az ELIZA (Weizenbaum, 1966) és a PARRY (Colby, Hilf, Weber,& Kraemer, 1972). ELIZA természetes nyelvű beszélgetést folytatott azáltal, hogy megvizsgálta a vizsgáztató által beírt kulcsszavakat. Amikor egy kulcsszót találtak, a szabályok letéteményeséhez jutottak hozzá, és a bemenetet válaszmondattá alakították át. Stilisztikailag Elizát egy Rogerian viselkedése alapján modellezték, személyközpontú, pszichológus. Az ELIZA program képes volt meggyőzni néhány vizsgáztatót arról, hogy kapcsolatba lépnek egy emberrel, mások pedig azt állítják, hogy az ELIZA volt az első program, amely átment a Turing-teszten. A második figyelemre méltó program a PARRY, az ELIZA programozottan hasonló, de fejlettebb változata. PARRY-t egy paranoid skizofrén viselkedése alapján modellezték. A Turing-teszt adaptációját alkalmazták a PARRY értékelésére, ahol tapasztalt pszichiáterek értékelték a Parry-val vagy paranoid skizofrén betegekkel folytatott beszélgetések átiratait. A 33 pszichiáter közül, akik kitalálták, melyik az ember, 48% – uk helyes volt ,ez a rész véletlenszerű találgatásnak felel meg (Saygin, Cicekli, & Akman, 2003).
itt a korai kortársak nyomában követjük azokat a technológiákat, amelyek a Turing-teszt variációit teljesítették. Pontosabban, arra törekszünk, hogy megválaszoljuk azt a kérdést, hogy a számítógépek képesek-e az anyaghasználat kezelését a terapeuta által nyújtott kezeléshez képest. Mint ilyen, itt felmerül a kérdés, hogy egy számítógép képes-e megtenni azt, amit mi (mint kezelési szolgáltatók) tehetünk. Célunk annak meghatározása, hogy egy számítógépes kezelés képes-e szimulálni a hagyományos kezelést úgy, hogy a számítógéppel végzett kezelés eredményei megkülönböztethetetlenek a személyes kezeléstől.
a sikeres Turing-teszt két kritériumra bontható:
1.kritérium: a számítógépes jelölt ugyanazokat a célokat érheti el, mint az emberi jelölt (empirikus).
2. kritérium: a számítógépes jelölt nem különböztethető meg az emberi jelölttől, így a vizsgáztató nem tudja megmondani a különbséget (intuitív).
ezeket a történelmileg értékes kritériumokat adaptáltuk a kritikus kérdés felmérésére: a számítógéppel szállított szerhasználati kezelések teljesültek-e, vagy akár meghaladták-e a terapeuta által szállított kezeléseket? Az adaptált kritériumok, az úgynevezett Addiction Technology Treatment Test (Budney, Marsch, & Bickel, 2014), a következők:
1.kritérium: a számítógépes beavatkozás azt teszi, amit a személyes beavatkozások tesznek. A teljesítmény kapacitások megegyeznek (empirikus).
2. kritérium: a számítógépes beavatkozás összehasonlíthatóan tapasztalt, mint a terapeuta beavatkozás. A betegek nem kedvelik az egyiket a másikhoz (intuitív).
a Turing-teszt keretrendszerének felhasználásával olyan tanulmányok értékelését javasoljuk, amelyek összehasonlítják a terapeuta és a számítógép által végzett beavatkozásokat. Összehasonlító értékeléssel, célunk annak meghatározása, hogy elértünk-e egy olyan pontot, ahol a szerhasználat számítógépes kezelése integratív és elég fejlett ahhoz, hogy megfeleljen a terapeuta által nyújtott kezelés normáinak.