チューリングテスト

コンピュータサイエンスのフロンティア

技術の到達範囲は、アクセスを増やす機会が決して大きくならないように成長してきました。 例えば、国際電気通信連合(ITU)は、70億以上の携帯電話加入権が世界中で維持されており、世界のすべての人々のほぼ半数がインターネットを使用していると 技術の範囲を考えると、コンピュータ化された治療法の広範な使用の機会は現在可能である。

例えば、IMBs Watsonは、もともとJeopardy game show championsと競合することにより、計算速度と精度の限界をテストするために開発されましたが、Sloan Kettering Memorial Cancer Centerの患者の治療に医師を支援する、より意味のある仕事ではあるが、派手ではないにもかかわらず、より派手ではない仕事に適応されています。 ワトソンのクラウドベースのコンピューティング能力は、人間の心の能力をはるかに超えた方法で診断と治療を知らせるために、医学研究の全分野に対, 2014). ワトソンは、技術が科学と医療に革命をもたらしている多くの方法の一つです。

IBMのワトソンのような現在の技術は、ほぼ信じられないほど洗練されているように見えますが、コンピュータが人間のレベルに達するか、超えるか Alan Turingによる独創的な論文で、Computing Machinery and Intelligence、彼は「機械は考えることができますか?”チューリングは、コンピュータがそれと相互作用する他の人がコンピュータが人間であると信じるほど十分に知的であるかどうかを調べるために、評価的な練習、チューリングテストを造語した(チューリング、1950)。機械が実際に考えることができるかどうかを知るためには、チューリングは最初に機械を定義し、思考を定義する必要があると指摘しています。 すぐに明らかになるのは、チューリングが本当に疑問を呈したのは、機械によって、そして機械によって、彼はコンピュータを意味し、私たち(思考実体として) ここでは、チューリングは人間の物理的側面と知的側面の間の分離を描いた。 彼の質問は、コンピュータが人間のパフォーマンスと区別できないような方法で実行できるかどうかにあります。 チューリングテストの必要なテナントは、コンピュータが私たちが考えるように考える必要はないということです。 チューリングの挑戦は、科学、哲学、sf映画や小説の偉大な作品の舞台を設定し、コンピュータをより人間のようにするための絶え間ない進歩の目標を設定しました。

コンピュータ機械と知性では、チューリングは、コンピュータが人間のような方法で応答することができるかどうかを評価するための漸進的に、より高度な手段であるチューリングテストのいくつかのバリエーションを提案しています。 まず、チューリングは、男の子と女の子が別々の部屋に入る模倣ゲームと呼ばれるパーティーゲームを導入することによって段階を設定します。 第三者、審査官は、少年と少女がタイプ書かれた答えで応答する一連の質問をします。 男の子と女の子の両方が異性のふりをし、審査官はプレイヤーの性別を正しく識別しようとします。 最も単純なバリエーションでは、チューリングはプレイヤーの一人をコンピュータに置き換えることを提案している。 ここでは、コンピュータは、残りの人間のプレイヤーがそうであるように、人間のふりをします。 審査官は、人間のプレイヤーを正しく識別しようとします。 このバリエーションでは、コンピュータは、審査官が以前のバージョンのゲームで誤った性別としてプレイヤーを誤って識別したのと同等の速度で、それを 1952年にチューリングによって記述された最終版では、審査官の陪審員は、人間とコンピュータのプレーヤーを決定することを目指しています。 コンピュータは、コンピュータプログラムが正常にそれが人間のプレーヤーであることを陪審員のかなりの部分を説得することができれば、テストに合格チューリングテストは1950年の概念以来、多くの人が検討し、批判してきました。

批判は、コンピュータが人間の行動と区別できないかのような実用的な懸念に、意識のような創発的な特性を表示する能力に関する哲学的な困惑から、実際には知性の尺度であるかのようなものである。 チューリングテストについての懸念にもかかわらず、それは人間と区別がつかないほど実行するコンピュータの能力を評価するための、強力でシンプルで扱いやすく、実用的なツールを提供します。 さらに、チューリングテストは、コンピュータの能力の広範な検査を可能にし、検査を一つの主題領域のみに限定することはできません。 James Moorは、1976年の論文An Analysis of The Turing Testで、機械が考えることができるかどうかについて帰納的推論を行う方法として、Turing testの強さを強調しています(Moor、1976)。 ムーアは、”チューリングテストは、思考の証拠として数えられる事実上すべての活動の直接的および間接的なテストを可能にする”(p.251)と書いている。 さらに、ムーアは、”チューリングテストが合格した場合、コンピュータが正常で生きている大人の人間のレベルで考えることができると帰納的に推論するための非常に十分な根拠があるだろう”(p.251)と述べている。チューリングテストに合格しようとする初期のコンピュータプログラムには、ELIZA(Weizenbaum,1966)とPARRY(Colby,Hilf,Weber,&Kraemer,1972)が含まれます。 ELIZAは、審査官からの入力された入力を調べてキーワードを調べることによって自然言語会話を提供しました。 キーワードが見つかったとき、ルールの保管場所にアクセスし、入力を返信文に変換するために使用されました。 文体的に、イライザはRogerianの、人中心の、心理学者の行動の後で模倣された。 ELIZAプログラムは、彼らが人間と対話していたことをいくつかの審査官を説得することができ、いくつかの主張ELIZAはチューリングテストに合格した最初のプ 第二の注目すべきプログラムは、PARRY、プログラム的に似ていますが、より高度なバージョンのELIZAです。 パリーは、偏執的な統合失調症の行動をモデルにしていました。 チューリングテストの適応は、経験豊富な精神科医がパリーまたは妄想統合失調症患者との会話の転写産物を評価したパリーを評価するために用いられた。 どちらが人間であるかを推測した33人の精神科医のうち、48%が正しく、ランダムな推測と一致していた(Saygin,Cicekli,&Akman,2003)。

ここでは、チューリングテストのバリエーションに合格した技術を開発するために着手した初期の同時代の足跡をたどります。 具体的には、コンピュータがセラピストが提供する治療と比較して物質使用の治療を提供できるかどうかの問題に答えることを目指しています。 このように、ここで提起された質問は、コンピュータが(治療提供者として)私たちができることを行うことができるかどうかです。 私たちの目標は、コンピュータ化された治療は、コンピュータ配信治療の結果は、対面治療と区別できないように、伝統的な治療をシミュレートすることがで

成功したチューリングテストの性能は、二つの基準に分けることができます:

基準1:コンピュータの候補者は、人間の候補(経験的)と同じ目的を達成

基準2:コンピュータの候補者は、審査官が違いを見分けることができないように、人間の候補者と区別できません(直感的)。

私たちは、これらの歴史的に貴重な基準を適用して、重要な質問を評価しました:物質使用のためのコンピュータ配信治療が満たされている、ま 依存症技術治療テストと呼ばれる適応基準(Budney、Marsch、&Bickel、2014)は、次のとおりです。

基準1:コンピュータ介入は、対面介入が行うことを行います。 パフォーマンス能力は一致します(経験的)。

基準2:コンピュータの介入は、セラピストの介入として比較的経験されています。 患者は一方を他方に好まない(直感的)。チューリングテストの枠組みを使用して、我々はセラピスト配信とコンピュータ配信介入を比較する研究を評価することを提案します。

比較評価を通じて、物質使用のためのコンピュータ化された治療が統合的であり、セラピストが提供する治療の基準を満たすのに十分に進んでいる



コメントを残す

メールアドレスが公開されることはありません。