インテリジェントな”音声”アシスタントの台頭(I.a.)

May29,2016·8min read

/div>1995年、2005年のアプリ、そして今、私たちは自然言語処理、機械学習、洗練された音声認識の進歩によって供給インテリジェントアシスタントの時代に入って

インテリジェントアシスタント(または単に、IA)は、個々のタスクやサービスを実行できるソフトウェアエージェントです。

たとえば、音声解釈と認識インターフェイス(一般的にシリに省略され、発音/ə s ə ri/)は、インテリジェントなパーソナルアシスタントと知識ナビゲータ、Apple Inc.の一部としのiOS、watchOS、およびtvOSオペレーティングシステム。私の最初のインテリジェントアシスタント:

iasは、スマートアドバイザーと呼ばれる消費者向けaiプログラミングの別のタイプと対比することができます。 スマートアドバイザプログラムは”主題指向”であり、IAsは”タスク指向”である。

今日のIAsは、人工知能、機械学習、音声認識技術でプログラムされており、データ入力から学習し、エンドユーザーのニーズを予測するのに役立ちます。 これらのIAsは、itが理解し、マルチステップの要求を実行し、そのようなホテルや飛行機の予約を行うなど、より複雑なタスクを実行することができ、

コンピューティングの歴史と認知の上昇

集計時代(パンチカードを使ってデータを入力して保存し、最終的には機械に何をすべきかを指示する単一目的の機械システム)の後、コンピュータがif/then論理演算とループを実行し、ソフトウェアでコード化された命令を実行するプログラミング時代が来た。 当初は真空管を中心に作られていたが、トランジスタとマイクロプロセッサの発明によって”ムーアの法則”を実証するようになった。

今日、我々はコンピューティングの歴史の新しい期間に入っている—認知コンピューティング時代

認知コンピューティング:人間の脳に触発されたコグニティブコンピューティング(CC)は、コンピュータ化されたモデルにおける人間の思考プロセスのシミュレーションです。 CCには、データマイニング、パターン認識、自然言語処理を使用して人間の脳の働きを模倣する自己学習システムが含まれます。

認知コンピューティングシステムは、次の表向きの特性を含むことができます。

  • 並列処理と連想記憶を含む人間の脳の強みをエミュレートします。
  • は、構造化データと非構造化データの自然言語処理を可能にします。
  • リアルタイムでビッグデータを理解/活用します。
  • は、機械学習を使用してコンテキストベースの仮説を開発します。
  • は、洗練されたパターン認識、ロボット制御、および感情的知性を示しています。

CCは、システムがどのように構築され、人間と対話するかについての基本的な理解を提供します。 IBMのWatsonなどの認知システムは、従来のシステムよりも知識を構築し、自然言語を学び、理解し、理性を持ち、人間とより自然に対話することができます。 彼らはまた、自信重み付けされた回答と証拠を支持してコンテンツを文脈に入れることができます。 彼らはすぐに新しいパターンと洞察力を識別することができます。 時間が経つにつれて、彼らは脳がどのように機能するかをさらに密接にシミュレートします。

認知コンピューティングはまた、人間の認知の限界を過ぎてプッシュし、より多くの情報に基づいた意思決定を可能にする、ビッグデータ間のドッ

私は、人間と機械の相互作用の大規模なパラダイムシフトをもたらしている自然言語処理と計算力の法則について以前に書きました。 ここでそれについての詳細を読みます。

グラフィカルユーザーインターフェイス(GUI)を持たないアプリケーションの爆発を目の当たりにしています。 彼らはしばらくの間、周りされてきたが、ごく最近主流に広がり始めました。 Facebook Messenger、plain SMS、Amazon Echoで実行できます。We Weat、Slack、facebook Messenger、またはAmazon Echoで実行できます。We Weat、wechat、Facebook Messenger、またはFacebook Messengerで実行できます。 これらのアプリケーションは、完全に人工知能(またはカーテンの後ろに人間)によって駆動されます。

これはすべて、

1のために可能になりました。 計算能力の減少コスト(ムーアの法則)。

2. データの可用性。

3. より良いアルゴリズム。

上記の要因の組み合わせは、まだ見られていないそのほとんどが、いくつかの消費者やビジネスに直面しているアプリケーションの成長につなが

Broad Categories of Intelligent Assistants

Intelligent Assistance landscape

Intelligent Assistants (IAs) are Growing, Albeit Slowly

Since June 2015, the IA players have started introducing new features, functions, and integrations at a profound speed.

明確に定義されたインターフェイスとオープンApiにより、今日のIAsは新しいタスクと機能を”スキル”に迅速かつ効率的に追加することができます。 たとえば、AmazonのEchoのIaであるAlexaは、電子書籍を声に出して読むことを超えて移動し、音楽を再生したり、ピザを注文したり、食料品を買い物したり、Uberを召喚したり、その他の100のタスクを実行できるようになりました。

明らかに開いていないAppleのSiriは、ユーザーがFacebookに投稿したり、近くのレストランでテーブルを予約したり、podcastを再生したり、予定を立てることができます。 Googleのホームでは、音楽を再生したり、天気や交通状況を伝えたり、回答を出したり、カレンダーやホテルの予約を管理したりすることができます。 Facebookのメッセージベースの”M”は、衣料品店や新しいファッションをお勧めし、お友達とこのすべてを共有することができ、Microsoftのコルタナは、計画の目的のため

さらに東に、中国では、BaiduのDuerは、推奨事項を提供し、オンライン購入を行い、レストランの予約を行い、映画のチケットを購入し、他の多くのオプションの中でフライトを予約することができる音声活性化アシスタントです。

一般の人々が自分の言葉を使って機械とのコミュニケーションをより快適にすると、彼らの需要は成長するはずです。

“未来を見て、次の大きなステップは、”デバイス”の概念そのものが消えていくことです。 時間が経つにつれて、コンピュータ自体—そのフォームファクタが何であれ—あなたの一日を通してあなたを助けるインテリ 私たちは、モバイルファーストからAIの最初の世界に移動します。”

-GoogleのCEO、サンダーピチャイ

現在-インテリジェントアシスタント

マークザッカーバーグは一つを構築しています; トニー-スタークはジャービスを持ってる

ほとんどすべてのハイテク企業は、現在、インテリジェントアシスタント空間に数千万ドルを投資しています。 本番環境とライブ環境でのIAの良い例をいくつか示します。

●Amazon Echo

●Jibo—まだリリースされて

● Google Home

● Apple Siri

● Facebook’s M

● Viv — Unlike Siri, Viv is an open system and will be launched by year end.P>●Baidu—Duer

●VoiceBoxテクノロジー

—次のパラダイムにクロスオーバー

私たちは進化の旅の始まりにいます。 声主導の助手の新しい波は最終的に科学者および消費者がそう長い間保持した夢を具体化する-“合法的に意味を理解し、意図で提供する—自然に話され時間が経つにつれて、私は本当に会話とトランザクションであるIAを見ることを期待しています。 彼らの理解は、機械学習と、支払いの好み、お気に入りのブランド、感情状態、過去の活動などの”個人的な”情報の摂取によって洗練され、応答を通知し、タス

もちろん、このia nirvanaは完全に実現するにはさらに数年かかるかもしれませんが、私たちはほぼ毎日、マシンが私たち自身のゲームで人間を上回ってい たとえば、最近2016年3月に、GoogleのDeepMindは伝説の囲碁プレーヤー Lee Se-dolを4:1で破りました。 それはちょうど数日前に不可能な成果だったでしょう。 今、技術はここにあり、その製品化されたバージョンは地平線上にあります。

裁判の”発見”段階のために巨大なファイルをslogするために使用される弁護士は、”ロス”にそれを裏返すことができます。

“エイミー”と呼ばれるインテリジェントなアシスタントは、電子メールを介して、自律的に会議を設定することができ、Gmailは受信メールに適切な応答を書

だから、”成熟した洗練された”知能アシスタントのパラダイムを提供するためには何が必要ですか?

世界的に大量採用と規模を見つけるための普遍的なI.A.製品は、次の特性を持つ必要があります。

  1. 唯一の”一つの”アシスタント—私が求めるすべ

2. 私のためにパーソナライズ—私の好みや情報、例えば食べ物の好み、旅行計画などについて学習します。

3. ユビキタス—この目に見えないアシスタントは、私が対話するすべてのデバイスにあるはずです。

4. 銀行、レストランの予約、食品の配達、旅行、食料品の買い物、タクシーの予約、ニュース、スポーツなど—重要なサービスのために/によって供給オープンプラットフォーム

“ユビキタス”とすべてにインテリジェントなインターフェイスを構築

私たちは、マシンとの関係に関して新しい時代に入っています。 コンピュータは私達の日常生活に統合され、最終的に私達が約気遣う事の多数について私達がするより多くを知っている。いずれにせよ、2016年は人工知能とそのビジネスと社会への潜在的な影響についての議論のための画期的な年です。

高度な音声技術はすぐにユビキタスとシームレスに私たちの日常生活に統合されます。 音声は、ユーザーが日々の生活について行くように、警報システム、ライト、キッチン家電、サウンドシステムなどと通信するための自然な手段を提供し、接続された家のための主要なインターフェイスになります。

すべてのタスクを完了する準備ができて、あなたの周りの”すべての強力なアシスタント”24/7を持っていた場合、あなたがどのように生産的であこのI.a.ビジョンが完全に実現されるには、さらに数年かかるかもしれません。

その時までに、物事のインターネット上のすべての”もの”は、私たちが言うことを理解することができます。 スマートフォン、タブレット、Pc(または私たちの車、テレビ、そして私たちのキッチンやファミリールームで彼らの場所を取っているそれらの”円筒形のスピーカー”)を超えた”目に見えないユビキタスなアシスタント”との会話を続けるように、私たち自身は、完全に快適になります。

テクノロジーとユーザーの採用が進むにつれて、生産性、学習、商取引、取引において、これらの”エージェント”のための何千ものユースケースが出現します。 開発者やサービスプロバイダーにとって、これらのIAプラットフォームは、コンテンツ、コマース、サービスを提供するための次の主要な市場

このすべては少しsfに聞こえるかもしれませんが、私の言葉をマークし、ある日、私たちの子供たちは尋ねるでしょう、

“あなたはどのように”助手”なしで育ったのですか?”

それまでは、人間の能力を増強する強力な認知技術のこの魅惑的な世界に”脳ショット”と深いダイビングを取ります。 人間と機械がどのように新しい理解の時代を築いているかを学びます。

いというこんにちはる。!.



コメントを残す

メールアドレスが公開されることはありません。