次のユーザインタフェースはチャットである

現代はコンピュータに囲まれた時代であるというのは、まったくもって陳腐な言葉です。
ただ、私たちはコンピュータをどのように使っているか、その使い方がどのように変化しているかを考えることは、有益なことです。

現在の使い方(ユーザインタフェース)

私たちの周囲には、WindowsやMacといったPCはもちろん、スマートフォン、AppleWatchなどのスマートウォッチをはじめとするウェアラブルデバイスなどが溢れています。さらに、家電やスーパーのPOSレジ、駅の券売機など、コンピュータが搭載されたデバイスは数多あるわけです。まさにユビキタス(これもまた古い言葉ですが)です。

IBM PC 1981
IBM PC 1981 / Mike Licht, NotionsCapital.com

こうしたコンピュータを使うとき、私たちは基本的に画面を見て、キーボードか画面タッチでコマンドを入力します(画面をタッチすることもある意味でコマンド入力です)。「私がコンピュータを使って何をやりたいのか」を明確にして、それをコンピュータに指示するわけです。
これは、太古の昔のBASIC(パーソナルコンピュータのごく初期はBASICはプログラミング言語であると同時にコンピュータに指示を与えるインタフェースでもありました)やMS-DOSといったCUI、WindowsやMacなどのGUIを問わず、人間はコンピュータに直接的な指示を与える必要があったのです。

この常識は徐々に変化しています。人間の意図をくむコンピュータが登場しつつあります。

コグニティブ・コンピューティング

IBMのWatsonは自らをコグニティブ・コンピューティングと呼称しています。コグニティブとは認知という意味であり、人間の意図を認知するコンピューティングを標榜しています。
Watsonはたしかに人工知能かもしれませんが(IBMはWatsonは人工知能ではないと言っていますが)、その指向性は「この人(ユーザーたる人間)は何を言っているのだろう」、「何を求めているのだろう」という意図を認知することです。

A Computer Called Watson
A Computer Called Watson / Atomic Taco

Watsonの日本語版はソフトバンクが提供することになっています。IBMはWatsonをブランドに掲げた多くのサービスを提供しますが、その中で日本語化が特に必要であり、ソフトバンクが提供するのは、下記の5つに限られます。

  • Natural Language Classifier(NLC)
  • Retrieve and Rank(R&R)
  • Document Conversion
  • Speech to Text
  • Text to Speech

この5つのサービスを組み合わせて構築出来るものは、「ユーザー(人間)の発する言葉を理解(Speech to Text)」し、「その意図することを分類によって認知(NLC)」し、「求められた回答を見つけ出し(R&R)」、「声を発して返答する(Text to Speech)」ことです。(Document Conversionは既存の文書をR&Rに投入するための元データを生成するツールです。)

R&Rは、検索エンジン部(Retrieve)と検索結果のランキング部(Rank)から構成され、検索エンジン部はオープンソースの検索エンジンであるApache Solrそのものですから、Watsonとして特異なのはRankの方に限られます。
また、NLCとR&Rは必ずしもセットではありません。NLCで意図を分類して認知した後で、既存システムのワークフローを動かすことも出来るわけです。

ユーザインタフェースの変化

こうした技術の方向性は何を意味するのでしょうか。それは、ユーザインタフェースの変化です。
前述のように、いままでのユーザインタフェースは画面に向かってCUIもしくはGUIでコマンドを与えることでした。それが、人間の言葉そのものに置き換えられるということです。ふつうに会話すれば、コンピュータが働いてくれる時代になりつつあります。

Pepper at Opening Ceremony of the 28th Tokyo International Film Festival
Pepper at Opening Ceremony of the 28th Tokyo International Film Festival / Dick Thomas Johnson

人間の言葉をそのままやりとりするユーザインタフェースとは、どのようなものでしょうか。既存の仕組みでは2つあります。1つはiPhoneに搭載されているSiriや、Pepperに話しかけるように音声認識するもの。もう1つはLINEやFacebookメッセンジャーのようなチャットアプリです。チャットアプリも音声での会話(現時点では相手は人間ですが)に対応するので、人間の言葉が音声であろうが文字であろうが、その差はあまりありません。(WatsonでもSpeech to TextやText to Speechを介せば音声と文字は同列に扱うことが出来ます。)

マインドセットを変えるとき

Facebookがメッセンジャー部分を別アプリに分けたのはなぜでしょうか。なぜ、LINEがオープン化を目指すのでしょうか。なぜ、Slack(主にテクノロジー企業で活用が増えている企業向けチャットアプリ)が注目されるのでしょうか。

その答えは、チャットこそが次世代のユーザインタフェースだからです。ここに大きな可能性があると考えているから、積極的に投資されるわけです。

まだ未来の話と思うかもしれません。しかし、時代は確実に変わっています。私たちエンジニアや、ITをビジネスに活用しようとしている経営者の皆さんも、マインドセットを変えていく必要があるのは間違いありません。

コメントを残す