第3回Watsonハッカソンの決勝大会を見てきた

6月29日にソフトバンクの本社で行われた、第3回Watsonハッカソンの決勝大会を見てきました。

ここのところWatsonの研究を続けているので、ハッカソンの決勝大会まで残るようなチームが、どのようなWatsonの使い方をしているのか、興味があったのです。
この間のWatson Summitも大人気のイベントになっていましたが、決勝大会の観覧者もとても多く、興味を持つ人が非常に多い技術なのだということが分かります。

決勝大会に残ったのは、システムリサーチ、セイノー情報サービス、インキュビット、富士フイルムICTソリューション、ジェイアール東日本企画の5社。最後の2社はPepperも併用した提案でした。

使用するAPI

Watsonにはさまざまなサービス(API)がありますが、このハッカソンでは基本的に日本IBMとソフトバンクによって日本語化された下記の6つのサービスを使うことになっているため、提案としてはバラエティに富んでいるもののWatsonの使い方という観点では似たようなものも多いように思いました。

  • NLC:自然言語認識
  • R&R:全文検索と人工知能を用いた並べ替え
  • Document Conversion:既存文書の変換
  • Dialog:対話
  • STT:音声をテキストに変換
  • TTS:テキストを音声に変換

この6つのサービスを組み合わせると、大体できあがるのは対話アプリです。
質問を音声で聞き取りSTTでテキストに変換→NLCで質問の意図を認識→R&Rで質問に対する回答を準備→TTSでテキストを音声に変換して回答という流れ。あとは、質問者とのやり取りをDialogで制御するかどうかといったところでしょう。

この6つのAPIでは言語しか扱えませんが、Visual Recognitionサービスを加えると画像も認識できるようになります。いくつかの会社が活用していました。

各社の提案

各社のプレゼンの時間は短く、ビジネス展開に関する内容も含める必要があるため、WatsonのどのAPIを使っているかを完全につかみ取るのは難しいのですが、おそらく、こんな感じだろうと思います。

システムリサーチ:罹災証明書発行システム

NLC:罹災状況を説明するテキストから緊急度などを分類
Visual Recognition:罹災した家屋等の画像から罹災の度合いを分類

セイノー情報サービス:スマート長距離運転パートナー

トラックの運転手との会話で、NLC、R&R、Dialogを活用

インキュビット:スマートビデオアド

STT:動画の音声をテキストに変換
NLC:テキストを分類し、その動画で何を喋っているかを認識
Visual Recognition:動画を静止画にした上で、何が映っているかを認識

富士フイルムICTソリューション:Pepperを活用したストレスチェック

NLC:Pepperとの会話からストレスチェック(ポジティブ、ネガティブの分類)
音声認識や表情解析をWatsonでやっているのか、Pepperの機能か、他の何かかは不明

ジェイアール東日本企画:Pepperと交通系ICカードを用いたスマートおもてなし

Insights for Twitter:Twitterから訪問地の近くに関するツイートを取得
NLC:ツイートをポジティブなもの、ネガティブなものに分類?
R&R:おすすめスポットなどの情報を取得?
音声認識や発声はPepperでやっていると思われる

Watsonの活用はアイディア+APIの組み合わせ

Watsonは人工知能系クラウドの中ではAPIがかなり充実していて、それを組み合わせるだけでアプリができる状態になっています。
逆に言えば、自分で機械学習のアルゴリズムを考えれば何でもできるというようなものではありません。
何でもできるわけではないけど、うまくハマった使い方を見つければアプリは超速でできるというのがWatsonの魅力だと思います。

つまり、Watsonの活用を考えることは、アイディアとAPIの組み合わせを考えることに等しいわけです。
自社が持つ市場、強み、アイディアに、WatsonのどのAPIを組み合わせれば、競争力を上げることができるか。また、Watsonにある豊富なAPIの何と何を組み合わせれば、自分の思うようなことができるか。
そうした、組み合わせの妙が重要なのです。

ハッカソンの次に必要なもの

蛇足ながら付け加えておくと、うまいAPIの組み合わせを見つけたとしても、真に能力を発揮させるためにはWatsonの学習プロセスが極めて重要です。どのような訓練データを準備すれば、思ったような回答を返してくれるようになるか。
また、初期学習だけでなく、システムが使われていく中での繰り返し学習し、日を追うごとに賢くなっていくような仕組みをどう作るかも重要です。

実は、Watson活用の難しさは、この学習プロセスにあるように思います。その辺のノウハウは、実際にやってみる、トライアンドエラーしてみることでしか得ることができません。

その辺のレベルまで話が進むと、次に必要なのはアイディア勝負のハッカソンよりは、勉強会とか、そういう地道なコミュニティなのかなという気がします。

この記事を書いた人

井上 研一

株式会社ビビンコ代表取締役、ITエンジニア/経済産業省推進資格ITコーディネータ。AI・IoTに強いITコーディネータとして活動。画像認識モデルを活用したアプリや、生成AIを業務に組み込むためのサービス「Gen2Go」の開発などを行っている。近著に「使ってわかった AWSのAI」、「ワトソンで体感する人工知能」。日本全国でセミナー・研修講師としての登壇も多数。