音声操作UI普及への課題

画像:映画「アイアンマン」に登場するAIアシスタント「ジャービス」はVUI(Voice User Interface)で複雑な操作を行います。まるで友人と話すような自然な会話で操作を行う姿は未来的です。現状のVUIが「ジャービス」のような便利な存在になるための課題とはどのような課題があるのでしょうか。

 

VUIとは
VUI(Voice User Interface)は音声を使って機械やシステムを操作するインターフェイスを指します。人間が自然と行う発話を使うことで特殊な知識や操作が不要なため、老人や子供など機械の操作が不得意なユーザーにも使いやすいインターフェースを実現することができます。いままでは決められたフレーズのみ認識可能でしたが、認識エンジンの進歩で人間の自由な話し言葉も認識されるようになりました。

 

自動車とVUIの相性
認識エンジンの進歩により自然な言葉(自然言語)での入力も可能になったことで家電、住宅、スマートフォン、スマートスピーカーなど幅広い分野で広まっていますが、特に自動車との親和性は高いです。両手が塞がった運転中でも発話によるコントロールは容易で、視線を動かさずに操作できることで安全性が高まるなどの機能面はもちろんですが、多機能化で複雑化するHMIをより人に優しい使い勝手にするためのソリューションとしてVUIが期待されています。

画像:音声認識UIの利用場所
出典:statista 「Where People Use Voice Assistants」https://www.statista.com/chart/7841/where-people-use-voice-assistants/

 

メルセデスは早くから音声認識によるHMIのコントロールに力を入れており、ウェブサイトでのプロモーションでも音声認識を前面に押し出しています。一方で、話しかけるだけで使えるVUIの長所だけではなく克服すべき課題もあります。

画像)メルセデス A-Class
出典)メルセデス・ベンツジャパンhttps://www.mercedes-benz.co.jp/passengercars.html?group=all&subgroup=see-all&view=BODYTYPE

 

環境に影響される
現在の音声を使ったUIは環境の影響を大きく受けます。例えば地下鉄の中など大きな騒音の中では聞き取ることは難しいと思います。反対に図書館のような静かな空間では他人の迷惑を考慮して話しにくい状況です。また日本のユーザーにとって公共の場では恥ずかしさを感じるユーザーが多いようです。国民の文化面が影響しており、インドなどの国では懸念がほぼありません。

 

コンテンツを専用で作る必要性
クックパッドはAlexaを使って話しかけることでレシピを検索できるアプリを提供していますが、音声アプリ専用にレシピを作り直しています。なぜなら通常の文字や写真を主とするレシピのように画像や動画で視覚的に情報を伝えることができないため、ユーザーが必要とすべき情報の種類が異なるからです。

画像:レシピを音声操作アプリに適応させる場合にはプロセスを細かく区切ることが必要
出典:クックパッド開発者ブログ 「対話のデザインプロセス〜Amazon Echoのスキル開発〜」https://techlife.cookpad.com/entry/2017/11/22/alexa-skilldesign

 

一度に伝えることのできる情報の限界
引き続いてレシピアプリの例になりますが、肉料理を食べたいと検索して、10も20も候補となる肉料理のレシピを読み上げられたら最後まで聴くことも覚えておくこともできません。通常ユーザーが短期間に記憶できる音声による選択肢は3つ程度だと言われています。また1つの選択肢が長すぎることもスムーズな体験を阻害します。ユーザーが記憶できる数と長さを意識したシンプルな選択肢を提供する必要があります。

 

正確な入力が難しい
音声入力でパスワードなどの何桁もの数字を入力したり、何人分もの住所を入力したりすることには向いていません。正確性や複雑な情報は音声入力の苦手とすることです。また間違えた操作を行ったときのキャンセルや元に戻す操作がスムーズでなくてはユーザーが安心してVUIを使用できません。

 

同時に複数のタスクが難しい
音声では同時に1つの操作しかできません。例えばスマートフォンでカレンダーや地図を見ながら予約したいホテルを探すことは可能ですが、音声操作UIのみで操作は困難です。また、選択を短時間に大量に行わなければならないことも苦手です。例えば何十問もあるような「はい・いいえ」で答えるアンケートなどは読み上げの待ち時間と選択肢の入力でユーザーは疲れてしまうため、音声操作UIには向いていないタスクだと言えます。このような場合は音声以外の入力方法を選択する必要があります。

 

VUIの未来
「発話」という人間の自然な行為でプロダクトやサービスを操作できることは多くの人にメリットがあります。VUIの普及にはいくつもの課題がありますが、1つ1つを確実に克服しながらVUIの利点が活かせる用途から確実に広がっていくことになるでしょう。

画像:音声認識UIを搭載したスマートスピーカーは爆発的に普及
出典:statista 「Smart Speaker Adoption Continues to Rise」https://www.statista.com/chart/16597/smart-speaker-ownership-in-the-united-states/

関連記事一覧