富士通研究所は2019年3月20日、コンタクトセンターにおける顧客とオペレーターの会話をAIにより分析することによって、通話中の応対トラブルの発生を9割以上の精度で検知する技術を開発したと発表した。同技術により、コンタクトセンターの管理者は、応対トラブルが発生した通話を途中でオペレーターから引き継ぐなどの支援を早期に行えるようになる。これにより、コンタクトセンター全体のオペレーター接続待ち時間を短縮できる。
コンタクトセンターでは、応対トラブルが発生した場合、該当する通話の通話時間が通常よりも長くなる。この結果、他の顧客はオペレーターに接続するまでの待ち時間が長くなってしまう。富士通研究所は今回、この問題を解決する施策として、応対トラブルの発生を検知する技術を開発した(図1)。応対トラブルが発生した通話を途中でオペレーターから引き継ぐといった対処ができるようになる。
拡大画像表示
実際のコンタクトセンターの会話データ(442通話分)を用いた評価実験において、顧客とオペレーターの同時発声などが含まれていても、通話中のトラブル発生に対して約91%と高い精度で検知できることを確認した。オペレーターの稼働率が高いコンタクトセンターに適用した場合を試算すると、顧客の待ち時間を平均で約2割短縮できるとしている。
今回開発した技術は、コンタクトセンター用の富士通のテレフォニー基盤に、応対トラブル検知機能として実装することを目指す。開発した技術の特徴は、大きく以下の2つがある。
1つは、応対トラブル発生の確からしさをスコア化することである。トラブルが発生した際の会話で多くなる傾向にある「~ではなく」や「分からない」などの否定的なキーワードを検出用のリストとして活用する。
さらに、「sou」(そう)や「naku」(なく)などの、音声言語の最小単位である音素の並びの傾向を認識する。顧客とオペレーターの同時発声時や言い澱みなどが原因で一部のキーワードが認識できない場合や、「そうではなく」や「そうじゃなく」といった多様な言い回しがある場合でも、トラブルの発生を検出できる。
トラブル発生の際に特有な否定的なキーワードの発声や、会話全体の声の高さや大きさなどから判断したストレス状態を、会話の一部の情報として検出し、事前に学習しておいたディープニューラルネットワークに入力する。これにより、トラブル発生の確からしさをスコアとして算出する。
2つめの特徴は、検知の精度を高める手法として、トラブル時の会話の特徴の時間変化パターンと、算出したスコアの軌跡を比べることである。トラブルが発生した際の会話に特有の時間変化パターンとして、トラブル時の会話の特徴が通話の冒頭から顕在化する傾向があるほか、全体の会話の中でも特徴が多くを占める傾向にある。
そこで、算出した応対トラブル発生の確からしさのスコアの軌跡が、これらの時間変化のパターンと近いかどうかでトラブル有無を判定する技術を開発した。これにより、スコアだけではある程度の長さの通話から算出しないと検知できない中で、パターンと照合することで通話開始から経過時間が短い通話途中であっても、応対トラブルの発生を高精度に検知できるようになる。