開発ツール/プラットフォーム 開発ツール/プラットフォーム記事一覧へ

[新製品・サービス]

マルチモーダルAI技術との連携で声や表情を認識した自然な応答が可能に─NTTレゾナントの「AI suite」

2021年11月10日(水)日川 佳三(IT Leaders編集部)

NTTレゾナントは2021年11月8日、AI機能API群「AI suite」の提供を開始した。テキスト情報のほか、音声・映像情報の解析を可能にするマルチモーダルAI技術などとの連携が行える。声や表情を認識した自然な受け答えを行うAIサービスの構築が可能になる。

 NTTレゾナントの「AI suite」は、テキスト情報のほか、音声・映像情報の解析を可能にするマルチモーダルAI技術などとの連携が行えるAPIサービスである。WebページやLINEなどのSNS、スマートフォンアプリへの組み込み、AR/VRとの連携といった形でAIサービスを構築することができる(図1)。

図1:テキスト情報や音声・映像情報を用いてユーザーに受け答えをするAI機能をWeb APIの形で提供する「AI suite」の概要(出典:NTTレゾナント)図1:テキスト情報や音声・映像情報を用いてユーザーに受け答えをするAI機能をWeb APIの形で提供する「AI suite」の概要(出典:NTTレゾナント)
拡大画像表示

 特徴は、テキスト、音声、映像など複数の入力情報を活用するマルチモーダルAI技術との連携に対応していること。NTTレゾナントのマルチモーダルAI技術は、同社の自然言語処理技術と、NTTコンピュータ&データサイエンス研究所の音声・映像認識技術を統合して開発したもの。テキストに加え、声の調子や表情、身振りなどの情報を基に、ユーザーの属性・感情・行動を予測し、ユーザー個々に合った自然な受け答えが行える。

 ユーザー企業は、AI suiteで提供されるAPI群を用いて、ユーザーの発話に対して、パターン化したルールベースの受け答えではない、人間らしい自然な受け答えを行うサービスを構築できる。「複数回の受け答えで会話の文脈を理解し、ユーザーの意図を踏まえながら的を射た応答を実現する」(同社)。また、会話から日時、場所、価格などの要素を抽出して、自動受付システムとデータ連携させるようなことも行える。

 AI suiteの主なユースケースを挙げている。1つは、顧客との音声会話で検索・予約・購入などを実行するAIである。顧客との音声会話を元にAIが検索・予約・購入などのアクションを代行するシステムを実現できる。

 例えば、顧客が「今から予約できるレストラン」を探していることをAIに伝えると、AIは好みのレストランの雰囲気や料理の系統・予約したい時間などの必要な情報をヒアリングし、おすすめの店の提案から予約までを一貫して実行する。さらに、AIは自動音声のような堅苦しさではなく、自然なやりとりから顧客の希望を正確に認識する。

 もう1つの例が、オンライン/メタバース上で接客するAIである。チャットボットをオンラインや3Dの仮想空間であるメタバース上で提供することで、親しみやすさと没入感のあるAI接客を実現する。顧客の行動履歴を学習することで、そのときどきの顧客の感情や状況を踏まえた提案などが行える。接客以外にも、社員のメンタル健康サポートや、コールセンターにおける人材トレーニングなどでも活用できる。

 サービス提供の背景としてNTTレゾナントは、Web会議やボイスチャットなど、音声や映像を主体とするコミュニケーションサービスが普及していることを挙げる。同社がこれまで取り組んできた自然言語処理AI技術はディープラーニング(深層学習)に基づくもので、音声・映像データの学習にも応用可能であることからAI suiteを開発したという。

関連キーワード

NTTレゾナント / API / 自然言語処理 / マルチモーダルAI / 自動応答 / コンタクトセンター / NTTコンピュータ&データサイエンス研究所 / ディープラーニング / メタバース

関連記事

Special

-PR-

マルチモーダルAI技術との連携で声や表情を認識した自然な応答が可能に─NTTレゾナントの「AI suite」NTTレゾナントは2021年11月8日、AI機能API群「AI suite」の提供を開始した。テキスト情報のほか、音声・映像情報の解析を可能にするマルチモーダルAI技術などとの連携が行える。声や表情を認識した自然な受け答えを行うAIサービスの構築が可能になる。

PAGE TOP