日立、雑音を含む複数話者の音声データをテキスト化するクラウドサービス

リスト

日立製作所は2018年10月16日、さまざまな業種における会議や商談などの会話音声をテキスト化するクラウドサービス「音声書き起こし支援サービス」を発表、同日販売を開始した。2018年10月31日から提供する。価格は、個別見積もり。

　音声書き起こし支援サービスは、会話音声データを音声認識によってテキスト化するとともに、テキスト化したデータを編集できるクラウドサービスである。現場の小規模な打ち合せから主要会議までの幅広い場面で、議事録などの記録作業を効率化できる。

図1：音声書き起こし支援サービスの概要（出典：日立製作所）
拡大画像表示

　特徴は、独自の音声認識技術として、雑音や反響音を除去して認識対象の音声のみを抽出する雑音除去技術と、複数方向からの音声を別々に認識する音源分離技術を活用していることである。雑音や複数話者の音声が含まれている音声データでも高精度にテキスト化できるとしている。

　従来、精度の高い音声認識を行うためには、話者それぞれにマイクを用意して録音する必要があった。これに対して日立製作所は、音源方向を特定する技術を組み込んだマイクを提供する。1つのマイクで録音した音声データから複数話者の音声を音源方向から識別し、話者ごとのコメントをテキスト化できる。

　また、一般のマイクやICレコーダー、スマートフォンで録音した音声ファイルも、クラウド上にアップロードすることによってテキスト化できる。さらに、ユーザー自身が固有名詞や専門用語などを登録できるため、業務に合わせて音声認識精度を高められる。

リスト

トピックス

[Sponsored]