開発ツール/プラットフォーム 開発ツール/プラットフォーム記事一覧へ

[新製品・サービス]

Web API型の音声認識エンジンに医療・製薬・金融に向けた特化版、アドバンスト・メディア

2020年4月2日(木)日川 佳三(IT Leaders編集部)

アドバンスト・メディアは2020年4月2日、音声認識エンジンの機能をソフトウェアに組み込むためのAPIをクラウド型で提供するサービス「AmiVoice Cloud Platform」を強化した。同日付で、領域特化型の音声認識エンジン3種を追加公開した。「汎用エンジン」に加えて、「医療汎用エンジン」、「業務報告_製薬エンジン」、「業務報告_金融エンジン」の3つを用意した。

 AmiVoice Cloud Platformは、Web APIの形で利用できる音声認識エンジンである(関連記事アドバンスト・メディア、Web API型の音声認識エンジン「AmiVoice Cloud Platform」を公開)。Web APIを呼び出すだけで利用できるため、アプリケーションに音声認識機能を簡単に組み込める。音声の文字化、音声対話、音声制御、音声翻訳など、音声を扱う各種の用途で利用できる。利用料は、発話している区間に限って1秒単位で課金する。無音やノイズなど、人の声がない区間は料金がかからない。

 用途に合わせて、リアルタイム認識API(WebSocketベースのAPI)と、バッチ認識API(HTTPベースのREST API)を用意している。リアルタイム認識APIは、HTML5でマイク音声を取得できるWebブラウザなどを使い、都度リアルタイムに音声データを文字化する用途に適する。一方、バッチ認識APIは、音声をまとめて一括処理して文字化する用途に適する。リアルタイム認識APIとバッチ認識APIともに、APIを利用するサンプルプログラムを公開している。

 今回、これまで提供してきた「汎用エンジン」に加えて、領域特化型の音声認識APIを用意した(図1)。「医療汎用エンジン」、「業務報告_製薬エンジン」、「業務報告_金融エンジン」、――の3つである。汎用エンジン同様に、ログ保存の有無を選択できる。また、リアルタイム認識とバッチ認識の両方の使い方ができる。また、それぞれのエンジンは、ユーザー自身で製品名や固有名詞などの単語を登録できる。

図1:AmiVoice 音声認識APIのイメージ(出典:アドバンスト・メディア)図1:AmiVoice 音声認識APIのイメージ(出典:アドバンスト・メディア)
拡大画像表示

 汎用エンジンは、幅広い用途で使える、汎用の音声認識エンジンである(表1)。現行版では、双方向型のディープラーニング技術「Bi-LSTM」を実装しており、自然発話を中心とした認識率を高めている(関連記事アドバンスト・メディア、双方向型ディープラーニング「Bi-LSTM」で音声認識を25%向上)。

表1:汎用エンジンの価格(税別)
従量課金
ログ保存あり 0.025円/秒
ログ保存なし 0.04円/秒

 今回追加した「医療汎用エンジン」は、一般的なビジネス用語に加え、病名・症状・薬品名などの医療用語をあらかじめ登録した、医療向けの音声認識エンジンである(表2)。「業務報告_製薬エンジン」は、日報や業務報告書の入力に向いており、一般的なビジネス用語に加えて製薬業界向けの用語を搭載している(表3)。「業務報告_金融エンジン」は、日報や業務報告書の入力に向いており、一般的なビジネス用語に加えて金融業界向けの用語を搭載している(表4)。

表2:医療汎用エンジンの価格(税別)
定額従量プラン 1時間/月 100時間/月 300時間/月 超過時の利用料金/従量課金
ログ保存あり 300円 3万円 9万円 0.125円/秒
ログ保存なし 480円 4万8000円 14万4000円 0.2円/秒
表3:業務報告_製薬エンジンの価格(税別)
定額従量プラン 1時間/月 100時間/月 300時間/月 超過時の利用料金/従量課金
ログ保存あり 600円 6万円 18万円 0.25円/秒
ログ保存なし 960円 9万6000円 28万8000円 0.4円/秒
表4:業務報告_金融エンジンの価格(税別)
定額従量プラン 1時間/月 100時間/月 300時間/月 超過時の利用料金/従量課金
ログ保存あり 600円 6万円 18万円 0.25円/秒
ログ保存なし 960円 9万6000円 28万8000円 0.4円/秒
関連キーワード

アドバンスト・メディア / 音声認識 / Web API

関連記事

Special

-PR-

Web API型の音声認識エンジンに医療・製薬・金融に向けた特化版、アドバンスト・メディアアドバンスト・メディアは2020年4月2日、音声認識エンジンの機能をソフトウェアに組み込むためのAPIをクラウド型で提供するサービス「AmiVoice Cloud Platform」を強化した。同日付で、領域特化型の音声認識エンジン3種を追加公開した。「汎用エンジン」に加えて、「医療汎用エンジン」、「業務報告_製薬エンジン」、「業務報告_金融エンジン」の3つを用意した。

PAGE TOP