アドバンスト・メディアは2019年11月8日、AI音声認識を活用したクラウド型文字起こしサービス「ProVoXT(プロボクスト)」を強化し、新たにAPIをリリースしたと発表した。ProVoXTのAPIを利用した最初のサービスは、アンペールの音声会議システム「ADS」である。
アドバンスト・メディアの「ProVoXT」は、AI音声認識によって音声をテキスト化する、クラウド型文字起こしサービスである。文字起こし業務を半自動化できることから、文書作成の効率が向上する。
ProVoXTの特徴の1つは、用途に応じて音声認識エンジンを選べること。ビジネス用語に強いエンジン、幅広い業種の専門用語を認識するエンジン、英語を認識するエンジン、などを提供する。また、企業の需要に合わせて個別にエンジンをカスタマイズすることもできる。
サービス提供の背景について同社は、議事録作成を中心とした文字起こし業務は人手や時間など負担の大きさから、省力化が求められている状況を挙げる。「AI音声認識を活用すれば、従来の2~3倍のスピードで音声をテキスト化できる」(同社)。
今回、ProVoXTを強化し、ProVoXTの機能を外部アプリケーションから利用するためのAPIを公開した。これを利用して組み込むことで、音声認識による文字起こし機能を、自社の製品・サービスから利用できるようになる。
ProVoXTのAPIを利用した最初のアプリケーションが、アンペールの音声会議システム「ADS」である(図1)。会議をマイクで録音し始めると、録音した音声データを、指定した時間単位で、自動的にProVoXTにアップロードする。音声の誤認識は、編集アプリケーション(AmiVoice Rewriter)を利用して修正できる。