エーアイは2017年8月1日、音声合成エンジンの新版「AITalk4.1」を発表した。新版では、関西弁風話者「みやび」と「やまと」を追加したほか、標準話者「れいな」に怒りと悲しみの新感情を追加した。また、ナレーション作成ソフト「AITalk声の職人 パッケージ版」の新機能として、効果音などの外部音声を挿入できるようにした。
AITalkは、音声合成エンジンソフトである。テキストデータを音声で発音させられる。特徴の1つは、コーパスベースの音声合成方式を採用したこと。機械音や音節ごとの合成ではなく、人の声を大量に録音したデータベースを使って、これを合成する。音のつながりのある自然な音声を合成できる。
言語の種類は36種類以上。日本語話者は、標準語が15人で関西風が2人。標準語を話す15人のうちの4人は、通常の会話に加えて喜びなどの感情を表現できる(男性の「たいち」は喜びの感情を、女性の「のぞみ」「まき」「れいな」の3人は喜び、怒り、悲しみの感情を表現できる)。
今回のマイナーバージョンアップでは、これまでβ版として提供してきた関西風の日本語話者2人(女性の「みやび」と、男性の「やまと」)を正式版とした。さらに、標準話者「れいな」の感情表現を増やし、従来の喜びの感情に加えて、怒りと悲しみの感情を使えるようにした。
提供形態は、アプリケーションに組み込むためのライブラリ「AITalk4 SDK」、Web API(REST API)経由でアプリケーションとデータ連携できるサーバーソフト型の「AITalk4 Server」、ナレーションの音声ファイル(WAF形式)を生成するパッケージソフト「AITalk4 声の職人」などがある。ライブラリを組み込むアプリケーションの開発言語はC/C++で、Windows(Visual Studio)およびLinux環境で利用できる。
価格(税別)は、AITalk4 声の職人が、買取型の場合に90万円、年間ライセンスの場合に初年度59万6000円、次年度以降が9万6000円。AITalk4 SDKとAITalk4 Serverは、基本料が50万円で、必須となる保守費用が年額9万6000円。エンジンを自社製品に組み込む場合は、別途ロイヤリティがかかる(応相談)。