[新製品・サービス]
「exaBase 生成AI」が音声ファイルに対応、録音データを取り込んで議事録を生成
2025年1月27日(月)日川 佳三(IT Leaders編集部)
エクサウィザーズと同社子会社のExa Enterprise AIは2025年1月27日、生成AIサービス「exaBase 生成AI」に、音声ファイルをテキストに変換する機能を追加したと発表した。「Gemini 1.5 Pro/Flash」の選択時に、顧客との面談や会議を録音したファイルをアップロードすると、AIが議事録や報告書を作成する。音声データを国外に出したくない企業でも利用できるように、同機能を日本国内リージョンのみで提供する。
Exa Enterprise AIの「exaBase 生成AI」は、法人向けの生成AIサービスである。Azure OpenAI ServiceのChatGPT/GPT各エディションのほか、複数の生成AI/大規模言語モデル(LLM)から用途に合ったものを選択して利用可能である(関連記事:「exaBase 生成AI」で複数のLLMを選択可能に、LLM間のプロンプト移行技術を提供予定)。
企業での利用を前提に機能強化を図っている。利用にあたって入力データが学習に利用されることはなく、入力を禁止するワードも登録可能である。運用面では、全社での利用状況を日次でモニタリング可能なほか、ユーザー単位で利用動向やチャット履歴を確認できる。予算の上限設定やSSO連携、ユーザーの一括登録の機能を備えている。
社内規則マニュアルや顧客提案資料など、社内の文書ファイル(PDF、CSV、テキスト、Excel/Word)の検索結果を利用して回答を生成するRAG(検索拡張生成)構成に対応している。画面から文書ファイルのアップロードや、クラウドストレージ「Box」にあるファイルの指定で参照可能である。
今回、LLMに「Gemini 1.5 Pro/Flash」を選択した場合に、アップロードした音声ファイルをテキストに変換できるようにした。音声と画像の同時取り込みも可能で、視覚情報を画像としてアップロードすることで補助的な情報として利用できる。音声データを国外に出したくない企業でも使えるように、日本国内リージョンだけで同機能を提供する。 今後は動画ファイルにも対応する予定である(表1)。
拡大画像表示