NTTコミュニケーションズ(NTT Com)は2025年2月19日、RAG用データ構造化技術「rokadoc」と生成AIガードレール技術「chakoshi」のパブリックベータ版を公開した。Web画面を通じて機能を評価可能である。両技術は単独でAPIサービスやライブラリとしては販売せず、これらを利用したSIサービスの形態で提供する。
NTTコミュニケーションズ(NTT Com)の「rokadoc」はRAG(検索拡張生成)システムのためのデータ構造化技術、「chakoshi」は生成AIのガードレール技術である。いずれも、単独でAPIサービスやライブラリとしては販売せず、これらを利用したSIサービスの形態で提供する。2025年2月19日、Web画面から機能を評価可能なパブリックベータ版を公開した。
図を含む社内文書を構造化データに変換してRAGの精度を向上
rokadocは、RAGを用いた生成AIシステムにおいて回答精度を高めるデータ構造化技術である。社内文書(PDF、Word/Excel/PowerPoint)をRAGで活用しやすいデータ形式(JSON形式の構造化データ)に変換する。グラフや図などを読み解いてデータを抽出し、回答の生成に利用できるようにする。図1は、画像から説明文(キャプション)を生成する例である。

拡大画像表示
業務で使うセルの結合や罫線などを含んだ表形式のデータについても、レイアウトを解析し、適切なデータを出力する(図2)。
Web画面から機能を利用できる。データを変換したい社内文書ファイルをパブリックべータ版のWebサイトにアップロードすると変換してくれる。

拡大画像表示
●Next:機密情報や個人情報、差別的な結果などチェック
会員登録(無料)が必要です