電通国際情報サービス(ISID)は2021年1月26日、AIで文書を分類・要約するクラウドサービス「TexAIntelligence(テクサインテリジェンス)」の機能強化を発表した。同年2月から提供する。Googleの自然言語処理モデル「BERT」を用いて独自構築した日本語学習済みのAIモデル「ISID-BERT」を備えている。
電通国際情報サービス(ISID)の「TexAIntelligence」は、ユーザー企業が蓄積した大量の文書の分類、要約、検索を、AI技術によって自動化するクラウドサービスである。2020年5月から提供している。
企業内には、顧客からの問い合わせやアンケート回答結果、社内に蓄積した技術文書や帳票など、価値がありながら活用できていない多くのテキストデータが存在する。TexAIntelligenceは、これらを活用できるようにする。
今回、機能強化が施された。自然言語処理モデルのBERT(Bidirectional Encoder Representations from Transformers)を軽量化した「A Lite BERT(ALBERT)」に、日本語データを事前に学習させた独自のAIモデル「ISID-BERT」を構築し、TexAIntelligenceに搭載した。さらに、1文書あたりの取り扱い可能な単語数を倍増させることによって解析対象を広げている。
この結果、TexAIntelligenceの1機能である、文書をカテゴリに分類する機能の性能が向上した。ISIDが用意した検証用の文書において、以前が82%だった精度を、ISID-BERT搭載モデルでは95%まで向上させた。
ISID-BERT搭載版のTexAIntelligenceによって、自然言語処理を行うAIモデルをユーザー自身で構築し、運用できるとしている。
なお、BERTは2018年10月にGoogleが発表した自然言語処理技術。近年はこの領域において、文章の意味や文脈理解に関する技術の進化が活発であるという。精度の向上に伴って企業における実装も広がっている。
ISIDは、TexAIntelligenceの自然言語処理精度向上を図るため、これまでBERTの研究開発に取り組んできた。今回、英語と比較して認識精度が低かった日本語を独自に学習させたISID-BERTを開発し、TexAIntelligenceに搭載した。