インサイトテクノロジーは2023年7月4日、データ統合ツールの新版「Insight Governor Ver.1.1」を発表した。同年7月から提供している。各部署に分散しているデータを統合して活用するために必要な機能群を一通り提供するツールである。具体的には、データのカタログ化、名寄せ、データの匿名化といった機能群を提供する。新版では、既存の大規模言語モデル(LLM)をファインチューニングしたAIを活用し、名寄せ機能の精度を高めた。
インサイトテクノロジーのデータ統合ツール「Insight Governor」は、データは、企業の各部署に散在しているデータを統合して活用するために必要な機能群(データのカタログ化、名寄せ、データの匿名化など)を提供する(関連記事:社内に散在するデータを統合/名寄せ/匿名化─インサイトテクノロジーの「Insight Governor」)。
今回の新版では、既存の大規模言語モデル(LLM)を基にインサイトテクノロジーがファインチューニングしたAIを活用し、名寄せ機能の精度を高めた(画面1)。あらかじめ名寄せのルールを登録することなく、氏名などの新字体/旧字体や表記ゆれ、製品名などの表記のばらつきを自動で検知できるようになった。
拡大画像表示
異なるテーブルやデータソースのデータを組み合わせて名寄せに活用する。例えば、顧客データの「氏名」「社名」「住所」「電話番号」などを参照することで、同性同名の別人を正しく区別できるようになった。既存の方法(名寄せルールの参照)では難しかった、初出の「氏名」「社名」「製品名」などの名寄せが可能になった。
新版では、異なるデータソース同士が共通して持っている関連データを検知する機能も追加した(画面2)。例えば、販売管理システムの「部品データ」と、在庫管理システムの「部品データ」を、各部署で別のデータ項目名で管理しているケースにおいて、これらを類似データとしてひもつけられる。これにより、データの可視化、統合、分析が可能になる。
拡大画像表示