[新製品・サービス]
富士通、独自技術により97%の精度でデータをクレンジングする「Interstage Information Quality」
2009年10月19日(月)IT Leaders編集部
富士通は2009年9月9日、データクレンジングソフト「Interstage Information Quality」を発表した。同製品は、住所や氏名データの欠落や旧字体の混在といった文字表記の違いを補正するデータクレンジングソフトである。主に、CRMやマーケティング分野での利用を想定している。
同製品の最大の特徴は、独自の解析技術により、データクレンジングの精度を高めていることである。従来のクレンジングソフトにおいては、データの先頭から順番に辞書と照合する前方一致の解析手法が一般的だった。しかし、この手法では例えば「東京都東新橋1丁目」(港区が欠落)というデータを補正できなかった。「東京都」は辞書で照合できるものの、区名がない時点で解析が完了してしまうからだ。
これに対して、Information Qualityの解析手法は「東京都」「東新橋」「1丁目」というすべての要素を一括して辞書と照合し、一致する要素の数が最も高い住所を選択。「港区」が抜けていると判別し、自動補正する。実際にこの手法を使って富士通が保有する顧客データをクレンジングしたところ、「百数十万件のデータを97%の精度でクレンジングできた」(データマネジメント・ミドルウェア事業部 第五開発部の押金章悟部長)。2プロセサのマシンを使った場合、100万件のデータを350秒で解析できるという。
過去40年分の住所辞書を搭載。過去に市町村合併や政令指定都市化などで住所表記に変更を重ねた場合でも、旧住所を現在の住所に自動変換できる。最新の住所辞書データを毎月送付するサービスも有償で提供する。
価格は1プロセサあたり250万円。住所辞書更新サービスは、1サーバーあたり年額80万円。