[市場動向]

SMBC、架空の不正取引データを量子アニーリングで生成してAIモデルを学習

不正データの再現率が従来手法よりも3~6%向上

2021年3月22日(月)日川 佳三(IT Leaders編集部)

三井住友フィナンシャルグループ(SMFG)、日本総合研究所(日本総研)、NECの3社は2021年3月22日、金融取引の不正を検出するAIモデルにおいて、学習用のサンプルが少ない不正取引データを量子アニーリングで生成する検証を実施したと発表した。不正取引の再現率を比較した結果、再現率がランダムより6~15%、従来手法のSMOTEより3~6%程度向上することを確認した。

 三井住友フィナンシャルグループ(SMFG)、日本総研、NECは、2020年2月から共同で、量子アニーリングの実用性を検証している。

 検証テーマの1つが、マシンラーニング(機械学習)への応用である。サンプルが少ない学習用データを、量子アニーリングによって生成する使い方である。

 金融取引における正常/不正を識別するAIモデルを構築する際には、正常に取引が行われた学習データ(負例データ)と、不正が行われた学習データ(正例データ)が必要になる。しかし、不正の事例は実際にはほとんど存在しないことから、正例データは少量しか取得できない。この問題への対処法の一種として、実際の正例データを基に「実在しないが確からしい」正例データを大量に生成する操作(オーバーサンプリング)を行うことがある。

 今回の検証では、規則性のない数値を生み出せるという量子アニーリングの特性を活用し、統計的に確からしい正例データ生成器を開発し、これを用いてオーバーサンプリングを実施した。

量子アニーリングで不正データの再現率が3~6%向上

 不正取引を識別するAIモデル(主にデータの分類に用いる決定木と呼ぶモデル)の学習に、オーバーサンプリングしたデータを適用した。この結果、従来手法(「ランダム」および「SMOTE」)と比較して不正データの再現率が向上することを確認した(図1)。

図1:サンプルが少ない不正取引データを量子アニーリングで生成した。従来の生成手法と比べて不正取引データの再現率が向上した(出典:三井住友フィナンシャルグループ、日本総合研究所、NEC)図1:サンプルが少ない不正取引データを量子アニーリングで生成した。従来の生成手法と比べて不正取引データの再現率が向上した(出典:三井住友フィナンシャルグループ、日本総合研究所、NEC)

 量子アニーリングを用いたオーバーサンプリング手法は、正例データをボルツマン分布と呼ぶ確率分布で再現する手法である。ボルツマン分布は確からしいデータを生成するために利用する。今回、正例データの生成時に量子アニーリングを適用している。

 従来手法の1つ、ランダムは、複数存在する正例データから、いくつかの正例データをランダムに選び、これらをそのまま複製する形で新たなデータを生成し、正例データに加える手法である。

 従来手法の1つ、SMOTE(Synthetic Minority Over-sampling TEchnique)は、複数存在する正例データから、類似した正例データを2件選び、これらの中間的な特徴を持つ新たなデータを生成し、正例データに加える手法である。

 なお、検証は、2020年9月から2020年12月まで実施した。検証環境として、カナダD-Wave Systemsの量子アニーリングマシンなどを使った。取引データには、海外クレジットカード会社における実際の取引履歴から作られた公表データを利用した。

関連キーワード

三井住友フィナンシャルグループ / 量子アニーリング

関連記事

Special

-PR-

SMBC、架空の不正取引データを量子アニーリングで生成してAIモデルを学習三井住友フィナンシャルグループ(SMFG)、日本総合研究所(日本総研)、NECの3社は2021年3月22日、金融取引の不正を検出するAIモデルにおいて、学習用のサンプルが少ない不正取引データを量子アニーリングで生成する検証を実施したと発表した。不正取引の再現率を比較した結果、再現率がランダムより6~15%、従来手法のSMOTEより3~6%程度向上することを確認した。

PAGE TOP