野村総合研究所(NRI)は2019年2月28日、文章から意味のあるデータを抽出して項目を推定するソフトウェア「Shingan」を発表、同日販売を開始した。フォーマットが異なる複数の文書から、AIを活用して自動的にデータを抽出し、後続のシステムへと連携させられるようにする。価格(税別)は、導入と稼働までのコンサルティング費用が100万円からで、月額利用料が30万円から。販売目標は、今後3年間で約20社。
NRIが開発したShinganは、文章から意味のあるデータを抽出し、データの項目を推定するソフトである(図1)。非定型データをシステムで取り扱えるデータに整え、後続のシステムへと連携させられるようにする。形態素解析や構文解析などの日本語処理技術と、マシンラーニング(機械学習)/ディープラーニング(深層学習)技術を組み合わせた。読み込む文書の特性に応じて事前に学習させたAIと辞書を抽出に利用する。
図1:Shinganを利用した、非定型データを抽出する流れ(出典:野村総合研究所)拡大画像表示
フォーマットが異なる複数の文書からExcelの形式でデータを抽出し、結果を出力する。抽出したデータと、抽出したデータの確度を、ダッシュボード画面で確認できる(画面1)。ダッシュボード上では、抽出したデータごとに、抽出結果の確度(0~100%)を一覧で表示する。「後続のシステムに連携すべき抽出結果として正しい可能性が高い」と判断したデータほど値が大きい。
画面1:Shinganで文書からデータを抽出した画面(出典:野村総合研究所)拡大画像表示
NRIは、販売開始前に、投資信託における各種業務を対象に実証実験を実施した。野村アセットマネジメントとは、運用報告書に記載されている各種文章の整合性チェックについて実証実験を実施した。NRIプロセスイノベーションとは、項目の抽出と他システムへのデータ連携について検証した。
なお、Shinganは、「crossnote」(アップデイティット製)などの文書管理システム上で稼働する。
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



