ビジネスの展開領域が幅広い製造業では、どの業務を対象に、どんなデータ分析を実施すべきかを十分に検討する必要がある。その一環として前回は、製造業のデータ分析には「精度追求型」と「速度重視型」の2タイプがあると説明した。前回は、精度追求型のデータ分析プロセスにおける分析テーマの作成について説明した。今回は、それに続く分析モデルの構築・改善と業務活用を取り上げる。
前回、一般的なデータ分析プロセスは大きく、(1)分析テーマの作成、(2)分析モデルの構築・改善、(3)業務活用の3つに分かれるとしたうえで、精度追求型の分析にける(1)分析テーマの作成について説明した(図1)。今回は、精度追求型データ分析プロセスにおいて最も多くの時間が費やされる(2)分析モデルの構築・改善から説明する。
拡大画像表示
(2)分析モデルの構築・改善プロセス
分析モデルの構築・改善プロセスは、モデル構築と評価を何度も繰り返すプロセスである。適切な分析モデルを選択しプロセス期間を短縮するためには、前プロセスの分析モデルの要件整理が重要となる。第2回で説明した「精度指標設計」は、最良の分析モデルを選択するために欠かせない。そのうえで、「分析モデル構築手法の絞り込み」により、業務に活用できる分析モデルの構築手法のみを検討する必要がある。
分析モデルの要件をしっかりと整理できていれば、分析モデルの改善のほとんどは、分析モデルの精度を高めることと同等になる。以下では、主な分析モデルにおいて精度が悪化する要因である「モデルの表現力不足」「過学習」「不良データ」への対処方法を紹介する。
要因1=モデルの表現力不足
分析モデルには様々なものがある。重回帰分析、ロジスティックス回帰分析、決定木、ランダムフォレストやニューラルネットワークなどだ。それぞれで“表現力”が大きく異なる。モデルの“表現力”とは、複雑な予測がどの程度まで可能なのかを示した言葉である。
会員登録(無料)が必要です
- 1
- 2
- 3
- 次へ >
- データ分析が導く自動化から業務改革、そしてサービス化へ:第5回(2015/09/08)
- 【第4回】速度重視型データ分析の対象は人の行動や感情(2015/08/11)
- 【第2回】精度追求型データ分析における分析テーマの作成(2015/06/09)
- データ分析が製造業を変える! 製造業のデータ分析には2つのタイプがある:第1回(2015/05/12)