企業の重要なデータを守るのに暗号化技術は欠かせない。しかし、データ分析や機械学習などで、暗号化をいったん復号しないと処理が行えず、また、復号した後のデータの保護は結局人依存になるといった問題がある。そこで注目されているのが、データを暗号化/秘匿化したまま処理を行う「秘匿計算」という技術だ。どのような仕組みを持ち、ユーザーはどのようなメリットを享受できるのか、同技術の研究を続けるZenmuTech 研究開発本部 開発統括部の石田祐介氏が解説する。
データ高度活用時代に求められる秘匿計算技術
秘匿計算とは、情報を秘匿したまま計算する技術のことです。
個人情報や機密情報といった重要データの保管においては、暗号化や秘密分散といった技術で情報を秘匿化することで、それを守ることができます。一方、現在は、情報を保管というより、情報を高度に活用することに重点が置かれるようになりました。近年、ビッグデータ分析やマシンラーニング(機械学習)、ディープラーニング(深層学習)といったキーワードをよく耳にするのは、データの高度活用時代が本格化している表れでしょう。
しかし、データ活用の場面を考えると、データ保管のための秘匿化だけでは情報を守るのに不十分なことがあるのです。その課題を解決するのが、本稿で取り上げる秘匿計算技術です。
なぜ、秘匿化だけでは不十分なのか。秘匿計算技術とは何なのか。以下で詳しく見ていきましょう。
復号しなければ計算できない
データを集めて保管するだけでは宝の持ち腐れで、それを活用してはじめてデータに価値が生まれてくるのは言うまでもありません。例えば、ターゲット顧客の年齢層を調査するために「顧客データベースから年齢の項目を抽出して平均を計算する」といった簡単なデータ活用は日常的に行われています。
一方で、情報を暗号化や秘密分散すると、その情報は「秘匿化」されます。秘匿化された情報は「復号」しなければ元の情報を得ることはできません。なお、秘密分散とは、情報を秘匿化された複数の断片(分散片・シェア)に分割する手法のことです。
例えば、先ほどの顧客データベースが、暗号化などで秘匿化されている場合、「年齢の項目を抽出する」ために、元の情報を「復号」しなければなりません。さもなければ、平均といったものは計算できません(図1)。
拡大画像表示
「復号できる」ことの「大きな力」と「こわさ」
復号できる能力は、非常に大きな力を持っているということを意味します。
重要な個人情報が秘匿化されて格納されているコンピューターがあるとしましょう。 このコンピューターは、平均等の統計処理を行うために、秘匿化された個人情報を復号できます。もし、このコンピューターが悪意のある人間にハッキングされてしまうと、格納してある個人情報は非常に危険な状態にさらされてしまいます。なぜなら、このコンピューターは元々統計処理を行うために、秘匿化された情報を復号できる能力を持っています。この能力が悪用された時、いくら情報を秘匿化していても、そのすべてを復号できてしまうので、秘匿化が意味を成さなくなってしまうのです。
HTTPSなら安心なのか
例えば、「DNA情報から病気のリスクを調べたい」といったケースを考えます。インターネット上でDNA情報を解析し、病気のリスクを調べるサービスがあったとします。DNA情報は大変に重要な個人情報です。そのサービスのサイトは、HTTPS(TLS/SSL)で通信が暗号化されており、正規の認証機関から証明書を得ていることも確認済みです。
さて、このサービスは安心して利用できるでしょうか?
会員登録(無料)が必要です
- 1
- 2
- 3
- 次へ >