[Sponsored]

「スキーマレス」のデータベースがAI時代のビジネス革新を加速する

MarkLogic創業者が見据えるテクノロジーと人間の近未来

2017年6月29日(木)

リスト

世界のデータベース市場で異彩を放つMarkLogic社の創業者、Christopher Lindblad（クリストファー・リンブラッド）が訪日した。同氏は検索サイト「Infoseek」でアーキテクトを務めたこともあり、長らくソフトウェア開発に携わった後、2001年にMarkLogic社（http://jp.marklogic.com/）を創業した。達観した独自の視点で、昨今注目されているAIやシンギュラリティについて綴った。

　訪日中の機会を活かして私は、日本でITに携わる方々と幅広く意見交換をさせていただきました。高い技術力や深い見識を持つ技術者が多くいて、日本技術の底力を見た気がします。それはとても貴重な体験となりました。

　中でもAIや機械学習、シンギュラリティが度々話題に挙がっていたのが印象的でした。いま日本で高い関心が持たれているのがよく分かります。ある人は「AIのブームは終わった。しかし本格的なビジネスチャンスはこれから」と話していました。私もこの意見におよそ同意します。これからAIは注目される段階から、ビジネスへの適用や技術的な実装という段階に入りつつあります。

米MarkLogicの創業者、クリストファー・リンブラッド（Christopher Lindblad）氏

　本題に入る前にAIの昔話をさせてください。私は学部生のころ、AIについても学びました。当時学生の間でAIについての興味深い議論がありました。例えば人間からAIに質問や命令を投げかけ、その反応がこちらの期待した答えや合理的な行動だったとします。そうすると一般的には「コンピュータはこちらの問いを理解した」と見なされます。

　しかし本当にコンピュータは“理解”したのでしょうか。そもそもコンピュータは私たちのように理解するのでしょうか。人間でもたまに“理解したふり”をすることがあります。コンピュータも理解したふりをしているだけかもしれません。

　そのため「コンピュータの理解と行動（応答）は分けて考えるべきではないか」と提言をした人がいました。これは哲学的でとても面白いテーマです。いまだにこの議論は結論に至っていません。

AIを支えるのはデータであり、それを蓄積するデータベースである

　さて本題に入りましょう。いま「AIの価値を高めるにはどうしたらいいか」が大きなテーマです。現在のAIやコンピュータは多くの場合、人間からの何らかの質問やクエリーに回答する形で稼働しています。しかし将来は現状を把握した上で自主的に人間に何かを通知するようになるのではと考えています。例えば健康状態が悪化していれば警告するなど、人間が考えもしなかったことを通知する。これはAIにとって一つの成功の形ではないかと考えています。

　AIの重要な要素を具体的に挙げると、ハードウェア、データ、アプリケーションの3つです。ハードウェアは壊れず確実に動くこと、データは必要なものを大量に集めること、アプリケーションには強力なアルゴリズムがあることが重要です。

　中でもデータはAIの質に関わる重要な要素です。インプットしたデータにより結果が左右されることもあるからです。偏った結果、間違った結果を出しては致命的な問題が起こることもあるかもしれません。結果の精度を高めるにはデータ量を増やし、多様なデータソースから収集していく必要があります。データ形式は業務で扱う数値やテキストだけではなく、TwitterなどのSNSのデータ、インターネットにあるあらゆるデータ、音声や画像なども必要になることもあるでしょう。

　その点を考慮するとAIで使うデータベースは「スキーマレス」である方が有利です。多種多様なデータを取り込むことができるからです。AIに限らず、昨今の変化の激しいシステムにおいてもスキーマレスは重要です。データベースを作成する時、将来どう発展していくか見通せないこともあります。そういう時にスキーマレスの柔軟性は重要性を帯びてきます。まずはスキーマレスで作成できて、後から自由に変更できる柔軟性が今のデータベースで重要になります。

企業や政府のデータ統合に強みを持つMarkLogic

　ここからいったん私の起業前にさかのぼります。私の人生において、インターネットを使い始めたことは大きな変化でした。なかでも検索エンジンの登場は大きなサプライズでした。同時に「これは強力なツールだ」と直感しました。これを企業内の情報システムでも使えるようにしたいと考え、そのためのデータベースを作るというのがMarkLogic起業時の構想でした。

　また私はMarkLogic起業前に、検索サイト「Infoseek」にて検索アプリケーション「ウルトラシーク・サーバー」のアーキテクトとして、設計や開発の全てを統括していました。この経験や技術がMarkLogic製品に活かされています。

　検索アプリケーションの後にデータベース開発というと、大きく飛躍しているように思えるかもしれません。実際、起業当時は「全くの別物」と思われていました。しかし検索サイトが実現することを企業内で実現するにはデータベースは欠かせません。多様なドキュメントを柔軟に格納するデータベースのほか、クエリーで検索できること、アプリケーションの使い勝手、そして企業で使うからにはデータを安全に格納することも必要です。

　私たちが開発している「MarkLogic」は多様なデータを統合するためのデータベースとなります。特徴は柔軟なデータモデル、ユニバーサルインデックス、エンタープライズレベルの信頼性です。

　なおMarkLogicはリレーショナルデータベースではないので分類としては「NoSQL」となります。しかしSQLは使えますし、当然のようにデータの一貫性も担保されます。紛らわしいと感じる人もいるかもしれません。幸いなことに最近では「マルチモデルデータベース」という用語が登場しました。MarkLogicを言い表すにはより的確ではないかと思っています。

　私たちのMarkLogicは情報を統合するためのデータベースを目指しており、当初から多くの企業や政府公共組織で採用されてきました。事例を挙げるときりがありませんが、大規模なものではいわゆる「オバマケア」（米国における医療保険制度改革）があります。ここで中心的な役割を果たすサイトが「HealthCare.gov（https://www.healthcare.gov/）」で、保険事業会社や政府機関などとデータ連携しています。それだけではなく、高いセキュリティ要件が求められ、かつ議会で定められた導入期日を守るために短期間でシステムを構築する必要もありました。このサイトは2016年には米国民1270万人が登録しています。米国政府が手がけた個人情報データを統合するプロジェクトとしては最大規模と言われています。またトランザクションは6500件/秒を実現するほど高速です。これはMarkLogicだからこそ実現しました。一般的な商用リレーショナルデータベースでは開発期間や柔軟性で困難でした。

　今ではMarkLogicは企業や政府の情報システムだけではなく、IoTやAIでも難なく適用できるため活躍の場を広げています。創業時にはまだ今のようなIoTやAIはありませんでしたが、スキーマレスという柔軟性と企業で使えるレベルの信頼性を持たせることに注力したことが現在の成功に繋がったと考えています。

20年前に現在は想像できなかったが、憧れた空想の世界を実現している

　日本滞在時には「シンギュラリティへの懸念」も何度か耳にしました。「およそ20年後かいつか、コンピュータやAIは人間を超えてしまうのではないか。そのとき人間はどうしたらいいか」という漠然とした不安を持つ人は少なくないようです。

　「シンギュラリティ」というと、現在からは全く想像できない世界でもあります。想像できないものが世界を制圧するかと思うと、確かに脅威かもしれません。しかし私は20年後も技術は人間にとってなじみのある姿で存在していると思います。

　20年後を想像するために、20年前を振り返ってみましょう。例えば20年前、私たちはスマートフォンを持っていませんでした。今ではこれがないと生活が成り立たないくらい手放せない存在ですが、ほんの20年前ではこれはSFの世界だけのものでした。

　20年前に現在の世界は想像できませんでしたが、現在の技術は私たちにとって受けいれられる形で発展しています。この先の20年後のAIがもたらすものも、20年前から見た現在のようになじみのある姿になっているのではないかと私は考えています。逆に言えば人間がなじめない技術では、人間は受けいれません。そうした技術は廃れてしまいます。なじみのある姿だからこそ、受けいれられ発展していけるのです。

　最後に私から日本の皆さんにお伝えしておきたいことを記します。データベースはアプリケーションで使われないと意味がありません。私の役割はこれまでと同様、これからもMarkLogicがアプリケーションで使われるように、データベース開発を進めていくことだと考えています。具体的にはデータ統合をより強力に、より簡単にできるようにしていきます。さらにこれからはこれまで以上にセマンティックに力を入れていこうと考えています。格納されたデータの意味を理解できるようにしていきます。この特徴はAI分野でも力を発揮していくでしょう。

　世界を見渡すと、日本は技術革新に長けた国です。今回の訪問でその確信を強めました。今後日本でどのような優れたアプリケーションやシステムが生まれるか、考えるとわくわくして興奮を禁じ得ないほどです。今後MarkLogicがAIはじめデータ活用のアプリケーションで皆さんの役に立つことができればとてもうれしいです。

【著者略歴】

クリストファー・リンブラッド
MarkLogic創業者

Christopher Lindbladは、ソフトウェア開発において20年を超える実績を持つ。Infoseek社でエンタープライズ検索アプリケーション「ウルトラシーク・サーバー」のアーキテクトとして働いた後（ウルトラシーク・サーバーはその後、Verity社を買収したAutonomy社の主力製品の1つになる）、MarkLogic（http://jp.marklogic.com/）を設立。

ウルトラシーク・サーバーの立ち上げにおいては、アーキテクチャ、設計、開発などすべてを統括する責任者を務める。Infoseek社以前は、Massachusetts Institute of Technology（MIT）で博士研究員として高速ネットワークとリアルタイムビデオ処理の研究に従事。MITでの研究期間中に、インターネットおよびマルチメディアテクノロジーに関する著作を15件以上発表している。

California Institute of Technology卒（学士：エンジニアリング、コンピュータサイエンス）。Massachusetts Institute of Technology（修士&博士：コンピュータサイエンス）。

●お問い合わせ先