東芝デジタルソリューションズは2019年12月3日、高頻度で大量に発生するIoTデータやビッグデータの管理に適した分散データベースの新版「GridDB v4.3」を発表した。PB(ペタバイト)級データの管理を、少ないサーバー台数でも可能にする技術を搭載した。
GridDBは、高頻度で大量に発生するIoTデータやビッグデータの管理に適した分散データベースである(図1)。サーバー台数を増やすスケールアウト構成によってデータベースの格納容量と性能を高められる。膨大な時系列データを効率よく蓄積できるとしている。
拡大画像表示
新版では、GridDB内部のデータ管理構造の最適化を行うことで、リソース使用量を大幅に削減し、1サーバーあたりのデータベース最大サイズを増やした。また、データベースのバッファ制御機能と、クラスタ内のデータ配置機能を強化した。さらに、複合索引などの機能を強化し、大規模データに対する処理性能を高めた。
これらにより、要件に応じて、スケールアウトだけではなく、スケールアップの手段を組み合わせて、少ないサーバー台数でもPB(ペタバイト)級データをミリ秒オーダーで処理できるようになった。
背景について同社は、IoTシステムにおいて、デバイスの増加や長期の稼働を経て、蓄積データサイズが増えてきていることを挙げている。「PB級データの管理が必要となってきている。一方、数十台のサーバーで構成した大規模なクラスタシステムはコストが高くつく」という。