データセクションは2018年8月14日、機械学習(マシンラーニング)に必要な教師データの作成を代行するサービス「MLFlow(エムエルフロー)アノテーション」を発表、同日提供を開始した。テキストと動画像の教師データを作成できる。動画像については大量のデータ群から必要なシーンを抽出する機能を搭載しているため、ユーザー側でのデータ精査は不要。
データセクションの「MLFlowアノテーション」は、機械学習(マシンラーニング)に必要な教師データの作成を代行するサービスである。データを説明する付加情報(メタデータ)をデータに付与し、教師データとして利用できるようにする。用途に合わせて、テキストと動画像、双方の教師データを作成できる。
拡大画像表示
特徴は、ユーザー側でデータを選定する必要がないことである。大量データを未選定のまま提出できる。判定エンジンが自動的に必要なデータを選定する。また、作成した教師データは、ユーザー側でWeb画面から随時確認できる。仕様(データの分類対象や分類基準など)に関するユーザーと開発者の認識の齟齬をなくせる。
価格は個別見積もり。画像の教師データを作成する場合は、データ検出(選定)とアノテーションの2段階で費用を見積もり、アノテーションにかかる費用は従量制となる。ユーザー側で事前に画像のデータ検出(選定)を行い、アノテーション対象の画像数を絞ることによって、費用を抑制できる。
教師データの作成を代行する背景について同社は、マシンラーニングを実ビジネスで活用するケースが増えている一方で、教師データの作成には多くの人手とコストがかかっていることを挙げている。