サイバーテックは2021年12月14日、AI学習用アノテーションサービス「セブアノ」を提供開始した。画像認識AIの学習データを作成するアノテーション業務を代行する。画像の領域分割、画像への特徴点付与、画像へのバウンディングボックス付与、データセットの分類の4つの用途に対応する。
サイバーテックの「セブアノ」は、画像認識AIの学習データを作成するアノテーション(ラベルなどのメタデータの付与)サービスである(図1)。サイバーテックがフィリピンのセブ島に所有するオフショア拠点「セブITアウトソーシングセンター」の正社員がアノテーションを実施する。
拡大画像表示
ディープラーニング(深層学習)によるAIモデルの精度向上には、量と質を両方満たす学習データ(教師データ)を安価に準備することが欠かせない。また、元となるデータセットには企業内の機密情報が含まれていることが多く、厳格な守秘義務の下、慎重に取り扱う必要がある。こうしたニーズに応える。
サイバーテックでは、数年前からディープラーニングに取り組んでいる。現在は、多言語マニュアルの組版と電子化を実現するシステム「PMX」のオプションとして、AI校正・ゆらぎ検出機能を提供している。必要なデータセットはすべてセブITアウトソーシングセンターで作成している。画像データに対するアノテーション業務においても、これまでに培った学習データの作成ノウハウやディープラーニングの知見を活用する。
主に、画像の領域分割(セグメンテーション)、画像への特徴点付与(キーポイント)、画像へのバウンディングボックス付与、データセットの分類(クラシフィケーション)の4つの用途に対してアノテーションを実施する。
- 画像の領域分割(セグメンテーション)
ユーザーから受領した画像データに対し、画像の輪郭線情報をもとにポリゴンでセグメント分割し、クラス付与(ラベリング)を実施する。セグメンテーションを行ったポリゴン情報はJSONファイル形式で提供する。 - 画像への特徴点付与(キーポイント)
画像に写っている人などの対象物の特徴点に座標情報を付与する。動植物や人体などの骨格検出や姿勢推定に利用できる。パーツの各所につけた座標(キーポイント)をもとに全体像を割り出す。 - 画像へのバウンディングボックス付与
ユーザーから受領した画像データ内の、対象となる物体や特徴に対して、矩形(バウンディングボックス)で囲む。同時に、囲んだオブジェクトが何であるかを示すクラスを付与し、座標情報のラベル付け(ローカライゼーション)を行う。 - データセットの分類(クラシフィケーション)
アノテーションの前処理として、カテゴリ分けによるラベリングにより、取捨選択を含め対象データを分類する。画像をはじめとする様々な形式のデータ分類に対応する。