[新製品・サービス]

強化学習で組み合わせ最適化問題を解くシステムをオーダーメイドで構築─Laboro.AI

2021年12月27日(月)日川 佳三(IT Leaders編集部)

Laboro.AI(東京都中央区)は2021年12月24日、AI開発サービス「組合せ最適化ソリューション」を発表した。大量の組み合わせの中から適した解を選択するAIアプリケーションを、個々のユーザー要件に合わせて構築するSIサービスである。強化学習技術を用いることで、最適化に要する時間(推論時間)を抑えるほか、複数の異なる最適化問題に対してチューニングだけで対応できるという。

 Laboro.AIの「組合せ最適化ソリューション」は、大量の組み合わせの中から適した解を選択するAIアプリケーションを、個々のユーザー要件に合わせて構築するSIサービスである。コンサルティングを通じて、ビジネス活用にあたっての議論やデータ選定の段階から支援する。組合せ最適化問題の具体例には、調理工程スケジューリング、配達経路最適化、アルバイトのシフト計画、船舶の積荷配置計画、製造組立ラインでの工程スケジュールなどがある。

 マシンラーニング(機械学習)手法の1つである強化学習技術を用いる。エージェントと呼ぶ主体が、一連の行動を通して得られる報酬を最大化するように学習することによって、自らの行動を最適化していく仕組み。一般的な教師あり学習では行動1つ1つに良い/悪いといったラベルをつける必要があるが、強化学習では一連の行動を通して得られる報酬を設定すれば、後は自動で最適解を獲得していくという。

 強化学習を最適化問題に適用することのメリットを同社は2つ挙げる。1つ目は、最適化問題が大きくなっても、最適化に要する時間(推論時間)が大きくなりにくい点である。学習データを元にしてさまざまなパターンを機械が自動で学び、学んだことを生かせるため、推論時に問題を解く時間が長くならない。頻繁に状況が変わり、その度に最適化が必要になるような状況においてメリットが大きい。

 2つ目は、多様な最適化問題に対してほぼ1つの枠組みでアルゴリズムを構築できる点である。数理最適化アルゴリズムでは、問題ごとに個別のアルゴリズム開発が必要になる一方で、強化学習では共通した技法を使いつつ必要に応じて問題ごとのチューニングを施すだけで済む。強化学習を活用するコツは、学習を促進する報酬の設計、最適化途中の価値関数の設計、高速なサンプリングのための実装上の工夫などになる。

 組み合わせ最適化問題の例として同社は、複数トラックでの配送ルートを決定する配達経路最適化問題を挙げる。問題設定は、配送対象の住宅に対して複数トラックで配送するという内容になる。「制約条件として、荷物を届ける日時の指定、トラックに一度に詰め込める荷物の制限などがある。こうした制約条件を満たして、配達時間を最小化する配達順序を決定する問題である。配達対象の住宅数が増え、トラックの台数も増えるなど、問題がより大きくなる場合、最適化が難しくなる」(同社)。

 このほか、スケジューリング問題の一例として、調理工程の最適化を挙げる。例えば、調理者1人が全部で4つの料理を作る場合、各料理に「野菜を切る」や「コンロで煮る」といった決められた手順があるほか、調理器具としてコンロ、オーブン、包丁、まな板、炊飯器を同時に1つまで使用できるといった制約がある。こうした条件の下、調理終了までの時間を最も短くする調理工程を選択する。

関連キーワード

Laboro.AI / 組み合わせ最適化問題 / SI / 強化学習

関連記事

トピックス

[Sponsored]

強化学習で組み合わせ最適化問題を解くシステムをオーダーメイドで構築─Laboro.AILaboro.AI(東京都中央区)は2021年12月24日、AI開発サービス「組合せ最適化ソリューション」を発表した。大量の組み合わせの中から適した解を選択するAIアプリケーションを、個々のユーザー要件に合わせて構築するSIサービスである。強化学習技術を用いることで、最適化に要する時間(推論時間)を抑えるほか、複数の異なる最適化問題に対してチューニングだけで対応できるという。

PAGE TOP