リコー、強化学習で多段推論を獲得したマルチモーダルLLMを開発、8Bモデルを無料公開

2026年3月31日(火)IT Leaders編集部、日川佳三

リスト

リコーは2026年3月30日、経済産業省とNEDOが主導する国産生成AI開発強化プロジェクト「GENIAC」第3期において、日本語のビジネス文書の図表読解に特化したマルチモーダルLLMの開発を完了したと発表した。複雑な図表に対して段階的に思考しながら正解を導き出すことが特徴である。同日、8Bパラメータの軽量モデルの無料公開も開始した。

　リコーは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構（NEDO）が主導する国産生成AI開発強化プロジェクト「GENIAC」第3期において、日本語ビジネス文書の図表読解に特化したマルチモーダルLLM（大規模言語モデル）「Qwen3-VL-Ricoh-32B-20260227」を開発した。

　複雑な図表に対して段階的に思考しながら正解を導き出せるのが特徴。リコーは同モデルを「リーズニングLMM（大規模マルチモーダルモデル）」と呼んでいる。

　開発の背景として、ビジネス文書や設計図面は構造が複雑で、内容や意味を読み取ることが難しいことを挙げている。「例えば、補助金申請書の表から『自分が受け取れる上限額』を求める場合、適用条件の読み取り、分岐の判断、数値の参照という複数の思考ステップを順に踏む必要がある。簡単なように見えて、人間が無意識に多段の推論を経ている場面は少なくない」（リコー、図1）。

図1：文書を正しく読み取るために多段の推論が必要になる例（出典：リコー）
拡大画像表示

　こうしたビジネス文書をAIに読ませるためには、テキストや図を認識して情報を取り出す能力だけでなく、情報をもとに複数ステップで論理を組み立てる能力が必要になる。これに対してリコーは、(1)文書画像の内容に関する質問と回答のペアを選定、(2)質問回答ペアを用い、ベースモデルに対する教師あり微調整（SFT：Supervised Fine-Tuning）、(3)強化学習（RL：Reinforcement Learning）の3ステップで学習させた（図2）。