リコー 軽量モデルのリーズニングLMMを無償公開 画像や音声を含むデータを高精度に理解し企業内の知識活用を促進
株式会社リコーは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内での生成AIの開発力強化を目的としたプロジェクト「GENIAC(ジーニアック/Generative AI Accelerator Challenge)」第3期で、図表を含む多様なドキュメントを高精度に読み取ることができるリーズニング性能を備えたマルチモーダル大規模言語モデル(以下、リーズニングLMM)の基本モデル「Qwen3-VL-Ricoh-32B-20260227」を開発した。LMM(Large Multimodal Model)とは、テキストに加えて画像、音声、動画などの複数種類のデータを同時に処理できるAI技術のこと。スクリーンショットからのテキスト要約や図表を含む質問への回答といったさまざまなタスクで高い性能を発揮することから、幅広いデータ形式を扱えるAIとして期待が高まっている。このリーズニングLMMも、多段推論を通じて複雑なドキュメントを理解できるという特長を有している。
また、リーズニングLMMの開発で適用した技術を活用した軽量モデル「Qwen3-VL-Ricoh-8B-20260227」を、3月30日から無償公開。さらに、リーズニング性能の評価に特化したリコー独自開発のベンチマークツールも今後公開予定となっている。
【公開先リンク】
https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227
企業内の知識の活用をAIにより効率化
企業内には、請求書や領収書、事業戦略や計画といった経営資料、サービスマニュアルや社内で定めた技術標準、品質管理基準など、多様なドキュメントが蓄積されている。これらはテキストだけでなく図や表組、画像なども含み、企業内での効率的な利用や新たな価値・イノベーションを生み出すための活用が期待されている。一方で、「テキスト検索では意図した結果が得られない」「検索機能のみでは文書の十分な活用が難しい」といった課題も指摘されている。
さらに近年では、労働力の減少に対応した効率的な働き方や、ベテラン社員の退職に伴う技能伝承、外国人労働者の増加に伴う文書の多言語化といった経営課題への対応が求められている。
こうした背景から、AIを用いて、企業内の知識を効率的に活用するニーズが高まっている。
リコーは、2024年8月から実施されたGENIACの第2期で、700億パラメータのLMMを開発。その基本モデルおよび独自開発のベンチマークツールを無償公開した。2026年1月には、中国のアリババクラウドが開発・提供する大規模言語モデル(LLM)ファミリーの「Qwen2.5-VL-32B-Instruct」をベースとした320億パラメータのコンパクトなLMMを開発している。
今回の第3期では、「Qwen3-VL-32B-Instruct4」をベースに「Qwen3-VL-Ricoh-32B-20260227」を開発。多段推論によって複雑なドキュメントを高精度に理解できる、リーズニングLMMの基本モデルとなる。同モデルでは、AIが環境と相互作用しながら最適な行動を学習する「強化学習」や、学習の順序を工夫した「カリキュラム学習」といった学習手法を取り入れ、これにより、複数ページにまたがる図表を関連付けて理解することを可能にした。読解難易度の高い質問に対しても高精度な回答を生成できる。
同モデルは、「Gemini2.5-Pro」などの大型商用モデルと同等のベンチマーク結果を確認している(2026年2月17日時点)。リーズニング性能を評価するための独自のベンチマークツールも開発しており、今後公開する予定。
さらに、日本企業での実務利用を想定し、思考プロセスの日本語化にも取り組んだ。これにより、日本語文書の読み取り精度向上に加え、回答の判断根拠や前提条件を日本語で確認できるようになり、実務利用での信頼性を高めている。
【Qwen3-VL-Ricoh-32B-20260227の特徴】
・図表読解の深化:強化学習やカリキュラム学習による推論プロセスの導入することで、複雑なドキュメントの読み間違いを大幅に低減
・論理思考力の向上:データの抽出に留まらず、読み取った数値に基づく計算や比較分析の精度が向上
・高信頼な回答生成:思考プロセスを日本語化することで回答の根拠を明確化し、ビジネス実務での信頼性が向上
企業での活用に向けた環境整備・コスト低減
AIについて、セキュリティやプライバシー、ガバナンスの観点から、オンプレミスや自社データセンターなどの社内専用環境で利用したいと考える企業が多く、省リソースでAIを活用できる環境へのニーズが高まっている。リコーが開発したQwen3-VL-Ricoh-32B-20260227は、オンプレミス環境での導入が可能で、企業の業種・業務に応じたファインチューニングにも対応している。
また、企業内での活用を加速するためには、開発コストや運用コストの低減も重要な課題といえる。リコーは、モデルマージ技術の活用により、効率的な開発プロセスを確立し、プライベートモデルの提供に活用。さらに、独自の画像トークンの圧縮技術を用いることで、高性能化に伴い増大する運用コストの低減にも取り組む。
リコーはこれまで、多様なAIソリューションを通じて、企業の業務変革を支援してきた。特に、複合機やスキャナー、カメラなどのエッジデバイス開発で培った画像処理技術や、ドキュメントおよびワークフローマネジメントに関する長年の知見を活かしたドキュメントAIの開発に強みを持つ。2025年12月には、企業内に蓄積されたノウハウや経験など、言語化されていない「暗黙知」を含む情報資産をAIで利活用する企業向けAIプラットフォーム「Hi.DEEN(ヒデン)」を発表した。また2026年3月には、AI・デジタル技術を軸にコンサルティング事業を展開する株式会社ライズ・コンサルティング・グループと、企業の経営課題解決を目的として、AX(AIトランスフォーメーション)の実現を支援する合弁会社設立に向けた基本合意書を締結している。
これらに加えGENIACで得られた成果を広く社会に還元することで、ドキュメントの利活用を促進。業務革新と付加価値の高い働き方を支援し、企業価値の向上に貢献することを目指す。


