電通総研、東北大学、Studio OusiaがAI国際会議「NeurIPS 2025」で優勝!オープンソースDeep Researchで未来を拓く

NeurIPSとは?世界最高峰のAI国際会議

「NeurIPS」は、機械学習、深層学習、強化学習、学習理論といったAI分野において、世界最高峰の規模と権威を持つ国際会議です。今回のコンペティション「MMU-RAG」では、「Deep Research」と呼ばれる長文形式の質問応答を高精度かつ効率的に処理するシステムの性能が問われました。3者のチームは、オープンソース技術を駆使して長文質問応答に特化したシステムを構築し、その高い精度と再現性が評価されたのです。

Deep Researchの核心に迫る:高度な情報探索と分析

「Deep Research」とは、ChatGPTやGeminiなどの生成AIに搭載されている、自律的な情報探索、要約、回答生成までを行う高度なリサーチ機能を指します。これまで商用サービス向けのクローズドな技術が主流でしたが、今回の成果はオープンソース技術でこれを再現・発展させる研究に大きな一石を投じるものです。

Deep Researchシステムの活用例

この高度な調査能力は、以下のような幅広い分野での活用が期待されています。

  • 市場調査や競合分析

  • 学術論文のサーベイや最新動向の把握

  • マーケティングリサーチ

  • 金融データや経済指標の分析 など

従来の検索との違い

Deep Researchシステムは、従来のキーワード検索とは一線を画す特徴を持っています。

  1. 検索意図の深い理解と調査計画の自動立案: 質問の背景や目的を推定し、複数ステップからなる調査手順を自動的に計画します。
  2. 広範な情報源からの自動収集: LLM内部の知識、インターネット上の多様な情報源、各種データベースから必要な情報を段階的かつ網羅的に収集します。
  3. 情報の信頼性評価と出典の提示: 収集した情報の信頼性や一貫性を評価し、回答に利用した情報の出典を明示します。
  4. 多角的な分析と高品質な洞察の生成: 情報同士の関連性や整合性を検証し、多面的な視点から分析することで、単なる要約にとどまらない質の高い洞察を提供します。

優勝への道のり:オープンソース技術の力 💪

電通総研は、Deep Researchを自社ソリューションにおける生成AI活用の重要な機能と位置づけています。これまで商用機能に依存していましたが、個社ごとのカスタマイズの難しさやコスト課題から、オープンソース技術を用いた内製化を視野に入れ、今回のコンペティションに参加しました。

Studio Ousiaの山田氏の指揮のもと、Qwen3-Next-80B-A3BをベースにDirect Preference Optimization(※1)を用いることで、長文回答の生成精度を向上させました。特に、自動評価が難しい「事実性」を適切に評価するため、Key Point Recall(※2)を指標とした自動評価フレームワークを構築。さらに、高度な検索モジュール(※3)を組み込み、ハイパーパラメータの調整を行うことで、長文形式の質問応答を効率的に処理するシステムを実現し、優勝という輝かしい成果につながりました。

用語解説

  • ※1:報酬関数の設計や報酬モデルの作成を行わずに、モデルを直接最適化する強化学習手法

  • ※2:生成された文章を評価する指標で、正解の文章に含まれる重要な文章や単語が、生成された文章にどれだけ含まれているかを示す指標

  • ※3:文書再ランク付けと要約化を用いて、生成された回答に含まれる各文章に、対応する検索文書を引用として添付するモジュール

未来を拓く成果と社会への応用 🚀

今回の成果により、オープンソース技術のみでDeep Researchシステムを設計、実装、評価するための知見と、再利用可能なアーキテクチャが確立されました。この基盤は、学術研究、企業内のナレッジ活用、公共分野など、さまざまな領域で高度なリサーチ機能をシステムに組み込むことを可能にします。

電通総研は、このDeep Research機能を自社ソリューション群に段階的に組み込むことで、調査、企画、文書作成、問い合わせ対応といった知的業務の効率化と高度化を目指しています。例えば、製造業における技術文書や障害事例の横断検索、公共分野における政策立案のための資料調査、コンサルティングプロジェクトにおけるリサーチの自動化など、幅広いユースケースへの展開が見込まれます。

特に重要な応用分野の一つがデジタルファイナンスです。金融機能のアンバンドル化が進む中で、Deep Research技術を組み込むことで、規制・ガイドライン、市場データ、企業開示情報など多様な情報源を横断的に分析し、新たな金融サービスの企画、審査、モニタリングを高度化していくことを目指します。

関係者のコメント

株式会社電通総研 事業開発室 データサイエンティスト 尾崎 尚憲 氏

「NeurIPS 2025」におけるコンペティション「MMU-RAG」で、現在大きな注目を集めているDeep Researchアプローチを核としたシステムで優勝できたことを大変光栄に思います。多段階の情報探索と推論を組み合わせるのみならず、リーズニングモデルのチューニングを行なった今回のアプローチは、LLMの検索を人間に寄せることを目指した取り組みです。今回の成果を出発点として、実用的な本当に役立つDeep Researchシステムの実用化・高度化に、今後も継続して取り組んでいきます。

東北大学 言語AI研究センター センター長 鈴木潤 氏

日々利用しているWeb検索の発展形として期待され、今後の様々な調べ物において中心的な方式になる可能性を秘めたDeep Research方式に連なる技術を自分たちで独自に組み上げる貴重な機会となりました。今後の研究に有益な知見や経験を得ることができました。

株式会社Studio Ousia チーフサイエンティスト 山田育矢 氏

最近、ChatGPTやGeminiなどに搭載されているLLMによる自律的なリサーチ機能であるDeep Researchは、主にクローズドな商用LLMを用いて実現されていますが、オープンな技術で同様の機能を実現することは難しい課題です。今回のコンペティションで開発したオープンで再現可能なDeep Researchが、その解決の一助となり、この分野の研究がさらに発展していくことを期待します。

各組織について

東北大学 言語AI研究センター

自然言語処理分野において国内最大級の研究グループを有し、AIアラインメントやセーフティ研究、AI基盤技術の発展を推進しています。AI駆動型研究の推進、AI人材育成、社会実装など、幅広い領域でAI技術の発展に貢献することを目指しています。
東北大学 言語AI研究センター

株式会社Studio Ousia

「テキストを「使えるナレッジ」へ」をビジョンに掲げ、自然言語処理を活用して組織の情報資産から新たな付加価値を創出しています。組織固有の知識も活用できる大規模言語モデル(LLM)の開発に強みを持ち、プロダクト提供や共同研究、受託開発、技術コンサルティングを通じて課題解決を実現しています。
株式会社Studio Ousia

電通総研

「HUMANOLOGY for the future~人とテクノロジーで、その先をつくる。~」を企業ビジョンとし、「システムインテグレーション」「コンサルティング」「シンクタンク」の3つの機能連携により、社会全体の進化を支援・実装しています。テクノロジーや業界を超えた「X Innovation」を推進し、新しい価値を創造し続けています。
電通総研

今回のNeurIPS 2025での優勝は、オープンソース技術を用いたDeep Researchシステムの可能性を大きく広げる画期的な成果と言えるでしょう。今後の社会実装とさらなる発展に期待が高まります。✨

この記事を書いた人 Wrote this article

lightstone

TOP