当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > MindDR 1.5:理想汽车多智能体研究框架解析

MindDR 1.5:理想汽车多智能体研究框架解析

2026-05-20 14:09:54 0浏览 收藏
理想汽车推出的MindDR 1.5多智能体研究框架,以仅约30B参数的轻量级模型,在DeepResearch Bench等权威评测中超越Gemini 3.1 Pro等大模型,实现性能与效率的双重突破——它通过Planning、DeepSearch、Report三大智能体分工协作,结合四阶段精细化训练(跳过高成本mid-training),将训练token减少71.4%、GPU耗时降低60%,同时支持自动化任务分解、多跳深度检索验证、结构化长报告生成及全程可追溯的推理溯源;该技术已落地“理想同学”智能助手,真实服务于汽车决策、学术研究、金融投研等高价值场景,堪称小模型撬动深度研究能力的标杆之作。

MindDR 1.5 是什么

MindDR 1.5 是由理想汽车信息智能体团队自主研发的多智能体深度研究框架,仅以约 30B 参数规模,在 DeepResearch Bench 基准测试中取得 52.54 分,性能位居行业前列。该框架采用 Planning、DeepSearch、Report 三大智能体协同工作的架构设计,并构建了包含 SFT 冷启动、Search-RL、Report-RL 及偏好对齐在内的四阶段训练流程,成功跳过高成本的 mid-training 阶段,使训练 token 数量减少 71.4%、GPU 卡时下降 60%,在保障高性能的同时显著降低资源消耗。目前,该技术已集成至“理想同学”(Livis)在线产品中并正式上线服务。

MindDR 1.5— 理想汽车推出的多智能体深度研究框架

MindDR 1.5 的主要功能

  • 自动化任务分解:Planning Agent 能够理解用户原始查询,并将其智能拆解为若干逻辑独立、可并行执行的子任务。
  • 多轮深度检索与验证:DeepSearch Agent 支持跨网页、数据库与代码环境的多跳搜索,结合实时验证与长程推理能力,提升信息获取准确性。
  • 结构化长报告生成:Report Agent 综合来自多个检索路径的证据链,生成具备完整引用、清晰层级与专业表达的高质量研究报告。
  • 跨智能体记忆共享与溯源机制:依托 Extended Chain-of-Thought(XoT)与 Tool Memory 技术,实现推理过程全程可追溯、工具调用记录统一管理。
  • 统一多工具接口支持:兼容 Web 搜索、结构化数据库查询、浏览器操作、Python 执行等多样化外部工具,提供灵活的任务扩展能力。

MindDR 1.5 的技术原理

  • 模块化多智能体协同架构:将复杂研究流程解耦为三个职责明确的智能体——Planning Agent(负责任务建模与调度)、DeepSearch Agent(专注信息挖掘与逻辑验证)、Report Agent(专精内容整合与表达优化)。三者通过共享 Memory 模块交换 XoT 推理轨迹与工具调用日志,有效规避单一大模型因上下文过长导致的记忆衰减与能力混杂问题。
  • 分阶段精细化训练策略
    • SFT 冷启动阶段:基于高质量指令微调数据,夯实基础工具使用能力、格式规范意识及多步推理习惯;
    • Search-RL 阶段:在真实工具环境中开展在线强化学习,引入动态奖励调度机制(依次侧重工具调用→格式合规→PRM评分→ORM评估),驱动搜索链路持续优化;
    • Report-RL 阶段:围绕 RACE 四维评价标准(全面性、洞察力、可读性、指令遵循度),叠加引用准确率与排版一致性奖励,全面提升报告质量;
  • 细粒度偏好对齐机制:融合 DPO(Direct Preference Optimization)与 Self-SFT 方法,针对性解决时间表述一致性、表格渲染异常等影响用户体验的关键细节问题。
  • 高质量合成数据构建:基于百度百科与英文维基百科构建领域知识图谱,通过子图采样、多跳问答生成、条件混淆扰动与多级质量过滤,批量产出具备强推理需求的训练样本;再与真实用户查询混合训练,缩小仿真与实际场景间的分布差异。

MindDR 1.5 的关键信息和使用要求

  • 研发主体:由理想汽车(Li Auto)旗下信息智能体团队完全自主设计、开发与维护。
  • 开源情况:技术白皮书与论文已在 arXiv 公开(编号:2604.14518),但模型权重及线上 API 接口暂未对外开源。
  • 模型规模:采用约 30B 参数的稠密模型与 MoE 架构双路线方案,在同参数量级开源系统中表现最优。
  • 训练效率:相比上一代 MindDR 1.0,整体训练 token 用量下降 71.4%,GPU 训练耗时降低 60%,大幅压缩研发周期与算力投入。
  • 落地形态:作为核心能力嵌入“理想同学”(Livis)智能助手产品,面向终端用户提供稳定、可信、响应迅速的深度研究服务。
  • 评测覆盖范围:全面适配 DeepResearch Bench、MindDR Bench、BrowseComp、xbench-DS、WideSearch 等主流深度搜索与报告生成评测体系。

MindDR 1.5 的核心优势

  • 极致性价比:以 30B 级中小规模模型达成业界领先性能,摒弃传统 mid-training 流程,兼顾训练效率与推理效果。
  • 职责解耦清晰:三智能体分工协作,分离规划、检索与撰写环节,避免端到端训练中的奖励稀疏性与能力干扰,天然支持子任务并行处理。
  • 渐进式强化学习机制:Search-RL 引入阈值触发式动态奖励调度,从基础动作精准性逐步跃迁至深层逻辑推理能力,模拟人类“顿悟”式成长路径。
  • 真实需求驱动评测:基于 500 条真实用户提问构建专属评测集 MindDR Bench,涵盖内容深度、事实准确性、呈现形式等多个维度,直击终端体验痛点。
  • 高效搜索决策能力:在同等结果准确率前提下,其工具调用频次与上下文 token 占用均明显低于同类竞品,兼顾精度与效率。

MindDR 1.5 的项目地址

MindDR 1.5 的同类竞品对比

对比维度MindDR 1.5Gemini 3.1 ProOpenAI Deep Research
开发方理想汽车GoogleOpenAI
参数规模~30B未公开(大模型)未公开(大模型)
架构设计三智能体协作(规划/搜索/报告分离)单/多智能体(未公开细节)单智能体端到端
训练策略四阶段管线(跳过 mid-training)大规模持续预训练端到端强化学习
DeepResearch Bench**52.54**52.1746.45
BrowseComp-ZH**45.7**
核心特点小模型+多阶段 RL,成本极低原生多模态,通用性强闭源产品,体验成熟
开源程度论文公开,模型未开源闭源闭源

MindDR 1.5 的应用场景

  • 汽车行业深度分析:支撑市场竞争态势研判、价格策略推演、三电技术路线比选等高复杂度商业决策场景。
  • 学术研究辅助:自动完成文献检索、观点归纳、多源交叉验证,并输出符合学术规范的综述报告与参考文献列表。
  • 金融投研支持:针对上市公司财报、行业政策、舆情动态进行多轮信息核查与结构化提炼,输出专业级投资简报。
  • 产品战略制定:融合公开数据、用户行为日志与竞品动态,生成具备实操指导价值的市场进入或功能迭代建议。
  • 智能座舱知识服务:作为“理想同学”的底层引擎,为车主提供权威、及时、可验证的出行相关深度知识问答。

今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

Win11系统日志大小调整方法Win11系统日志大小调整方法
上一篇
Win11系统日志大小调整方法
百度小说添加书架收藏方法教程
下一篇
百度小说添加书架收藏方法教程
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    4714次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    5070次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4949次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    6875次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    5309次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码