AI Industry-Academia Insights

AI Industry-Academia Insights

发表日期: 2026年3月20日

1.破解罕见病难题,DeepRare多智能体协作登上Nature

2月18日,Nature发表了一篇关于罕见病诊断智能体系统DeepRare的研究成果,引发广泛关注。研究团队提出多智能体协同架构,将大语言模型从 “裁决者” 转为 “协调者”,统筹多种工具协同推理,大幅提升系统可靠性与可信度。

当前,罕见病诊断面临三大挑战:高度异质性、低频接触以及知识的动态更新。DeepRare通过三层架构应对这些挑战:中央Host由大语言模型驱动,负责任务拆解与调度;服务层由多个专门的Agent组成,如表型提取、基因分析和知识检索模块;外部知识层整合了文献、数据库和病例库。系统通过动态调用外部资源,降低了“幻觉”风险,并增强了透明性和可扩展性。

DeepRare的核心创新包括多模态输入整合、透明推理链生成和跨中心泛化能力。它能够处理复杂输入,例如自由文本描述、HPO表型条目和VCF基因文件,并通过证据绑定提供可追溯的推理链条。研究团队测试了9个跨地域、多来源的数据集。在真实临床病例中,DeepRare不仅在Top-1准确率上超越了专家水平,还通过分层协同显著提升了诊断效率。系统的模块化设计使其能够动态调度资源,适应不同场景需求。

消融实验表明,DeepRare的优越性来源于架构设计,而非单一模型的参数规模。类似病例检索、知识检索和自反机制等模块相互协同,使系统在罕见病诊断中具备强大的泛化能力和可靠性。

DeepRare的突破展示了一种新的医疗AI范式:从“模型驱动”转向“系统驱动”,实现诊断的组织化、透明化和动态化。这一研究为未来医疗AI的发展指明了方向,即通过结构创新提升临床可用性,而非单纯依赖模型规模的扩大。

链接:https://www.nature.com/articles/s41586-025-10097-9


2.从“背题”到“看诊”,字节发布豆包医学版 MedXIAOHE

2月13日,字节跳动小荷健康团队发布了豆包医学版MedXIAOHE。该模型融合了实体感知的持续预训练、工具增强的智能体推理以及基于循证的长文报告生成等多项核心技术,在一系列综合性医疗评测中表现优异。

BaMedXIAOHE基于Seed视觉-语言基础模型,由视觉编码器、轻量级多模态连接器和自回归大语言模型组成。其采用的多模态原生分辨率Transformer能够处理文本问答、影像解读、OCR信息提取、长文报告生成等多种任务,实现视觉特征与文本token的交错融合,支持多轮对话及基于推理的生成。

为弥合“刷榜高分”与“临床可用”之间的鸿沟,MedXIAOHE提出了三大技术创新:

持续预训练:基于五层分类体系,通过平衡训练、指导性数据收集与量化评估,构建了约6400亿token的高质量持续预训练语料,有效缓解了长尾病例理解薄弱的问题。

中期强化训练:通过综合数据合成引擎、多专家拒绝采样和结构化思维链,集成工具增强的智能体训练,将模型从“知识记忆”提升至“临床思维”层面,实现可追溯的循证推理。

后期训练与对齐:依托多层混合奖励系统与RFT增强的课程强化学习,使模型更可靠、更符合临床偏好与安全规范。

在整合了30多个公共数据集的统一Med-VLM评测基准中,MedXIAOHE在视觉诊断、医学影像理解、医学文本问答等多个维度均达到领先水平,超越GPT-5.2和Gemini 3.0。同时,其诊断推理与指令遵循能力表现突出,能够生成高质量、低幻觉的临床报告。

MedXIAOHE展示了一条构建高性能、高实用性医疗多模态大模型的清晰路径,贡献了一整套可复现的方法论,有助于减少幻觉、提升鲁棒性和强化推理能力,推动医疗多模态基础模型向更标准化且贴近临床实际需求的方向发展。

链接:https://arxiv.org/pdf/2602.12705


3.开启医疗AI新纪元,首个医疗世界模型MedOS发布

2月20日,斯坦福大学、普林斯顿大学、NVIDIA、Nebius、VITURE及AI4Science Catalyst Institute联合发布了全球首个通用医疗具身世界模型——MedOS。这标志着医疗AI实现了从基于语言模型的“虚拟助手”到能够理解并介入物理世界的“智能实体”的跨越。

针对传统医疗AI在物理理解层面的局限,MedOS通过整合人工智能、扩展现实(XR)与协作机器人技术,构建了一个通用的State-Action-Transition(状态-动作-转换)医疗闭环。在感知层面,它超越了传统的影像诊断,能够通过XR设备实现对临床场景的深度理解;在模拟层面,它能在数字孪生环境中进行反事实推演,预测疾病进展与治疗效果;在干预层面,它可驱动医疗协作机器人主动介入物理世界,实现精准操作。

MedOS的架构设计模拟了人类医生的“双系统认知模式”,兼顾处理效率与推理深度。在急诊或手术场景中,MedOS的“快系统”负责实时边缘推理,快速响应高时效性临床需求;面对复杂并发症或多系统疾病时,“慢系统”则承担时空推理任务,制定从诊断到康复的最优诊疗路径。

实验数据显示,在MedOS的辅助下,年轻医生、医学生乃至护士的诊断与操作准确率可显著提升至资深医师水平,实现了将专家隐性知识通过算法有效传递。同时,MedOS还能有效缓解操作者因疲劳导致的生理震颤与决策偏差,为医疗安全构筑一道“硅基防线”。此外,MedOS具备自主临床发现能力,可自主分析病例、调用公共数据库(如TCGA)开展研究,在临床实践中挖掘新的医学知识。

MedOS的发布是人工智能在医疗领域应用的重要分水岭,标志着医疗AI正式迈入“物理时代”。未来,MedOS将作为人类医生感知能力的延伸与行动能力的增强,提供基于医学智慧的更优诊疗方案。

2025年12月20日,OpenAI创始成员之一的Andrej Karpathy在《2025 LLM Year in Review》的推文中探讨了2025年AI领域的一些重要突破和现象级产品,认为这些范式转变将完全重塑行业格局。

链接:https://medos-ai.github.io/paper


4.赋予AI“记忆、眼睛、工作流”,智诊科技实现三重突破

2月25日,杭州医疗AI企业智诊科技推出了Wise MemOS 2.0、WiseDiag V2、WiseResearch三大升级产品,并上线“好伴AI”微信小程序。这些突破让AI真正拥有持续记忆、多模态理解能力和循证工作流,从根源上解决医疗AI的“幻觉”难题。

Wise MemOS 2.0:让AI拥有“时间感”,从信息检索升级为主动认知

与依赖外部数据库的传统AI不同,智能记忆系统Wise MemOS 2.0将记忆直接内化于模型本身,实现跨任务、跨时间的持续学习能力。该系统模拟人类大脑的记忆固化过程,让新旧信息在模型内部实时融合、动态更新,并引入自适应衰减机制——重要的逻辑连接被持续强化,无关信息自动淡出。在业内权威的Locomo记忆能力评测中,Wise MemOS 2.0得分跃升至95.8%,较上一代提升近32个百分点。

WiseDiag V2:从“读文字”到“辨全貌”,实现多模态信息的可控融合

为了让模型掌握核心推理逻辑,医疗多模态大模型WiseDiag V2在底层实现了视觉特征与医学知识的精准对齐。其医疗训练数据跃升至800亿Token,覆盖更完整的疾病谱系。通过对3万余例真实病历进行深度拆解,WiseDiag V2构建了完整的循证推理路径,让AI诊断全程有证据、可解释、可追溯。在MedBench、MedQA、vl-health、HealthBench等多项权威医学评测中,WiseDiag V2凭借强大实力霸榜。实际临床场景中,WiseDiag V2实现了罕见病的精准诊断。

WiseResearch与“好伴AI”:用“负责任”的循证工作流重塑诊疗

医疗智能体WiseResearch配备了三大核心工具:MedOCR专为医疗文档设计,可精准提取生化报告中的数值、单位、箭头信息,实现近100%零失误识别;MedDB收录超40万条经专家审核的医学条目,覆盖1.2万种疾病,每条知识都明确标注证据等级和时效性;MedSearch专业医学搜索引擎与全球顶尖医疗指南保持同步。目前,智诊科技已将上述技术集成到“好伴AI”微信小程序中,全面开放包括报告解读、拍照识热量、专家问答、健康档案等核心功能。

智诊科技现已全面开放模型API、智能体开放、场景化解决方案三层能力底座,并在300多家医院落地,累计服务人数接近百万。这种从记忆中枢到证据链、再到千家万户的完整可信路径,正在推动中国医疗AI一场从CureMedicine(治愈医学)到CareMedicine(关怀医学)的变革。

链接:https://www.wisediag.com


5.编程AI双雄对决,Codex 5.3 快到离谱,Opus 4.6 稳到封神

2月6日,OpenAI与Anthropic同日发布了最新模型——GPT‑5.3‑Codex与Claude Opus 4.6, 前者在“速度”维度占据绝对优势,而后者在“上下文处理”、“代码质量”和“工具调用”上全面领先。这场在硅谷掀起AI编程大战,标志着生成式 AI已从单纯的“代码补全”彻底转向“全自主智能体”时代。

GPT‑5.3‑Codex:极速高效的“黑客”

GPT‑5.3‑Codex凭借极致速度与工程效率征服了开发者。一名程序员借助它,仅用14天就完成了经典游戏的全平台重构,甚至破解了失传20年的私有协议,完成了传统团队数月才能实现的代码考古与重构。另有极客耗资1万美元API费用,将Codex打造成智能体集群,自动爬取信息、生成数百条科研假设、优化工作流并自主提交代码,大幅提升研发与决策效率。

Claude Opus 4.6:思维深邃的“艺术家”

在权威评测中,Claude Opus 4.6全面屠榜。在Arena.ai平台,它在代码、文本、专家三大领域全部登顶,代码能力较上一代暴涨106分,文本任务超越Gemini 3 Pro,专家任务领先第二名近50分,成为全能型“六边形战士”。在EpochAI前沿数学测试中,Claude Opus 4.6在高难度数理任务上表现亮眼:Tier4极难题目得分与GPT‑5.2 (xhigh)持平,竞赛数学、专家科学问题以及ARC AGI抽象推理等核心指标均位居前列,综合能力跻身全球顶尖水平。

GPT‑5.3‑Codex和Claude Opus 4.6的发布,实现了AI能力的全面突破,大幅降低了编程门槛,将开发从繁琐的技术实现转向纯粹的创造力释放。未来,“一人公司”将成为现实,真正的限制不再是技术,而是人的想象力。

链接:https://www.apex36tech.com/blog/claude-opus-46-vs-gpt-53-codex-ai-showdown


6.“集群+超节点”,华为新一代算力底座惊艳MWC 2026

近日,在巴塞罗那世界移动通信大会(MWC 2026)上,华为凭借新一代算力底座“集群+超节点”的架构创新,一举斩获GTI Awards六项大奖,涵盖技术创新、产品方案及移动AI应用等多个领域。

本次华为发布的计算产品及解决方案,包括Atlas 950 SuperPoD智算超节点、Atlas 850E 超节点服务器,以及业界首款通用计算超节点TaiShan 950 SuperPoD,和TaiShan 500、TaiShan 200等系列化产品,为各行业AI智能化升级注入新动能。

基于灵衢打造的Atlas 950 SuperPoD智算超节点,通过多项关键技术实现架构突破:采用零线缆电互联与零漏液全液冷设计,大幅提升系统可靠性;独创UB‑Mesh递归直连拓扑,支持8192卡无收敛全互联,跨柜卡间往返时延从7μs降至3μs。该超节点采用万卡级集群架构,算力、带宽与内存规模分别达到业界水平的6.7倍、62倍与15倍。相比传统集群,大模型训练效率、可靠性与推理性能均大幅提升。

业界首款通用计算超节点TaiShan 950 SuperPoD,实现百纳秒级超低时延、TB级超大带宽,最大48TB内存池化能力,从根本上解决了通算场景时延高、数据搬移开销大的难题,为大型机、小型机替代提供了可行技术路径。

在全球人工智能浪潮下,华为提供了一条“不靠先进制程、靠系统协同、开源开放、低成本、自主创新”的全新技术路径,让世界在英伟达之外,有了另一个能落地、能规模化、能支撑AGI的算力底座选择,重塑了全球算力基础设施的发展范式。

链接:https://www.huawei.com/cn/news/2026/3/mwc-superpod-ai