AI Industry-Academia Insights

AI Industry-Academia Insights

发表日期: 2025年5月12日


一、Nature新发布:AMIE大型语言模型在医学鉴别诊断中的突破性应用  

4月,Nature发布了一项新研究,介绍了一种专为临床诊断推理优化的大型语言模型——Articulate Medical Intelligence Explorer(AMIE)。该研究强调,准确诊断对有效医疗至关重要,但开发能够辅助医生进行诊断的人工智能(AI)系统一直充满挑战。传统研究多关注机器输出诊断的准确性,然而,实际临床实践需要一个迭代且互动的推理过程。AMIE的问世为设计新型交互工具带来了转机。

研究基于《新英格兰医学杂志》的302个挑战性医学案例,20名临床医生参与评估。医生们在两种辅助条件下工作:一种是使用搜索引擎和标准医学资源;另一种是使用AMIE辅助加上这些资源。主要评估指标为鉴别诊断列表中是否包含最终诊断。

结果显示,AMIE在独立生成鉴别诊断列表方面显著优于无辅助的临床医生(准确度59.1% vs 33.6%)。使用AMIE辅助的临床医生相比无辅助医生,其鉴别诊断质量更高、更全面(准确度51.7%和44.4%)。

研究最后指出,尽管AMIE表现出色,但其在实际临床环境中的使用仍需谨慎。未来的研究应加强探索LLMs在特定场景中增强临床医生鉴别诊断能力的方式。




论文链接:
https://doi.org/10.1038/s41586-025-08869-4  


二、Nature发布MUSK模型,助力精准肿瘤学发展 

近日,Nature发布了一项创新研究,介绍了一种名为MUSK的视觉-语言基础模型。该模型能整合病理图像和临床报告等多模态数据,助力精准肿瘤学的诊断和治疗。MUSK基于多模态变压器架构,通过统一掩蔽建模预训练,使用了5000万张病理图像和10亿个病理相关文本标记,并通过约100万图像-文本对的对比学习对齐视觉和语言特征。

实验数据显示,MUSK模型在多项医学任务中展现卓越性能:在跨模态检索领域,其零样本检索能力在BookSet和PathMMU数据集上显著优于同类基础模型;视觉问答任务中,PathVQA数据集准确率高达73.2%;图像分类任务中多个指标表现优异。在临床预测方面,该模型对分子生物标志物的识别精度超越现有病理模型,黑色素瘤5年复发风险预测(VisioMel数据集)AUC达0.833,泛癌预后生存预测(16种癌症)平均c-index为0.747,非小细胞肺癌免疫治疗反应预测(PFS及治疗响应)AUC分别达到0.768和0.705。




论文链接:
https://doi.org/10.1038/s41586-024-08378-w 



三、Nature发布创新模型,助力胶质瘤快速检测与手术效率提升 
胶质瘤治疗的一个关键挑战是在手术中准确检测肿瘤浸润程度,以实现安全的最大范围切除。然而,大多数胶质瘤患者在术后仍会残留可安全切除的肿瘤组织,这往往导致肿瘤的早期复发和患者生存率的下降。针对这一难题,Nature最近期发表的一项研究开发了一种名为FastGlioma的视觉基础模型。该模型能够在不到10秒内快速、准确地检测新鲜、未经处理的手术组织中的胶质瘤浸润情况,为胶质瘤手术提供了全新的辅助工具。

FastGlioma基于大规模自监督学习技术进行预训练,使用约400万张无标记的快速光学显微图像数据,并通过微调生成标准化评分,用于指示光学全视野图像中肿瘤浸润的程度。在一项涉及220名弥漫性胶质瘤患者的前瞻性、多中心国际测试中,FastGlioma以平均92.1±0.9%的曲线下面积 (AUC) 精确检测并量化了肿瘤浸润程度。

此外,在一项对比实验中,FastGlioma在检测肿瘤浸润方面,远超现有的图像引导和荧光引导辅助技术(涉及129名患者)。这一结果表明FastGlioma在不同患者群体、医疗中心和世界卫生组织定义的弥漫性胶质瘤分子亚型中均表现出色,其性能稳定可靠。



论文链接:
https://doi.org/10.1038/s41586-024-08169-3 


四、DeepSeek-R2即将到来,清华合作推动奖励模型新进展 


4月5日,DeepSeek发布了一篇新论文,与清华大学研究者合作揭示了一种全新的奖励模型推理Scaling方法。研究指出,尽管强化学习可以有效提升大型语言模型的推理能力,但在多个领域中获取准确的奖励信号仍是一个重大挑战。为解决这一问题,DeepSeek与清华研究团队提出了一种名为自我原则点评调优(Self-Principled Critique Tuning, SPCT)的创新学习方法,并基于此构建了DeepSeek-GRM系列模型,同时引入元奖励模型(meta RM)进一步优化推理扩展性能。


SPCT方法以拒绝式微调作为冷启动阶段,结合基于规则的在线强化学习,使模型能够自适应地生成评判原则并准确生成点评内容,从而显著提升奖励信号的质量和扩展性。在推理Scaling策略上,研究团队也进行了深入探索,采用基于采样的投票机制,通过生成奖励进行筛选,并巧妙利用元奖励模型引导投票过程,有效过滤低质量样本。实验结果显示,DeepSeek-GRM-27B在多个综合奖励模型(RM)基准测试中表现出色,其推理扩展能力显著提升,甚至在某些场景中超越了参数量更大的模型。



论文链接:
https://arxiv.org/abs/2504.02495 


五、AI+医疗,DeepSeek赋能420余家医院最新数据 


3月25日最新发布的数据展示了DeepSeek在医疗领域的多场景应用情况。这些应用基于420余家医院的实践成果,展现了AI在提升医疗服务质量与效率方面的潜力。


数据显示,东南大学附属中大医院应用DeepSeek实现了症状分诊与科室匹配,以及结构化病历生成;北京协和医院借助该系统为患者提供诊断参考和个性化治疗方案;厦门大学附属第一医院利用其自动生成病历文书初稿,提升病历书写效率;重庆市第五人民医院(重庆大学附属仁济医院)通过系统生成病历质控分析报告,实现病历智能质控。这些案例表明,不同地区的医院正积极探索AI技术在医疗服务中的应用。

从地域分布来看,广东、浙江、湖北等省市的多家医院在患者服务、临床支持、医院管理等方面积极引入DeepSeek系统,推动了当地医疗服务的智能化发展。例如,广东省妇幼保健院利用其构建全生命周期健康管理体系;佛山市顺德区第五人民医院实现了院内导航和方言识别功能。这些实践表明,越来越多的地区正积极拥抱AI+医疗模式,借助技术力量优化医疗服务流程,提升诊断准确性,加强医院管理效能,最终实现医疗服务质量和效率的双重提升,为患者带来更优质的就医体验。



原文链接:
https://mp.weixin.qq.com/s/WfWaRbackd3J533cZnoiog 


六、英伟达VISTA3D模型:引领医学影像分割新突破 


近日,英伟达联合多家机构推出的VISTA3D多模态医学影像分割模型,凭借其首创的三维超体素特征提取方法,实现了三维自动分割与交互式分割双模态的协同优化。在23个数据集的综合基准测试中,该模型的分割精度较现有最优专家模型提升了5.2%。


近年来,尽管医学影像分析技术取得了巨大的进步,但精准分割任务仍然高度依赖人工,这不仅耗时,而且容易因专业人员的视觉疲劳而产生边界误差。VISTA3D采用模块化设计理念,基于SegResNet构建三维分割核心,形成U型网络架构。自动分支可激活自动分割功能,交互分支能激活交互式分割功能,二者结合时可通过算法合并模块编辑结果。其自动分支采用智能编码技术管理人体结构,节省内存且避免学习偏差;人工修正模块采用三维点击定位技术,提升医生修正效率。

在训练阶段,VISTA3D整合了大量CT扫描数据,并采用半监督学习及渐进式训练策略,使其在多个国际公开数据集上的验证表现优异,这表明该模型在实际临床应用中具有巨大的潜力。



论文链接:
https://doi.org/10.48550/arxiv.2406.05285  



七、英伟达联合谷歌、迪士尼推出Newton,助力机器人仿真发展
  
近日,NVIDIA联合Google DeepMind和Disney Research推出了开源物理引擎 Newton,旨在推动机器人学习与开发。Newton基于 NVIDIA Warp 构建,与多个学习框架兼容,且开源特性使开发者可自由使用、分发和贡献成果。

Newton具备诸多优势。其利用NVIDIA Warp加速,能高效仿真;兼容开源物理引擎MuJoCo,特别是其关键引擎MuJoCO-Warp,可大幅提升性能;支持可微物理,能通过仿真传播梯度,优化系统参数;具有高度可扩展性,支持多物理场仿真和自定义求解器,并基于OpenUSD构建,灵活聚合数据。

在应用方面,Disney Research将率先使用Newton推动机器人角色平台发展,如为BDX机器人提供支持。同时,相关合作方正合作定义机器人的OpenUSD资产结构,统一工作流,推动机器人技术发展。



原文链接:
https://mp.weixin.qq.com/s/rdnxQhVPfE3Xyb4tEjxN8A