持续霸榜MedBench!深兰科技医疗大模型综合评测第一
2025-05-30近日,国内权威医疗大模型评测平台MedBench发布最新评测榜单,深兰科技DeepBlue-MR-v1医疗大模型不仅以复杂医学推理评测第一的成绩持续霸榜,而且在多个综合评测中以94.2的高分荣膺桂冠。
榜单显示,参与本次评测的大模型有阿里蚂蚁大模型、腾讯优图天衍医学大模型、基于华为盘古大模型研发的润医医疗大模型、云知声UniGPT-Med-U1大模型等。
复杂医学推理评测持续霸榜多维度综合测评获得第一MedBench是中文医疗大模型第一权威评测平台,由上海人工智能实验室与上海市数字医学创新中心联合国内多家医疗机构和科研单位设立,该平台汇聚了顶级医疗机构的专家经验和知识储备,已为全球超387个模型提供评测,华为、百度等头部企业将其视为技术验证门槛,部分医院更将评测结果纳入采购参考,同时其评测体系被纳入国家药监局AI三类证申报支持范畴,并发表于中科院一区期刊,形成“产学研用评”闭环生态。在国际层面,MedBench垂域深度可比肩MIMIC-CXR等国际知名评测体系,但更加适配中文医疗场景需求,成为全球医疗AI赛道的重要参考系。
深兰科技DeepBlue-MR-v1医学推理大模型是由深兰科技自主研发的医学推理大模型,擅长临床医学问诊、辅助医学诊断和制定诊疗方案等任务。通过对医学教科书、诊疗指南、专家论文、病案病历、医学推理、医学术语以及心理咨询等海量数据的清洗、构建和医学专家团队标注,运用自研训练体系,实现了人类医学推理能力对齐的基于Transformer架构的稠密大语言模型。DeepBlue-MR-v1医学推理大模型在海量高质量的医学数据上进行预训练,构建医学推理语义空间,然后通过后训练监督微调、医学推理指令增强和多阶段自适应强化学习算法实现医学推理能力迭代提高。
医学推理能力是AI医疗皇冠上的明珠。深兰科技DeepBlue-MR-v1医疗大模型,自登顶MedBench复杂医学推理能力榜首至今,持续霸榜并扩大领先优势。在保持复杂医学推理能力的绝对领先优势的同时,还在医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理共五个维度的综合得分也荣登MedBench榜首,该成绩充分彰显了行业领先的技术实力。
深兰AI问诊助手落地湖北多家三甲医院目前,基于DeepBlue-MR-v1医疗大模型,深兰科技所开发的AI医疗产品,已形成涵盖“AI问诊助手”、“远程视频问诊”、“辅助诊断系统”及“医学专家知识库”等在内的智能体产品矩阵。与武汉市中心医院、武汉协和医院、武汉市血液中心、武汉市精卫中心、武汉市武东医院等多家医疗机构达成合作,将联手推动AI技术在问诊、诊断、专科服务等场景的深度应用。
-
【央视新闻】深兰熊猫公交亮相首部反映交通运输业史诗纪录片《交通中国》
媒体报道 -
央视《新闻联播》采访深兰科技陈海波:为可持续发展贡献中国科技力量
媒体报道 -
【上观新闻】长宁企业研发的这款“缺陷检测设备”为制造业生产装上“火眼金睛”!
媒体报道 -
【经济日报】深兰科技公司贯通基础研究与应用开发——人工智能赋能传统产业
媒体报道 -
【经济日报】深兰科技公司贯通基础研究与应用开发—— 人工智能赋能传统产业
媒体报道 -
【河南日报】深兰机器人商丘制造基地在商丘市梁园区投产
媒体报道 -
树洞救援武汉中心正式挂牌,深兰用平台和技术为公益赋能
公司新闻 -
深兰科技开启“海外名校产业博士计划”,董事长陈海波被聘为上海交通大学博士生导师
公司新闻 -
出席第三届“一带一路”峰会的斯里兰卡总统会见深兰科技董事副总裁刘园桂一行
公司新闻 -
【每日经济】专访深兰科技董事长陈海波:大模型如何助力人类从“碳基生命”走向“硅基生命”?
媒体报道 -
深兰科技科研团队6篇论文被国际医学信息科学顶尖学术会议收录
公司新闻 -
国家知识产权局公布《2023年度国家知识产权优势企业名单》,深兰科技成功入选
公司新闻 -
深兰科技董事长陈海波担任上海市科学技术协会常委
公司新闻 -
深兰科技500辆智能驾驶巴士订单落地 ,人民日报等多家央媒报道
媒体报道 -
泰国社会发展和人类安全部部长秘书率考察团到访深兰科技
公司新闻 -
深兰科技与一带一路(国际)研究院签署国际市场合作协议
公司新闻 -
【36氪】深兰科技发布国内首款个人记忆管理智能体——好记猫App
媒体报道 -
浦东创投集团参与完成深兰科技数亿元Pre-IPO轮投资
公司新闻 -
央企国家队重磅出手!中交集团三大王牌集体"联姻"深兰科技
公司新闻 -
持续霸榜MedBench!深兰科技医疗大模型综合评测第一
公司新闻