医疗AI新突破!南洋理工发布首个电子病历处理评测标准
2025年12月16日 09:40·AIBase
在现代医疗体系中,电子病历(EHR)无疑是核心数据形式,记录了患者从诊断到治疗的各项关键信息。这些数据不仅为医生提供决策支持,也推动了医疗人工智能的发展。南洋理工大学的研究团队近期推出了首个全面评测大型语言模型(LLM)处理电子病历能力的基准 ——EHRStruct,标志着医疗 AI 研究的一大步。
EHRStruct 基准涵盖了 11 项核心任务,共计 2200 个样本,任务设计充分考虑了临床场景、认知层级及功能类别,形成了一套严谨的评测框架。研究人员表示,通用大模型在处理结构化电子病历时表现出色,超越了专门针对医学领域设计的模型。同时,他们还发现,数据驱动的任务性能更强,输入格式和微调方法对模型的表现也有显著影响。
在评测中,研究团队对 20 个主流的 LLM 和 11 种增强方法进行了系统性比较,结果显示,结合 EHRMaster 框架和 Gemini 模型后,LLM 在处理结构化 EHR 时的性能显著提升,甚至超越了当前最先进的模型。该研究成果已被 AAAI 2026 会议录用,预计将在未来的学术交流中引发广泛关注。
为了推动这一领域的发展,研究团队还推出了 “EHRStruct 2026 - LLM 结构化电子病历挑战赛”,旨在为研究人员提供一个统一、可比较的评测平台,促进对 LLM 在结构化电子病历处理能力的深入研究。
EHRStruct 的建立过程可分为四个阶段:任务合成、任务体系构建、任务样本抽取和评测流程搭建。由医学专家和计算机科学家共同合作,确保了评测的临床相关性和可重复性。这一评测框架不仅具有科学性和严谨性,也为后续的研究提供了丰富的数据支持。
这一重要研究的发布,不仅为医疗 AI 的进步提供了新的工具和方法,也为今后的临床决策与数据分析提供了更为可靠的支持。我们期待更多的医疗 AI 应用在实际工作中落地,实现更高效的医疗服务。


