医学教育的AI飞跃:代理式检索增强生成(RAG)、开放权重大型语言模型(LLMs)和实时病例洞察如何塑造纽约大学朗格尼医学中心的新一代医生

医学教育的AI飞跃:代理式检索增强生成(RAG)、开放权重大型语言模型(LLMs)和实时病例洞察如何塑造纽约大学朗格尼医学中心的新一代医生

病人数据记录往往复杂且有时不完整,这意味着医生并不总能立即获得所需的所有信息。此外,医学专业人士无法跟上行业内涌现的大量病例研究、研究论文、试验和其他前沿发展。位于纽约市的纽约大学朗格尼健康中心(NYU Langone Health)提出了一种新颖的方法来解决下一代医生面临的这些挑战。这家学术医疗中心——包括纽约大学格罗斯曼医学院、纽约大学格罗斯曼长岛医学院以及六家住院医院和375家门诊机构——开发了一个大型语言模型(LLM),作为备受尊敬的研究伙伴和医疗顾问。每天晚上,该模型处理电子健康记录(EHR),将其与相关研究、诊断提示和必要背景信息相匹配,然后于次日清晨以简洁、定制化的电子邮件形式发送给住院医生。这是纽约大学朗格尼健康中心开创性医学教育方法——“精准医学教育”的一个基本组成部分,该方法利用AI和数据为医学生提供高度个性化的学习路径。

“医疗领域需要这种‘一切精准’的概念,”纽约大学朗格尼健康中心教育信息学副院长兼医学教育创新研究所所长Marc Triola告诉VentureBeat。“很明显,证据表明AI可以克服医疗系统中的许多认知偏差、错误、浪费和低效,提高诊断决策能力。”

纽约大学朗格尼健康中心如何使用Llama增强病人护理?该中心使用基于最新版本的Llama-3.1-8B-instruct的开放权重模型,以及开源的Chroma向量数据库进行检索增强生成(RAG)。但模型不仅仅访问文档,它还积极使用搜索和其他工具来发现最新的研究文献。每晚,模型连接到该设施的EHR数据库,提取前一天在朗格尼就诊的患者的医疗数据。然后,它搜索诊断和医疗状况的基本背景信息。使用Python API,模型还在PubMed中搜索相关医学文献,PubMed拥有“数百万篇论文”。LLM筛选出评论、深入论文和临床试验,选择几篇看似最相关的文献,“并将它们整合成一封漂亮的电子邮件”。次日清晨,医学生以及内科、神经外科和放射肿瘤学住院医生会收到一封包含详细病人总结的个性化电子邮件。例如,如果一位充血性心力衰竭患者前一天接受了检查,电子邮件将提供关于心脏疾病基本病理生理学和最新治疗方法的复习信息。它还提供自学问题和AI策划的医学文献,并可能给出关于住院医生下一步可以采取的行动或可能忽略的细节的建议。

“我们从学生、住院医生和教职员工那里收到了很好的反馈,他们认为这无缝地使他们保持了最新状态,他们正在将这种方式融入到病人的护理计划中,”Triola说。他个人的一个关键成功指标是,当系统故障导致几天没有发送电子邮件时,教职员工和学生抱怨他们没有收到早晨的提醒,这已经成为他们思考的一部分。“因为我们在医生开始查房前发送这些电子邮件——这是他们一天中最疯狂和最忙碌的时间之一——他们注意到没有收到这些电子邮件并想念它们,这太棒了。”

这个先进的AI检索系统是纽约大学朗格尼健康中心精准医学教育模型的基础,Triola解释说,该模型基于“高密度、无摩擦”的数字数据、AI和强大的算法。过去十年间,该机构收集了大量关于学生的数据——他们的表现、他们照顾病人的环境、他们编写的EHR记录、他们做出的临床决策以及他们通过病人互动和护理进行推理的方式。此外,纽约大学朗格尼健康中心还拥有医学生可以使用的所有资源的庞大目录,无论是视频、自学或考试问题,还是在线学习模块。该项目的成功也归功于医疗设施的简化架构:它拥有集中的IT、一个医疗方面的单一数据仓库和一个教育方面的单一数据仓库,允许朗格尼将其各种数据资源结合起来。首席医疗信息官Paul Testa指出,如果没有出色的数据,就不可能构建出色的AI/ML系统,但“如果你的系统中数据散落在未仓库化的孤岛中,这并不容易实现”。虽然医疗系统庞大,但它以“一个病人、一份记录、一个标准”的方式运营。

生成式AI使纽约大学朗格尼健康中心能够摆脱“一刀切”的教育模式。Triola说,他的团队一直试图解决的问题是:“他们如何将诊断、每个学生的个人情况和所有这些学习材料联系起来?”“突然之间,我们有了一个很好的钥匙来解锁这个问题:生成式AI。”这使学校能够摆脱一直以来的“一刀切”模式,无论学生打算成为神经外科医生还是精神病学家——这是需要独特方法的截然不同学科。重要的是,学生在整个学习期间都能获得量身定制的教育,以及适应他们需求的“教育推动”。但你不能只是告诉教职员工“花更多时间与每个学生在一起”——这在人力上是不可能的。“我们的学生一直渴望这一点,因为他们认识到这是医学领域高速变化的时期,而生成式AI将改变……成为医生意味着什么。”

为其他医学机构树立榜样。当然,在这个过程中也遇到了挑战。值得注意的是,技术团队一直在解决模型的“不成熟”问题。Triola指出:“它的嵌入式知识既广泛又准确,这令人着迷,但有时也有限制。它会连续99次完美、可预测地工作,然后在第100次时做出一系列有趣的选择。”例如,在开发早期,LLMs无法区分皮肤上的溃疡和胃部的溃疡,这两者“在概念上完全不相关”,Triola解释说。他的团队随后专注于提示细化和基础化,结果“令人瞩目”。事实上,他的团队对堆栈和流程如此自信,他们认为它可以作为其他机构效仿的一个很好例子。“我们倾向于使用开源和开放权重,因为我们希望达到这样一个目标:我们可以说,‘嘿,其他医学院,其中许多资源不多,你们也可以廉价地做到这一点。’”Testa同意说:“这是可重复的吗?这是我们想要传播的东西吗?绝对是的,我们想在医疗领域传播它。”

重新评估医学中的“神圣不可侵犯”的做法。可以理解的是,整个行业都非常担心AI系统中可能存在的微妙偏见。然而,Triola指出,在这个用例中,这不是一个很大的担忧,因为这是一个相对简单的任务。“它是搜索,它是从列表中选择,它是总结,”他指出。相反,最大的担忧之一是技能退化或丧失。举个例子:某个年代的人可能会记得在小学学习草书,但他们可能已经忘记了这项技能,因为他们在成年生活中很少有机会使用它。现在,它几乎已经过时,在今天的初等教育中很少教授。Triola指出,成为医生有一些“神圣不可侵犯”的部分,有些人不愿意以任何方式将这些部分交给AI或数字系统。“例如,有一种观念认为,年轻医生应该在不进行临床设置时积极研究和埋头于最新的文献中。但今天可用的医学知识量和临床医学的‘疯狂节奏’要求以不同的方式做事,”Triola强调说。在研究和检索信息方面,他指出:“AI做得更好,这是一个许多人不愿意相信的不舒服的事实。”相反,他认为:“让我们说这将赋予医生超能力,并找出人类和AI之间的副驾驶关系,而不是谁将做什么的竞争关系。”

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/yi-xue-jiao-yu-de-ai-fei-yue-dai-li-shi-jian-suo-zeng-qiang

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年2月22日
Next 2025年2月22日

相关推荐

发表回复

Please Login to Comment