K Health 自主医疗 AI 在模拟病例中诊断准确率达 90.2%,超越人类医生
数字初级医疗服务商 K Health 开发的自主 AI 系统在基于电子健康记录(EHR)的 200 个模拟病例测试中,诊断准确率达 90.2%,显著高于 50 名执业医生的 77.9%;治疗方案对临床指南的遵循度更达 98.7%。该研究已发表于《自然·医学》,研究者强调 AI 旨在增强而非替代医生能力。

AI看病比老医生还准?最新研究结果让人意外
医疗AI又有新突破!数字医疗公司K Health研发的AI系统,在一项电子病历(EHR)诊断测试中,表现碾压人类医生。这项重磅研究刚登上顶级期刊《自然·医学》。
实测数据:AI全面领先
研究设置200个模拟病例,覆盖心脑血管、糖尿病等常见病。参赛选手:
- AI选手:K Health的智能诊断系统
- 人类选手:50位持证上岗的全科医生
比赛项目:诊断准确率、治疗方案靠谱程度、该做的检查有没有漏。
成绩单来了:
- 诊断准确率:AI 90.2% vs 医生77.9%
- 治疗方案规范度:AI 98.7% vs 医生82.7%
- 犯错次数:AI明显更少(具体数字没公布)
K Health首席创新官Ran Balicer博士说:"这标志着AI不仅能当助手,在某些场景下已经可以独当一面了。"
不是来抢饭碗的
研究团队特别强调:
- AI是来帮忙的——把简单病例交给AI,医生专心搞疑难杂症
- 重点是解决看病难——特别是缺医少药的偏远地区
AI最牛的是能发现医生容易忽略的细节,减少误诊和乱开药的情况。
落地还要多久?
虽然成绩亮眼,但研究者坦言:
- 还需要更多临床试验
- 得先搞定伦理和监管问题
【国内用户划重点】 目前国内批准的医疗AI都是"辅助诊断"(比如看CT片),像这种能独立看病的AI还没上岗。短期内最可能先在社区医院试点,帮居民做初步筛查。
要注意的是,这次测试用的都是模拟病例,真实看病时那些需要"望闻问切"的复杂情况,AI能不能hold住还是未知数。
本文基于 GNews:News-Medical.net 报道, 由 AiDuo123 AI 编辑翻译改写。原文链接: https://www.news-medical.net/news/20260621/Autonomous-medical-AI-outperforms-doctors-in-simulated-EHR-cases.aspx
常见问题
- K Health 的 AI 系统是否已在真实医疗场景中使用?
- 原文未明确说明。研究基于模拟病例测试,研究者强调需进一步验证才能广泛临床应用。K Health 作为数字初级医疗服务商,可能已在其平台内部使用类似技术,但具体部署情况需查阅公司官方信息。
- 90.2% 的诊断准确率在医疗 AI 中处于什么水平?
- 这一数据在基于 EHR 的初级医疗诊断任务中属于较高水平。但需注意:准确率受病例复杂度、疾病类型影响,且研究由 AI 开发方主导。独立第三方验证和真实世界表现数据将更具参考价值。
- 中国用户能否使用类似的自主诊疗 AI?
- 目前不能。中国对医疗 AI 实行严格审批,自主诊疗功能需符合三类医疗器械标准。现有获批产品多为辅助诊断工具。未来此类技术可能先在互联网医院、基层医疗机构的标准化场景(如常见病初筛)试点,但完全替代医生决策在短期内不现实。
- AI 诊断准确率更高,是否意味着医生会被取代?
- 研究者明确表示目标是增强而非替代。AI 在标准化流程和指南遵循上有优势,但医疗涉及复杂沟通、伦理判断、罕见病识别等 AI 难以处理的场景。更可能的趋势是 AI 处理常规病例,医生聚焦复杂与危重症患者。
相关 AI 工具
文中提到或相关的 AI 工具 — 点进去看适合谁、怎么用、值不值得折腾
Gemini
精选对话与助手
Google 推出的多模态 AI 助手,深度集成 Google Drive / Workspace / YouTube。Gemini 2.5 Pro 上下文最高 2M tokens,Veo 3 可生成高质量视频。
Claude
精选对话与助手
Anthropic 推出的 AI 助手,以长上下文(200K tokens)、对复杂任务的细腻理解、Artifacts 可视化输出闻名。Claude Sonnet 4.5 / Opus 4.7 在编程、写作、推理多项基准上领先。
Cursor
精选编程与开发
AI-first 代码编辑器,基于 VS Code 构建,深度集成 Claude / GPT-4o 等模型。Composer 多文件编辑、Tab 自动补全、Agent 模式三大杀手锏。
相关推荐
同类资讯 — 由发布时间排序

Anthropic 提议暂停前沿 AI 开发引发关注与争议
AI 开发公司 Anthropic 于 7 月 18 日发布论文,建议当前沿 AI 模型超越特定能力阈值时应暂停开发,以应对潜在灾难性风险。该提议强调临时性暂停而非永久停止,旨在为社会争取时间建立安全协议和国际治理框架。但谁来定义"红线"、如何全球执行、经济影响几何等关键问题仍待解答,引发业界对 AI 治理路径的深度讨论。

前 OpenAI 核心成员 Prafulla Dhariwal 回印度创业,招募 AI 人才
曾参与 GPT-3、GPT-4 和 Sora 开发的前 OpenAI 技术团队成员 Prafulla Dhariwal 宣布回到印度创办 AI 公司,计划打造"对世界产生巨大影响"的 AI 产品,并向工程师和研究者发出招募。此举被视为印度"人才回流"趋势的又一标志性案例。

用 ChatGPT 或 Claude 报税?印度税务专家警告四大风险
印度税务界发出警告:尽管 ChatGPT 和 Claude 等 AI 工具可简化报税流程,但在复杂税务场景下易出错、信息可能过时、存在数据隐私风险,且用户需自负法律责任。专业人士建议 AI 仅适合基础查询,正式申报仍需人工税务顾问把关。

特朗普称不再视 Anthropic 为国家安全威胁,AI 政策立场或转向
前总统特朗普在接受 Axios 采访时表示,不再将 AI 初创公司 Anthropic 视为国家安全威胁,并认为该公司"非常重要且强大"。此前特朗普曾与 Anthropic CEO Dario Amodei 在特朗普大厦会面。这一表态标志着特朗普对 AI 技术态度的潜在转变,可能影响其 2024 年大选后的 AI 政策走向。