杨净 发自 凹非寺
量子位 | 公众号 QbitAI
国内首个医疗大模型,已经在“接诊”患者了。
在评审过程中,专家们也发现了一些意想不到的“惊喜”:
比如,出现漏诊误诊的概率比较小。
北大人民医院薛峰主任就发现,MedGPT通过多轮询问,根据患者脚底板疼痛症状,竟然在最后可以推断诊断出「有可能出现压迫颈神经」这样的结果。
这也就是说,从知识储备上,AI医生其实可能高于一个经验不太丰富的医生。
另外,MedGPT就诊时的“沉稳”表现也得到了点赞。
中日友好医院心内科主任医师任景怡就表示:我觉得最好的一点是当诊断尚不明确时,MedGPT并不会轻易给出结论,而是要坚持通过继续问诊或检查收集更多信息。
于是即便MedGPT还存在一定问题,她还是给了比真人医生还高的分数,并直言:这是里程碑的结果。
不可否认的是,MedGPT还有些问题需要调整,几位专家指出它会出现偶尔过度给出治疗建议、重复推荐检查项目、某些概念表述不准确,以及无法实现查体等局限——要想MedGPT更加可用,这些意见一定程度比正面评价还要重要。
但总的来说,首个医疗大模型的公开首秀的结果还算不错。
总结下来,首先是大模型的基本能力都有,语义理解、多轮对话、多模态识别等,还能像OpenAI那样通过插件商店链接到各种行业应用。
还有通用大模型被广为诟病的对齐和准确性问题,MedGPT整个流程结果也不输真人医生。
再从行业维度来看,确实能真正从医学角度为医生提供有效帮助,提升患者疾病管理效率。
此次真实测试过程中可以看到,它能基于有效问诊以及医学检查数据,MedGPT得以进行准确的疾病诊断,并为患者设计疾病治疗方案。
这就需要企业既要在垂直行业深耕,还要有AI技术实力。这就需要提及它背后的缔造者——医联。
在行业上,作为互联网医疗的早期入局者,医联已经积累了超过150万医生和2000万患者,稳固的医患关系链长期互动之下,形成了大量专业的医学数据。
此外医联长期关注医疗与技术的深度融合,已打造了近140个疾病管理标准化流程,涉及肿瘤、心脑血管、糖尿病等常见病症,覆盖1000多个病种,形成了一整套全数字化全流程疾病管理体系。
在互联网医疗时代,这些疾病管理体系可以为行业提供线上管理的有效依据,提升行业整体效率。而在AI赋能下的数字医疗行业来临之时,这便成了AI医疗的重要依托。
还有被微软200亿美元收购的Nuance,借由微软OpenAI合作之便,正在将GPT-4集成到临床笔记软件DAX中,以减轻临床医生的负担。
前者的大模型还没有到真正落地,后者无非是集成通用大模型的API,其行业的准确性和一致性无法得到保障。
但MedGPT一亮相就惊艳全场,并拿下多个行业首次:
首次突破AI医生多轮对话的难题;
首次实现从有效问诊到医学检查的跨越;
首次实现AI给出准确诊断和治疗方案;
首次AI具备全流程诊断能力……
这与垂直领域深耕、有场景有数据有关。
医联在医疗行业有9年深耕,积累了丰富的知识、数据和应用,构筑起了深厚的技术和用户壁垒。
一旦实现大模型技术的应用, 在现有的用户场景基础之下,将会迅速规模化落地。这是其他想入局者无法拥有的先发优势。
上一次AI浪潮来袭时,最终也是场景玩家率先吃掉AI红利。
现在同样也依旧是场景玩家吃掉大模型红利,只不过技术路径已经明晰,落地速度自然要比以往快得多。
第三,医疗AI落地提速,也侧面印证了大模型的发展趋势——
雪球效应展现,从技术到应用部署的飞轮会越转越快。
ChatGPT最开始只会一本正经地胡说八道,短短几个月内基于用户反馈、插件开发生态,真正被各行业的人加入到工作流中,并上线了端侧应用。
还有Midjourney、Stable Diffusion被人诟病无法画手的问题,也能在短短几周内解决;以及国内大模型涌现、更新速度加快,文心一言一个月能迭代四次等等。
“大模型-应用-数据”的加速闭环一旦打通,那么产业落地的速度将会比上一波浪潮更快。
而医联大模型MedGPT一个月就进入到真实患者全流程测试阶段。在此之后,根据数据飞轮迭代大模型,落地速度只会越来越快。
或许很快,医疗AI2.0就会惠及到每个人身边。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
花粉社群VIP加油站
猜你喜欢