在人工智能与医疗健康深度融合的当下,OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试,而不是简单的答题或选择题模式。根据测试数据显示,大模型在医疗保健领域的表现有了显著提升。例如,从之前的GPT-3.5Turbo的16%到GPT-4o的32%,再到o3的60%,整体性能有了显著进步。尤其是小型模型的进步更为突出,GPT-4.1nano不仅在性能上超越了GPT-4o,而且成本降低了25倍。
HealthBench的开源意义非凡。它为全球研究人员和开发者提供统一且权威的测试标准,有力推动AI技术在医疗健康领域的发展。研究人员可借助该标准和评估方法,更好地了解AI系统性能,优化算法、提升模型性能。不同医疗机构和团队也能以此为平台,共同探索AI在医疗中的应用,促进跨领域合作交流。
无独有偶,近期AI大模型“六小虎”之一的月之暗面近期对AI医疗产品进行布局,以提升旗下产品Kimi在专业领域的搜索质量,并探索Agent等产品方向。月之暗面回应称,Kimi近期持续优化财经、法律、医学等专业领域的搜索信源质量,旨在为用户提供更可信、可靠的高质量回答。
政策方面,近期工信部等七部门印发《医药工业数智化转型实施方案(2025-2030年)》,其中明确提出深化人工智能赋能应用。支持相关单位建立医药大模型创新平台,协同开展医药大模型技术产品研发,开展“人工智能赋能医药全产业链”应用试点,面向医药全产业链形成一批效果显著的标志性应用场景。方案还提出到2030年实现规上医药工业企业数智化转型全覆盖的目标,这无疑为AI制药等领域的快速发展注入强大动力。
2025未来医疗医药100强展会举行,业内看好“AI+医疗”赛道前景。以“THENOW临界点”为主题的2025未来医疗医药100强展会(2025VBEF)近日在苏州召开。当前,中国医疗健康市场正在发生巨变。一是院内院外市场格局变化,随着医改各项措施的全面推进,院外市场占据了越来越重要的位置;二是国内和海外市场的变化,在贸易事件影响下,企业需更慎重地平衡两大市场的关系;三是技术变革带来市场新增量,尤其是以大模型为代表的人工智能技术,除了降本增效之外,还可能在生产方式、诊疗模式等方面产生深刻影响。
对于AI医疗的发展前景,机构发表部分观点。
信达证券认为2025年是AI医疗快速发展的元年,在政策推动、技术创新以及企业积极参与等多因素的共振下,AI医疗产业有望开启高速发展的新篇章,为医疗服务的质量和效率提升带来前所未有的机遇,同时也将为相关企业创造巨大的商业价值,推动医疗健康行业的深刻变革。
华泰证券:随着OpenAI推出HealthBench等医疗大模型评估基准的建立和完善,AI医疗模型的性能评估将更加科学、全面,有助于加速AI技术在医疗领域的落地应用,为医疗行业的智能化升级提供有力支持,相关企业有望迎来新的发展机遇。
中金公司:AI在医疗健康领域的应用前景广阔,从辅助诊断、医疗影像分析到药物研发等各个环节都有望实现深刻的变革和创新。随着技术的不断进步和政策的支持,AI医疗市场将迎来快速发展,相关企业的研发投入将逐渐转化为实际的经济效益,推动行业的持续繁荣。
综上,AI医疗有望成为2025的年度投资主题,与其他国家相比,我国AI医疗的底座能力强、具备先发优势和互联网化的运维能力。AI医疗正步入加速发展期,叠加政策东风,行业前景广阔,未来创新与突破值得期待。
未经允许不得转载:德讯证顾 » 262名医生打造、GPT-4o性能翻倍!AI医疗黄金时代已经来临?