262名医生打造、GPT-4o性能翻倍！AI医疗黄金时代已经来临？-财富在线

摘要：随着全球人工智能技术不断突破和政策环境持续优化，AI医疗产业正迎来前所未有的发展机遇。

在人工智能与医疗健康深度融合的当下，OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是，该测试集的5000段核心测试对话，全部由来自60个国家/地区的26个专业262名医生打造，极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试，而不是简单的答题或选择题模式。根据测试数据显示，大模型在医疗保健领域的表现有了显著提升。例如，从之前的GPT-3.5Turbo的16%到GPT-4o的32%，再到o3的60%，整体性能有了显著进步。尤其是小型模型的进步更为突出，GPT-4.1nano不仅在性能上超越了GPT-4o，而且成本降低了25倍。

HealthBench的开源意义非凡。它为全球研究人员和开发者提供统一且权威的测试标准，有力推动AI技术在医疗健康领域的发展。研究人员可借助该标准和评估方法，更好地了解AI系统性能，优化算法、提升模型性能。不同医疗机构和团队也能以此为平台，共同探索AI在医疗中的应用，促进跨领域合作交流。

无独有偶，近期AI大模型“六小虎”之一的月之暗面近期对AI医疗产品进行布局，以提升旗下产品Kimi在专业领域的搜索质量，并探索Agent等产品方向。月之暗面回应称，Kimi近期持续优化财经、法律、医学等专业领域的搜索信源质量，旨在为用户提供更可信、可靠的高质量回答。

262名医生打造、GPT-4o性能翻倍！AI医疗黄金时代已经来临？ 1

政策方面，近期工信部等七部门印发《医药工业数智化转型实施方案(2025-2030年)》，其中明确提出深化人工智能赋能应用。支持相关单位建立医药大模型创新平台，协同开展医药大模型技术产品研发，开展“人工智能赋能医药全产业链”应用试点，面向医药全产业链形成一批效果显著的标志性应用场景。方案还提出到2030年实现规上医药工业企业数智化转型全覆盖的目标，这无疑为AI制药等领域的快速发展注入强大动力。

2025未来医疗医药100强展会举行，业内看好“AI+医疗”赛道前景。以“THENOW临界点”为主题的2025未来医疗医药100强展会（2025VBEF）近日在苏州召开。当前，中国医疗健康市场正在发生巨变。一是院内院外市场格局变化，随着医改各项措施的全面推进，院外市场占据了越来越重要的位置；二是国内和海外市场的变化，在贸易事件影响下，企业需更慎重地平衡两大市场的关系；三是技术变革带来市场新增量，尤其是以大模型为代表的人工智能技术，除了降本增效之外，还可能在生产方式、诊疗模式等方面产生深刻影响。

262名医生打造、GPT-4o性能翻倍！AI医疗黄金时代已经来临？ 2