§6.6 医学决策支持系统的评估
一、医学决策支持系统评估的困难性
任何医学系统进入临床应用之前,必须经过客观的评估,这样做有法律和道德方面的原因。医学决策支持系统所有评估研究的核心问题是:评估系统的客观标准即“黄金标准”是什么?这种客观标准必须首先经正式研究建立起来,或者由独立的专家委员会提出。遗憾的是在医学领域,这种标准由于各种原因不容易建立起来,所以评估系统的“金标准”不易实现。虽然过去和现在都做了大量的工作,但在医学信息学界和临床医学界还没有医学决策支持系统评估方面达成共识。
1993年1月的《Methods of Information in Medicine》杂志发表了一系列有关的评论,讨论了目前临床决策支持系统技术的评估问题,Stead等总结了目前对这个难题的看法,提出了系统分阶段评估的方法,即评估应该包括决策支持系统开发过程的各个阶段,而且评估本身是一个过程,即使在决策支持系统进入临床应用以后还应继续评估。
二、医学决策支持系统的效能
医学决策支持系统评估中最重要的有两个部分,一是医学知识库中知识的准确性、完整性、一致性和与目标的相关性,目前对这一方面的评估还没有统一的标准;二是决策支持的效能。因为对医学决策支持系统效能的评估结果也能反映出知识库中知识的质量及知识库的构建是否合理等情况,因此,目前临床决策支持系统评估主要是对其效能的评估。
对于一个二分类决策模型(例如分类结果为A疾病和B疾病,或者分类结果为健康和异常),表示效能的最常用方法是2×2矩阵,如图6.7所示。
图6.7 二分类决策模型的效能评价矩阵
根据图6.7,衡量决策模型效能的参量主要有:
敏感度:
特异度:
阳性预测率:
阴性预测率:
总体效能:
对于一个n分类决策模型,系统的效能同样可以用一个n×n的矩阵来表示,效能参量可以用每一类的程序准确性的用户准确性来描述。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。