DRGs解决了如何支付患者的诊疗医疗保险的问题。DRGs还解决了如何评价医院管理和医生绩效的问题。将同类诊疗分成一组,再分成一组支付“一口价”,这是传统DRGs的基本方法论。传统DRGs实施的困难包括:第一,如何正确合理地分组?二、如何制定合理的“一口价格”?因此,中国DRGs版本数量众多,长期无法统一。大数据DRGs干脆不做小组仪。患者去医院看病时,可以通过类似的患者处基地自动匹配合理的治疗费用。这个方法和向网易云音乐用户推荐音乐的方法几乎完全一样。 2019年9月10日,马云宣布退休。
在此之前,4天前网易云音乐获得阿里巴巴、云峰基金等共计7亿美元的融资,估值为70亿美元左右。这是公开报道中马云退休前阿里巴巴的最新投资。
网易云音乐产品逻辑是根据用户听歌的数据,找到与其他用户的行为一致、行为最相似的用户组,然后根据该用户组的歌曲记录进行个性化推荐。
这一逻辑与中国医疗保险支付机制DRGs最新方法——“大数据兵种特定分数”相同。
一个病人去医院看病,医疗保险要为他支付多少钱才能得到有效合理的医疗服务?不会过度诊疗,也不会敷衍了事。
“大数据兵种评分”方法是根据疾病诊断、治疗操作、个人特征等找到相似的患者,根据平均费用计算对该患者的治疗费用。这种方法通常被称为大数据DRGs。
DRGs的方法论与每个人医疗保险费用的精细管理密切相关。如果顺利的话,医疗保险基金的使用效率可以提高,看病贵的问题也可以得到一定程度的解决。
中国的DRGs研究始于1988年,自2018年成立国家医疗保险局成为“不可容忍”的主力以来,已经过去了30年。
30年来,DRGs来自医院自愿的绩效管理和医疗保险控制费的实际需求。有引进外国小组仪进行本地化改造的尝试,也有自主开发小组仪的实践。
随着大数据时代的到来,医疗大数据、机器学习等智能手段被运用到DRGs的改革实践中,成为一支生力军。
8点建文之前的报道《中国DRGs的前世今生:一项舶来的医保支付机制如何本土化》已经从时间层面明确梳理和总结了从中央到地方的DRGs政策和实践。
本文从方法论的角度出发,着眼于各种DRGs之间的差异,特别是大数据兵种评分方法上的创新,努力了解逆圆锥、过去。
DRGs——医疗保险支付“黄金意义”
简而言之,DRGs(Diagnosis-Related Groups)正在解决患者医疗保险如何支付费用的问题,需要在“项目特定费用”和“人头税”这两个极端之间选择“中庸之道”。
只要正确遵循项目费用,就有可能出现重复住院、进一步检查药物、刺激引进尖端诊疗设备、销售高价药品等过度诊疗的情况。
如果完全按照人头支付,可以引导医院选择性地接收患者,例如症状较轻、住院时间较短的患者。 如果分解患者住院次数,得到更多的“头脑”,最终医患矛盾可能会突出。
DRGs的出发点是基于这样的概念:患者接受的治疗与患者的病情有关,与医院的特性(如病床规模、是否是专科医院等)无关。
治疗每个患者需要消耗一定的资源,每个患者根据年龄、性别、第一次和第二次诊断、住院时的状态等消耗不同的资源,医疗保险部门通过计算患者消耗的资源总量来制定医院费用。
现实中,个人差异很大,所以无法确定“一人一价”。这就需要一种方法,将预期消耗诊疗资源相似的人分成小组,为每一组制定单一的支付标准(一般称为“一口价格”),向医疗机构支付费用。
例如,治疗关节炎的全膝关节置换,在上海其他医院的治疗费用从5万元到9万多元不等,是治疗费用的1.74倍。制定“一口价格”可以抑制不合理的医疗行为,使医院管理更加科学化。
从上面的说明中可以看出,DRGs实施的核心有两个。第一,如何正确合理地分组?二、如何制定合理的“一口价格”?这两个问题也密切相关,分组的合理性可以大大提高制定“一口价格”的准确性。
那些DRGs的先驱们
DRGs分组的基本理念是根据患者的疾病类型、治疗方法和个人特点来区分不同的分组。可以通过以下三个步骤完成:
第一步是将大多数病例分为不同的“疾病对流(MDC)”。澳大利亚AR-DRGs分为23种疾病的大类,美国AP-DRGs和我国CN-DRGs共分为26种疾病的大类。
第二步是根据治疗“操作”方式将相似MDC细分为主干DRGs。
第三阶段,根据同类疾病、同类治疗以及患者的个人特征而定。
如病例的年龄、性别、出生体重(新生儿病例)等,将基干DRGs再度细分。举例来说,“胸部食管恶性肿瘤”与“血管性心脏病”即属于不同的疾病大类(MDC),首先就分入不同组别。
然后,针对“胸部食管恶性肿瘤”有不同的治疗手段,所以“胸部食管恶性肿瘤+保守治疗”、“胸部食管恶性肿瘤+食管癌根治术”、“胸部食管恶性肿瘤+食管癌根治术+空肠造口术”将成为不同的基干DRGs。
最后,针对同样被分入“胸部食管恶性肿瘤+食管癌根治术”这一组别的患者,依据其年龄、性别等个人特征再度细分,比如细分为“胸部食管恶性肿瘤+食管癌根治术+男”“胸部食管恶性肿瘤+食管癌根治术+男+40-50岁”等不同组别。
上述举例只是为了解释说明DRGs三步分组的一般流程,实际操作过程中,情况要复杂得多。
由于病例数量和类型众多,DRGs的分类过程需要借助计算机来完成,这就需要对上述三个步骤逐一编码。不同DRGs的主要区别就体现在分组的细节和编码系统的设计上面。
比如,上海申康在借鉴澳大利亚AR-DRGs的分类方法时发现,在肾疾患内科治疗组,AR-DRGs分为L61肾衰竭、L62肿瘤、L63感染、L64结石、L67其他。
而按照《肾脏内科国家临床重点专科建设项目评分标准(试行)》要求,肾脏内科主要病种为原发性肾小球疾病、间质性肾炎、高血压肾病、糖尿病肾病、狼疮性肾炎、血管炎肾损害、淀粉样变肾病等。如果上述肾病导致肾衰竭,则肾衰竭体现在病案首页的其他诊断中,而非主要诊断,导致肾疾病患者基本都在L67中。所以申康在实践过程中,以AR-DRGs为基础,推出了申康版DRGs。
在编码系统方面,美国的AP-DRGs使用ICD-9诊断和操作编码,澳大利亚的AR-DRGs使用ICD-10。而“师承”AP-DRGs和AR-DRGs的北京版DRGs的诊断编码采用ICD-10,但操作编码用ICD-9。
此外,虽然DRGs使用ICD编码作为基础,但在实际应用过程中,还会对依据各地实际构建本地的ICD版本,例如美国的ICD-CM、澳大利亚的ICD-AM、北京的ICD-BM等。
2015年,国家卫计委的医政医管局,成立了国家DRGs质控中心,在北京版DRGs的基础上发布了CN(Chinese)-DRGs模式,并在全国15个试点城市推行。
2017年,国家卫计委下属的卫生发展研究中心,又推出了以“收付费改革”为中心的“C(China)-DRGs”模式。
分组的细节不同以及编码系统的不同,再加上各地实践过程中会依据各地不同情况,删减、修改、变更现有分组,导致了中国DRGs为数众多且无法统一。
这么多版本、这么多术语,有没有看得很晕?没关系,因为到下一节,就可以把这分组这件事忘记了。
不设分组器的大数据病种分值
中国DRGs的先行者引入国外标准时有些内生性的问题无法解决。
第一,各种分组设定,是先有分组模型,再去对照现实,所以会与现实存在偏差。有些疾病及诊疗方式,可能就不在现有的分组器中。
此外,中国经济水平及医疗水平发展不均,导致各地区诊疗路径不一。例如,上海治疗骨折的路径是西式的,会通过手术的方式用钢板固定;但在西部偏远地区,外科医生会用木棍绑在伤腿上的方式进行。两种治疗手段的花费相差甚远,患者恢复时间也不一样,感受更是迥异。
因此,上海试行的DRGs在运用到西部地区时,还要进一步调整。但由于分组器是人为设定的,所以在做适应性改造时,还需要人工介入调整,所需时间长,成本较高。
第二,任何政策的出台都存在着管理者与政策参与者之间的博弈。一旦参与主体熟知政策规则,其最优化行为的理性选择会对政策的长期适用性造成影响。
例如,八点健闻在调研各地实施DRGs的过程中发现,面对医院和医生的抵制,出于防范医生钻空子的目的,大部分医保试点地区的DRGs分组器不向医生公开。
然而,此举并不有效。2018年,国家医保局曾组织专家去医院调研DRGs。一些医生坦言,DRGs的分组规则即使不开放,经过一段时间的实际报销情况,医生们大致也能推算出来。这就可能发生“病人被分入一个比其应分入的DRG组复杂程度更高的组,使医院获得更高的支付”。
大数据应用技术发展到今天,对于上述两个问题都已有了较为成熟的解决方案。
试想,你手机上的音乐类App,会依据你的喜好为你推荐你喜爱的歌曲;购物类的App会为你推荐你可能喜欢的商品。背后的机理就在于,这些App会根据你的听歌或者购物行为产生的数据,与其他用户行为做匹配,找出与你行为最为相似的那群用户,然后依据这群用户的听歌或消费记录,向你做定制化的推荐。当然,“找相似”的这个过程,还需要运用统计学的方法。
这个场景是不是看着有些眼熟?——DRGs的核心不就是希望在任意一个患者进入医院时,就能依据疾病诊断、治疗操作及个人特征数据,找到与他相似的患者,根据这群患者治疗的平均花费,为这个患者计算应该预付的治疗费用吗?
所以大数据病种分值干脆不要分组器,实现动态分组。
首先,将医院病案首页中统一的编码统统输入系统,穷举“疾病诊断+治疗方式”的排列组合,形成了1000多个疾病诊断组和3000个左右的治疗方式目录组。然后利用前文所描述的“找相似”的方法,最终形成一万多个具有相似特征、可以用来制定“一口价”的组别。
这样一来,就较好地解决了上述两个问题:因为数据来源于全量的病例数据,所以不存在没有被录入的疾病及诊疗方式;又因为分组是动态调整的,即使医生的预期发生了改变,动态分组也能察觉到预期的变化而调整分组(假设你之前爱听华语歌曲,有一段时间喜欢听英语歌曲,你的个性化推荐目录也会出现调整,英语歌曲的推荐会变多)。
DRGs定价制度
说完分组说定价,简单说来DRGs定价制度大致有两个思路:
第一,形成疾病分组后,利用过去3-5年次均费用的结果制定定额标准。这种定价方式简单易行,但由于定价“一刀切”,且缺乏动态调整,一般而言,多用于首次DRGs定价。
第二,理想情况下,在考虑当地经济医疗发展水平的基础上,进行病种的成本核算确定基本费率,并通过确定各DRG组的相对权重来最终确定每组的总费用。
考虑到目前我国部分药品与医疗器械价格虚高,且许多劳务性医疗服务项目收费过低,尚没有一套较成熟完善的成本核算分析,所以很难界定每个DRG组的费用。
但已有一些尝试解决的方法,如前文所述的C-DRGs,即通过在31个省市设立全国医疗服务价格与成本监测研究平台,采集了大量的各地上报数据作为价格与成本的研究依据。
此外,大数据DRGs由于收集了全量的数据,可以实时动态地反映每组治疗费用的变化。虽然初期用于定价的数据精准度不够,但随着DRGs改革的不断推进,分组定价也会越来越趋近于真实费用。
DRGs效果评估
虽然中国的DRGs实践已有30年,但在全国范围内,“起了个大早”的DRGs改革却“赶了个晚集”,巨大的区域差别、复杂的机制设计与参与各方的明显博弈,一度令其举步维艰。
C-DRGs、CN-DRGs、申康版DRGs,甚至还有云南玉溪、禄丰、广西柳州等地版本的DRGs都正在试点当中,尚未收到全面的效果对比数据。但存在一些指标,可以用来衡量DRGs分组的有效性。
入组率。即某地区或某医院住院医疗服务成功分组的例数。入组率越高,医保支付能覆盖的范围越广。
组内变异系数(CV)。即用该组医疗费用的标准差除以该组医疗费用的平均数,用来衡量组内医疗资源消耗的同质性。CV值越小,支付的稳定性越好,越接近均值,风险越小。
例如,用两种计算方式得到的某个分组组内平均费用都是9万元,但方式一的分组中实际个体构成为12万元、9万元、6万元;方式二分组中实际个体构成为10万元、9万元、8万元。方式二的CV值明显要更低,支付的风险更小。如果费用是6万元和12万元,医保都按照9万元去付,对两者都不合适。
预付费用与实际费用的偏差比对。在DRGs试行一段时间后,可以计算每个组别预付费用与实际费用差值的绝对值,然后对绝对值求和,该值越小越好。
DRGs中存在一个“不可能三角”,即分组少、入组率高、组内变异系数低,这三个目的不可能同时达到。分组越细,自然入组率会提高,组内变异系数会降低,但分组则会大大增加;若分组少,入组率高,则必然组内的个体差异会增大,给医保支付带来更大的风险。
“DRGs不会不经过纷争就形成标准,一定是有实践、有教训、有成本后才能形成规范。目前,DRGs的发展是在把潜规则变成规则的过程中。在规划中政府能做的是,形成方向性引导和政策配套支持,而不是政府先出台标准。而大数据DRGs的特点就是,只要数据量够大,就能很快形成规则。”上海市决策咨询委员会委员许速如是说。
张丽敏|撰稿
王吉陆|责编
我们尊重原创版权,未经授权请勿转载。