数据“打”假:最大的争议就是福利滥用
我们才刚刚开始全面利用数据挖掘的技术。我们相信,使用正确的技术,加上专业的人员,并保证数据安全,通过这三者的结合,数据挖掘将成为我们提高财务审计效率和效果的重要工具。09
——美国国会政府问责办公室,关于数据挖掘在国会的听证,2003年3月
欧洲大部分的发达国家都实现了全民医疗保险制度。
但对这种全民福利的做法,长期以来,美国社会并不认同。
不认同的原因主要有两点:一是对政府的不信任;二是认为如果政府对公民大包大揽负全责,公民就会对自己不负责。
在这种态度的主导下,美国的福利制度,一直以来都是以具体的项目为依托、以特定的群体为目标来开展的。其中,两个最大的医疗福利计划是1965年通过的,也是第36任总统约翰逊促成的:
一是专门针对残障人士和65岁以上老人的医疗保险计划(Medicare);
二是以贫困人口为对象的医疗补助计划(Medicaid)。
也就是说,老、弱、穷看病,政府买单。第一个医疗保险计划是通过保险来支付,由联邦医疗保险和补助中心(CMS)监管实施;第二个医疗补助计划是政府直接支付,由联邦政府CMS中心和各个州政府共同实施,分成支付。
根据CMS中心的统计,2009年,医疗保险计划支出共5023亿美元,覆盖了4700万的美国人口;医疗补助计划共支出3739亿美元,覆盖了5680万美国人口。10由于两个计划都是针对社会的弱势人群,它们之间也互有交叉,例如,对于老年的贫困人口群,就可能同时适用两个计划。2009年,有850万人同时受惠于两个项目。
福利政策在全世界最大的争议,就是福利滥用、最后养了懒人,导致社会发展缺乏动力。美国虽然慎之又慎,但这两块免费大蛋糕,也不例外。2008年,联邦调查局在《财务犯罪年度公开报告》中估计,联邦政府每年的医疗开支当中,大概有3%到10%涉嫌造假和欺诈。11面对利益,人类的创造力总是无穷的:虚假账单、重复申报、无中生有,小病大治、慢治、长治,隐瞒收入和存款、装穷吃低保,林林总总,不一而足。
两个项目的受惠人群,加起来有近1亿人,平均每人每月上一次医院,一年就有12亿张账单,按照联邦调查局的估计,大概会有3600万到1.2亿张账单存在问题。如果要依靠人力去张张审查,其工作量是难以想象的。
目前,CMS中心最主要的措施,就是通过数据来打假。
2001年,加州州政府率先推出了一个数据挖掘的项目“保险补助双向核对”(Medical-Medicaid Data Match),将医疗保险和医疗补助两个项目的数据整合起来,利用两个计划中的人员、时间、价格、地点等数据信息对每一宗申报进行互相核实,通过计算机算法自动确定相互矛盾、有异于常态的支付记录,一旦发现造假或者不实申报的可疑账单,则转入人工追讨的环节。
这大大缩小了人工审查的范围,提高了打假的效率。
由于效果显著,2004年,这个项目在个别州的实施范围进一步扩大,由事后追讨推进到了事前防范。这意味着,CMS中心一收到申请报销的账单,就启用数据挖掘系统对该申请的数据记录进行“风险评分”:得分低于预定风险额度的申报则转入自动支付的环节;得分超过该风险额度的申请将退回申请人,或提交专门的小组进行人工复审。
支付后的账单,最后还要经过另一个数据挖掘算法的审核,发现可疑的,再转入人工追讨的环节。
以上措施的效果非常显著,很快引起了美国国会的重视。大部分国会议员都相信,数据挖掘的做法将为国家节省开支。2005年,国会通过了《赤字削减法案》(Deficit Reduction Act of 2005),该法案的根本目的是“精简机构、裁减开支”。在对大多数联邦机构削减经费的情况下,国会却给CMS中心下拨了专款,用于成立扩大专门的数据挖掘审查队伍。卫生部甚至主张,这种数据打假的项目应该纳入国家医疗信息系统基础设施建设的范围,换句话说,以后的医疗系统,在设计阶段,就应该包括数据挖掘的打假功能。
说明:2010年10月6日,奥巴马和Technology CEO Council的成员座谈,商讨如何利用高端的数据分析技术来削减开支。(图片来源:www.techceocouncil.org)
数据挖掘还常常能给工作人员带来一些意外的惊喜。例如,Neulasta是一种治疗癌症的注射剂,2006年,CMS中心的算法发现,不同医院提交的Neulasta账单不一致,有的账单使用毫克作为单位,有的账单使用瓶作为单位,而一瓶为6毫克。经过调查证实,使用瓶的账单属于“有意或无意”的人为错误,但这个错误,把申报的开支扩大了6倍。仅该项发现,就为联邦政府挽回了近50万美元的损失。
2007年3月,CMS中心的首席财务官希尔(Timothy B. Hill)出席国会的听证会,他例举了数据挖掘项目实施一年多之后的效果:通过数据挖掘预设的风险评分门槛,确定了2500万美元的虚假申报,事后的数据挖掘复审环节又追讨了1500万美元的超额申报;其中,有50多宗欺诈案浮出水面,最后移交司法部门处理。12
除了CMS中心,联邦政府的社会福利项目都陆续开始采用数据打假的做法。2010年10月,为了削减赤字,奥巴马在白宫和他的技术顾问委员会召开会议,IBM、DELL、Intel等大公司的CEO向他建议说,联邦政府如果在社会福利的项目上加大数据挖掘、分析技术的应用,预计10年内可以再为国家节省2000亿美元。
近十几年来,除了福利打假,数据挖掘的技术在联邦政府的其他部门也获得了广泛的应用。“9·11”以后,国家安全局更是依赖该项技术跟踪确定恐怖分子,本书后续章节对这项技术及其应用还将有专门的介绍。