首页 理论教育 数据质量管理的实施步骤

数据质量管理的实施步骤

时间:2023-03-02 理论教育 版权反馈
【摘要】:例如,在商业银行的信贷客户数据中,有很大一部分有关客户的行为数据是由信贷员在做客户调查时得到的,并录入到信贷系统中,最后这些数据由商业银行的授信模型的开发人员使用。综上所述,商业银行应将数据质量控制以规范化的动态管理过程展开,逐步提升数据库可信度水平,直到达到预先设定的水平,确保为对外信息披露和内部风险量化管理模型的建设和实施提供充分的支持。

7.3.2 数据质量管理的实施步骤

确定了数据质量的原则与标准后,我们便可以按照这个标准与原则确定具体的计划,使数据质量逐步达到这个标准。一般来说,实施的步骤主要包括:

1)建立专业队伍,制定数据质量管理的对象、标准和规则,并确定数据的关键内容。这个阶段也就是项目的评估阶段,对数据质量管理来说是非常重要的。在这个阶段,需要确定项目的范围,全面考察数据的来源、数据使用的目标。数据质量管理项目在这个阶段最重要的首先是:建立一支包括业务人员、风险管理人员以及计算机专业人员的队伍。其主要任务是制定数据质量管理的对象,确定数据管理的内容(即数据的来源),建立数据质量管理的标准,确定哪些数据对商业银行来说是最重要的,哪些是商业银行的关键数据。

2)制定数据管理质量的需求设计。利用前一步评估得到的结果(哪些数据库、数据表和字段对内部评级来说是最关键的数据等等),项目队伍对每一个具体的数据库、表和字段指定具体的策略,细化质量管理的具体任务。

3)将数据库包括的所有数据项标准化。数据库中各个数据项标准化是数据质量中的重要一环,对将来数据的一致性的检测异常重要,因为数据的来源不一样,同一个数据项可能会出现在各个不同的数据库中,而且各个数据库中需要考虑的重点不一样,有可能其尺度会不一样,统计口径也会不一样。

4)数据质量管理的实施。在实施阶段,主要有如下几项任务:①数据质量管理培训——需要将数据质量管理的原则、标准等让每一个涉及的人员都了解,并在实施的过程中按照这些原则执行。②测试数据——在检测平台上测试各个数据,孤立数据中的问题,找出错误数据的原因。③完善数据——确定缺失数据并制定增补缺失数据的方法,修改数据并将正确数据并入正确数据库。④抽样检验数据的可信度——前面已经提到,要数据完全正确是不可能的,银行只能在数据准确性与可用性方面取得平衡,确定数据的可信度。数据的可信度,是根据统计抽样原理以及各个数据的质量标准,对整个数据库抽样,考察抽样数据的准确性,从而估计整个数据的准确性。数据可信度是由百分比来度量的,数字越接近1,数据越可信。

7.3.3 数据质量的监控

数据质量管理的过程是个动态优化过程,不可能一步达到理想的状态,只能事先设定各个阶段的目标,逐步将数据库的质量提高到内部评级模型可以依赖的地步。当数据达到一定的质量标准之后,同样需要对数据进行检测,以保证数据的质量不下降。

1)数据质量原因分析。仅仅检查数据和对数据处理不可能解决根本问题,并且还只可能集中在数据的准确性上,不能从更全面的角度来考虑数据质量问题。数据的质量问题不仅产生于数据创建的时候,而且产生于数据从信息链的一个环节到另一个环节的传递过程。数据的质量问题产生的另一个主要原因是:数据的创建者很少使用数据,通常这些数据传到下一个信息链后,在下一个阶段由其他使用者使用,所以错误数据在产生时不易被发现。在商业银行的数据质量管理中,数据的质量问题常常产生于以下几种情况:①数据从其产生者传到使用者。例如,在商业银行的信贷客户数据中,有很大一部分有关客户的行为数据是由信贷员在做客户调查时得到的,并录入到信贷系统中,最后这些数据由商业银行的授信模型的开发人员使用。这些信贷数据的质量问题,产生于信贷员的调查过程与数据的录入过程。②数据从一个机构卖到另一个机构的过程。例如,在进行经济分析时使用的宏观数据,主要是从权威机构,如国家统计局、中央银行或其他数据公司等购买的,由于各个机构本身的统计口径不一样,很容易造成数据的不一致。③数据从一个系统传到另一个系统的过程。例如,信贷数据从信贷系统经过统计加工到财务系统的过程。

2)数据质量的监控。从上面的分析我们可以知道,数据的质量问题经常产生于数据创建时,所以对数据产生时的监控对于提高数据质量能够起到事半功倍的效果。瑞·德曼建议数据监控的重点集中在:①关键数据。客户的违约数据对于内部评级模型的开发是非常关键的,所以对于客户的违约数据就需要重点监控。②来源于客户的数据。③洁净数据的持续性。数据经过数据清冼后,要避免数据又重新被弄脏(出现质量问题)同样非常重要。④数据质量的责任。数据质量问题的责任明确与否直接影响到数据质量的提高,对数据责任人的监控也是必不可少的。

数据的质量控制是一项长期的工作,因此数据质量控制队伍必须长期保持。对待这些数据也需要像对待其他产品一样,视其为一种非常重要的资产。

综上所述,商业银行应将数据质量控制以规范化的动态管理过程展开,逐步提升数据库可信度水平,直到达到预先设定的水平,确保为对外信息披露和内部风险量化管理模型的建设和实施提供充分的支持。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈