从过去十几年发展路径来看,大数据技术对银行数字化进程的影响,往往是小步快跑的渐进式变革,但偶尔也足以重构银行的业务体系。
2007年,数据仓库的概念在全球范围内兴起,全球各银行在数据与分析领域的投资呈上升趋势。而中国境内的数据与分析领域关注者寥寥。
2010年伊始,中国大陆的数据行业发展进入快车道。随着互联网、物联网和移动支付技术的发展,国内数据资产迅速积累,赋能银行等金融机构的数据应用建设。
从2010年之后,国内银行的大数据实践逐步从部门级的单点尝试,逐步成为全行级的核心战略之一。
早期,银行的大数据实践一般会基于数据仓库等基础数据平台,进一步实现跨部门的底层数据整合、治理,以及细化数据定义、数据维度设计。而最近一两年,一些在数字化转型中较为领先地位的银行已建立了独立于业务部门、IT部门的大数据部门,统筹负责全行的数字化转型,这意味着银行对数字化的认知发展到了新阶段。
为此,爱分析通过对大数据与数据科学的发展历程的梳理,对典型应用场景的剖析,以及对行业代表企业——华策数科的深入访谈,试图找到一条发展主线。在本文中,爱分析将从时间维度来回顾数年来中国数据与分析领域的历程与变化,并从空间维度来阐述众多的数据技术分支的市场机会所在。
01 数据资产积累,数据与分析发展进入新阶段
大数据时代的到来,首先使银行数字化进程中的数据资产得到了极大的扩充,从原先主要来自业务系统的、以结构化为主的数据,拓展为来自企业内外部多个源头、包含结构化和非结构化的海量数据。
在此基础上,大数据处理技术的发展使得数据分析的实时性、灵活性得到提升,数据洞察的深度和有效性进一步加强。经过数据预处理后,银行便可以更精准从中获得数据洞察,最终应用于商业决策。
从数据特征维度、变量类型和算法复杂度来看,国内数据与分析领域的技术发展,已经进入第三阶段。
总体而言,数据的发展趋势是数据的使用量和计算量越来越大。早期的数据分析大多基于运营商、手机行为等数据。随着互联网数据资产的积累,数据特征维度从几十位向几十万位演进,月训练样本量也从几十万向百万级别扩张。
变量类型也随之而变。在数据有限的情况下,银行往往只能使用收入预期等强相关变量建模。而基于百万级别的样本量,银行可以引入用户行为偏好等弱变量建模,为征信白户构建信用评分。
算法发展趋势是从可解释性强的简单模型,发展到解释性变弱的复杂模型,再到强调复杂模型的可解释性。
算法应用一直以来面临着两难的问题:复杂度很强的模型的效果比传统的逻辑回归模型要好。营销场景里复杂算法的业务价值更明显,以短信营销为例,发送10万条短信,通过复杂算法后转化率可显著提升两倍。但是,复杂算法内在逻辑不明显,难以满足监管对模型可解释性的要求。
因此,早期银行对复杂程度高的集成学习模型接受度不高,行内也缺乏相应人才储备。
2018年是算法和模型发展的节点。随着市场竞争压力的提升,以及相关人才引进,银行对复杂模型认知度和理解度不断提升,开始强调兼顾效果和算法的可解释性。
在新一阶段,随着银行认知的提升与战略倾斜,数据与分析的发展有广阔想象空间。银行目前面临的问题是:如何降低数据分析成本,同时最大化数据与分析带来的效益。在这一方面,银行与第三方数据与分析服务商携手可提供更多数据服务形式进行变现。
02“用数学解决商业问题”,实现数据与分析效益最大化
数学在人类文明的发展中起着非常重要的作用,可以说正是数学推动了重大的科学技术进步。
伴随着信息的数字化和信息通道的大规模联网,从手机聊天到银行卡数据,今天所有的信息都由二进制数编码,经数学算法设计。而依据数学所作的创造设想也已经达到可即时试验、即时实施的地步。
在银行数字化方面,领先的第三方数据与分析实践将蕴藏在数字与公式之间的纯粹样式带入银行数字化的实践中,并为后来者提供洞见。而在探寻实现数据与分析价值最大化的路径中,数据整合和各部门协作,开始变得缺一不可。
成立于2007年的华策数科,正是致力于用“数学问题解决商业问题”,在金融应用领域,通过利用数据赋能银行营销和风控场景。华策数科将“数据科学艺术家”作为未来发展愿景,从数据整合和各部门协作出发,不断融合数据的科学性和艺术性。
首先,华策数科通过整合各个领域内头部合作伙伴的资源,以独到的眼光发现企业各个环节可被有效利用的数据资源,将不同来源的数据整合、筛选、加工,实现数据的可用、脱敏、共享,为客户提供数据分析与应用服务。
其次,华策数科从组织架构上进行调整,分为产品方案部、售前部门和数据中心三大板块。数据中心下设模型中心、数据结构化、底层数据清洗和特征工程部门。目前,华策数科的模型中心沉淀了超过1000个不同场景深度分析模型。
在项目落地过程中,各部门协同推动产品设计和落地实施:产品方案部和售前部门负责产品和解决方案的设计,将业务问题数学化;数据中心则负责选取数据特征,利用多方安全技术手段进行模型拟合和构建,制定实施路线图,推动应用快速落地。
例如,针对银行冷启动场景,售前人员绘制解决方案框架,数据中心负责数仓搭建、数据流转、筛选具体特征对应的规则和模型、组合相应的模型跟规则、模型部署、模型迭代和客户教育。
华策数科经过十多年的丰富实践,不仅形成了成熟的方法论,同时致力数据与分析应用方法的推广。
华策数科将自身的模型中心作为培养中心,银行人员在模型中心全程参与建模过程,构建完成之后能够将模型带回行内。通过这类联合建模的方式,华策数科与银行人员共同探索数据与分析领域的模型构建,真正做到数据的推广和普及。
03 乘数字化浪潮,数据与分析应用加速筑基
2020年注定将是一个冰与火淬炼的年岁,充满了变数和悬念。在数字化浪潮席卷的当下,变革和创新正在重塑着银行价值链。
受到疫情和政策环境双重因素驱动,金融机构利润增速承压。银保监会数据显示,20H1银行净利润增速-9.4%,增速较20Q1下降14pc,低于市场预期,而全国银行业不良贷款率上升0.06%,达到2.04%。银行亟需进行数字化转型,提升营收,加强风险管控。
因此,随着宏观经济环境不确定性的增加,数字化在银行价值链:营销、贷前准入、贷中监测、贷后管理环节渗透程度不断提升。数据与分析的应用随之爆发。
爱分析将以华策数科为例,对数据与分析在银行的应用及其带来的价值进行阐述。
在精准营销和贷前风险管控环节,银行传统的做法存在的问题有三方面:第一,客户分层颗粒度较粗,导致客户需求洞察不足。第二,缺乏对下沉客群的数据覆盖,不能把控来自互联网的外部流量带来的风险,坏账率承压。第三,缺乏精准定价策略,客群流失严重,用信率难以提升。
首先,在营销阶段,华策数科基于海量数据源和数据分析技术,建立颗粒度更细的客群分组,用于精准营销的环境中,帮助银行区分好资产和不好的资产、评估客户需求、最合适的触达客户时间,银行可以在最合适的时间对接优良资产的客户,解决了“客户是谁,客户的喜好是什么,在哪里服务客户”金融三大传统经典问题。
华策数科利用数据技术定位潜在客户,帮助银行进行精准投放广告,将投放效果提升了17个点,并降低了20%的营销成本。
其次,在贷前审核环节,华策数科通过关联分析,判断是否有团伙欺诈、是否涉及薅羊毛等风险行为,由此制定黑灰名单,降低了欺诈风险。例如,某头部金融机构与华策数科合作,优化信贷风控流程,进件通过率提升15%,坏账率大幅下降4.6%。
再次,在贷中监测环节,华策数科提供贷中预警功能和客户流失预测服务:通过API与银行系统打通,为银行建立客户违约预警和客户流失触发机制,当发现异常情况时,判断是否需要提前进入人文关怀。
在风控规则和模型开发方面,华策数科引入决策引擎,管理数据接入,进行变量开发,生成风控规则和模型,用拖拉拽等简易的编程方式实现决策流程搭建。
决策引擎作为支撑平台,能够减少操作的人工,将审批时效提升了80%。并通过管理模型部署的审批流程和个人权限,对审批环节进行监控,保证操作合规性。
最后,在贷后催收环节,银行传统的催收模型,一般基于历史数据和简单的打分模型(scorecard-based model)或者逻辑回归、决策树等标准分析模型进行风险预测,由于数据维度不够,模型效果有限,且未能考虑实时风险变化。
尤其是疫情之后,金融机构面临债务违约,呼叫中心催收压力陡增,超负荷运转。为减少坏账损失、节省催收成本,越来越多的银行采用了机器学习技术对客群进行细分,并为每一类客群定制多渠道催收策略。
华策数科结合现金流等数据,对客户进行划分,建立了多分类模型的预催收策略,针对不同层级的客群采取不同的催收策略、催收强度。
例如,对于欠款金额高、违约率高的客户,可转为人工催收,进行委外催收或者互联网仲裁。对于欠款金额和违约率较低的客户,仅使用机器人外呼催收、短信、电子邮件等低接触性渠道进行逾期提醒。对还款能力强的高价值客户,可使用高接触性渠道,例如成立专门的催收团队,提供定制化服务。有效提升客户体验。
04 数据与分析的未来,一场连通信息孤岛的变革
数据和算法为一切商业和交易奠定了时代基础,谁能捕捉技术变迁的节奏、抓住行业发展机遇,谁就在参与未来。
爱分析认为,数据与分析模型未来发展的方向主要体现在两方面:一是模型与技术的创新,二是新业务模式,即开放银行兴起。
首先,模型创新的趋势是从黑盒不断的走向白盒的过程,在可解释性和模型有效性之间寻找兼容点。
在这一领域,领先的第三方数据与分析服务商已开始自研可解释性模型。例如,华策数科采用子网络和加性模型组合的方式做了新的可解释性的神经网络的尝试,为银行开发信用评分卡。
具体来说,神经网络和加性模型的整合是把逻辑回归里每个X1、X2特征作为一个子网络,一方面使得模型以逻辑回归的形式展现,同时兼具非线性计算的特征,能够尽可能多的使用弱变量;另一方面,模型计算之后能够做可视化展示,显示出哪些因素对借款人的信用变化产生了影响。
其次,随着银行数字化水平的提高,开放银行在5年内有望缔造万亿市场。开放银行能够链接场景方和金融服务方,在用户导入与用户粘性、开发新客群和新地区,和增加数据维度三个方面体现优势。
过去的20年,社会发展的能力变化,是从懂业务到懂技术再到懂用户,只有更了解C端用户,才可能更了解数字化变化着的行业和解决方案。
因此,爱分析认为,在开放银行的构建过程中,技术本身并不是行业参与者的长期壁垒。对于银行而言,基于成熟的技术,改造和优化金融业务流程,最终目的是为更多的优质客群提供更好的金融产品和服务,以及更优质的服务体验。
为实现这一目标,链接生态中各类服务提供者必不可少,每一个服务提供者都将成为生态与客户的触点。
目前,大型银行、中小城商行在开放银行领域的布局已然形成。华策数科与某城商行合作,打造开放银行新业态。
中小城商行、农商行银行在客群资源、预算和获客能力方面难以与大行抗争,亟需挖掘更多获客场景。中小银行更倾向于发挥其本地化优势,搭建开放银行平台。
因此,华策数科为某城商行提供开放平台和API对接集成技术支撑。开放平台建好之后,向该行推荐旅游公司,银行利用相关营销模型分析、挖掘用户对旅游产品的偏好,在合适的时间向旅游爱好者推荐相应的旅游产品。在这一过程中,银行向用户推送符合其需求的金融产品,将用户转化为行内客户。
同时,华策数科还通过撮合银行和手机厂商,达成直联式的服务。给银行方提供脱敏后的用户数据,做到客户信用可控,同时给手机供应商提供分期借贷模式,带来更大的用户流量。
在开放银行的业务模式下,通过链接异业平台的企业,第三方数据与分析服务商和银行在获客引流、客群运营、风险管控和数据共享方面成果互惠互利。一方面,第三方数据与分析服务商创新了与银行的合作模式,通过金融科技的手段实现普惠金融。另一方面,中小型城商行、农商行能够因地制宜拓展获客场景,实现低成本的获客和运营。