当淘宝卖家小林正为过年阶段经营旺季所需资金发愁,此时,旺旺跳出一个消息:亲,根据你店铺经营的波动,系统判断你最近的资金需求有所提升,结合你的信用状况,将给予您30万的信用贷款授信。30万,这恰是此时小林店铺所需要的资金量。
科幻?但这样的场景你一定很熟悉:晚上7点30分,CCTV新闻联播之后的天气预告,可以告知你未来1—2天每个城市的天气状况,会不会下雨,下多少。如果你上网,甚至可以在中国气象网查到未来3—7天的天气状况。
既然数据可以用来分析气象走势,为什么不能用来分析商家的信用等级并支撑信用贷款呢?
目前,信贷服务多是在企业产生信贷需求以后,再进行信贷审核,以企业当前的经营状况来进行信贷风险判断。但矛盾的是,很多企业产生信贷需求的时间点,恰是企业经营的低点,由此造成企业所获得的信贷资金,往往和其需求不匹配;而且单以一个时间点的状况对企业进行判断,无法掌握企业后续的经营走势,不利于风险防范。
正是带着这种思考,在蚂蚁微贷(原阿里小贷)数据运用中,如何透过数据去判断小微企业的信用等级、未来经营走向和融资需求(包括其需求出现的时间节点和量)已经成为重点。
在整个蚂蚁微贷业务决策中,数据分析处在核心位置。其中,上百个基于电商数据建立的模型交叉生效,构成整个风险决策体系核心。目前,蚂蚁微贷的模型体系涵盖贷前、贷中、后管理、反欺诈、市场分析、信用体系和创新研究六大部分。在众多模型中,有一个特殊的模型,它像是一个水晶魔球,专门负责预测未来,称之为“水文模型”。
试想,在淘宝网这个电商生态系统里,每家店铺的销售数据就像一条条河道里的水文,会随着市场的热度、客户的喜好、卖家的运营以及季节周期性的波动而忽高忽低。不同的淘宝店铺尽管销售产品千差万别,但可以根据行业、主营类目、星级进行归类划分,这好比不同的店铺出现在河道里的不同位置,可以纵向对比他们的水位高低好坏。如果能提前预知店铺未来交易的变化,那就可以提前预判其资金需求的节点、量级,又能横向对比出店铺运营的好坏,尽早识别出店铺运营潜在的风险。
那么,如何预测店铺未来的经营状况呢?这涉及交易、流量、收藏、广告、评价、处罚、社交、运营等综合反映店铺经营情况的变量,并将单一变量,通过各种衍生,获得一系列变量。将这些变量从原来的绝对值变量转变为相对值变量,剔除了季节性对绝对值的影响,就能使不同规模、类型的卖家具有相同的可比性。对于一个卖家来说,在不同的月份上,这些变量的表现就会如同水文一样呈现变动,蚂蚁微贷称之为“水文变量”。
在构建水文模型的时候,蚂蚁微贷摸索出了解决两大世界级数据分析领域难题的方法,一是如何进行大浪淘金般的数据挖掘,二是海量数据如何在云计算平台进行加工运算处理。
目前,直接或间接反映店铺情况的基础指标就有70多种,涉及交易类、流量类、收藏类、广告类、评价类、处罚类、社交类、运营类等。蚂蚁微贷按类目、星级分别统计一个“水文数据”库,且在库中记录过去的、静态的常数及其分布情况。有了总体的统计常量,就可以把每个店铺在各自所属的类目和星级进行比对,进行各种衍生,如同比、环比增长,以及在同行业对比的排名和变化趋势,总计共几百种衍生方式,从而得到为数众多的相对性指标(即自变量),同时对自变量进行标准化,使之脱离量纲,变得可比。目前水文库中存在的水文指标已超过三万个。
庞大的数据需要有足够的运算能力支撑。在构建水文模型的过程中,所有数据放在一起有数百T之大。传统的数据分析方法根本无法直接处理,只能靠抽样损失信息来处理。而阿里云平台提供了强大的云计算功能,对数亿条数据进行分析时,在传统数据挖掘平台上需要数天、甚至数周才能完成运算,在阿里云平台上却只要数小时就能获取结果。
正是依赖于这样的云计算、大数据,蚂蚁微贷的纯信用贷款模式才能顺利运作,在完全无抵押、无担保的情况下,为小微企业提供资金支持。
(转载自《阿里商业评论》,原题为《大数据、云计算:信用贷款的“水晶球”》)
预览时标签不可点收录于话题#个上一篇下一篇