当前位置: 沃微圈 > 阅读 > 科技 >

#早餐会之321#主题:数联铭品在大数据金融基础的看法

来源:转载


主题:数联铭品在大数据金融基础的看法
主讲人:吴桐
时间:2015年6月15日
与会:互联网金融千人会数百位核心会员

【嘉宾介绍】

吴桐,数联铭品CFO,知乎财经领域第一大v,有19万粉丝。

【主要内容】

自2014年开始,互联网金融爆发出一轮又一轮的浪潮,一时间席卷整个互联网,大有颠覆整个传统金融的劲头。但我们呼喊着互联网改变金融行业的时候,我们做了什么呢?我们有真正“改变”金融行业吗?

2013年,余额宝横空出世,瞬间席卷整个互联网。截止2015年一季度,余额宝用户数量接近2亿,基金规模超过7000亿,位居全球第二大货币基金。我们常常说,余额宝改变了理财,改变了金融行业。真的如此吗?余额宝实质是货币基金,它所做的仅仅是改变了货币基金的销售渠道,但对货币基金的本质,即货币基金本身的金融逻辑,是没有变化的。

P2P被寄予了打通中小企业融资渠道、改变中国畸形信贷市场、构造多层次资本市场的厚望。自诞生以来,P2P平台蓬勃发展,到今年已经超过了2000家。我们看到,P2P高效的将资金供需双方结合在了一起,这也被喻为互联网改变了金融。真的如此吗?绝大多数P2P平台没有任何风控措施,甚至连充分的信息披露都没有,这不叫金融的改革,只能叫金融的倒退。

这些例子还有很多很多,诸如互联网证券、互联网基金、互联网分期、互联网理财、等等等等,都只是在渠道上进行了创新,在我看来,只能叫互联网创新,还谈不上金融创新。那么什么才是互联网时代的金融创新?

互联网金融包含两部分。第一,流量。流量给互联网金融产品带来用户。金融的本质是资金的流通,资金流通就需要用户。因此,互联网金融的第一个要件就是能够带来用户的流量。这方面我们已经做得很好了,前面讲的都是在流量方面做的非常优秀的互联网金融产品的例子。

互联网金融的第二部分是模型。模型是金融真正的核心。金融模型的本质是什么?本质是将风险偏好不同的资金供给方和风险不同的资金需求方匹配起来。为什么这么说?资产的风险不同,有高有低;投资者的风险偏好也不同,承受能力有高有低。如果我们将风险承受能力低的投资者匹配到了高风险资产,结果将是灾难性的。大家明白,股市是高风险市场,所以国家天天强调,股市有风险,入市需谨慎。可是呢,不断有大妈拿着养老钱进场,还有中年人拿着全部家当加杠杆去炒股,这些人都是风险承受能力很差的人,如果让太多这样的投资者这样玩,国家就会面临不和谐的风险。

但风险和收益又是正相关的。大多数人只关注收益率,却不关注风险。在互联网金融领域尤其如此。甚至有一种隐隐的趋势:互联网金融带来的就是高收益率。这是不对的。然而很多互联网金融的创新者为了吸引用户,往往都陷入了盲目攀比收益率的恶性循环,置风险管控于罔顾。这无论如何都不能称作是金融创新。模型的本质是区分风险,收益率都不是模型的根本问题,光在收益率上做文章是金融的倒退。

所以,我们在做互联网金融的时候,应该回到金融的核心:模型。模型应该怎么做?模型又包含哪些部分?

第一,是被我们称作“实然”的部分。实然是指客观存在的事实。这些客观事实包括资产的财务状况、基本信息、关联关系、法律信息、交易信息、客观环境、等等。这些信息中,有些是私有信息,有些是公开信息。“实然”部分的详细讨论,以及私有信息和公开信息如何处理,信息的其他界限,将在明天详细展开。

第二,是被我们称作“应然”的部分。这个部分阐述事实与风险的内在联系。首先要明确的是,在互联网金融的背景下,事实与风险的内在联系必定是基于大数据的。互联网解放了数据的来源和形式限制,我们比以往任何时候都容易获得数据,也比以往任何时候都能获得更丰富的数据。在这样的环境下,我们需要找到一个不同于西方的、不同于传统的全新的内在联系。这将是颠覆性的创新,将从比以往更高的维度来看待风险。“应然”部分的详细讨论,我们周三展开。

上面和大家分享了数联铭品对大数据金融基础的一些看法。其中提到了互联网金融的两个部分,分别是流量和模型。其中,模型又分为实然和应然两个部分。实然是指客观存在的事实,应然是指事实与风险的内在联系。今天我和大家分享的是实然究竟包含哪些内容,其中有什么界限,有什么亟待解决的问题,以及数联铭品在实然领域的一些实践。

实然是指客观存在的事实。实然的主体包括两种,自然人和法人。实然的内容涵盖了主体的方方面面,比如财务状况、基本信息、关联关系、法律信息、交易信息、客观环境、履约记录等等。实然的一个应用是画像,即通过主体的相关事实推断主体的一些特征,从而对主体的可能行为有一个快速的了解。这个应用已经非常广泛。大家熟悉的“猜你喜欢”模块正式利用用户画像,预测用户可能购买的产品。目前已经有不少企业在从事这方面的应用,这里不再敷述。

实然的另一个应用是征信。大数据征信也是当下非常热门的话题。根据定义,征信是专业化的、独立的第三方机构为个人或企业建立信用档案,依法采集、客观记录其信用信息,并依法对外提供信用信息服务的一种活动,它为专业化的授信机构提供了一个信用信息共享的平台。传统的征信方式是各个部门独立搜集征信对象的相关信息,再由征信机构进行汇总和发布。进入了大数据时代,数据的搜集渠道空前扩张,任何一家互联网企业每时每刻都在产生大量数据。同时,也不断有更多数据被公开出来。因此,征信不再局限于整合各个部门独立搜集的数据,而是朝着数据来源多元化、异构化、海量化发展。

实然部分看似简单,展示客观存在的事实即可。实际上实然有诸多边界,任何边界的跨越都会给实然的应用带来威胁和变革。

1、个人隐私与公共信息的边界。这个话题目前国内讨论的最热烈,也最受关注。这块国内的《征信业管理条例》已有明确的红线规定。基于我们与合作伙伴的共同研究,个人信息包括两大类:个人敏感信息和个人一般信息。其中个人敏感信息的一般原则是指一旦遭到泄露或修改,会对标识的个人信息主体造成不良影响。并且,各个行业的个人敏感信息的具体内容也不同,根据接受服务的个人信息主体意愿和各自业务特点确定。比如,个人健康信息,各级医疗卫生计生服务机构以及各类数据服务商在服务和管理过程中产生的个人基本信息、医疗卫生服务信息等,在某些情况下也属于个人敏感信息。一般来说,个人敏感信息可以包括身份证号码、手机号码、种族、政治观点、宗教信仰、基因、指纹等。在一些情况下,个人的相关信息,诸如年龄、性别、公司、职业等,通过组合在一起可以很容易定位一个人的信息,也属于个人敏感信息。此外,个人的属性标签,也就是将相关信息进行一定的泛化,形成模糊一些的描述性标签,也就是个人用户画像的内容,是否属于个人敏感信息,是当下激烈争执的一个点。

2、歧视与公正的边界。什么是歧视?歧视指因为信息主体的某个缺陷、缺点、能力、出身等因素得到不平等的对待。比如,经过模型分析,得出出生于某个省份的人信用记录普遍不良,从而对所有出生于这个省份的人进行较低的信用评价,这是地域的歧视。再比如,经过模型分析,得出总监职位的人信用记录普遍优于入门员工,从而依据职级对个人信用评价,这是职级的歧视。歧视与公正的边界,国内几乎无人谈及。但它在西方发达国家已经引起了非常广泛的讨论,并形成了相关的广泛接受的约定。常见的不得用于信用评估的歧视有性别歧视、种族歧视、常见疾病歧视、地域歧视、外貌歧视、智力歧视等等。随着我国社会的发展,歧视与公正的边界的讨论会很快进入公众的视野。

3、独立与利益冲突的边界。独立包括指实质上的独立和形式上的独立。实质上的独立,是指信用评估机构在进行信用评估时其专业判断不受影响,公正执业,保持客观;形式上的独立,是指信用评估机构避免出现这样的情形,使得拥有充分相关信息的理性第三方推断其公正性、客观性或专业怀疑受到损害。这在传统信用评估行业容易发生,因为传统信用评估行业主要基于人的工作,而人的社交环境较为复杂,很难去评价怎样的情形才能完全保证实质和形式上的独立。在大数据时代,因为主要工作基于计算机而非人,所以只要能够保证形式上的独立,基本就能保证实质上的独立。

数联铭品的浩格云信企业全息画像,是我们在实然方面基于公开数据的实践。企业全息画像的所有数据源全部取自公开数据,有效避开了个人隐私和公共信息的边界。我们的主打产品是企业关联方图谱,基于全量的企业工商注册信息,可在一瞬间实时生成关联方拓扑图,并且可以互动操作,追踪每一个关联节点的直接关联方。同时可以实时搜索和展现拓扑图中任一节点与目标公司的关联关系链。除此之外,企业全息画像还集合了在诉信息、裁判文书、商标专利、招标中标、招聘人事、土地财产等各方面企业相关背景信息,打造一站式的非财务信息搜索服务。企业全息画像作为第一个完全基于公开数据的征信产品,开创了大数据征信的先河。

目前数联铭品的企业全息画像产品,广泛用于银行、P2P等信贷机构,会计师、PE/VC等股权融资机构,以及新三板、证监局、人民银行、金融局等监管机构,为客户提供目标企业的基础背景信息,其中尤其是关联方图谱,服务于反欺诈、贷前/投前、贷中/投中、贷后/投后等一系列风险管理过程,提供了所需的基础数据以及相关线索。其中,我们根据企业业务本质初步总结出了关联方图谱的相关特征,例如关联方图谱呈现太阳形则一定是投资型企业,若呈现菊花形则一定是中介型企业,等等。这些结论为大家提供了一个超越普通的基于财报评价企业的维度去看待企业,使我们可以一眼就看出企业业务的本质,从而迅速对企业风险做一个判断。

数联铭品希望通过非财务数据丰富风险管理的基础数据。过去金融机构过多基于财务数据,对非财务数据仅做定性分析。发展到今天,我们看到会计师的服务边界已经模糊,从过去的仅着重财务报表到今天的着重对目标企业客观事实的描述。在信贷行业,尤其国内的中小微企业,财务数据非常不可靠,导致过去借鉴自西方的基于财务数据的风险管理模型水土不服。我们需要重构一个基于企业完整画像的风险管理模型。这个模型,就是明天我们将讨论的基于大数据的风控模型,也是数联铭品在风控领域的最新实践。

上面与大家分享了数联铭品在大数据金融模型中的实然领域的实践,提到了企业全息画像的所有数据源全部取自公开数据,有效避开了个人隐私和公共信息的边界。我们的主打产品是企业关联方图谱,基于全量的企业工商注册信息,可在一瞬间实时生成关联方拓扑图,并且可以互动操作,追踪每一个关联节点的直接关联方。同时可以实时搜索和展现拓扑图中任一节点与目标公司的关联关系链。除此之外,企业全息画像还集合了在诉信息、裁判文书、商标专利、招标中标、招聘人事、土地财产等各方面企业相关背景信息,打造一站式的非财务信息搜索服务。企业全息画像作为第一个完全基于公开数据的征信产品,开创了大数据征信的先河。

金融起源于西方。我们知道,西方的风控是最成体系,也是非常有效的。西方的风控体系中,重点分析对象是财务数据,非财务数据仅作为定性的模块参与到风险管理模型中来。财务数据的分析包括几个方面,其一是业务数据的分析,包括收入、成本、毛利率,市场前景及占有率,供应链情况及前景等;其二是财务报表分析,主要对近三年各项利润表、资产负债表、现金流量表项目进行分析,结合主要财务比率如营运能力、偿债能力、盈利能力的变化趋势;其三是贷款、对外担保、抵押质押的情况,也就是企业与金融机构发生的关系。通过这些财务数据的分析,我们可以很容易的掌握一个企业的大致风险水平。

我国金融风控借鉴自西方,大约70%的风险评估过程依赖于财务数据。但是财务数据分析有它的局限性。这个局限性体现在两方面,一方面是新兴行业的财务数据放在既有的风控模型中无法适用。比如,知乎这样的互联网企业,有很优秀的用户基础,给这个社会创造了巨大的价值,风投资本持续涌入。但是因为它没有收入,在信贷风控模型中无法获得通过。另一方面,国内企业的财务数据,尤其是中小微企业的财务数据,非常不可靠,两套帐现象非常严重,甚至每次外发的财务报表都不一样,这导致高度依赖财务数据的风控模型几乎失效。我们很容易发现这样的现象,银行客户经理或者所谓的融资咨询机构与贷款客户勾结起来,篡改财务报表,达到欺骗银行风控模型的目的。

财务数据还有一个问题,就是财务数据仅仅反映了过去的信息,而金融实质上是关注未来发生的事情。过去的财务数据能够影响未来的现金流动吗?从感官上来讲,能够影响。过去财务数据所形成的趋势,很容易带动人联想到企业未来的发展也会按照这个趋势前进。这好比罗素讲述的鸡的故事,一只鸡发现农夫每天都来喂自己,于是预言农夫将来会继续喂养自己。然而有一天,农夫绞断了鸡的脖子。事实上,从过去的财务数据去推演未来的现金流动,是非常片面的,也并不是一个好方法。

那么究竟是什么从根本上决定了企业未来的走向呢?是企业所处的环境。企业所处的环境包括内部环境和外部环境。内部环境指企业边界内的环境,是企业自身可以改变的,包括了产权、治理结构、经营和内部控制、组织结构、所有权结构和财务数据,外部环境指企业所处的大环境,是企业自身不能改变的,包括行业情况、监管环境、税收环境和法律环境。从这里可以看到,财务数据仅仅占企业环境的一小部分。

我们认为,基于企业所处环境的新一代风控模型已经势在必行了。这将完全不同于过去的过于倚重财务数据的风控模型。有两点原因会促使这样的新一代模型在国内诞生。其一,财务数据普遍不可靠。这点前面已经讲过,财务数据不可靠是导致目前国内风控模型整体失效的原因,其结果是一方面不良贷款率飙升,另一方面小微企业贷款非常艰难。其二,我国的企业数据公开已经走在了国际前列。从我们的观察来看,虽然美国最早提出了政府数据公开的概念,但是,我国国内目前公开的数据所蕴含的价值才是世界领先的。其中就包括了构成数联铭品企业关联方图谱的基础数据——工商注册数据。

那么新一代风控模型应该如何做呢?我们认为,这样的模型包含四大方面的数据:一、个人/公司的基本信息,包括个人资历、个人/公司的信用信息、公司财务指标、家庭结构关系、家庭社会地位关系、个人社交关系、工商注册信息等;二、个人/公司商务信息,包括线上零售交易信息、专利信息、个人/公司资质、土地出让/转让信息、质押抵押信息等;三、个人/公司社会公众信息,包括涉诉信息、专利信息、被执行人信息等;四、个人/公司社会关联方信息,包括自媒体、证券社区、行政监管/许可、行业背景、商标、招中标、行政处罚、抵押担保等。

除了这些个体的数据,我们还需要评估关联方对风险的影响,包括高风险的关联方节点对目标企业的静态影响以及风险在关联方网络中的流动影响。这才是新一代风控模型的全貌。它不仅包含了企业自身所处的环境,还包含了它的关联节点所处的环境,以及所有这些关联节点之间的关联关系。这之中,关联关系才是整个模型的重中之重。关联关系决定了一家企业的“基因”,一家企业的基因长什么样,它的未来就会长什么样。也就是说,企业的未来不是由财务数据决定的,甚至也不是企业所处的环境决定的,而是企业的关联关系决定的。

足以支撑上面所述的如此多因素的风控模型,必然是基于大数据技术的。数联铭品拥有大数据方面的领军人物周涛博士、孙伟博士,以及金融风险管理领域的顶级专家袁先智博士、陈公越博士,加上互联网金融领域黄震博士、易欢欢等豪华外部顾问团队,已经开始着手完成这样的风控模型。我们相信,这样的新一代风控模型,不仅仅是国内首创,更会成为领导全球金融风控变革的一面旗帜。

之前给大家介绍了数联铭品在互联网金融的核心——模型上所做的努力,这是务实方向上的工作。同时,我们在务虚方向,也有非常大的动作。

5月18日,由BBD(数联铭品)主办,达晨创投和数据堂协办的“第一届商业大数据全球峰会•觉醒”登陆蓉城洲际酒店会议中心。会上,COSR——策略研究理事会正式宣布成立。理事会致力于规范数据服务标准、提升我国数据服务能力、优化决策效力和效率。此次峰会同时发布了COSR数据服务框架,规范了数据服务必须满足可靠性和合规性两个目的,即数据服务的可靠性、决策相关性和及时性,以及数据的采集、整理、储存和分析合规合法性。这将是数据服务行业的ISO9000。

为什么需要COSR?什么是COSR?什么是COSR数据服务框架?COSR数据服务框架包含哪些内容?结构是什么样的?接下来我一一解释。

大数据方兴未艾。信息革命走到今天,人类第一次可以高速处理海量多种信息,大数据成为各行业发掘业务洞察、支持决策优化的战略武器。据《2014-2018年中国大数据产业发展前景与投资战略规划分析报告》,93%的企业都认为数据具有或可能具有很高的价值,大数据的价值已经在企业中获得了广泛的认可。

然而,大数据带来的不仅仅是机遇,在技术和应用层面实现大数据的价值面临着很多挑战和困难,例如:数据来源良莠不齐、数据管理困难、数据分析模型构建不易、数据隐私和用户使用权难以平衡。为了解决这些问题,近年来出现了一大批致力于数据服务的专业数据服务企业,大数据服务市场应运而生。

作为新兴的高科技服务业务,大数据服务高度复杂。大数据需求企业很难判断数据服务质量,从而规避潜在的经营和法律风险。在此背景下,COSR提出了数据服务框架,旨在打造数据服务需求方、服务供给方和其他利益相关方共同认可、遵循的业务规范,实现数据服务的可靠性以及合规性,提升大数据服务市场的透明度,促进大数据服务市场的健康和迅速发展。

这是推出COSR的背景。我们需要一种标准来规范数据服务行业。这个数据服务行业的界限非常宽泛,只要利用数据进行服务的行业都算。它包括了当下热门的大数据金融、个性化推荐等,也包括了传统的资产评估、征信服务、信用评级、资讯平台、贷款评级、行业分析等行业。

COSR全称“Council of Strategy Research”,即策略研究理事会,是一个致力于大数据行业发展的非营利性组织。该组织致力于通过规范数据服务、提升服务能力,来优化决策的效力和效率。COSR的发起组织有数联铭品科技有限公司、安理律师事务所、华院数据技术有限公司、国信优易数据有限公司、数据堂科技有限公司、清华大学经济管理学院、北京航空航天大学软件学院、北京航空大学铭品大数据创新实验室、电子科技大学大数据研究中心。

在COSR框架中,什么是数据服务呢?数据服务管理框架旨在帮助数据服务企业更好地管理组织, 提高数据服务的质量,降低运营风险,符合相关法律法规的要求;同时向数据服务需求方提供服务质量和合理合规的保证。从而降低数据服务的不确定性,促使数据服务提供商和需求方长期深入合作,有效应对经济和竞争环境的不断变化,并且创造并更新各类数据服务商业模式。

数据服务是原数据供给(Data Provision)、数据虚拟化(Data Fabric),数据平台(Data Platform),数据分析(Data Analytics)的总称,覆盖从数据搜集、处理、复用、分析到业务洞察的各个层次。

从数据需求方的视角来看,现代的数据供应商超越了传统的数据搜集者这一概念,而是提供了一种支持数据需求方业务流程和管理决策的数据服务,因此,数据成为服务(DaaS, Data as a Service),而基于大数据的数据服务也成为BDaaS(Big Data as a Service)。

这个定义强调数据服务的多层次性,提供数据、数据管理、数据工具、基于数据的决策支持都是数据服务的范围。典型的数据服务组织往往未能涉及所有的数据服务层次。

COSR数据服务框架包含哪些内容呢?接下来我逐一介绍一下。数据服务是一种高度复杂的高技术现代企业服务。在剧烈变化的市场环境和多样的服务需求下,如何控制数据服务企业的经营风险,提高数据服务的质量和可靠性,满足法律法规、隐私保护等合规要求,是数据服务组织董事会、高级管理层、投资人、客户、监管机构等内外部利益相关方面临的共同问题。

COSR致力于解决这个问题。 COSR数据服务框架为董事会和管理层提供了:

•系统管理数据服务组织的管理框架;

•实施有效的内部控制的基础;
•识别、分析和控制潜在风险的方法;
•消除冗余,提高经营效率的契机。

对于外部利益相关方和其它与组织相关方而言,运用本框架会:

•提高对数据服务组织实现其业务目标的信心;
•加深对数据服务过程和结果的理解;
•提高对数据服务质量的信心;
•更好地评价和比较不同的数据服务提供商;

•更好地整合外部数据服务和自身业务。

COSR数据服务框架适用于各种与数据服务有关的行业,包括资产评估、征信服务、信用评级、资讯平台、贷款评级、行业分析等等。数据服务框架不仅适用于对数据服务公司的评估,也适用于对公司内部的数据服务部门的评估。

COSR数据服务框架是由主体、目标和要素构成的一个三维结构。主体是按职能部门或产品线划分的业务单元;主体所致力于实现的是目标;主体实现目标必不可少的是要素。它们的关系可以用一个立方体来表示:

•立方体的纵向代表数据服务的两种目标:数据服务的可靠性、数据服务的合规性;
•立方体的横向代表数据服务的五个要素;
•立方体的第三维代表主体结构。

目标:数据服务的设计旨在确保实现下列目标:

(1)数据服务的可靠性, 指数据服务的可靠性、决策相关性和及时性。

(2)数据服务的合规性, 指数据的采集、整理、储存、分析和运用符合相关法律法规要求。

要素:数据服务通过如下核心要素体现:

(1)服务环境

数据服务环境是数据服务框架的基础,董事会和高级管理层应在高层建立基调,强调规范的数据服务管理的重要性,统一期望的行为准则,并在组织的各个层级强化这种要求。服务环境包括组织的诚信和道德价值观;组织结构以及权责的分配;吸引、培养和留用人才的程序;用以实现问责的绩效衡量、激励和奖励机制。服务环境对整个数据服务框架有深远的影响。

(2)基础数据管理

高质量的数据是数据服务的基础。数据服务企业应当对数据源进行筛选、去隐私处理、评估、入库和质量管理,以确保数据源的准确、有效和合规。

(3)数据技术

数据技术指数据服务企业在进行数据服务时所需的基本数据技术,包括数据采集技术、数据清洗技术、数据储存技术、数据分析技术。这些技术保障了数据数量、数据读写能力、数据库可扩展性、数据可用性、分析结果的可靠性。数据技术是很多数据服务企业的核心能力之一。

(4)数据应用

数据应用指客户要求的数据服务最终呈现形式。

(5)风险与控制

数据服务中的风险需要得到识别、评估和控制。常见的风险有执行风险、数据风险、信息技术基础设施风险等。

最后一个维度是主体:数据服务框架通过主体这一组织架构实现。根据具体的数据管理组织架构,主体是按职能部门或产品线划分的业务单元。

之前讲了很多概念性的东西,下面来分享一个实例,分享一下基于大数据技术我们可以得到多么有价值的信息。这是我们浩格云信企业全息画像的定制化服务的一部分。标准服务包括前几天提到的关联方搜寻及图谱展示、裁判文书和在诉信息搜寻、商标专利、招标中标、招聘人事、土地财产等各方面企业相关背景信息。定制化服务主要以个别目标企业为中心展开,帮助客户了解目标企业日常运营方面的信息。

这是一家电商类的网站。这里我就不提它的名字了。我们知道,电商类网站都会展示商品的成交信息,以获得用户的信任。如果我们能将所有商品的成交信息全部汇总,那么就能得到这家电商类企业的真实运营情况。于是,我们从去年开始跟踪这家网站,拿到了它从成立至今跨度达五年的所有成交信息,并在这些信息基础上进行分析。

首先我们看一下近五年总体的销量情况。

接着是近五年的销售额和均价。可以看到,规模化后这家网站的平均单价是在不断下探。


这是更加细节的销量情况,分别是分季度和年度。可以看到,在每年3月店庆的时候,销量都非常高。另外14年6月有一个异常点,销量几乎为零。同时期,大量舆论报道其卖假货。

除了对销量和销售的观察,我们甚至可以在该上市公司披露年报前测算出当季度的销售数据。(上图)

以上是成交信息最直接的应用,即观察销量、销售额。接下来是对成交信息进行进一步的分析和应用。这两张图分别是该平台上的品牌数量和单品数量。可以看到,品牌数量增长趋缓,但单品数量依旧稳步上升。

这张图是平台上的品牌销量前十位。可以看到,平台上成交的品牌由最初的迪奥、资生堂、碧欧泉等国外大牌逐渐变成了菲诗小铺、卡姿兰、百雀羚等本土品牌。从另一侧面印证了平台平均单价的下滑。


这张图是每年的成交价格分布。可以看到单价150元以下的成交占比由2011年的32%逐渐上升到2014年的69%。


同时,平台的用户平均消费间隔也在逐年上升。

最后一个也是最核心的一个指标,该平台的平均用户留存率。可以看到,每年用户留存率的斜率(也就是用户流失的速度)在不断变大。

关于数联铭品以及数联铭品的理念、产品,这里就为大家简单介绍完毕。

【互动环节】

霍学文:你们在企业图谱分析中,发现一些出问题的企业经常会有什么现象?或者容易出现什么问题?

吴桐:简单介绍下关联方图谱产品。找出目标企业的关联方后,我们会通过我们的静态图算法根据关联方的拓扑结构生成一个图谱。这个图长这样的:

这个图可以看出我前面所说的“企业的基因”,左边这种是中介型企业,我们称之为“菊花形”,可以看到中介型企业背后有强大的势力在支撑中介业务;右边这种是投资型企业,我们称之为“太阳形”,因为投融资活跃才会形成这样的图谱。这个图谱反过来也适用。只要一家企业的关联方长成这样的图形,那么一定可以推断它本质上是什么样的企业。比如,我们在为人行排查风险的时候,发现“川威集团”的关联方图谱是太阳型,而川威集团主业是钢铁。通过对川威集团关联方拓扑图的分析,我们可以断定川威集团已经脱离其主业,变成了一家搞投融资的企业。这样的图谱实质上2年前就已经成型,川威集团的“基因”已经变成了投融资企业,注定会出风险。到去年川威资金链断裂,可谓是走到了它“命中注定”的结局。这是川威集团的关联方图谱,也是太阳形。

除了图谱的拓扑结构,每个关联方节点的属性也同样重要。我们在与霍老师联合打击非法集资的过程当中,通过我们的基于关联方图谱的投资型企业生命周期理论和关联节点属性的分析,成功的预测出了非法集资的企业,并通过银行流水进行了验证。

老高在路上:如果企业绕道持股或海外vie呢?或者类当年德隆系类似交叉持股呢?
吴桐:交叉持股完全可以识别出来,只要在国内进行了工商登记的企业,发生的关联关系我们都能够识别。
马志伟: 企业工商注册数据本身信息量并不是非常丰富,而中小企业的关联关系信息在公开数据资源中应该也有限。能否谈一下这类关系图谱主要依据的数据源?
吴桐:其实工商注册所蕴含的信息量远比想象的大。今天展示给大家的都是公开数据信息。未来接入一些其他关联关系之后,这张图会更加震撼。

马志伟:是的,特别现在推行年度工商信息公示后,工商信息会更丰富。你们如何获取?频率如何?“成功的预测出了非法集资的企业,并通过银行流水进行了验证” 银行流水的获取是需要企业提供或授权吗?
吴桐:通过我们的网络数据采集器获取,至少每月更新一次。
张鹏飞:网络数据采集银行流水?银行流水属于公开数据吗?不需要取得授权?
吴桐:银行流水验证是通过霍老师那边做的。我们的价值在于提供线索,大幅缩小关注范围。



点击下方“阅读原文”欢迎加入千人会社区平台,与业内人士沟通交流
↓↓↓

分享给朋友:
您可能感兴趣的文章:
随机阅读: