融科技顾名思义,是金融和科技的结合,我们将科技定义为大数据和算法的结合,从流程上来说可细分为数据采集、数据存储和算法。
大数据
大数据的概念从四五年前开始火爆,最近更是频繁进入众人视线,然而大数据究竟是什么?业界常用的大数据的定义为4个V,分别是Variety(多样化)、Volume(数据量)、Velocity(速度)和Value(价值)。
大数据并不是一个新名词,也不是最近才被大规模商业化,早期银行等金融机构已将大数据用于反欺诈、反洗钱和管理黑名单。而近年来大数据的使用场景递增是在计算机的存储能力和运算能力大幅提高的背景下发展起来的。由于数据量持续增多,数据结构趋于多样化,因此数据挖掘和数据清洗、处理是很重要的工作。
社交网络,用户行为数据和GPS数据等为我们提供了广泛的非结构化数据,而手机等传感器的数量增加为我们提供了持续的数据来源。大数据的来源一般可分为两类,一类是中心化收集的数据,另一类是去中心化收集的数据,也为众包数据。前者较典型的是运营商数据,后者比较典型的是GPS数据。众包数据在大数据发展历史中起到重要的作用,提高了大数据的量级和效率,特斯拉虽然在自动驾驶技术上从时间来看比谷歌较晚起步,但是由于其已大规模投入生产和使用,每一辆车的驾驶数据都可反馈并对自动驾驶模型进行优化,从数据和模型优化角度来说可能更具优势。
金融科技的应用层面
从应用层面来看,金融科技实质是利用大数据和算法做判断、预测和优化。大数据和机器学习是用来预测未来,深度学习算法是加速大规模数据分析并使其自动化的关键工具。在金融领域,大数据和算法最广泛运用的是授信领域。金融机构收集关于用户的广泛数据并基于一定的算法对用户进行反欺诈和风险定价。金融机构的相对优势就建立在数据量和算法的更新上,数据量的累积能够优化金融机构的算法模型,而算法模型的优化能够带来好的用户服务体验,好的体验能够吸引更多的客户,在此基础上,金融机构能够实现数据-算法-客户-数据的闭环。
我们根据大数据和金融可结合的领域,制作了以下图表。其中,上表是最近比较讨论比较火热的科技名词,下表是科技和金融业务结合的应用。
图一:2016年科技热词
图二:金融和科技结合在不同领域的应用
大数据的监管建议——关于隐私和不公正
随着大数据收到关注和商业化的运用,我们也需要关注金融机构运用大数据的伦理和法律问题:隐私和不公正。在大数据的量呈爆发性增长时,围绕个人的数据量和维度会越来越多,如果未获得用户授权,或者被授权方没能对数据进行保护,则可能被黑客盗用而进行违法行为。由于数据清洗,数据转化和模型构建和最优化目标的选取涉及人为决策行为,大数据决策的结果不能照成不公正。金融机构不能过度依赖于大数据,不能认为大数据和机器学习一定能带来中立、无偏差的结果。
大数据的应用和价值的挖掘不能以牺牲个人隐私和公正性为代价,应通过严格的执法和行业的自律,确保大数据在产权清晰、权利保障有效和结果公正的框架下发挥更大的价值,大数据才会拥有健康的未来。我们期待未来会有更多金融和科技结合的领域出现,实现真正的普惠金融。