当前位置:大学毕业论文> 论文参考文献>材料浏览

关于关键技术论文范文写作 基于大数据的互联网金融征信的关键技术与问题分析相关论文写作资料

主题:关键技术论文写作 时间:2024-02-24

基于大数据的互联网金融征信的关键技术与问题分析,本论文主要论述了关键技术论文范文相关的参考文献,对您的论文写作有参考作用。

关键技术论文参考文献:

关键技术论文参考文献 大数据杂志关于互联网金融的论文互联网金融论文题目有关大数据的论文

摘 要:本文研究了基于大数据的互联网金融信用数据的采集、处理、分析、挖掘方法,阐述了构建互联网金融征信系统的关键技术和应用细节,探讨了互联网金融征信系统建设面临的隐私保护、信用数据集成、信用数据分析难点等急需解决的问题.

关键词:大数据;互联网金融;征信

一、应用大数据技术的互联网金融征信现状

随着我国互联网金融的持续发展,诞生出许多新的服务模式,这些模式有利于中小微企业的融资难问题, 并展现出巨大的长尾效应,进一步促进了“普惠金融”,但由此暴露出互联网金融信用体系建设的滞后性值得密切关注.利用互联网金融的特点,基于大数据、云计算等技术,可以开拓出一种新型的征信模式,实现主动分析客户相关信息生成信用评级.该模式通过对互联网金融用户日常交易数据和社交数据的收集整合,借助大数据技术从海量信息流中挖掘用户特征、习惯,进而推断出其实际财务状况,进行风险评判.这种基于大数据的互联网金融征信是对现有的人民银行征信系统覆盖面有限问题的改善,以此为基础产生的互联网金融创新更是层出不穷.下面就介绍一下基于大数据的互联网金融征信的数据处理流程、关键技术及面临问题.

二、应用大数据技术处理互联网金融信用數据的流程

互联网金融征信就是利用大数据的高效率、低成本的特点,综合分析网络交易平台中的行为数据进而判断授信对象的信用状况,得出信用评分,并根据其进行风险认定.而要充分利用互联网金融的信用数据则需要多种技术的协同操作,云计算提供基础的计算资源,文件系统提供最底层存储能力,在文件系统之上建立数据库系统,然后构建索引,最后利用数据分析技术从海量数据中发现信用相关数据.

下面就对互联网金融信用数据的处理流程和技术进行分析.

(一)数据采集

数据的采集是利用多个数据库来收集来自客户端(Web、App)的数据.从采集数据规模考虑,必须采用具有良好可扩展性的分布式数据库系统.采集到的数据包括结构化,半结构化和非结构化数据,传统的关系数据库技术无法处理半结构化和非结构化数据,需要采用NoSQL数据库存储半结构化和非结构化数据.比如,电商使用关系型数据库BD2或Oracle来存储结构化事务数据,使用NoSQL数据库Redis和MongoDB来存储非结构化数据.

另外,在数据的采集过程中,高并发数是需要高度关注的问题.例如,双十一时的电商和春运时的购票网站,并发的访问量的峰值达百万.这种情况除了在采集端部署大量数据库收集数据外,同时还需解决大量数据库之间的负载均衡问题.

(二)数据预处理和清洗

要对数据采集端的海量数据进行有效分析,需将数据导入分布式存储集群或分布式数据库中进行预处理和清洗.导入的数据量巨大,有时会达每秒钟百兆,甚至千兆级别,如何解决海量数据导入、预处理和清洗是该过程的关键.其次,数据清洗过程中,相对细微且有用的信息有时混杂在庞大的数据量中,清洗粒度过细,可能将有用的信息过滤掉,清洗粒度过粗又无法去除无效信息,所以,清洗过程需要仔细考量和权衡.再次,互联网金融不同领域在数据处理的方式及效率上具有极大的差异性,实际中不存在单一数据库能够应对所有应用场景,如海量文本数据就不可能和图像数据采取同样的处理方法.

(三)数据统计分析

数据分析是获取信用数据最核心的问题,有价值的数据来自对每一次网络点击的计算分析.而数据的数量,采集的速度,类型的多样性决定着分析方法的复杂程度,选择合适的分析方法是决定最终数据是否有价值的关键.比如PowerDrill主要应用于大数据量的核心数据集分析,Dremel侧重于多数据集分析,数据集的种类相较于PowerDrill的应用场景多很多.另外,实时性分析会选择基于MySQL的列式存储Infobright、EMC的GreenPlum和Oracle的Exadata等来处理;基于半结构化数据或批处理的分析需求,会选择使用Hadoop.

(四)信用数据挖掘

信用数据挖掘一般不设置主题,通过在现有数据上应用各种算法进行计算,来满足高级别数据分析的需求.比较典型算法有SVM(统计学习)、NaiveBayes(分类)和Kmeans(聚类),主要工具有Hadoop的Mahout等.数据挖掘的由于计算量大、算法复杂且以单线程算法为主,所以,提高计算效率是信用数据挖掘的关键问题.

三、应用大数据技术的互联网金融征信面临的问题

上文讨论了互联网金融信用数据的处理流程及关键技术,但是互联网金融征信系统建设还面临着其他方面的问题.

(一)互联网金融征信的保护问题

互联网的发展使数据的产生和传播更加便捷,随之出现的保护问题越来越需要重视.《征信业管理条例》第十三条明确指出采集非依法公开的应当取得信息主体本人同意.但矛盾是如果为了保护而将所有数据隐藏,那么数据的价值就大大降低.目前,互联网金融企业可以收集到客户的行为数据,分析出其资产和信用情况,推出产品和服务,实现共赢.因此大数据时代的保护和数据价值的挖掘,应该是在不暴露个人敏感信息的前提下进行的,尝试在减少数据损失的同时保护用户隐私.

(二)互联网金融征信的大数据集成

为了充分全面反映借款人的资信状况,征信系统应该包括信息主体尽量多的信贷交易数据.目前,征信系统的数据主要来源是传统银行业金融机构和小额贷款公司,不包括互联网金融企业.有必要在保护信息主体权益的前提下进行互联网征信数据的收集,这就涉及到互联网金融征信系统的集成.人民银行应在政策层面推进互联网金融征信归集,要求互联网金融机构按照统一的规则,整合加工数据,向用户提供标准化征信产品.

(三)互联网金融征信的大数据分析

半结构化和非结构化数据量的迅猛增长,给大数据时代的数据分析技术提出了很高的要求.

一是数据处理的实时性.互联网金融很多应用场景的数据分析要求在线实时.然而,大数据实时处理的模式至今没有一个通用的处理框架.各种分析工具只能对应其特定的应用类型,这就要求对现有的技术和工具进行改造来满足不同的业务需求和应用场景.

二是数据模式变化中索引的设计.大数据时代数据量的变化决定着数据模式的变化,数据模式的变化又要求索引结构的设计能够在其发生变化时快速调整来适应.现有的大数据索引方案基本都有特定的应用场景,设计适应变化数据模式的索引方案将是大数据时代的主要挑战之一.

三是先验知识的缺乏.结构化数据在以关系模型进行存储的同时就隐含了数据属性和数据关系的先验知识.而在面对大数据分析时,一方面半结构化和非结构化数据很难以类似关系数据库中结构化数据的方式表现先验知识,另一方面半结构化和非结构化数据很多以流的形式需要实时处理,无法实时建立先验知识.

四、结束语

《征信业管理条例》中规定,只要是从事放贷业务的机构,都应该接入央行征信系统.中国人民银行征信中心已允许小贷公司接入央行征信系统.互联网金融未来在政策允许的情况下,也应加入央行的征信体系. 随着互联网金融的蓬勃发展,征信作为互联网金融业务创新的基础,其作用日益明显.互联网金融企业对征信的需求也越来越迫切.征信关系到国计民生,应由政府主导,保证其公信力、强制力、规范性和广泛性.然而,不论是拓宽征信数据来源,还是扩大征信覆盖范围,互联网金融都是绕不开的一个环节,大数据征信都是需要深入研究的领域.

参考文献

[1]孟小峰,慈祥.大数据管理: 概念、技术与挑战[J].计算机研究与发展, 2013, 50( 01) : 146-169.

[2]申德荣, 于 戈, 王习特, 聂铁铮, 寇 月. 支持大数据管理的NoSQL 系统研究综述[J]. 软件学报,2013,24(08).

[3]朱春莹.面向大数据查询的索引技术研究 [D].山东:山东大学,2016:6-9.

[4]曾忠禄.大数据分析: 方向、方法与工具[J].情报理论与实践,2017,24(01).

作者简介:

张菲菲,人民银行淮南市中心支行.

结论:适合关键技术论文写作的大学硕士及相关本科毕业论文,相关关键技术开题报告范文和学术职称论文参考文献下载。

基于大数据平台互联网金融和小微企业融资
摘要:小微企业的数量在国内中企业中的占有量不断增大,成为我国经济发展中的主要推动力。但是,小微企业经营发展中,由于小微企业融资成本高、融资渠道少。

大数据下互联网金融方向应注意问题
摘要:当前在经济社会发展的背景下,互联网金融行业也发生了巨大变革,大数据在其发展中发挥着重要的作用。在互联网金融中应用大数据,有利于金融资源的合。

大数据在互联网金融领域应用
摘 要:作为互联网金融的核心内容,数据非常关键,采用大数据技术更是支撑互联网金融发展的重要力量。本文分析了大数据技术在互联网金融领域中进行应用的。

论文大全