当前位置:大学毕业论文> 论文范文>材料浏览

关于机器学习论文范文写作 基于大数据分析下的机器学习模型设计方法相关论文写作资料

主题:机器学习论文写作 时间:2024-02-04

基于大数据分析下的机器学习模型设计方法,本论文主要论述了机器学习论文范文相关的参考文献,对您的论文写作有参考作用。

机器学习论文参考文献:

机器学习论文参考文献 大数据时代论文关于大数据的论文大数据杂志有关大数据的论文

摘 要:随着全球化时代的到来,社会上各个领域的产业快速兴起,产生了大量的数据,因此信息量变得巨大.但是由于大数据的数量庞大,复杂多变,产生了许多问题,而只适用于处理小数据的机器学习模型却不能处理这些问题,因此研究大数据下机器学习模型设计方法成为了社会的热点话题.通过分析现阶段机器学习存在的不足,探讨基于大数据背景下机器学习模型的设计方法.通过改进机器学习模型解决各大企业因数据量过大产生的问题.

关键词:大数据;机器学习;设计方法

中图分类号:TP181 文献标识码:A 文章编号:1009-3044(2018)01-0197-02

20世纪70年代,信息化时代到来,许多产业随之兴起,每天都会产生庞大的数据信息.这些数据多而杂乱,但是每一条都极其重要,里面蕴含着有价值的信息[1].传统数据分析通过人为事先安排好的方法分析数据,从中发掘有价值的信息,而大数据分析就不会受到这一限制,它是直接从数量庞大,结构复杂的数据中分析出有用的信息,从而使数据发挥最大的价值,但是这一过程相当复杂,很难快速获得信息,因此必须借助机器学习模型来完成.大数据技术的目标实现与机器学习的发展必然密不可分[2].个人可以在这个大数据库中找到通往财富大道的途径;企业可以在这个大数据库中寻找商机,在市场竞争中占尽优势,获取丰厚的利润;国家可以在这个大数据库中寻找有用的线索,预防它国入侵,预测灾害的发生等.因此,为了社会方方面面的发展,机器模型的设计必不可少.

机器学习隶属于人工智能的一个研究范围,旨在让计算机像人一样能够自主学习,从而加快计算机处理数据的速度.1997年,卡内基梅隆大学机器学习学院院长兼教授Mitchell T M认为机器学习过程就是计算机以学到的经验为基础,提升自身性能的过程[3].机器学习的最终目的是从数据中获取知识.机器学习模型设计一般由环境、学习元、知识库和执行元四部分组成,如图1所示.

大数据以发掘数据中有价值的信息为己任,而机器学习是其中的重要手段.这种手段对于大数据分析来说是解决的重要途径,大数据使机器学习算法更准确,同时机器学习算法对内存计算的速度要求也越来越高.所以大数据与机器学习相互制约,相互促进,彼此依靠.本文通过研究机器学习模型的设计方法来处理大数据.

1 支持向量机

1995年,Corinna Cortes和Vapnik创建了支持向量机(Support Vector Machine,SVM),它是新出现的一种机器学习模型,这种模型一出现就在这一领域掀起了巨大的浪潮,引起了人们的广泛关注[4].支持向量机机器学习模型是以VC维理论和结构风险最小原理基础,样本信息为基点,在模型的复杂性和学习能力之间寻找最佳平衡点, 以求达到最佳的效果.支持向量机这一学习模型常应用在小样本、非线性、高维模式识别、人脸检测、机器翻译等领域.

SVM是最新的也是应用最广的机器学习模型.例如对于线性可分的问题,SVM是要找到间隔最大的超平面将两种不同的样本分开,间隔最大的超平面具有最好的泛化能力,如图2所示.

现在通过一个例子来解释超平面的定义,x是权重向量,y是最优超平面偏移,

a样本到最优超平面的距离为:

为超平面确定的判别函数.SVM可以将x和y之间的间距值最大化.然后通过解答对偶问题,从而得到x和y的数值,之后把核函数引入非线性可分的问题中.线性不可分是一种正常现象,存在许多问题中,因为对偶问题的目标函数是不确定的,因此不可能达到最优化.要想解决这一问题,有两种方法:软间隔优化,即放宽对输入空间的限制,对于某些错误可以选择忽视.但是当某些极度线性不可分问题出现时以及分类错误过多无法解决时,这种方法就不适用了.核技巧,即找到一个核函数,将处在低维空间中的数据转化到高维空间中,这样数据就变得可分了,从而得到解决.这一方法也不能保证解决所有线性不可分问题,因此对于更复杂的线性不可分问题,要把两种方法结合起来使用.

2 人工神经网络

人工神经网络(ANN),是模拟大脑运转过程的机器学习方法,简称神经网络.它是一种类似于数学统计学的机器学习方法.根据图3,人类建立了人工神經网络模型:[5].

这个模型主要有三点优势:首先,能够自主学习.例如,锻炼人工神经网络进行脸部识别的功能,把成千上万张面部图像和对应的人物信息输入到这个模型,神经网络就会逐渐学会这项技能.这项技能在预测方面发挥重要作用,可以帮助人们进行灾难预测,风险预测等.其次,具有联想存储功能.这种功能需要通过人工神经网络的反馈系统实现.最后,能够快速找到问题的最佳解决方法.但是要想找到最佳的解决方法,就要把所有的解决方式尝试一遍,这需要很大的计算量,而利用神经网络机器学习模型就能把这种复杂问题简单化,从而快速找到最佳方法.

人工神经网络有着支持向量机不具备的优势,它对非线性问题的处理能力更强,适应性更好,弥补了传统机器学习在模式、语音识别、非结构化信息处理方面存在的不足,使它应用的范围更广,在神经系统、模式识别、智能控制等领域都用到了这种机器学习模型.将神经网络和其他机器学习模型结合使用,在处理大数据信息方面更加有效,使人工智能向前迈进了一大步,促进了信息处理技术不断发展.随着信息化不断发展,人工神经网络确定了新的发展方向,使它的运行模式更加人性化,例如与模糊系统、遗传算法、进化机制等结合,就是其中一个研究方向,如果取得成功,对大数据的分析将会更加容易.把信息几何与人工神经网络相结合研究,为人工神经网络的理论研究开辟了新的途径.人们对人工神经网络机器学习模型的研究更加深入,因此这一模型会应用的范围会越来越广,但需要改进的空间还是很大.其中把神经网络与其他技术的结合以及由此而来的混合方法和混合系统,已经成为主要研究的对象.但是由于它们都有各自的优势和缺陷,因此要把神经网络与其他技术相结,首先要做到的就是取其精华,去其糟粕,继而可以获得更好的应用效果,但是这也是最大的难点之一.但是,我们必须克服这一难点,这是我们无法回避的.

3 机器学习模型的分类

大数据下机器学习模型有很多,支持向量机和神经网络是两种最重要的模型.根据算法,模型可以分为三大类.第一种,监督学习,是指计算机从大数据中提取相关信息,之后大数据再对信息进行验证,并提供结果.这种模式的根本目的是让计算机学通过这一过程,学到经验,然后去解决类似问题.神经网络和支持向量机都是监督学习;第二种无监督学习,是指计算机在大数据中自主截取有用的信息.这种学习的目标具有不确定性;第三种强化学习,是指无大数据验证的情况下,计算机自主对信息进行评估[6].

4 结束语

综上所述,本文对大数据分析下机器学习模型的两种设计方法进行了全面的阐述.支持向量机和人工神经网络都是处理大数据的实用又有效的学习方法.通过这两种方法可以在大数据中获取对人们有用的信息,促进人类社会的发展,乃至推动人类社会文明的进步.目前,大数据技术已在金融、电信、医疗等众多行业和领域中得到广泛应用.但随着社会的进步,人们需要对机器学习进行更深入的研究,以便应对越来越庞大的数据信息.

参考文献:

[1] 孙存一,龚六堂.大数据思维下的利率定价研究——以机器学习为视角的实证分析[J].金融理论与实践,2017,67(7):1-5.

[2] 吴启晖,邱俊飞,丁国如.面向频谱大数据处理的机器学习方法[J].数据采集与处理,2015,16(4):703-713.

[3] 徐倩漪,齐芳.基于机器学习的通信网络非结构化大数据分析算法研究[J].激光杂志,2016,37(10):125-128.

[4] 徐健锋,许园,许元辰,等.基于语义理解和机器学习的混合的中文文本情感分类算法框架[J].计算机科学,2015,42(6):61-66.

[5] 李力,林懿伦,曹东璞,等.平行学习—机器学习的一个新型理论框架[J].自动化学报,2017,43(1):1-8.

[6] 史金梅,夏伟.基于大数据分析的学生最优选课方案模型的设计与实现[J].现代电子技术,2017,37(14):30-32.

结论:关于对写作机器学习论文范文与课题研究的大学硕士、相关本科毕业论文机器学习论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

大数据背景下高中化学学习模式变化探究
【摘要】处于大数据时代的现今社会,科学技术日新月异,在科技快速发展的同时,化学技术的发展为科研事业提供物质基础。因此,培养化学方面的人才,成为了。

大数据时代医院人事档案管理信息化实现方法探析
摘 要:随着大数据时代的到来,各行行业都面临着信息化建设的考验。当今医院人事档案 管理走向信息化也是时代发展的一个重要趋势。传统的人事档案管理已。

大数据时代医院人事档案管理信息化实现方法
摘 要:档案信息化建设工作是每一个单位都必不可少的管理部分。而人事管理部门在进行管理工作过程中形成的医院人事档案,也是人事管理部门历史面貌的反映。

基于大数据分析智能客服系统和设计
摘 要:根据呼叫中心的历史数据,较为准确的、高效的预测话务业务量趋势,合理调度和编排客服人员,提升客服系统服务保障质量,是当前各类客服系统面临的。

论文大全